Спокойно. Повече от година се въртя около този доверителен интервал. Изчел съм всичко, което може да се намери за него, и съм сигурен, че го прилагам правилно. Ако търсиш някакъв проблем, то той не е в начина на прилагане или във формулите, а в това, че дава верни числа ако характеристиките на редицата не се променят с времето.
Например ако с доверителен интервал търсим процента на детайлите със сбъркани размери в една поточна линия, той ще дава верни числа дотогава, докато не се смени машината с по-нова. Новата машина вече ще има други характеристики и ще създаде друга цифрова редица със сбъркани детайли. Ако доверителния интервал не го знае това, ще започне да дава грешни стойности.
Също и за изборите - с доверителен интервал прогнозират уж успешно, но този доверителен интервал не може да отчете, че в някое село например има покупко-продажба на гласове. И ако в България има много такива села с подкупени гласоподаватели, рейтинговите агенции ще сбъркат с прогнозата.
За представителната извадка си прав, но тя има друг смисъл. Тя предварително се смята колко голяма трябва да бъде, щото прогнозата да има предварително зададен диапазон на грешката. Тоест смятат обратната задача. Това обаче не означава, че формулите на доверителния интервал не работят и при малък брой сделки. Напротив - работят правилно дори и при 2 сделки. При една сделка не работят, защото няма стандартно отклонение, но при 2 и повече сделки формулите са правилни, сами където под 30 сделки се използва Т-разпределението на Стюдънт. То за всякакъв брой сделки може да се ползва, и дори е по-правилно така да се прави, но над 30 сделки по-лесно се смята с нормалното разпределение, което при голям брой сделки почти се припокрива с разпределението на Стюдънт.
Има една уловка, при която доверителния интервал може да не е правилен, и тя е ако стратегията създаде цифрова редица, много различаваща се от нормалното разпределение. Тогава трябва да търсим какво е това разпределение, и да смятаме площта на опашките (това прави доверителния интервал) по кривата на плътността на съответното разпределение. Пак си има формули за тази площ, но те са различни при различните разпределения.
Иначе началните и централните моменти се смятат по един и същи формули за всички видове разпределения, така че голяма част от статистическите показатели на една стратегия са верни независимо какво разпределение са създали сделките. Някои разпределения са симетрични и техния Skewness е равен на нула. Знае се обаче каква е неговата формула и по нея по обратен път можем да предположим с голяма вероятност какво точно разпределение е изкривило симетричността, ако се сблъскаме с такава стратегия. Просто смятаме 4-те централни момента и по 4-тия момент правим обратно търсене на типа разпределение с формулите от този линк:
http://mathworld.wolfram.com/Skewness.html
Ако обаче Skewness е равен на нула или е близо до нулата, имаме си работа с Нормалното разпределение или с разпределението на Стюдънт, и моите формули за доверителния интервал са верни.