7. Экспериментальные оценки истинных значений измеряемой случайной величины и её среднеквадратичного отклонения
Если в распоряжении исследователя находится конечное число независимых результатов повторности одного и того же опыта, то он может получить лишь экспериментальные оценки истинного значения и дисперсии результата опыта.
Оценки должны обладать следующими свойствами:
1.Несмещённости, проявляющейся в том, что теоретическое среднее совпадает с истинным значением измеряемого параметра.
2.Состоятельности, когда оценки при неограниченном увеличении числа измерений могут иметь сколь угодно малый доверительный интервал при доверительной вероятности.
3.Эффективности, проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметь наименьшее рассеяние (дисперсию).
Экспериментальная оценка среднеквадратичного отклонения обозначается S с указанием в скобках символа анализируемой величины, т.е.
S (yk) – среднеквадратичного отклонение единичного результата.
S (y) – среднеквадратичное отклонение среднего результата.
Квадрат экспериментальной оценки среднеквадратичного отклонения S² является экспериментальной оценкой дисперсии:
Для обработки результатов наблюдения можно использовать следующую схему:
Определение среднего значения полученных результатов:
Определение отклонения от среднего значения для каждого результата:
Эти отклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеют разные знаки, когда значение результата опыта превышает среднее значение, ошибка опыта считается положительной, когда значение результата опыта меньше среднего значения, ошибка считается отрицательной.
Чем точнее произведены измерения, тем ближе значение отдельных результатов и среднее значение.
Если по m результатам рассчитывают оценку истинного значения
, а затем, используя те же результаты, рассчитывают оценки абсолютных отклонений:
то оценку дисперсии единичного результата находят по зависимости:
Разность между числом т независимых результатов уки числом уравнений, в которых эти результаты уже были использованы для расчета неизвестных оценок, называют числом степеней свободы f:
f=m –1.
Для оценки дисперсии эталонного процесса f=m.
Поскольку средняя оценка
является более точной, чем единичная ук, дисперсия средних будет меньше дисперсииединичных результатов в m раз, если рассчитано по всем mединичным результатам ук:Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S2 (yк) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитывают с помощью критерия Стьюдентаt(P; f):
,где Р – доверительная вероятность (Р=1-q, q– уровень значимости).
Проверка надёжности полученных результатов по критерию Стьюдента для проведенного числа опытов m при избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит, что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах. Критерий t(P; f) с доверительной вероятностью Р показывает во сколько раз модуль разности между истинным значением определённой величины y и средним значением ỹ больше стандартного отклонения среднего результата.
8. Определение грубых ошибок среди результатов повторностей опыта
При статистическом анализе экспериментальных данных для процессов, негативный результат которых не создает ситуаций, опасных для жизни людей или утраты больших материальных ценностей, доверительная вероятность обычно принимают равной Р=0,95
Среди результатов yk повторностей опыта могут быть результаты, значительно отличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой, либо с неизбежным случайным влиянием неучтенных факторов на результат данной повторности опыта.
Признаком наличия «выделяющегося» результата среди других является большая величина отклонения │▲yk│= yk– yˉ.
Если ▲yk>yпред, то такие результаты относятся к грубым ошибкам. Предельное абсолютное отклонение определяют в зависимости от сложившейся ситуации различными методами. Если, например, проводиться статистический анализ экспериментальных данных опыта с эталонным процессом (известно истинное значение результата опыта и ▲yk=yk-y) и если исследователь имеет в своем распоряжении оценку дисперсии S2(yk) с таким большим числом степеней свободы, то может принять f→∞ и S2(yk)=σ2, то для определения грубых ошибок можно применить правило «2-х сигм»: все результаты, абсолютные отклонения которых по модулю превышают величину двух среднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками и исключаются из массива экспериментальных данных (вероятность исключения достоверных результатов равна уровню значимости q=0,05).
Если доверительная вероятность отличается от 0,95 то пользуются правилом «одной сигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданной вероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому и рассчитывают абсолютное отклонение:
Если в распоряжении исследователя имеется лишь приближенная оценка дисперсии с небольшим (конечным) числом степеней свободы, то применение правила «сигм» может привести либо к необоснованному исключению достоверных результатов либо к необоснованному оставлению ошибочных результатов.
В этой ситуации для определения грубых ошибок можно применить критерий максимального отклоненияrmax(P, m), взятый из соответствующих таблиц. Для этого rmax сравнивают с величиной r, равной
(22)
Если r > rmax, то данный результат должен исключаться из дальнейшего анализа, оценка yˉ должна быть пересчитана, изменяются абсолютные отклонения ▲ykи соответственно оценка дисперсии S2(yk) и S2(yˉ). Анализ на грубые ошибки повторяют при новых значениях оценок yˉ и S2(yk), прекращают его при r <= rmax.
При пользовании формулой (22) следует применять оценку дисперсии, полученную по результатам повторностей опыта, среди которых находится сомнительный результат.
Для определения грубых ошибок существуют и другие методы, среди которых наиболее быстрым является метод «по размаху», основанный на оценке максимальных различий полученных результатов. Анализ по этому методу проводят в такой последовательности:
1)располагают результаты yk в упорядоченный ряд, в котором максимальному результату присваивается номер первый (y1), а максимальному – наибольший (ym).
2)Если результатом, вызывающим сомнение, будет ym, рассчитывают отношение
(23)
если сомнительным результатом будет y1 – отношение
(24)
3)при заданном уровни значимости q и известном числе повторностей m по приложению 6 находят табличное значение критерия αТ.
4)если α > αТ, то подозреваемый результат является ошибочным и его следует исключить.
После исключения грубой ошибки находят по таблице новую величину αТ и решают судьбу следующего «подозреваемого» результата, сравнивая αТ и рассчитанный для него α.
Если есть основание предполагать, что 2 наибольших (2 наименьших) результата являются «промахами», то их можно выявить в один прием, используя соответствующий столбец таблицы приложения 6 для определения αТ и рассчитывая α по формуле:
(25)
или
(26)
Средневзвешенные оценки дисперсии. Анализ однородности исходных оценок дисперсии
Если в распоряжении экспериментатора имеются результаты многократных измерений величин критерия оптимальности в опытах при различных условиях ведения процесса, то появляется возможность расчета средневзвешенной оценки дисперсии единичного результата, единой для всех опытов эксперимента.