Так как мы имеем дело с неизвестной генеральной совокупностью и выносим суждения о ней на основе выборочной информации, то мы можем и не прийти к правильному выводу. Мы сделаем неправильный вывод, если отвергнем нулевую гипотезу, когда она справедлива (ошибка I рода), или примем нулевую гипотезу, когда она ошибочна (ошибка II рода).
В большинстве случаев при проведении проверки гипотез в экономике задается некоторый допустимый уровень вероятности совершения ошибки I рода (
чем больше степень уверенности в нулевой гипотезе, тем меньше должно быть значение
чем больше цена отбрасывания справедливой нулевой гипотезы, тем меньше значение должно иметь
Сформулируем общий алгоритм проверки статистических гипотез. Процедуру проверки можно описать следующими шагами:
1) формулировка гипотезы. Гипотеза формулируется в терминах различия величин. Например, есть случайная величина х и константа a. Они не равны (арифметически), но нужно установить, значимо ли статистически между ними различие. Существует два типа критериев:
а) двухсторонний критерий вида: х
б) односторонний критерий вида: х< a или х< a.
Необходимо отметить, что знаки >, <, = здесь используются не в арифметическом, а в «статистическом» смысле. Их необходимо читать «значимо больше», «значимо меньше», «различие незначимо».
2) Установка закона распределения. Далее необходимо установить или постулировать закон распределения. Существуют также критерии, которые не зависят от вида распределения - так называемые непараметрические критерии.
3) Вычисление тестовой статистики. Тестовая статистика - некоторая функция от рассматриваемых величин, закон распределения которой точно известен и ее можно сравнить с табличным значением.
4) Сравнение с табличным значением. Затем тестовая статистика сравнивается с табличным значением. Тестовая статистика всегда зависит от доверительной вероятности, и, в некоторых случаях, от дополнительных параметров. Так, в приведенном выше примере сравнения двух дисперсий тестовая статистика сравнивается с табличным значением критерия Фишера («критическим» значением), которое зависит от доверительной вероятности и числа степеней свободы дисперсий.
5) Вывод. На основании сравнения делается вывод о том, выполняется ли гипотеза (например, значимо ли различие и т.д.).
Уровень значимости
Допустим, рассчитанное по эмпирическим данным значение критерия попало в критическую область. Тогда при условии верности проверяемой гипотезы H0 вероятность этого события будет не больше уровня значимости
Если альтернативная гипотеза
Для принятия решения о принятии или отвержении гипотезы необходимо рассчитать расчетное значение критерия, выбрать критическую область, и сравнить расчетное значении критерия с табличным. Критическая область будет зависеть от выбранной альтернативной гипотезы, как показано на рисунках 1-3.
Рисунок 1 – Двухсторонняя критическая область.
Гипотезы:
Табличное значение критерия определяется для уровня значимости
Рисунок 2 – Критическая область при альтернативной гипотезе «больше чем».
Гипотезы:
Табличное значение критерия определяется для уровня значимости
Рисунок 3 – Критическая область при альтернативной гипотезе «меньше чем».
Гипотезы:
Табличное значение критерия определяется для уровня значимости
2.2 t-критерий Стьюдента
t-критерий Стьюдента - общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Данный критерий был разработан Уильямом Госсеттом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (а руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсетта вышла в журнале «Биометрика» под псевдонимом «Student» (Студент).
Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий.
t критерий Стьюдента для одной выборки:
где
где
t критерий Стьюдента для двух выборок: