Этот вид статистических гипотез относится к гипотезам о виде закона распределения генеральной совокупности.
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: X ~ R(а; b) – случайная величина X подчиняется равномерному распределению с параметрами (а; b) (в контексте задачи – «В фирме «А» –нет осведомителя (инсайдера)»; «Распределение числа удачных ходов фирмы-конкурента – случайно»);
Н1: случайная величина X не подчиняется равномерному распределению (в контексте задачи – «В» фирме «А» – есть осведомитель (инсайдер)»; «Распределение числа удачных ходов фирмы-конкурента – неслучайно»).
В качестве критерия для проверки статистических гипотез о неизвестном законе распределения генеральной совокупности используется случайная величина %2. Этот критерий называют критерием Пирсона.
Его наблюдаемое значение (2набл) рассчитывается по формуле
где m(эмп) i– эмпирическая частота i-й группы выборки; m(теор) i– теоретическая частота i-й группы выборки.
Составим таблицу распределения эмпирических и теоретических частот (таблица 2).
Таблица 2
m(эмп) i | 7 | 3 |
m(теор) i | 5 | 5 |
Найдем наблюдаемое значение 2набл
Критическое значение (2кр) следует определять с помощью таблиц распределения 2 по уровню значимости и числу степеней свободы k.
По условию = 0,05, а число степеней свободы рассчитывается по формуле
k= n – l – 1
где k- число степеней свободы; n– число групп выборки; l– число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки (если все параметры предполагаемого закона известны точно, то l= 0).
По условию задачи, число групп выборки (n) равно 2, так как могут быть только 2 варианта действий фирмы-конкурента: «удачные» и «неудачные», а число неизвестных параметров равномерного распределения (l) равно 0.
Отсюда k= 2- 0-1 = 1.
Найдем 2кр по уровню значимости а = 0,05 и числу степеней свободы k= 1:
2кр(a=0,05;k=1)=3,8
2набл < 2кр, следовательно, на данном уровне значимости нулевую гипотезу нельзя отклонить, расхождения эмпирических и теоретических частот - незначимые. Данные наблюдений согласуются с гипотезой о равномерном распределении генеральной совокупности.
Это означает, что для утверждения о том, что действия фирмы-конкурента на рынке неслучайны, нет оснований и на уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Ответ. На уровне значимости = 0,05 можно утверждать, что в фирме «А» нет платного осведомителя фирмы-конкурента.
Пример 2. На уровне значимости = 0,025 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты (табл. 3):
Таблица 3
m(эмп) i | 5 | 10 | 20 | 25 | 14 | 3 |
m(теор) i | 6 | 14 | 28 | 18 | 8 | 3 |
Решение. Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: X ~ N(2) - случайная величина X подчиняется нормальному закону распределения с параметрами и 2.
Н1: случайная величина X не подчиняется нормальному закону распределения с параметрами и 2.
В качестве критерия для проверки нулевой гипотезы используем критерий Пирсона 2.
Найдем наблюдаемое значение (2набл):
Найдем критическое значение критерия (2кр) по таблице распределения 2кр по уровню значимости и числу степеней свободы k.
По условию = 0,025; число степеней свободы найдем по формуле
k= n – l – 1
где k– число степеней свободы; n- число групп выборки; l–число неизвестных параметров предполагаемой модели, оцениваемых по данным выборки.
По условию задачи число групп выборки (n) равно 6, а число неизвестных параметров нормального распределения (l) равно 2.
Отсюда k = 6- 2-1 = 3.
Найдем 2кр по уровню значимости = 0,025 и числу степеней свободы k = 3:
2кр(=0,025; k=3) = 9,4
2набл > 2кр, следовательно, на данном уровне значимости нулевая гипотеза отклоняется в пользу конкурирующей, расхождения эмпирических и теоретических частот – значимые. Данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
Ответ. На уровне значимости = 0,025 данные наблюдений не согласуются с гипотезой о нормальном распределении генеральной совокупности.
2.2 Проверка гипотезы с неизвестной дисперсией генеральной совокупности согласно критерию Стьюдента
Цель использования критерия Стьюдента - выявление достоверности различия между данными двух выборок одной и той же генеральной совокупности
Метод Стьюдента применяется для сравнения двух выборок, взятых из одной и той же генеральной совокупности, или двух различных состояний одной и той же выборочной совокупности.
При этом могут представиться следующие случаи:
1. По объему:
а) обе группы большие (n>30);
б) обе группы малые
;в) одна - большая, вторая - малая.
2. По составу:
а) группы с попарно-зависимыми вариантами, когда i- варианта первой группы сравнивается с i- вариантой второй группы
;б) группы с попарно-независимыми вариантами (можно менять варианты местами внутри группы).
Пример. Техническая норма предусматривает в среднем 40 с на выполнение определенной технологической операции на конвейере по производству часов. От работающих на этой операции поступили жалобы, что они в действительности затрачивают на нее больше времени. Для проверки данной жалобы произведены хронометрические измерения времени выполнения этой технологической операции у 16 работниц, занятых на ней, и получено среднее время выполнения операции X = 42 с. Можно ли по имеющимся хронометрическим данным на уровне значимости = 0,01 отклонить гипотезу о том, что среднее время выполнения этой операции соответствует норме, если:
а) исправленное выборочное среднее квадратическое отклонение s – 3,5 с;
б) выборочное среднее квадратическое отклонение 3,5 с?
Решение, а) Для решения данной задачи необходимо проверить гипотезу о том, что неизвестная генеральная средняя нормальной совокупности точно равна определенному числу, когда дисперсия генеральной совокупности неизвестна (выборка мала, так как n = 16 меньше 30).
Сформулируем нулевую и конкурирующую гипотезы согласно условию задачи.
Н0: а = а0 = 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) равно гипотетически предполагаемому числовому значению а0 (применительно к условию данной задачи - время выполнения технологической операции соответствует норме).
Н1: а > 40 – неизвестное математическое ожидание а (нормально распределенной генеральной совокупности с неизвестной дисперсией) больше числового значения а0 (применительно к условию данной задачи – время выполнения технологической операции больше установленной нормы).
Так как конкурирующая гипотеза – правосторонняя, то и критическая область – правосторонняя.
В качестве критерия для сравнения неизвестного математического ожидания а (нормально распределенной генеральной совокупности с неизвестной дисперсией) с гипотетическим числовым значением а0 используется случайная величина t-критерий Стьюдента. (Приложение 2).
Его наблюдаемое значение (tнабл) рассчитывается по формуле
где X – выборочная средняя; а0 – числовое значение генеральной средней; s– исправленное среднее квадратическое отклонение; n – объем выборки.
Найдем наблюдаемое значение tнабл
Критическое значение (tкр) следует находить с помощью таблиц распределения Стьюдента (приложение 2) по уровню значимости и числу степеней свободы k.
По условию = 0,01; число степеней свободы найдем по формуле
k = n - 1,
где k- число степеней свободы; n- объем выборки.
k = 16 - 1 = 15.
Найдем tкр по уровню значимости = 0,01 (для односторонней критической области) и числу степеней свободы k = 15:
tкр( k=15)= 2,6
Заметим, что при левосторонней конкурирующей гипотезе Н1:а < 40tкр следует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости (для односторонней критической области) и числу степеней свободы k = n – 1 и присваивать ему знак «минус».
При двусторонней конкурирующей гипотезе Н1: а≠40tследует находить по таблицам распределения Стьюдента (приложение 2) по уровню значимости а (для двусторонней критической области) и числу степеней свободы k = n – 1.
tнабл < tкр следовательно, на данном уровне значимости нет оснований отклонить нулевую гипотезу.