Введем также
(1)Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни выражаются через введенные величины:
E(U) = mna , E(S) = mn + m(m+1)/2 – E(U) = mn(1- a) + m(m+1)/2,
D(S) = D(U) = mn [(n – 1) b2 + (m – 1) g2 + a(1 -a)]. (2)
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными с параметрами, задаваемыми формулами (1) .
Если выборки полностью однородны, т.е. их функции распределения совпадают, справедлива гипотеза
H0: F(x) = G(x) при всех x, (3)
то L(t) = t и a= 1/2. Подставляя в формулы (3), получаем, что
E(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12.
Следовательно, распределение нормированной и центрированной статистики Вилкоксона:
T = ( S – m(m+n+1)/2) (mn(m+n+1)/ 12 ) – 1/2 ,
при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).
Из асимптотической нормальности статистики Т следует, что правило принятия решения для критерия Вилкоксона выглядит так:
- если |T| <
то гипотеза (2) однородности (тождества) функций распределений принимается на уровне значимости a,- если же |T| >
то гипотеза (1) однородности (тождества) функций распределений отклоняется на уровне значимости .В прикладной статистике наиболее часто применяется уровень значимости
Тогда значение модуля статистики Т Вилкоксона надо сравнивать с граничным значениемПравила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (1). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?
Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами
E(T) = ( 12mn ) 1/2 (1/2 – a) (m+n+1) – 1/2,
D(T) = 12 [(n – 1) b2 + (m – 1) g2 + a(1 -a) ] (m+n+1) – 1.
Из формул (11) видно большое значение гипотезы
H01: a = P(X < Y) = 1/2 .
Если эта гипотеза неверна, то, поскольку m < n, справедлива оценка
|M(T)| > (12m n (2n+1) – 1) 1/2 |1/2 – a , (4)
а потому |M(T)| безгранично растет при росте объемов выборок. В то же время, поскольку
то
D(T) < 12 [(n – 1) + (m – 1) + 1/4] (m+n+1) – 1 <12.
Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (4), стремится к единице при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе
АH01: a = P(X < Y) ё 1/2 . (5)
Если же гипотеза (8) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой
D(T) = 12 [(n – 1) b2 + (m – 1) g2 + 1/4 ] (m+n+1) – 1. (6)
Гипотеза (4) является сложной, дисперсия (6), как показывают приводимые ниже примеры, в зависимости от значений b2 и g2 может быть как больше единицы, так и меньше единицы, но согласно неравенству (5) никогда не превосходит 12.
Приведем пример двух функций распределения F(x) и G(x) таких, что гипотеза (4) выполнена, а гипотеза (2) – нет. Поскольку
a = P(X < Y) = òF(x)dG(x) ,
1 – a = P(Y < X) = òG(x)dF(x),
и a = 1/2 в случае справедливости гипотезы (4), то для выполнения условия (3) необходимо и достаточно, чтобы
ò(F(x) – G(x)) dF(x) = 0 , (7)
а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1; 1). Тогда формула (11) переходит в условие
ò(F(x) – G(x)) dF(x) = – 1/2 ò(G(x) – (x + 1)/2 ) dx = 0.
Это условие выполняется, если функция (G(x) – (x + 1)/2) является нечетной.
При проверке гипотезы однородности мы рассмотрели различные виды нулевых и альтернативных гипотез – гипотезу (2) и ее отрицание в качестве альтернативы, гипотезу (3) и ее отрицание, гипотезы о равенстве или различии медиан. В теоретических работах по математической статистике любят гипотезу сдвига, в которой альтернативой гипотезе (2) является гипотеза
H1: F(x) = G(x + r) при всех x и некотором r, отличным от нуля
Если верна альтернативная гипотеза H1, то вероятность P(X < Y) отлична от 1/2, и критерий Вилкоксона является состоятельным.
В некоторых прикладных постановках гипотеза (4) представляется естественной. Например, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает погрешности измерения одного значения, а G(x+r) – другого. Однако в большинстве прикладных постановок нет никаких оснований считать, что отсутствие однородности всегда выражается столь однозначным образом, как следует из формулы (7). Поэтому мы, рассматривая проблему выбора статистического критерия для проверки однородности, пришли к выводу о необходимости использования критериев, состоятельных против любого отклонения от гипотезы однородности (4), прежде всего критериев Смирнова и типа омега-квадрат (Лемана-Розенблатта).
Отметим еще одно обстоятельство. Часто говорят (в соответствии с классическим подходом математической статистики), что нельзя проверять нулевые гипотезы без рассмотрения альтернативных. Однако при практическом анализе данных зачастую полностью ясна формулировка той гипотезы, которую желательно проверить (например, гипотезы полной однородности – см. формулу (3)), в то время как формулировка альтернативной гипотезы не очевидна (то ли это гипотеза о неверности равенства (3) хотя бы для одного значения x, то ли это альтернатива (4), то ли – альтернатива сдвига (5), и т.д.). В таких случаях целесообразно "обернуть" задачу – исходя из статистического критерия найти альтернативы, относительно которых он состоятелен. Именно это и проделано в настоящей статье для критерия Вилкоксона.
Характеристика мониторинга внеучебной активности
Оперативное управление ходом учебного процесса с еженедельным темпом получения информации
Наглядное представление полученных данных
Аттестация по контрольной точке
Число не аттестованных контрольных точек у студентов (5 курс)
Количество пропущенных часов