Смекни!
smekni.com

тема: «Информационная система рейтингового мониторинга учебного процесса в семестре» (стр. 2 из 2)

Введем также

(1)

Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни выражаются через введенные величины:

E(U) = mna , E(S) = mn + m(m+1)/2 – E(U) = mn(1- a) + m(m+1)/2,

D(S) = D(U) = mn [(n – 1) b2 + (m – 1) g2 + a(1 -a)]. (2)

Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными с параметрами, задаваемыми формулами (1) .

Если выборки полностью однородны, т.е. их функции распределения совпадают, справедлива гипотеза

H0: F(x) = G(x) при всех x, (3)

то L(t) = t и a= 1/2. Подставляя в формулы (3), получаем, что

E(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12.

Следовательно, распределение нормированной и центрированной статистики Вилкоксона:

T = ( Sm(m+n+1)/2) (mn(m+n+1)/ 12 ) – 1/2 ,

при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).

Из асимптотической нормальности статистики Т следует, что правило принятия решения для критерия Вилкоксона выглядит так:

- если |T| <

то гипотеза (2) однородности (тождества) функций распределений принимается на уровне значимости a,

- если же |T| >

то гипотеза (1) однородности (тождества) функций распределений отклоняется на уровне значимости
.

В прикладной статистике наиболее часто применяется уровень значимости

Тогда значение модуля статистики Т Вилкоксона надо сравнивать с граничным значением

Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (1). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?

Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами

E(T) = ( 12mn ) 1/2 (1/2 – a) (m+n+1) – 1/2,

D(T) = 12 [(n – 1) b2 + (m – 1) g2 + a(1 -a) ] (m+n+1) – 1.

Из формул (11) видно большое значение гипотезы

H01: a = P(X < Y) = 1/2 .

Если эта гипотеза неверна, то, поскольку m < n, справедлива оценка

|M(T)| > (12m n (2n+1) – 1) 1/2 |1/2 – a , (4)

а потому |M(T)| безгранично растет при росте объемов выборок. В то же время, поскольку

то

D(T) < 12 [(n – 1) + (m – 1) + 1/4] (m+n+1) – 1 <12.

Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (4), стремится к единице при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе

АH01: a = P(X < Y) ё 1/2 . (5)

Если же гипотеза (8) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой

D(T) = 12 [(n – 1) b2 + (m – 1) g2 + 1/4 ] (m+n+1) – 1. (6)

Гипотеза (4) является сложной, дисперсия (6), как показывают приводимые ниже примеры, в зависимости от значений b2 и g2 может быть как больше единицы, так и меньше единицы, но согласно неравенству (5) никогда не превосходит 12.

Приведем пример двух функций распределения F(x) и G(x) таких, что гипотеза (4) выполнена, а гипотеза (2) – нет. Поскольку

a = P(X < Y) = òF(x)dG(x) ,

1 – a = P(Y < X) = òG(x)dF(x),

и a = 1/2 в случае справедливости гипотезы (4), то для выполнения условия (3) необходимо и достаточно, чтобы

ò(F(x) – G(x)) dF(x) = 0 , (7)

а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1; 1). Тогда формула (11) переходит в условие

ò(F(x) – G(x)) dF(x) = – 1/2 ò(G(x) – (x + 1)/2 ) dx = 0.

Это условие выполняется, если функция (G(x) – (x + 1)/2) является нечетной.

При проверке гипотезы однородности мы рассмотрели различные виды нулевых и альтернативных гипотез – гипотезу (2) и ее отрицание в качестве альтернативы, гипотезу (3) и ее отрицание, гипотезы о равенстве или различии медиан. В теоретических работах по математической статистике любят гипотезу сдвига, в которой альтернативой гипотезе (2) является гипотеза

H1: F(x) = G(x + r) при всех x и некотором r, отличным от нуля

Если верна альтернативная гипотеза H1, то вероятность P(X < Y) отлична от 1/2, и критерий Вилкоксона является состоятельным.

В некоторых прикладных постановках гипотеза (4) представляется естественной. Например, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает погрешности измерения одного значения, а G(x+r) – другого. Однако в большинстве прикладных постановок нет никаких оснований считать, что отсутствие однородности всегда выражается столь однозначным образом, как следует из формулы (7). Поэтому мы, рассматривая проблему выбора статистического критерия для проверки однородности, пришли к выводу о необходимости использования критериев, состоятельных против любого отклонения от гипотезы однородности (4), прежде всего критериев Смирнова и типа омега-квадрат (Лемана-Розенблатта).

Отметим еще одно обстоятельство. Часто говорят (в соответствии с классическим подходом математической статистики), что нельзя проверять нулевые гипотезы без рассмотрения альтернативных. Однако при практическом анализе данных зачастую полностью ясна формулировка той гипотезы, которую желательно проверить (например, гипотезы полной однородности – см. формулу (3)), в то время как формулировка альтернативной гипотезы не очевидна (то ли это гипотеза о неверности равенства (3) хотя бы для одного значения x, то ли это альтернатива (4), то ли – альтернатива сдвига (5), и т.д.). В таких случаях целесообразно "обернуть" задачу – исходя из статистического критерия найти альтернативы, относительно которых он состоятелен. Именно это и проделано в настоящей статье для критерия Вилкоксона.

Характеристика мониторинга внеучебной активности

Оперативное управление ходом учебного процесса с еженедельным темпом получения информации

Наглядное представление полученных данных

Аттестация по контрольной точке

Число не аттестованных контрольных точек у студентов (5 курс)

Количество пропущенных часов

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

  1. Microsoft Access 2003 [Текст] : справочник / под ред. Ю. Колесникова — СПб.: Питер, 1999. – 420с.
  2. Вероятность и математическая статистика. Энциклопедия [Текст] / под ред. Ю. В. Прохорова. — М.: Большая Российская Энциклопедия, 1999. – 1052 с.
  3. Википедия. Свободная энциклопедия. [Электронный ресурс] / Статья «Математическая статистика»; Режим доступа: http://ru.wikipedia.org/wiki/, – Загл. С экрана. – Рус., англ.
  4. Высокие статистические технологии [Электронный ресурс] / Институт высоких статистических технологий и эконометрики; ред. Орлов А.А.; – М.: Выс. стат. тех., 2008. – Режим доступа: http://orlovs.pp.ru/, – Загл. С экрана. – Рус.
  5. ГОСТ 11.011-83. Прикладная статистика. Правила определения оценок и доверительных границ для параметров гамма-распределения [Текст] – М.: Изд-во стандартов, 1984. – 53 с. – Переиздание: М.: Изд-во стандартов, 1985. – 50 с.
  6. Пиявский, С. А. Управляемое развитие научных способностей молодёжи [Текст]/ С.А. Пиявский – Москва, 2001г., 156 с.
  7. Пиявский, С. А., Дерябкин В.П. Методические указания к дипломному проектированию. [Текст]/ С.А. Пиявский, Дерябкин В.П. – Москва, 2001г., 156 с.
  8. Пиявский, С.А. Численные методы принятия решений в компьютерных технологиях технического творчества в строительстве [Текст]: монография / С.А. Пиявский. – М.: Ассоциация строительных высших учебных заведений 1994г. – 68 с.
  9. Рубен, А.Н. Эффективная работа с СУБД [Текст]: монография / А.Н. Рубен, А. Г. Горев, С. П. Макшарипов – СПб.: Питер, 2001. – 822 с.
  10. Фаронов, В.В. Программирование на языке C# [Текст]: монография/ В.В. Фаронов. – СПб.: Питер, 2007. – 240 с.: ил.