Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если
Построим "ось значимости".
Uэмп >Uкр
Ответ: Н0 принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.
Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков (см. Табл. 2.4).
Вопрос 4 Н - критерий Крускала-Уоллиса
Назначение критерия
Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Описание критерия
Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978). Иногда его называют критерием "суммы рангов" (Носенко И.А., 1981).
Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.
Гипотезы
H0: Между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака.
H1: Между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.
Графическое представление критерия Н
Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 2.6 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 2.6 (б)), то различия между выборками оказываются недостоверными.
Рис. 2.6. 2 возможных варианта соотношения рядов значений в трех выборках; штриховкой отмечены зоны наложения
Ограничения критерия Н
При сопоставлении 3-х выборок допускается, чтобы в одной из них n=3, а двух других п=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (Р≤0,05).
Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.
Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица предусмотрена только для трех выборок и (n1, n2, n3)≤5.
При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия X2, поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению X2 (Носенко И.А., 1981; J. Greene, M. DOlivera, 1982).
Количество степеней свободы при этом определяется по формуле: v=c-l где с - количество сопоставляемых выборок.
3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½*[c*(c-1)]*1. Для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ*.Пример
В эксперименте по исследованию интеллектуальной настойчивости (Е.В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в Табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.
Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?
Таблица 2.5
Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)
Группа 1: анаграмма ФОЛИТОН (n1=4) | Группа 2: анаграмма КАМУСТО (n2=8) | Группа 3: анаграмма СНЕРАКО (n3=6) | Группа 4: анаграмма ГРУТОСИЛ (n4=4) | |
1 | 145 | 145 | 128 | 60 |
2 | 194 | 210 | 283 | 2361 |
3 | 731 | 236 | 469 | 2416 |
4 | 1200 | 385 | 482 | 3600 |
5 | 720 | 1678 | ||
б | 848 | 2081 | ||
7 | 905 | |||
8 | 1080 | |||
Сум-мы | 2270 | 4549 | 5121 | 8437 |
Сред-ние | 568 | 566 | 854 | 2109 |
Сформулируем гипотезы.
Н0: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.
H1: 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток нх решения.
Теперь познакомимся с алгоритмом расчетов.
АЛГОРИТМ 5
Подсчет критерия Н Крускала-Уоллиса
1.Перенести все показатели испытуемых на индивидуальные карточки.
2.Пометить карточки испытуемых группы 1 определенным цветом, например, красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым к желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)
3.Разложить все карточки в единый ряд по степени нарастания признака, несчитаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.
4.Проранжкровать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.
5.Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.
6.Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.
7.Подсчитать значение критерия Н по формуле:
где N- общее количество испытуемых в объединенной выборке;
п - количество испытуемых в каждой группе;
Т- суммы рангов по каждой группе.
8а. При количестве групп с=3, n1,n2,n3 ≤5, определить критические значения и соответствующий им уровень значимости по Табл. IV Приложения 1.
Если Нэмп равен или превышает критическое значение H0,05 H0 отвергается.
'с - количество выборок.
8б. При количестве групп с>3 или количестве испытуемых n1,n2,n3 ≤5определить критические значения χ2 по Табл. IX Приложения 1.
Если Нэмп равен или превышает критическое значение χ2 , Но отвергается.
Воспользуемся этим алгоритмом при решении задачи о неразрешимых анаграммах. Результаты работы по 1-6 шагам алгоритма представлены в Табл. 2.6.
Таблица 2.6
Подсчет ранговых сумм по группам испытуемых, работавших над четырьмя неразрешимыми анаграммами
Группа 1: анаграмма ФОЛИТОН (n1=4) | Группа 2: анаграмма КАМУСТО (n2=8) | Группа 3: анаграмма СНЕРАКО (n3=6) | Группа 4: анаграмма ГРУТОСИЛ (n4=4) | |||||||||
Длитель-ность | Ранг | Длитель-ность | Ранг | Длительность | Ранг | Длитель-ность | Ранг | |||||
60 | 1 | |||||||||||
128 | 2 | |||||||||||
145 | 3.5 | 145 | 3.5 | |||||||||
194 | 5 | |||||||||||
210 | 6 | |||||||||||
236 | 7 | |||||||||||
283 | 8 | |||||||||||
385 | 9 | |||||||||||
469 | 10 | |||||||||||
482 | 11 | |||||||||||
720 | 12 | |||||||||||
731 | 13 | |||||||||||
848 | 14 | |||||||||||
905 | 15 | |||||||||||
1080 | 16 | |||||||||||
1200 | 17 | |||||||||||
1678 | 18 | |||||||||||
2081 | 19 | |||||||||||
2361 | 20 | |||||||||||
2416 | 21 | |||||||||||
3600 | 22 | |||||||||||
Суммы | 38,5 | 82,5 | 68 | 64 | ||||||||
Средние | 9.6 | 10,3 | 11.3 | 16,0 |
Общая сумма рангов =38,5+82,5+68+64=253.