При работе с порядковыми данными 1 используют такие непараметрические тесты, как тест U (Манна-Уитни) и тест Т Вилкоксона, Тест U позволяет проверить, существует ли достоверная разница между двумя независимыми выборками после того, как сгруппированные данные этих выборок классифицируются и ранжируются и вычисляется сумма рангов для каждой выборки. Что же касается критерия Т, то он используется для зависимых выборок и основан как на ранжировании, так и на знаке различий между каждой парой данных.
Чтобы показать применение этих критериев на примерах, потребовалось бы слишком много места. При желании читатель может подробнее ознакомиться с ними по специальным пособиям.
1 Такие дачные чаще всего получаются при ранжировании количественных данных, которые нельзя обработать с помощью параметрических тестов.
it и обработка данных
307
-
Корреляционный анализ
При изучении корреляций стараются установить, существует ли какая-то связь между двумя показателями в одной выборке (например* между ростом и весом детей или между уровнем IQ и школьной успеваемостью) либо между двумя различными выборками (например, при сравнении пар близнецов), и если эта связь существует, то сопровождается ли увеличение одного показателя возрастанием (положительная корреляция) или уменьшением (отрицательная корреляция) другого.
Иными словами, корреляционный анализ помогает устанойить, можно ли предсказывать возможные значения одного показателя, зная величину другого.
До сих пор при анализе результатов нашего опыта по изучению действия марихуаны мы сознательно игнорировали такой показатель, как время реакции. Между тем было бы интересно проверить, существует ли связь между эффективностью реакций и их быстротой. Это позволило бы, например, утверждать, что чем человек медлительнее» тем точнее и эффективнее будут его действия и наоборот.
С этой целью можно использовать два разных способа: параметрический метод расчета коэффициента Браве - Пирсона (г) и вычисление коэффициента корреляции рангов Спирмена (rj, который применяется к порядковым данным, т.е. является непараметрическим» Однако разберемся сначала в том, что такое коэффициент корреляции.
*
Коэффициент корреляции
Коэффициент корреляции - это величина, которая может варьировать в пределах от +1 до — L В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной-минус L На графике этому соответствует прямая линия, проходящая через точки пересечения значений каждой пары данных:
Переменная I
А '
Переменная В
Полная положительная корреляция [г = +1)
20'
308
Приложение
В случае же если эти точки не выстраиваются по прямой линии, а образуют «облако», коэффициент корреляции по абсолютной величине становится меньше единицы и по мере округления этого облака приближается к нулю:
В случае если коэффициент корреляции равен 0, обе переменные полностью независимы друг от друга,
В гуманитарных науках корреляция считается сильной, если ее коэффициент выше 0,60; если же он превышает 0,90, то корреляция считается очень сильной. Однако для того, чтобы можно было делать выводы о связях между переменными, большое значение имеет объем выборки: чем выборка больше, тем достовернее величина полученного коэффициента корреляции. Существуют таблицы с критическими значениями коэффициента корреляции Браве-Пирсона и Спирмена для разного числа степеней свободы (оно равно числу пар за вычетом 2, т. е. п — 2). Лишь в том случае> если коэффициенты корреляции больше этих критических значений, они могут считаться достоверными. Так, для того чтобы коэффициент корреляции 0,70 был достоверным, в анализ должно быть взято не меньше 8 пар данных
при вычисленииг (табл. В.4) и 7 пар данных
при вычислении (табл5 в дополнении Б,5).
С тиши-тика и /юраоотка thin пых 30Q
Коэффициент Браве-Пирсона
Для вычисления этого коэффициента применяют следующую формулу (у разных авторов она может выглядеть по-разному):
где
-сумма произведений данных из каждой пары;п - число пар;
-средняя для данных переменной X; -средняя для данных переменной У; -стандартное отклонение Для распределения х; -стандартное отклонение для распределения у. Теперь мы можем использовать этот коэффициент для того, чтобы установить, существует ли связь между временем реакции испытуемых и эффективностью их действий. Возьмем, например, фоновый уровень контрольной группы.Д1 | 19 | 8 | 152 |
Д2 | 10 | 15 | 150 |
ДЗ 1 г К>8 | 12 1 22 | 13 г 14 | 156 308 |
Отрицательное значение коэффициента корреляции может означать, что чем больше время реакция, тем ниже эффективность. Однако величина его слишком мала для того, чтобы можно было говорить о достоверной связи между этим двумя переменными.
Теперь попробуйте самостоятельно подсчитать коэффициент корреляции для экспериментальной группы после воздействия, зная, что
j j -.40 Приложение Ь
Какой вывод можно сделать из этил результатов? Если вы считаете, что между переменными есть связь, то какова она-прямая или обратная? Достоверна ли она [см. табл. 4 (в дополнении Б. 5) с критическими значениями г]?
Коэффициент корреляции рангов Спнрмена rs
Этот коэффициент рассчитывать проще, однако результаты получаются менее точными, чем при использовании г, Это связано с тем, что при вычислении коэффициента Спирмена используют порядок следования данных, а не их количественные характеристики и интервалы между классами.
Дело в том, что при использовании коэффициента корреляции рангов Спирмена (г,) проверяют только, будет ли ранжирование данных для какой-либо выборки таким же, как и в ряду других данных для этой выборки, попарно связанных с первыми (например, будут ли одинаково «ранжироваться» студенты при прохождении ими как психологии, так и математики, или даже при двух разных преподавателях психологии?). Если коэффициент близок к + 1, то это означает, что оба ряда практически совпадают, а если этот коэффициент близок к — 1, можно говорить о полной обратной зависимости.
Коэффициент rs вычисляют по формуле
где d- разность между рангами сопряженных значений признаков (независимо от ее знака), а п- число пар.
Обычно этот непараметрический тест используется в тех случаях, когда нужно сделать какие-то выводы не столько об интервалах между данными, сколько об их рангах, а также тогда, когда кривые распределения слишком асимметричны и не позволяют использовать такие параметрические критерии, как коэффициент г (в этих случаях бывает необходимо превратить количественные данные в порядковые).
Поскольку именно так обстоит дело с распределением значений эффективности и времени реакции в экспериментальной группе после воздействия, можно повторить расчеты,'которые вы уже проделали для этой группы, только теперь не для коэффициента г, а для показателя rF Это позволит посмотреть, насколько различаются эти два показателя.
Cniwrntcnmtcti if оораштгка ошшых
?М
Испыту- | Эффек- | Время | Ранга | Ранги | d | d* |
емые | тивность | реакции | X* | У* | ||
.V | у | |||||
Д8 | 8 | 17 | 12 | 5 | . 7 | 49 |
Д9 | 20 | 13 | L | 2 | ] | 1 |
Д ю | 6 | 20 | 15 | 11,5 | 3,5 | 12,25 |
Д и | 8 | 18 | 12 | 7,5 | 4,5 | 20,25 |
Д 12 | 17 | 21 | 2 | 13,5 | 11,5 | 132,25 |
Д 13 | 10 | 22 | 8,5 | 15 | 6,5 | 42,25 |
Д 14 | 10 | 19 | 8,5 | 9,5 | 1 | 1 |
Ю9 | 9 | 20 | 10 | 1,5 | 2,25 | |
Ю 10 | .7 | 17 | 14 | 5 | 9 | 81 |
Д 11 | 8 | 19 | 12 | 9,5 | 2,5 | 6,25 |
Ю 12 | 14 | 14 | 4 | 3 | 1 | I |
Ю 13 | 13 | 12 | 5 | 1 | 4 | 16 |
Ю 14 | 16 | 18 | 3 | 7,5 | 4,5 | 20,25 |
Ю 15 | 11 | 21 | 7 | 13,5 | 6,5 | 42,25 |
Ю 16 | 12 | 17 | 6 | 5 | 1 | 1 |
428 . |
* Следует помнить, что