Смекни!
smekni.com

Курс лекций Математические методы в психологии (стр. 25 из 32)

ВНИМАНИЕ! При выборе критерия рекомендуется пользоваться АЛГОРИТМОМ 7.

Алгоритм принятия решения о выборе критерия для сопоставлений

Курс «Математические методы в психологии»

(Материалы для самостоятельного изучения студентами психологами и социальными работниками)

Лекция № 5

ОЦЕНКА ДОСТОВЕРНОСТИ СДВИГА В ЗНАЧЕНИЯХ ИССЛЕДУЕМОГО ПРИЗНАКА

Вопросы:

1. Обоснование задачи исследования изменений

2. G – критерий знаков

3. T – критерий Вилкоксона

4. Критерий Χ2r Фридмана

5. L – критерий тенденций Пейджа

6. Алгоритм принятия решения о выборе критерия оценки изменений

Вопрос 1

Обоснование задачи исследований изменений

В психологических исследованиях часто бывает важно доказать, что в результате действия каких-либо факторов произошли достоверные изменения ("сдвиги") в измеряемых показателях. К числу таких факто­ров должен быть отнесён, прежде всего, фактор времени. Сопоставление показателей, полученных у одних и тех же испытуемых по одним и тем же методикам, но в разное время, дает нам временной сдвиг.

Многократные обследования одних и тех же лиц на протяжении достаточно длительного отрезка их жизненного пути, измеряемого ино­гда десятками лет, представляет собой так называемое лонгитюдинальное исследование, суть которого хорошо известна любому представите­лю Ленинградской-Петербургской школы психологии. Этот метод по­зволяет определить генетические связи между фазами психического раз­вития и дать научно обоснованный прогноз дальнейшего психического развития (Ананьев Б.Г., 1976, с. 26-27).

Сопоставление показателей, полученных по одним и тем же мето­дикам, но в разных условиях измерения (например, "покоя" и "стресса"), дает нам ситуационный сдвиг. Условия измерения могут изменяться не только реально, но и умозрительно. Например, мы мо­жем попросить испытуемого "представить себе", что он оказался в других условиях измерения: в будущем, в позиции других людей, кото­рые оценивают его как бы со стороны, в состоянии разгневанного отца и т. п. Сопоставляя показатели, измеренные в обычных и воображае­мых условиях, мы получаем умозрительный сдвиг.

Мы можем создать специальные экспериментальные условия, предположительно влияющие на те или иные показатели, и сопоставить замеры, произведенные до и после экспериментального воздействия. Если сдвиги окажутся статистически достоверными, это позволит нам утверждать, что экспериментальные воздействия были существенными, или эффективными.

Например, мы можем сделать вывод о том, что данная програм­ма тренинга действительно способствует развитию уверенности, или что данный способ внушающего воздействия влияет на изменение отноше­ния испытуемых к той или иной проблеме, или что психодраматическая замена ролей подтверждает постулат Дж.Л. Морено о сближении по­зиции спорщиков после того, как им пришлось играть роль своего оп­понента и т.п.

Во всех этих случаях мы говорим - о сдвиге под влиянием контро­лируемых или не контролируемых воздействий. И здесь мы наталкива­емся на методическую трудность, которую оказывается возможным преодолеть только путем введения контрольной группы, которая не ис­пытывала бы на себе воздействия данного экспериментального фактора. Если нет контрольной группы, то сдвиг в экспериментальной группе может объясняться действием самых разных причин: временем суток, в которое производились замеры, важным для испытуемых событием, которое произошло между 1-м и 2-м замерами н по мощности воздей­ствия значительно перекрыло экспериментальный фактор и т. п. Мы никогда не сможем исключить той возможности, что изменения, достиг­нутые, как нам кажется, в результате наших воздействий, на самом де­ле объясняются неучтенными причинами, вот если в экспериментальной группе сдвиги окажутся достоверными, а в контрольной группе - недос­товерными, то это, действительно, может свидетельствовать об эффек­тивности воздействий. При отсутствии контрольной группы мы конста­тируем, что сдвиг произошел, но не имеем права приписать его именно данным, изучаемым нами, факторам воздействия.

Допустим, мы установили, что после того, как двум конфликтую­щим подгруппам пришлось играть роль своих оппонентов в споре, уси­лилось ощущение понимания этих оппонентов "изнутри". Но мы не можем исключить возможности, что если бы мы не проводи­ли психодраматической замены ролей, взаимопонимание все-таки бы улучшилось просто в силу того, что обе подгруппы какое-то время учи­лись и работали вместе. Бывают случаи, когда мы не располагаем контрольной группой, но зато в нашем распоряжении есть 2 или более экспериментальных, различающихся по условиям и способам воздействия на них. Это

могут быть, помимо экспериментальных, и разнообразные естественные условия жизни, обучения, работы, общения и даже питания, водоснаб­жения, географического расположения и т. д. Сопоставление групп, различающихся по этим признакам, позволит нам уточнить специфиче­ское действие экспериментальных или естественно действующих факто­ров, хотя при этом нам следует помнить, что воздействие неучтенных факторов может оказаться еще более мощным.

В выводах мы все-таки будет ограничены, если не проверили свои результаты на контрольной группе, в которой измерения произво­дились параллельно.

Помимо рассмотренных сдвигов: временных, ситуационных, умо­зрительных и сдвигов под влиянием, - можно рассмотреть еще особую категорию структурных сдвигов.

Мы можем сопоставлять между собой разные показатели одних и тех же испытуемых, если они измерены в одних и тех же единицах, по одной и той же шкале. Например, мы можем исследовать перепад ме­жду вербальным и невербальным интеллектом, измеренными по мето­дике Д. Векслера, или сопоставлять экспертные оценки эмпатичности и наблюдательности, измеренные по одинаковой 10-балльной шкале, или время решения двух задач, измеренное в секундах, или экзаменацион­ную успешность по разным дисциплинам и т.п.

В принципе, мы могли бы для такого рода "перепадов" использо­вать критерии оценки достоверности в средних тенденциях для незави­симых выборок: U - критерий, Q - критерий и угловое преобразование Фишера. Однако, строго говоря, перед нами - зависимые ряды значе­ний, поскольку они измерены на одних и тех же испытуемых, поэтому будет более обоснованным использовать критерии оценки достоверности сдвигов для связанных выборок. Исключение представляют случаи, когда мы сопоставляем величины сдвигов в двух независимых группах испытуемых, например экспериментальной и контрольной (см. Табл. 3.1). Допустим, если мы установили, что положительный сдвиг в сторону улучшения взаимопонимания наблюдается и в экспериментальной, и в контрольной группах, мы можем попробовать доказать, что в эксперимен­тальной группе этот сдвиг достоверно больше, чем в контрольной, и что, следовательно, экспериментальное воздействие все-таки существенно.

Последний важный вопрос касается того, должны ли мы всегда производить оба замера на одной и той же выборке, или "сдвиг" можно изучать на сходных, так называемых "уравновешенных" выборках, сов­падающих друг с другом по полу, возрасту, профессии и другим значи­мым для исследователя характеристикам.

В сущности, допускается сопоставление показателей разных вы­борок, уравновешенных по всем значимым для исследования признакам. Иными словами, можно уровень тревоги или объем внимания до экза­мена измерять у одной подгруппы, а после экзамена - у другой под­группы, если они "уравновешены". Опыт показывает, однако, что соз­дать "уравновешенные" подгруппы практически невозможно. Мы всегда упираемся в факт существования различий между выделенными под­группами, которые могут в значительной степени повлиять на результат. В итоге окажется, что мы исследовали не влияние экзаменационного стресса на уровень тревоги или объем внимания, а различия по этому показателю между двумя выделенными подгруппами. К сожалению, в значительной степени это относится и к проблеме сопоставления экспе­риментальной и контрольной групп: мы почти никогда не можем быть уверены, что выявленные различия объясняются действием исследуемых факторов, а не различиями между двумя выборками.

Многие исследователи обходят эту проблему самым простым об­разом: они вообще не заботятся о контрольной группе. Сдвиг есть - значит, воздействие эффективно! И действительно, при отсутствии кон­трольной выборки тоже можно порассуждать на тему о том, какими же причинами, кроме предполагаемой, могут объясняться полученные сдвиги...

Другой вариант "уравновешивания" – ведение параллельных форм теста. В тех случаях, когда на результатах повторных замеров могут сказаться эффекты научения, приходится "до" измерять реакции испытуемого с помощью одного инструмента, а "после" - с помощью другого. В результате на измерениях может отразиться и действие фак­тора времени, и различия в параллельных формах теста, и непонятно что еще. Создать параллельную форму методики не менее трудно, чем подобрать "уравновешенную" группу испытуемых. И все же, в тех слу­чаях, когда у нас нет другого выхода, приходится прибегать к этому способу.

При сопоставлении двух, замеров, про­изведенных на одной и той же (экспериментальной) выборке, применя­ются критерии знаков G и критерий Т Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же выборке, при­меняются критерий тенденций L Пейджа, а если он неприменим из-за большого объема выборок - критерий χ2r Фридмана.

В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух группах испытуемых (контрольной и экспериментальной или двух экспериментальных), мы можем использовать различные ва­рианты сопоставлений: