Смекни!
smekni.com

Психофизические шкалы (стр. 34 из 34)

Шкалы наименований
Добавлено Psychology OnLine.Net

Печать
Обсудить (0)
Жалоба

I. ШКАЛЫ НАИМЕНОВАНИЙ

Они получаются при применении самого общего и наиболее слабого из методов, позволяющих приписывать числа вещам, и употребление слова «измерение» на этом уровне может быть оправдано лишь в том случае, если придавать этому слову самое общее значение. Однако они довольно часто позволяют произвести числовую обработку психологических наблюдений, и поэтому следует упомянуть их наряду с другими методами, дающими возможность произвести ту же обработку, исходя из более специфических правил.
§ 1. Экспериментальные условия

Для того чтобы построить и использовать шкалу наименований, экспериментатор должен быть в состоянии расклассифицировать свои данные, то есть экспериментально установить отношение равномерности, позволяющее ему распределить пол ученные данные в определенное число «дизъюнктных» классов: каждый результат должен найти свое место в одном и только одном классе. Это условие предполагает, во-первых, чтобы полученные данные были отделены друг от друга, как элементы одной какой-то совокупности, и, во-вторых, чтобы был найден экспериментальный критерий, позволяющий отнести каждый результат к определенному классу. Приведем несколько примеров.

В ходе определения порога тактильного различения с помощью эстезиометра Мануврие (Фресс, 1956, стр. 96) элементами, подлежащими классификации, являются ответы испытуемого. При этом пользуются двумя классами: «Ощущение двух точек» и «Отсутствие ощущения двух точек». Такой ответ, как «сомнительно», показал бы несостоятельность предложенного критерия ж потребовал бы внести изменение в организацию эксперимента: поэтому либо испытуемому дается инструкция пользоваться только одним из двух первоначальных ответов, либо — и чаще всего — принимаются три класса. Оказывается, что в этом примере класс «отсутствие ощущения двух точек» по существу не охватывает всех ответов, отличающихся от ответа «я ощущаю две точки». Поэтому возникает необходимость посредством самой организации эксперимента (в данном случае — посредством инструкции, даваемой испытуемому) ограничить число возможных ответов. Можно сделать классификацию более тонкой, подразделяя соответственно каждый из ее классов. Так, если испытуемого просят сравнивать переменный стимул с каким-то фиксированным стимулом, можно разрешить ему пользоваться только одной из трех категорий ответов: «Меньше», «Равный», «Больше». Можно, однако, сделать классификацию более тонкой, если подразделить первый класс на два подкласса: «Меньше» и «Может быть меньше», и точно так же поступить в отношении третьего класса.

Менее тонкая классификация достигается с помощью противоположного приема или введения особого условия, определяемого природой наблюдений. Например, можно отказаться от класса «Может быть меньше», условясь относить половину таких ответов к классу «Меньше» и половину к классу «Равный».
Предыдущие примеры показывают, что классификация может становиться более тонкой только при изменении условий эксперимента, тогда как объединение нескольких классов в один класс может производиться либо на экспериментальной стадии, либо на стадии количественной обработки результатов. Из этого, по-видимому, следует, что мы всегда заинтересованы в применении как можно более тонкой классификации. В действительности, хотя в общем следует придерживаться этого правила, нельзя забывать и о других соображениях. Достижение таких условий эксперимента, которые привели бы к наилучшей классификации, является дорогостоящим делом в буквальном смысле этого слова, экспериментатор же всегда должен распределять свои средства в зависимости от всей стратегии своего плана работы, а не руководствоваться только наибольшей точностью измерения в ущерб остальному. Может случиться, например, что большее число сравнительно грубых измерений будет полезнее, нежели небольшое число очень тонких измерений. Более того, во многих случаях, когда экспериментальная операция, служащая основанием для измерения, состоит в классифицировании стимулов наблюдателем, увеличение числа классов, предлагаемых наблюдателю, не влечет за собой бесконечного увеличения информации, которую последний может передать: увеличивающиеся ошибки сводят на нет преимущество, которое можно было ожидать от более тонкой классификации. Для определения оптимального числа классов можно воспользоваться понятием «эквивалентного числа», заимствованным из теории информации (Фаверж, 1953, стр. 468—469). Мы снова вернемся к проблеме тонкости классификации на экспериментальной стадии, после того как приведем несколько других примеров, цель которых — лучше проиллюстрировать трудности, возникающие при различении классифицируемых элементов и определении критериев классификации.

Шкалы наименований часто применяются для количественного анализа клинических бесед между психологом и испытуемым, и мы найдем многочисленные примеры тому в критическом обзоре Ж. Камбона (1955). Элементом, подлежащим классификации, в данном случае может быть фрагмент речи одного индивида, заключенный между двумя высказываниями другого, либо «обмен», то есть высказывание психолога, сопровождаемое ответом испытуемого. Высказывания испытуемого могут быть расклассифицированы в такие категории, как «прекращение или продолжение изучения самого себя», «осознание ситуации» и т. д.; высказывания психолога — в категории: «интерпретации», «объяснения», «переформулирования» и т. д. Такие классификации облегчает подробная регистрация и запись каждой беседы.

Вычленение элементов, подлежащих классификации, может быть более трудным в экспериментах, где объектом наблюдения является поведение индивидов, например в ходе применения индивидуальных тестов (Рёшлен, 1950). В таком случае в поведении испытуемого следует выделить некоторое число действий, то есть фаз поведения, единый характер которых устанавливается тем, что два независимых наблюдателя одновременно отмечают их появление: например, «задает вопрос», «роняет предмет», «ставит предмет на место» и т. д. Каждый из этих признаков составляет шкалу наименований с двумя классами: наличие действия или его отсутствие.

Аналогичным образом можно анализировать и классифицировать наблюдения, произведенные над больными. Однако, когда этот анализ производится по истории болезни больных (Ваше, Рёшлен, 1956), можно допустить, что если какой-либо признак не отмечен в истории болезни, то это означает, что он отсутствует у больного, а в этом нельзя быть вполне уверенным.

В некоторых психологических исследованиях часто принимается во внимание профессия испытуемых или, если речь идет о детях, профессия их отца. Эта информация может быть использована только через посредство шкал наименований, применение которых довольно затруднительно. В самом деле, с одной стороны, обиходная терминология в этой области весьма неточна и такой термин, как, например, «механик», может относиться к самым различным занятиям. Это первое затруднение может быть устранено лишь при условии получения от испытуемого достаточно подробного описания его действительной деятельности. С другой стороны, эта деятельность всегда имеет многочисленные аспекты, которые могут привести к многочисленным системам классификации, из которых каждая может быть более или менее тонкой.

(По социо-профессиональным категориям: земледельцы, сельскохозяйственные рабочие, хозяева, представители свободных профессий, а также высшие кадры, средние кадры, служащие и т. д.; по категориям общественной деятельности: сельское и лесное хозяйство, добывающая промышленность, строительство и общественные работы, транспорт, торговля и т. д.; по положению: независимые ненаемные, предприниматели, люди, пользующиеся помощью семьи, ученики, надомники и т. д. (по данным Государственного института статистики и экономических исследований).

Очевидно, следует выбрать такую систему классификации, при которой можно с большим основанием надеяться, что она представляет какой-то интерес с точки зрения изучаемой психологической проблемы, и с этой точки зрения уровень квалификации испытуемого или сфера его деятельности, например, не могут быть безразличны. Более того, интересно использовать уже примененную в других исследованиях классификацию или классификацию, для которой можно воспользоваться статистическими данными, полученными в результате общей переписи населения, как, например, классификацию Государственного института статистики и экономических исследований.

Проблема степени тонкости шкалы наименований может быть рассмотрена теперь, исходя из большего числа аспектов. В ходе создания подобной шкалы часто возникает необходимость, с одной стороны, подразделять некоторые первоначально предусмотренные классы, а с другой стороны, объединять ряд других классов.

(Совокупность возможных классификаций составляет, таким образом, с точки зрения их тонкости упорядоченную по частям совокупность, treillis (решетку) (Фаверж, 1959): можно составить, с одной стороны, классификацию, по крайней мере столь же тонкую, как самая тонкая (если брать классы после их подразделения и до их объединения), а с другой стороны, классификацию, по крайней мере столь же грубую, как наиболее грубая.)

Эти подразделения и объединения диктуются двумя типами соображений.
Одни из них касаются возможностей используемого средства наблюдения и стоимости его применения: обычно отказываются от подразделения признаков поведения, относительно которых два наблюдателя не могут прийти к соглашению; а также от подразделения шкалы профессий, которое потребовало бы дополнительного опроса нанимателей каждого субъекта. Другие соображения, быть может, наиболее важные, касаются содержания информации, которую стараются таким образом получить. Это соображения двоякого рода.
С одной стороны, нужно иметь в виду, что в большинстве случаев уровень точности классификации не может быть изменен без того, чтобы это не повлекло за собой непременного изменения в содержании информации, которая становится не только более или менее точной, но и совершенно иной. Подразделяя такой признак поведения, как «задает вопрос», на «вопросы, относящиеся к пониманию инструкций» и «вопросы, относящиеся к значению полученного результата», мы вводим не более точный способ учета вопросов, а совершенно новое измерение в анализе.

С другой стороны, часто трудно использовать такую классификацию, которая не была бы связана со многими другими. Классифицировать испытуемых по их профессии — это значит также различать их в среднем по уровню культуры, уровню жизни, продолжительности и характеру досуга и т. д. Слова, употребляемые для обозначения классов, не должны в таком случае вводить в заблуждение: названия профессиональной деятельности в приведенном примере должны пониматься как символы, значение которых не может быть ограничено тем значением, какое они имеют в обычном языке. Этот недостаток может быть устранен или смягчен в некоторых случаях путем более строгого определения условий наблюдения и «измерения». В других случаях экспериментальный анализ может быть дополнен последующей обработкой полученных в результате его чисел по заранее намеченному плану, делающему эту обработку возможной. Это замечание, относящееся не только к шкалам наименований, подводит нас, в частности, к рассмотрению вопроса о том, какие же свойства чисел эти шкалы позволяют приписывать вещам.

§ 2. Свойства чисел

Числа, случайно примененные для обозначения классов, обладают только одним свойством — быть отличными друг от друга, и вполне очевидно, что в данном случае пользуются не ими. Все виды числовой обработки, основанные на шкалах наименований, касаются упорядоченных в каждом классе чисел наблюдений или их состава. Методы, применяемые в ходе этой обработки, называются иногда «статистикой качественных признаков» (Юл и Кендэл, 1949, гл. I—V).

Поскольку никакая экспериментальная операция не устанавливает порядка между классами, по-видимому, нет смысла рассматривать состав классов в каком-то особом порядке. Следовательно, можно ограничиться изучением формы гистограммы, представляющей распределение признаков, остающихся верными при любом перемещении классов. По тем же причинам статистические меры, основанные на ранге, например медиана, в данном случае лишены какого бы то ни было смысла. Это с еще большим основанием относится к статистическим мерам, основанным на понятии отклонения, разницы между двумя измерениями, таким, как среднее арифметическое или стандартное отклонение.

Зато можно определить, какой класс имеет самый большой состав, и назвать этот класс модой распределения. В данном случае мы сможем говорить о моде, являющейся статистической мерой «центральной тенденции», лишь употребляя это выражение в широком и несколько необычном смысле, ибо распределение этого типа фактически не имеет «центра», поскольку эти классы не являются упорядоченными. Если предположить, что мы продолжаем наблюдения, не изменяя условий, в которых проводились наблюдения, приведшие к данному распределению, то мода будет представлять наблюдения, которые можно ожидать с максимальной вероятностью.

При такой гипотезе неопределенность в отношении класса, к которому будет относиться будущее наблюдение, зависит только от числа классов и их состава и может быть, следовательно, установлена. Речь идет об энтропии распределения в том смысле, в каком употребляется этот термин в теории информации Шеннона и Уивера (1949), с которой психолог сможет познакомиться благодаря публикациям Фавержа (особенно 1953 и 1954 б). Энтропия определяет дисперсию в самом широком смысле слова. Она возрастает вместе с числом классов, и для данного числа классов максима льна, когда все они обладают равным числом элементов. Следовательно, сразу видно, что она варьирует, как и неопределенность суждения наблюдателя в отношении будущего стимула, то есть стимула, который ему предстоит воспринять. Однако можно сказать, что количество информации, приносимое наблюдением, тем больше, чем больше предшествующая неопределенность суждения наблюдателя. Отсюда эта внешне парадоксальная ассимиляция между неопределенностью и информацией: энтропия какого-нибудь распределения наблюдений измеряет среднее количество информации, приносимой каждым из них. Понятием энтропии широко пользуются, в частности, проводя эксперименты в области речи. Несколько примеров этого мы найдем в критическом обзоре Брессона (1954). Таким же образом можно, вероятно, определять абсолютный порог как величину стимула, для которой энтропия распределения ответов (распределенных в два класса: «воспринимаемый стимул» и «невоспринимаемый стимул») является наибольшей.

Если для классификации одной и той же совокупности экспериментальных данных в соответствии с двумя различными шкалами наименований применялись два различных экспериментальных критерия, то количественная обработка результатов этих «измерений» позволит узнать, зависимы ли друг от друга эти два экспериментальных критерия или нет.

Мы скажем, например, что выбор профессии детьми и занятие их отцов независимы друг от друга, если выбор детей распределяется в той же пропорции в различные классы по профессиям, как это было у их отцов. Такая статистическая мера, как х2., позволит определить, достаточно ли действительное распределение наблюдений отклоняется от этого теоретического распределения, от этой модели, чтобы можно было без излишнего риска ошибки отбросить таким образом сформулированную гипотезу о независимости друг от друга этих признаков. Именно таким образом и определяют в вышеприведенных примерах, какие признаки поведения и какие симптомы связаны друг с другом.

Вот пример, в котором хи-квадрат используется с этой целью (Рёшлен, 1960). Наблюдатель отмечает для каждого испытуемого из группы, состоящей из 97 испытуемых, число случаев, когда в ходе выполнения какого-нибудь теста возникают такие действия, как «задает вопрос», «действует сразу» и т. д., каждое из которых было объектом предварительного эксплицитного определения. Частоты появления каждого признака группируются в два класса, выбранных с таким расчетом, чтобы они содержали как можно более близкие количества испытуемых. Например, в отношении признака «задает вопрос» один класс состоял из 47 испытуемых, не задавших ни одного вопроса, а другой — из 50 испытуемых, задавших один, два, три или семь вопросов. Для каждой пары признаков можно, следовательно, составить таблицу сопряженности 2 х 2, и независимость друг от друга этих двух таким образом дихотомизированных признаков проверяется критерием хи-квадрат.

Однако ясно, что в данном примере применение дихотомии не обязательно. Оно объясняется явным желанием подумать о направлении связи между двумя признаками, понятии, которое может потерять весь свой смысл, если таблица сопряженности больше, чем 2x2. Более того, если приходят к решению дихотомизировать шкалу, то это можно, вероятно, сделать многими другими способами, каждый из которых соответствовал бы другой величине.
В других случаях дихотомия имеет менее произвольный характер. Так обстоит дело, например, когда врач, обследующий больного, отмечает наличие или отсутствие того или иного симптома (Ваше и Рёшлен, 1956).

Поэтому можно утверждать, что выбор профессии детьми и занятие их отцов независимы друг от друга, если неопределенность суждения психолога в отношении профессии, которая будет выбрана ребенком, остается в среднем такой же независимо от того, знает он или не знает профессию отца. Понятно, что сравнение мер энтропии, произведенное при обеих гипотезах, позволит узнать, независимы ли эти две шкалы в этом смысле. Если они не являются независимыми, мы скажем, что некоторое количество информации передается от одной шкалы к другой, то есть от одной системы наблюдения к другой. Количество переданной информации R составляет определенную меру степени связи между двумя делениями, «коэффициент сопряженности» (Фаверж, 1959), наряду с другими возможными.

(Выражение «коэффициент сопряженности», употребляемое без всякого-определения, в общем применимо к коэффициенту С К. Пирсона или к среднеквадратичному коэффициенту сопряженности (Юл и Кендэл, 1949, стр. 68).

Переданное количество информации использовалось в экспериментах по изучению речи, обучения или в совсем иной области психологии: при анализе информации, приносимой изучением испытуемых с целью их профессиональной ориентации и включающей самые различные наблюдения (Ваше, 1957) и т. д.
В этой последней работе таблицы сопряженности составлены между большим числом шкал наименований, взятых попарно. Вот два примера:

Прошлая школьная жизнь (с точки зрения нарушений)
а) Учеба в одной и той же начальной школе, отсутствие длительных или частых пропусков занятий;
б) несколько смен школы (по крайней мере трех). Определенная нерегулярность посещаемости;
в) многочисленные смены школ, перемена местожительстваt продолжительное отсутствие (в несколько месяцев), значительная нерегулярность посещения (ежемесячные пропуски).

Молодежные группы
а) Принадлежит к одной какой-нибудь группе (скаутской группе, клубу, благотворительному обществу);
б) принадлежал к какой-то группе в прошлом и не принадлежит к ней в настоящее время;
в) никогда не принадлежал ни к какой группе.
Мы видим, что шкалы, используемые в данном случае, фактически являются шкалами порядка. С ними обращаются как со шкалами наименований, так как для некоторых наблюдений не может быть установлено отношение порядка. Более того, отметим, что таблицысопряженности превосходят размер 2 X 2, а это влечет за собой необходимость поклеточного описания расхождений между наблюдаемым составом и теоретическим составом для интерпретации констатируемых связей.

Большим преимуществом применения переданного количества информации R перед хи-квадрат является в данном случае краткость вычислений. В самом деле, если N — общее число наблюдений, то вычисление NR требует лишь подсчета суммы чисел, взятых в таблице, n log2 n, суммы, состоящей из такого числа слагаемых, сколько членов содержится в таблице сопряженности (включая крайние члены и общий состав), то есть 16 членов для двух переменных в данном примере.

Никогда не следует упускать из виду соотношения, которое устанавливается между экспериментальными операциями, использованными для осуществления классификации, с одной стороны, и значением результатов, полученных в итоге количественной обработки,— с другой.

Оно поможет понять, например, вариацию измерения сопряженности между двумя делениями, когда тонкость делений варьирует,— свойство, отмеченное Фавержем (1959). Следует попытаться сопоставить эти вариации, поскольку в большинстве случаев деление может быть сделано более тонким лишь посредством введения таких экспериментальных критериев, которые по своему характеру отличаются от ранее применявшихся. Именно в этом смысле следует понимать рекомендацию Юла и Кендэла (1949, стр. 74—75) говорить о связях и сопряженности только применительно к гомогенным классификациям, то есть таким классификациям, в которых тонкость деления достигается путем применения всегда одного и того же принципа подразделения ко всем классам одного какого-то уровня.

В общем, можно сказать, что именно это соотношение позволит понять, что числа, приписываемые вещам с помощью правил, столь общих, сколь правила, применяемые на этом уровне, могут дать лишь недостаточно специфические ответы на вопросы, которые хотят решить с помощью таких способов «измерения». Так, переданное количество информации R позволяет узнать, уменьшается ли в среднем неопределенность суждения психолога в отношении профессии; избираемой ребенком, если ему известна профессия его отца. Однако психолог, обладающий только этим количеством информации R, не может сказать, является ли дисперсия выборов детей, отец которых имеет такую-то конкретную профессию, более слабой или менее слабой, чем общая дисперсия выбора; он также не в состоянии сказать, какая профессия чаще всего выбирается этим особым классом детей. Ответ на эти вопросы требует дополнительного анализа таблицы частот. Напротив, достаточно знать коэффициент нормальной корреляции г, вычисленный в надлежащих условиях между двумя шкалами интервалов, чтобы узнать среднее арифметическое и стандартное отклонение измерений, осуществленных на одной из этих шкал для всех элементов, имеющих данное значение на другой.

Это сравнение показывает границы, свойственные «слабым», недостаточно специфическим моделям, и объясняет стремление психолога пользоваться в некоторых случаях шкалами измерения, более сильными, чем шкалы наименований.