Смекни!
smekni.com

Когнитивная наука Основы психологии познания том 2 Величковский Б М (стр. 4 из 118)


«Язык и восприятие» Джордж Миллер и Филипп Джонсон-Лэйрд (Miller & Johnson-Laird, 1976), систематически соотнесены с глаголами, описы­вающими различные формы механических взаимодействий объектов.

Другим достоинством процедурной семантики является то, что поня­тия трактуются здесь не только как конъюнктивные, но и как дизъюнктив­ные сочетания исходов перцептивных и когнитивных операций. Дан­ный подход может быть распространен на понятия, отдельные представители которых не имеют инвариантного — необходимого и до­статочного — набора признаков. Классическим примером служит по­нятие «игра», включающее «детские игры», «Олимпийские игры», «карточные игры», «игры животных», «игры в мяч» и т.д. (этот пример предложен знаменитым австрийским логиком, философом и лингвис­том Л. Витгенштейном — см. 6.2.2). Любопытно, что усилия и реальные достижения процедурной семантики фактически связаны с разработкой референтной теории значения, под знаком критики которой сто лет на­зад создавалась современная формальная логика. Дальнейшее развитие этого подхода могло бы помочь распространить процедурные описания, используемые главным образом при изучении восприятия и сенсомотор-ных координации, на семантическую память. В конце этого раздела мы рассмотрим некоторые новые нейропсихологические данные, которые говорят о возможности такого обобщенного использования процедур­ной интерпретации.

Имплицитное знание представляет собой серьезную проблему с точки зрения более традиционных семантических подходов, ориенти­рующихся на формальную логику. Дело в том, что в логической семан­тике критерии выделения понятий («семантические компоненты», «по­стулаты значения» и т.д.) обычно задаются в явном, эксплицитном виде. В последние годы в когнитивных исследованиях возникли и, от­части, уже получили значительное распространение новые междисцип­линарных подходы, ведущие к построению математических моделей, в которых имплицитное знание неожиданно получает достаточно есте­ственную интерпретацию.

Первый тип современных моделей, возникший в 1980-е годы в нейроинформатике и части когнитивных наук, основан на использова­нии различных вариантов неоднократно упоминавшихся выше искус­ственных нейронных сетей. Они отличаются от семантических сетей, ис­пользуемых в традиционной когнитивной психологии и в работах по искусственному интеллекту, гомогенностью связей между узлами и, са­мое главное, способностью к простым формам обучения (рис. 6.2). Пу­тем целенаправленного обучения сети (например, с помощью метода обратного распространения ошибки — см. 2.3.3) часто удается добиться довольно полного соответствия предсказаний этих моделей данным психологических экспериментов и нейропсихологических наблюдений. Нейронные сети демонстрируют категоризацию стимульных ситуаций, способность правильно «узнавать» слегка измененные варианты вы-18 ученных ранее понятий, а также разнообразные ассоциативные эффек-



добрый большой живой С1 зеленый красный желтый

ISA есть может имеет

живое существо

растение

животное

дерево

цветок

птица

рыба

сосна

дуб

роза

астра

дятел

канарейка

карась

лосось


живое существо

растение

животное

дерево

цветок

птица

рыба

растет

движется

плавает

летает

поет

лай

ветки

лепестки

крылья

перья

размеры

жабры

листья

корни

кожа


Рис. 6.2. Нейронная сеть, репрезентирующая понятия в семантической памяти (по: McClelland, 2000).


ты типа семантического прайминга. Знание представлено в моделях нейронных сетей в неявном, «субсимвольном» виде, а именно как со­вокупность градуально меняющихся в ходе обучения порогов актива­ции отдельных формальных нейронов и всей сети в целом.

Другой подход, представленный латентным семантическим анали­зом (LSA Latent Semantic Analysis) и гиперпространственным аналогом языка (HAL — Hyperspace Analogue to Language), возник в вычислительной лингвистике и разделе информатики, занимающемся базами данных. Этот подход имеет эмпирический характер, хотя он и не был связан пер­воначально с психологическими исследованиями. Исходным материа­лом при подобном анализе становятся разнообразные тексты. Модели значения слов строятся на базе компьютерной обработки огромных массивов текстов (подборок газет, энциклопедий, протоколов парла­ментских слушаний), обычно включающих не менее десятка миллионов слов. При этой обработке изначально учитывается только близость слов друг другу в линейной развертке текста (Landauer & Dumais, 1997). По сути дела, речь идет о построении базы данных ассоциативных связей


19


слов с учетом их непосредственного словесного окружения. Матрицы близости слов обрабатываются с помощью факторного анализа, после чего значение слова описывается как вектор в пространстве нескольких сотен (как правило, порядка 300) далее неспецифируемых, то есть в из­вестном смысле имплицитных измерений.

Без всякой подгонки параметров, характерной для нейронных сетей, эти более или менее «вслепую» построенные модели демонстрируют ин­тересные результаты, такие как предсказание величины прайминг-эф-фектов, а также успешности метафорического сравнения понятий (мета­форические сравнения, например, «Наш начальник — акула», особенно проблематичны для моделей дискретных семантических маркеров — см. 7.4.2).

Следует отметить, что эти многомерные пространственные модели выявляют не только общее семантическое сходство разных слов (напри­мер, «улица», «дорога» и «путь»), но и близость грамматических форм одного и того же слова между собой («путь», «пути», «путем» и т.д.), хотя, как легко понять, такие грамматические формы практически никогда не встречаются рядом внутри одного предложения5. Причина этого послед­него эффекта состоит в том, что оценка сходства слов при латентном семантическом анализе осуществляется посредством вычисления гло­бального сходства контекстов во всем массиве текстов, Если эти новые данные получат подтверждение в дальнейших исследованиях, то это мо­жет означать необходимость возвращения к дискуссиям, сопровождав­шим возникновение когнитивного подхода (см. 1.3.3 и 7.3.1), поскольку возможность выделения грамматических форм и правил на базе инфор­мации о линейной близости слов в предложении изначально отрицалась генеративной грамматикой.

Еще один, совсем новый, но, судя по всему, перспективный подход основан на использовании для представления знаний геометрических моделей, восходящих к работам великого русского математика Николая Ивановича Лобачевского (1792—1856). Отказавшись от 5-го постулата Евклида («Через точку, лежащую вне прямой, можно провести одну и только одну параллельную ей линию»), он открыл возможность рассмот­рения геометрии на поверхности стягивающихся в точку или, например, гиперболически расширяющихся тел. Если в начале 20-го века была об­наружена полезность этих моделей для описания связанных с теорией относительности космогенических представлений, то начало 21-го века демонстрирует их применимость в области когнитивных исследований, а именно при моделировании концептуальных структур. Иллюстратив­ный пример приведен на рис. 6.3, где плотность упаковки и количество объектов возрастает на периферии пространства. Не так ли работает и

5 Для количественной оценки сходства значений двух слов в латентном семантичес­
ком анализе вычисляется косинус угла, образованного соответствующими векторами. По­
добно обычным коэффициентам корреляции, он варьирует в диапазоне от 1 (полное со­
впадение) до 0 (ортогональное положение векторов). Значение словосочетания (фразы,
предложения) вычисляется путем определения векторной суммы значений составляю-
20 щих слов (см. 7.3.2).

Рис. 6.3. «Граница круга IV» Морициуса Эшера как художественная иллюстрация ново­го подхода к представлению знаний в пространствах с неевклидовой геометрией.

наш мысленный взор, отчетливо выделяя один-два объекта и оставляя невообразимо сложную паутину потенциально доступных связей и отно­шений на периферии сознания?

Именно эти свойства неевклидовых моделей были использованы не­давно немецким нейроинформатиком Хельгой Риттером (Ritter, 2004) для моделирования функций внимания, способного контекстуально связывать выделяемую сознательно единицу опыта с ее имплицитным концептуальным окружением. Предложенный им инструментарий назы­вается гиперболическими самоорганизующимися картами (Hyperbolic Self-Organizing Maps). Элементы искусственных нейронных сетей осуществля­ют здесь дискретизацию гиперболического пространства, особенностью которого является экспоненциальный рост объема при увеличении дис­танции от начальной точки. Это увеличение объема используется для размещения дополнительных репрезентаций, а также для увеличения размерности их связей. Самоорганизующиеся карты моделируют далее эффекты сдвига фокуса внимания, ограничивая детальность и размер­ность выделяемого в данный момент фрагмента. Емкость упаковки мо­жет, таким образом, сочетаться с относительной легкостью навигации (browsing) и поиска данных (data mining), основанных на сдвигах внима­ния. Гибкая настройка семантических связей в этом подходе должна обеспечить в будущем интуитивно понятный и технологичный формат представления исключительно больших массивов знаний (см. 7.4.3).