«Язык и восприятие» Джордж Миллер и Филипп Джонсон-Лэйрд (Miller & Johnson-Laird, 1976), систематически соотнесены с глаголами, описывающими различные формы механических взаимодействий объектов.
Другим достоинством процедурной семантики является то, что понятия трактуются здесь не только как конъюнктивные, но и как дизъюнктивные сочетания исходов перцептивных и когнитивных операций. Данный подход может быть распространен на понятия, отдельные представители которых не имеют инвариантного — необходимого и достаточного — набора признаков. Классическим примером служит понятие «игра», включающее «детские игры», «Олимпийские игры», «карточные игры», «игры животных», «игры в мяч» и т.д. (этот пример предложен знаменитым австрийским логиком, философом и лингвистом Л. Витгенштейном — см. 6.2.2). Любопытно, что усилия и реальные достижения процедурной семантики фактически связаны с разработкой референтной теории значения, под знаком критики которой сто лет назад создавалась современная формальная логика. Дальнейшее развитие этого подхода могло бы помочь распространить процедурные описания, используемые главным образом при изучении восприятия и сенсомотор-ных координации, на семантическую память. В конце этого раздела мы рассмотрим некоторые новые нейропсихологические данные, которые говорят о возможности такого обобщенного использования процедурной интерпретации.
Имплицитное знание представляет собой серьезную проблему с точки зрения более традиционных семантических подходов, ориентирующихся на формальную логику. Дело в том, что в логической семантике критерии выделения понятий («семантические компоненты», «постулаты значения» и т.д.) обычно задаются в явном, эксплицитном виде. В последние годы в когнитивных исследованиях возникли и, отчасти, уже получили значительное распространение новые междисциплинарных подходы, ведущие к построению математических моделей, в которых имплицитное знание неожиданно получает достаточно естественную интерпретацию.
Первый тип современных моделей, возникший в 1980-е годы в нейроинформатике и части когнитивных наук, основан на использовании различных вариантов неоднократно упоминавшихся выше искусственных нейронных сетей. Они отличаются от семантических сетей, используемых в традиционной когнитивной психологии и в работах по искусственному интеллекту, гомогенностью связей между узлами и, самое главное, способностью к простым формам обучения (рис. 6.2). Путем целенаправленного обучения сети (например, с помощью метода обратного распространения ошибки — см. 2.3.3) часто удается добиться довольно полного соответствия предсказаний этих моделей данным психологических экспериментов и нейропсихологических наблюдений. Нейронные сети демонстрируют категоризацию стимульных ситуаций, способность правильно «узнавать» слегка измененные варианты вы-18 ученных ранее понятий, а также разнообразные ассоциативные эффек-
добрый большой живой С1 зеленый красный желтый |
ISA есть может имеет |
живое существо
растение
животное
дерево
цветок
птица
рыба
сосна
дуб
роза
астра
дятел
канарейка
карась
лосось
живое существо
растение
животное
дерево
цветок
птица
рыба
растет
движется
плавает
летает
поет
лай
ветки
лепестки
крылья
перья
размеры
жабры
листья
корни
кожа
Рис. 6.2. Нейронная сеть, репрезентирующая понятия в семантической памяти (по: McClelland, 2000).
ты типа семантического прайминга. Знание представлено в моделях нейронных сетей в неявном, «субсимвольном» виде, а именно как совокупность градуально меняющихся в ходе обучения порогов активации отдельных формальных нейронов и всей сети в целом.
Другой подход, представленный латентным семантическим анализом (LSA — Latent Semantic Analysis) и гиперпространственным аналогом языка (HAL — Hyperspace Analogue to Language), возник в вычислительной лингвистике и разделе информатики, занимающемся базами данных. Этот подход имеет эмпирический характер, хотя он и не был связан первоначально с психологическими исследованиями. Исходным материалом при подобном анализе становятся разнообразные тексты. Модели значения слов строятся на базе компьютерной обработки огромных массивов текстов (подборок газет, энциклопедий, протоколов парламентских слушаний), обычно включающих не менее десятка миллионов слов. При этой обработке изначально учитывается только близость слов друг другу в линейной развертке текста (Landauer & Dumais, 1997). По сути дела, речь идет о построении базы данных ассоциативных связей
19
слов с учетом их непосредственного словесного окружения. Матрицы близости слов обрабатываются с помощью факторного анализа, после чего значение слова описывается как вектор в пространстве нескольких сотен (как правило, порядка 300) далее неспецифируемых, то есть в известном смысле имплицитных измерений.
Без всякой подгонки параметров, характерной для нейронных сетей, эти более или менее «вслепую» построенные модели демонстрируют интересные результаты, такие как предсказание величины прайминг-эф-фектов, а также успешности метафорического сравнения понятий (метафорические сравнения, например, «Наш начальник — акула», особенно проблематичны для моделей дискретных семантических маркеров — см. 7.4.2).
Следует отметить, что эти многомерные пространственные модели выявляют не только общее семантическое сходство разных слов (например, «улица», «дорога» и «путь»), но и близость грамматических форм одного и того же слова между собой («путь», «пути», «путем» и т.д.), хотя, как легко понять, такие грамматические формы практически никогда не встречаются рядом внутри одного предложения5. Причина этого последнего эффекта состоит в том, что оценка сходства слов при латентном семантическом анализе осуществляется посредством вычисления глобального сходства контекстов во всем массиве текстов, Если эти новые данные получат подтверждение в дальнейших исследованиях, то это может означать необходимость возвращения к дискуссиям, сопровождавшим возникновение когнитивного подхода (см. 1.3.3 и 7.3.1), поскольку возможность выделения грамматических форм и правил на базе информации о линейной близости слов в предложении изначально отрицалась генеративной грамматикой.
Еще один, совсем новый, но, судя по всему, перспективный подход основан на использовании для представления знаний геометрических моделей, восходящих к работам великого русского математика Николая Ивановича Лобачевского (1792—1856). Отказавшись от 5-го постулата Евклида («Через точку, лежащую вне прямой, можно провести одну и только одну параллельную ей линию»), он открыл возможность рассмотрения геометрии на поверхности стягивающихся в точку или, например, гиперболически расширяющихся тел. Если в начале 20-го века была обнаружена полезность этих моделей для описания связанных с теорией относительности космогенических представлений, то начало 21-го века демонстрирует их применимость в области когнитивных исследований, а именно при моделировании концептуальных структур. Иллюстративный пример приведен на рис. 6.3, где плотность упаковки и количество объектов возрастает на периферии пространства. Не так ли работает и
5 Для количественной оценки сходства значений двух слов в латентном семантичесРис. 6.3. «Граница круга IV» Морициуса Эшера как художественная иллюстрация нового подхода к представлению знаний в пространствах с неевклидовой геометрией.
наш мысленный взор, отчетливо выделяя один-два объекта и оставляя невообразимо сложную паутину потенциально доступных связей и отношений на периферии сознания?
Именно эти свойства неевклидовых моделей были использованы недавно немецким нейроинформатиком Хельгой Риттером (Ritter, 2004) для моделирования функций внимания, способного контекстуально связывать выделяемую сознательно единицу опыта с ее имплицитным концептуальным окружением. Предложенный им инструментарий называется гиперболическими самоорганизующимися картами (Hyperbolic Self-Organizing Maps). Элементы искусственных нейронных сетей осуществляют здесь дискретизацию гиперболического пространства, особенностью которого является экспоненциальный рост объема при увеличении дистанции от начальной точки. Это увеличение объема используется для размещения дополнительных репрезентаций, а также для увеличения размерности их связей. Самоорганизующиеся карты моделируют далее эффекты сдвига фокуса внимания, ограничивая детальность и размерность выделяемого в данный момент фрагмента. Емкость упаковки может, таким образом, сочетаться с относительной легкостью навигации (browsing) и поиска данных (data mining), основанных на сдвигах внимания. Гибкая настройка семантических связей в этом подходе должна обеспечить в будущем интуитивно понятный и технологичный формат представления исключительно больших массивов знаний (см. 7.4.3).