Практическое применение (защищенное несколькими патентами) находят работы по латентному семантическому анализу (см. 6.1.1 и 7.4.2). Он используется, например, для определения индивидуального профиля интересов покупателей интернет-магазинов. Каждый выбор книги в интернет-магазине фирмы AMAZON сопровождается определением семантического вектора интересов, к которому автоматически подбираются наиболее похожие книги, сразу же предлагаемые для покупки (обычно в пакете двух-трех наименований). Последующее взаимодействие позволяет еще более точно определить профиль интересов данного клиента. Понятно, что эта же когнитивная технология может использоваться и в целом ряде других практически важных ситуаций — подборе работы по интересам и квалификации клиента, нахождении сходных по содержанию текстов при полном различии составляющих эти тексты слов и, например, при автоматической оценке качества перевода текстов с одного языка на другой.
Фундаментальная проблема состоит в поддержке коммуникации, которая включена в процессы решения некоторых конкретных опосредованных использованием компьютеров практических задач (CSCW, computer supported cooperative work — поддерживаемая компьютерами совместная работа). В отличие от развернутого речевого общения процессы практического взаимодействия включают массу экстралингвистических, или «синпрактических», компонентов. Космонавт, пытающийся укрепить солнечную батарею, авиамеханик, находящийся внутри ремонтируемого им двигателя, военный медик, делающий операцию, или мобильный робот, демонтирующий ядерный реактор, часто нуждаются в строго дозированной в пространстве и времени подсказке экспертов, иногда находящихся за сотни километров от места событий. Поиск решения связан с предоставлением всем участникам общения наряду с акустическим каналом связи видеоизображения рабочей зоны, генерируемого с помощью одной или нескольких телевизионных камер. Однако видеоизображение ситуации в целом еще недостаточно специфично, чтобы быстро и однозначно определить предметные референты практических инструкций типа «Соедини эту штуковину с той» или «Убери камень с правой стороны».
Некоторое время назад нами было предложено явно вводить в опосредованное компьютерами общение информацию о фокусе внимания и интенциях участников (Velichkovsky & Hansen, 1996). Речь идет прежде всего о поддержке операций совмещения внимания участниками общения. Эффекты совместного внимания (joint attention) и их взаимодействие с речью хорошо известны из исследований онтогенеза (см. 7.1.2). Еще Выготский отмечал, что социализация внимания является важнейшим условием речевого и интеллектуального развития младенца. В первые месяцы жизни называние взрослым некоторого объекта увеличивает продолжительность его зрительной фиксации младенцем по сравнению с фиксацией других объектов, одновременно присутствующих в поле зрения (Bornstein, 1996). При возникновении речевой коммуникации характер речи во время фаз «совместного внимания» и вне них оказывается различным как по семантике, так и по синтаксису (Tomasello, 1996). В дальнейшем мы остаемся чрезвычайно чувствительны к направлению взора наших визави (нечувствительность к нему является одним из важнейших диагностических признаков аутизма)*9. Можно сказать, что отслеживание и учет распределения внимания
49 Для изучения особенностей реагирования на другого человека в последнее времяпартнеров — одно из важнейших условий успешного общения и организации совместной деятельности
Современные коммуникативные технологии, такие как электронная почта, интернет и видеоконференции, позволяют исключительно быстро, в режиме близком к реальному времени передавать гигантские объемы текстовой и визуальной информации При этом, однако, отчасти теряется важнейшая информация о динамике внимания участников общения В результате значительная часть диалогов участников видеоконференций посвящена не обсуждаемым проблемам, а самому процессу коммуникации («Кому ты это сейчас говоришь7»), а вероятность полетов менеджеров крупных корпораций друг к другу после проведения телеконференций часто возрастает, а не уменьшается Применение основанных на видеообработке систем регистрации движений глаз может быть необходимым дополнением существующих коммуникационных технологий Действительно, передача информации о том, где в предметном окружении в данный момент находится точка фиксации и, следовательно (с известными оговорками — см 4 3 1), фокус зрительного внимания позволяет формировать состояния «совместного внимания», значительно облегчая решение конструктивных задач кооперативного типа (Vehchkovsky, 1995)50
Тот же прием делает возможным отслеживание социальной микродинамики диалогов участников видеоконференций На рис 7 9А показана современная версия более ранней экспериментальной системы GAZE (ВЗОР), которая включала регистрацию направления взора участников обсуждения (Vertegaal, Vehchkovsky & Van der Veer, 1997) Такая бесконтактная регистрация движений глаз, основанная на автоматическом слежении за зрачком в видеоизображении, упоминалась нами в одной из предыдущих глав (см 2 4 2) Если некоторый участник (партнер 1) обсуждения обращается к другому участнику (партнер 2), фиксируя лицо этого участника на экране компьютера, то на мониторах всех других партнеров изображение лица и глаза партнера 1 поворачиваются в направлении изображения лица партнера 2, так что доминирующая межличностная направленность обращения становится очевидной Путем высвечивания местоположения фокуса зрительного внимания (например, с цветовой маркировкой для идентификации участника) в совместном рабочем поле данная методика делает также возможным выделение объектных референтов речи На рис 7 9Б показана еще одна современ-
50 Следует отметить, что зрительные фиксации могут выполнять несколько разных функций, таких как относительно поверхностная, амбьентная обработка или же фокальная обработка, направленная на идентификацию объектов (см , например, 3 4 2) Коммуникативную нагрузку несут скорее продолжительные фиксации длительностью более 500 мс Фильтрация подобных фиксаций позволяет, кстати, использовать взгляд в качестве замены традиционной компьютерной мышки (Vehchkovsky & Hansen, 1996) Это важно при затруднениях в использовании рук и речевого ввода информации, в частности, парализованными людьми В настоящее время во всем мире используется несколько сотен систем управления компьютерами (а следовательно, и множеством других технических систем) с помощью взора для инициации команд нужно просто чуть внимательнее по-172 смотреть на соответствующий иконический знакРис. 7.9. Системы виртуального общения, использующие информацию о направленности зрительного внимания участников А Модификация более ранней лабораторной разработки, Б Современная промышленная система VR-видеоконференций (по Ве-личковскии, 2003)
ная коммуникационная система такого рода, используемая для проектирования новых изделий в автомобильной промышленности (с разрешения фирмы DaimlerChrysler)
Интересно, что проблема эксплицитного выявления фокуса внимания весьма остро стоит и в случае других современных коммуникационных технологий Так, развитие собственно речевого взаимодействия с компьютерами и вообще разнообразными техническими системами
173
сдерживается тем обстоятельством, что существующие голосовые интерфейсы, к сожалению, не обладают способностью к селективному восприятию, например, в его специфической форме, известной в когнитивной психологии как эффект вечеринки (см. 2.2.1). Эти устройства просто пытаются обработать все, что произносится в непосредственной от них близости. Поэтому и здесь очень важной представляется задача разработки чувствительных к вниманию пользователя интерфейсов.
Выявление интенций представляет собой следующий, еще более сложный и важный этап в развитии технологических приложений когнитивных исследований по сравнению с описанными попытками включения параметров внимания в процессы коммуникации. Основная перспектива здесь состоит в создании совершенно нового, некомандного принципа взаимодействия человека и технических систем. Попробуем проиллюстрировать эту идею двумя примерами актуальных практических разработок. Первый пример уже кратко упоминался в этой главе, в разделе, посвященном чтению (см. 7.2.3). Почему иностранный язык нужно, по возможности, учить в живом общении с носителями языка? Потому что при межличностном взаимодействии происходит постоянное отслеживание затруднений партнера и поддержка предоставляется тогда, когда надо, и в объеме, который необходим для данной ситуации. Нельзя ли смоделировать подобную гибкую поддержку, оказываемую без эксплицитного запроса (то есть «без команды» — некомандный принцип) со стороны испытывающего затруднения пользователя и без обычного отвлекающего от контекста «путешествия» по словарям и тезаурусам?