употребление глаголов вторичной имперфективизации [Русский язык в его
функционировании].
Среди других теоретических работ следует отметить :
— исследования по аффиксации: изучение словообразовательного потенциала суффиксальных типов русских существительных [Каде], суффиксальной универбации и усечения в русском словообразовании
[Осипова Л.И.], возникновения новых аффиксов [Мамрак], сочетаемости пре-
фиксов в русском слове [Кузнецова], парадигматики и синтагматики русских
глагольных префиксов [Волохина и др.], суффиксоидов в современном английском языке [Бартков], словаря словообразовательных аффиксов в русском языке [Улуханов, 93];
— исследования словообразовательной мотивированности и ее связи с
производностью [Улуханов,92], мотивационного отношения “имя-глагол”
[Осипова М.А.], типов полисемии в производном слове и границ словообразова-
тельного гнезда [Ширшов, 96] ;
— работы по различным типам окказиональных способов словообразо- вания [Улуханов, 92];
— исследования по связи морфологического уровня с другими уровнями
языка: фонемным (морфемный или фонемный принцип русской орфографии)
[Моисеев,95], синтаксическим (синтаксическая деривация как проявление изоморфизма между словообразованием и синтаксисом) [ ], лексическим
(лексический состав русского языка со словообразовательной точки зрения
[Моисеев, 91], семантическим (границы словообразовательной семантики) [Улуханов,91], стилистическим (стилистические аспекты русского словообразования ) [Vinogradova];
— работы по диахронической морфологии русского словообразования [Улуханов, 92], диахронии словоизменения и словообразования русских существительных [Русский язык в его функционировании], развития категории
одушевленности в русском языке [Крысько].
Как и в каждой области знания, в морфологии немало интересных и спор-
ных проблем. Поскольку “словообразование постоянно балансирует в языке между системностью и беспорядком” [Пиотровский, 95], в литературе живо обсуждаются правомерность использования понятия усечения морфем [Добродомов], сложные случаи морфемики и словообразования [Шанский], пограничные случаи между словоизменением и словообразованием [Муравьева], лексикой и словообразованием [Глухих], морфемика в ее отношении к формообразованию [Герд, 94], проблемы трактовки групповой флексии [Плун-
гян,94].
С точки зрения историографии морфологии безусловный интерес представ-
ляет переписка Н.С.Трубецкого и Р.О.Якобсона о повелительном наклонении
русского глагола [Храковский, 94].
Типологические исследования по морфологии
Естественными и традиционными представляются работы по сопостави-
тельной морфологии русского языка с другими языками и прежде всего со сла-
вянскими, балканскими и балтийскими. Из огромного количества подобных
работ прежде всего следует отметить доклады российской делегации на X I Меж-
дународном съезде славистов в Братиславе (1993г.) [Земская и др., Нещименко,
], материалы научных конференций
и сборников, в которых среди прочих обсуждаются проблемы:
— сопоставительной славянской аспектологии [Смирнов];
— образно-экспрессивного употребления грамматических категорий [Ши-
рокова];
— словообразовательной интерференции в славянских языках [Джамбазов];
— морфологической типологии слова в разноструктурных языках, в том
числе в русском, английском, французском и испанском [Широкова,92];
— типологии грамматических категорий — в частности, категории лишитель-
ности в славянских и балканских языках [Иванов и др.], категории наклонения
в разных языках [Сабанеева];
— морфологические характеристики слов в “старославянском словаре” [Кры-
сько].
Как всегда, весьма разнообразны сопоставительные морфологические исследования по другим языкам: английскому [Биренбаум], малагасийскому [Коршунов], тагальскому [Шкарбан], чешскому [Стешковская], эвенскому
[Роббек], лезгинскому [Керимов], эскимосскому [Вахтин], вепсскому [Иткин],
догон [Плунгян, Plungian], дари [Островский].
Прикладные исследования по морфологии
Прикладная морфология, являясь составной частью компьютерной линг-
вистики, традиционно считается в ней наиболее исследованной областью,
в задачу которой входит:
— разработка морфологических процессоров — систем автоматического
морфологического анализа и синтеза слов, а также систем лемматизации — сведе-
ния словоформ к словарным словам;
— автоматизация морфологических исследований, предусматривающая про-
ведение ряда лингвистических работ с помощью ЭВМ для решения основной за-
дачи — разработки морфологических процессоров: использование СУБД для
составления морфологических словарей, проведения типологических исследо-ваний, моделирования морфологических явлений и т.д.
Следует отметить, что в настоящее время используются самые разнообраз-
ные автоматизированные системы обработки речи и текста, применяющие мор-
фологические процессоры: системы машинного перевода, коррекции и редакти-
рования текста, анализа и синтеза речи, информационного поиска (в особенности
полнотекстовые системы), автоматического реферирования, автоматические словари, экспертные системы и обучающие лингвистические автоматы. В указанных системах морфологические процессоры являются наиболее надеж-
ными и хорошо отработанными компонентами. В последних промышленных и коммерческих разработках хорошо зарекомендовали себя морфологические процессоры процедурного типа, работающие на базе словаря основ, — ср. сис-
темы автоматического морфологического анализа в СМП АСПЕРА [Королев,
91,95], MORSE [Пиотровский, 95], в автоматических корректорах WinОРФО [Ашманов, 95], автоматического морфологического синтеза в СМП СПРИНТ-2 [Тихомиров, 92], лемматизации русских слов [QUALICO-94].
Модификация морфологических процессоров в основном идет за счет
использования блока анализа слов, не содержащихся в словаре (“новых слов”),
которые традиционно анализируются на основе принципа морфологической аналогии, предполагающего сильную корреляционную зависимость между
грамматическими характеристиками слов и буквенным составом их концов.
Этот принцип давно и успешно используется в морфологических процессорах, разработанных Г.Г.Белоноговым. В 80-е годы киевскими лингвистами (В.И.Пе-
ребейнос, Т.А.Грязнухина, Н.П.Дарчук и др.) принцип аналогии был положен
в основу морфологических анализаторов русского языка, работающих без ка-
ких-либо словарей. Модификация этого подхода, также предполагающего ис-
ключение словарей для целей морфологического анализа или использование
их в минимальной степени, в последнее время была предпринята Г.Г.Белоно- говым для русского и некоторых других языков [Белоногов и др.,95], а также другими специалистами по вычислительной морфологии [Шереметьева и др., 96].
Широкое распространение персональных ЭВМ создает благоприятные
условия для автоматизации морфологических исследований — автоматического
формирования русского морфологического словаря по исходным массивам слов
и словосочетаний [Большаков,93], использования специализированных словарных
баз данных для анализа морфологии русского языка, автоматического типологи-
ческого анализа морфологии семитских языков [QUALICO-94], автоматического
формирования перечня структурных типов префиксов русских существительных
[Герд, 93], использования автоматизированной системы составления и ведения флективных классов русских существительных, прилагательных и глаголов, применяемых в морфологическом процессоре СМП АСПЕРА [Королев, 95],
моделирования морфологического анализа русских слов, содержащих суффик-
сы [Гельбух, 92].
В заключение напомним о том, что за последние несколько десятилетий
морфология переживала свои периоды взлетов и падений. В 60-е годы нашего
столетия определенный застой в морфологических исследованиях был вызван
бурным распространением структурного синтаксиса, а затем и семантики. Одна-
ко со временем развитие науки и требования жизни все расставили по своим ме-
стам, и в последние годы, как свидетельствует наш краткий обзор, теоретическая
и прикладная морфология вновь являются важным полигоном для лингвистичес-
кой теории и практики.
Обеспечение взаимодействия с ЭВМ на естественном языке (ЕЯ) является важнейшей задачей исследований по искусственному интеллекту (ИИ). Базы данных, пакеты прикладных программ и экспертные системы, основанные на ИИ, требуют оснащения их гибким интерфейсом для многочисленных пользователей, не желающих общаться с компьютером на искусственном языке. В то время как многие фундаментальные проблемы в области обработки ЕЯ (Natural Language Processing, NLP) еще не решены, прикладные системы могут оснащаться интерфейсом, понимающем ЕЯ при определенных ограничениях.
Существуют два вида и, следовательно, две концепции обработки естественного языка:
для отдельных предложений;
для ведения интерактивного диалога.
Природа обработки естественного языка
Обработка естественного языка - это формулирование и исследование компьютерно-эффективных механизмов для обеспечения коммуникации с ЭВМ на ЕЯ. Объектами исследований являются:
собственно естественные языки;
использование ЕЯ как в коммуникации между людьми, так и в коммуникации человека с ЭВМ.
Задача исследований - создание компьютерно-эффективных моделей коммуникации на ЕЯ. Именно такая постановка задачи отличает NLP от задач традиционной лингвистики и других дисциплин, изучающих ЕЯ, и позволяет отнести ее к области ИИ. Проблемой NLP занимаются две дисциплины: лингвистика и когнитивная психология.
Традиционно лингвисты занимались созданием формальных, общих, структурных моделей ЕЯ, и поэтому отдавали предпочтение тем из них, которые позволяли извлекать как можно больше языковых закономерностей и делать обобщения. Практически никакого внимания не уделялось вопросу о пригодности моделей с точки зрения компьютерной эффективности их применения. Таким образом, оказалось, что лингвистические модели, характеризуя собственно язык, не рассматривали механизмы его порождения и распознавания. Хорошим примером тому служит порождающая грамматика Хомского, которая оказалась абсолютно непригодной на практике в качестве основы для компьютерного распознавания ЕЯ.