Нижегородский государственный
лингвистический университет
им. Н.А. Добролюбова
дипломная работа
на тему
Электронные словари
и их применимость
для традиционного
машинного перевода
Выполнил:
студент гр. 503А Тараскин А.А.
Научный руководитель:
к.ф.н. доц. Яржемский А.Н.
Нижний Новгород, 2003 г.
Содержание:
Введение________________________________________ 3
Глава I. Место лексикографии среди
лингвистических дисциплин._______________________ 5
a. Лексикография как одна из наук о языке.____________ 6
b. Типы словарей._________________________________ 8
c. Составление словарей.___________________________ 22
Глава II. Электронные словари.____________________ 24
a. Электронные словари "МультиЛекс"._______________ 24
b. Электронные словари "Lingvo".____________________ 25
c. Преимущества электронных словарей.______________ 26
d. Новые мехи требуют нового вина.__________________ 29
e. Читатели и писатели._____________________________ 30
f. Проблема актуальности.__________________________ 31
g. Соответствие уровню достижений
лингвистической науки.__________________________ 31
Глава III. Машинный перевод._____________________ 33
a. Немного истории._______________________________ 33
b. Классификация систем машинного перевода
по Лари Чайлду.________________________________ 34
Полностью автоматизированный МП.______________ 34
Автоматизированный МП
при участии человека.___________________________ 35
Перевод, осуществляемый человеком
с помощью компьютера._________________________ 35
c. Системы машинного перевода.____________________ 37
Система МП Retrans Vista._______________________ 40
Система МП PROMT XT._________________________ 43
Глава IV. Практическая часть._____________________ 49
Заключение______________________________________ 54
Библиография___________________________________ 56
Введение.
В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи компьютерные словари являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей. Данная работа посвящается изучению указанных проблем, а также анализу некоторых лингвистических программных продуктов, направленных на автоматизацию процесса перевода.
Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров (а тем более таких, каким было бы 'под силу' осуществлять более или менее современные программы машинного перевода) насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Россия все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами,препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много, следствием чего является тот факт, что услуги их недешевы. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой - сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное - лингвистики.
Цель данной работы - определение того, насколько можно использовать современные программные продукты для осуществления перевода, а также выявление наиболее перспективных, на наш взгляд, направлений исследований в области его автоматизации.
В соответствии с поставленной целью, задачами исследования являются:
- уяснение местоположения компьютерной лексикографии среди лингвистических наук;
- уяснение различий между электронными и традиционными бумажными словарями;
- определение максимально эффективного способа организации электронных словарей;
- уяснение различий между разнообразными системами МП и классификации последних;
- анализ работы систем машинного перевода на примере перевода, произведенного программой PROMT XT, и сравнение образцов перевода с переводом, сделанным человеком. Анализ причин несоответствия.
Глава I.МЕСТО ЛЕКСИКОГРАФИИ СРЕДИ
ЛИНГВИСТИЧЕСКИХ ДИСЦИПЛИН
Слово «лексикография» греческого происхождения, lexikos — относящийся к слову, словарный и grapho — пишу. Следовательно, лексикография означает: «пишу слова» или «пишу словари». В современном значении лексикография — это теория и практика составления словарей, главным образом языковых, лингвистических, в отличие от неязыковых, энциклопедических.
Лексикография как научный термин появилась в широком обиходе сравнительно недавно. Например, в энциклопедическом словаре Брокгауза и Ефрона (1896 г.) нет статьи на слово «лексикография», однако есть статья на слово «лексикология». Справедливости ради следует отметить, что в статье «словарь» этого же справочника имеется слово «лексикография», где оно является синонимом словосочетания «словарная техника».
В энциклопедическом словаре братьев А. и И. Гранат (1916 г.) уже есть статья на слово «лексикография», которая определяется как «научные способы обработки словесного материала языка для составления лексикона». Отметим в этом определении акцент на «научные способы обработки».
В первом издании «Большой советской энциклопедии» (1938 г.) в статье на слово «лексикография» дано: «Лексикография (греч.), работа по составлению словарей». И только во втором (1953 г.) и третьем (1973 г.) изданиях этот термин толкуется достаточно современно: «Лексикография — раздел языкознания, занимающийся практикой и теорией составления словарей». (БСЭ, 3-е изд. 1973, т. 14).
С другой стороны, статьи на слово «лексикография» нет ни в энциклопедии «Британика», ни в энциклопедии «Американа», хотя в обеих есть статьи на слово «словарь». Отсутствие термина «лексикография» в таких солидных современных справочниках, как британская и американская энциклопедии, отнюдь не случайно. Это объясняется, во-первых, молодостью лексикографии как науки и, во-вторых, тем, что даже среди самих языковедов до сих пор еще идет спор, является ли лексикография наукой, точнее, частью науки о языке, или же она просто техника составления словарей, в лучшем случае, искусство их составления.
Видный испанский лексикограф X. Касарес в своей широко известной книге «Введение в современную лексикографию» (которая переведена на русский язык) утверждает, что лексикография — это техника и искусство составления словарей. (Вспомним определение «лексикографии» в первом издании БСЭ: «работа по составлению словарей».)
Известный английский лексикограф, автор знаменитых справочников по английскому и американскому сленгу Эрик Патридж, посвятивший всю свою жизнь составлению словарей, не случайно назвал свою последнюю книгу, плод многолетних разысканий в области словарного дела, так: «Благородное искусство лексикографии как объект занятий и опыт страстного его приверженца».
Даже Ф. Гоув, главный редактор третьего издания словари Уэбстера (1461 г.), крупнейшего лексикографического предприятия нашего времени, пишет в программной статье «Успехи лингвистики и лексикография»: «Лексикография еще не наука. По-видимому, они никогда не будет наукой. Однако это сложное, топкое и порой всепоглощающее искусство, требующее субъективного анализа, произвольных решений и интуитивных доказательств".
Лексикография как одна из наук о языке
Существует, однако, другая точка зрения на лексикографию. Ее сторонники считают, что лексикография — это не просто техника, не просто практическая деятельность по составлению словарей и даже не искусство, а самостоятельная научная дисциплина, имеющая свой предмет изучения (словари различных типов), свои научные и методологические принципы, свою собственную теоретическую проблематику, свое место в ряду других наук о языке.
Впервые эту точку зрения на лексикографию со всей определенностью высказал известный советский языковед академик Л. В. Щерба. В предисловии к русско-французскому словарю (1936 г.) он писал: «Я считаю крайне неправильным то пренебрежительное отношение наших квалифицированных лингвистов к словарной работе, благодаря которому почти никто из них никогда ею не занимался (в старые времена это за гроши делали случайные любители, не имевшие решительно никакой специальной подготовки) и благодаря которому она получила такое нелепое название «составление» словарей. И действительно, наши лингвисты, а тем более наши «составители» словарей просмотрели, что работа эта должна иметь научный характер и никак не состоять в механическом сопоставлении каких-то готовых элементов».
Развивая выдвинутые в 1936 г. положения, Л.В. Щерба публикует в 1940 г. статью (ставшую потом широко известной и за рубежом), в которой на большом фактическом материале начинает разрабатывать основные теоретические вопросы лексикографии. Л.В. Щерба мыслил написать несколько статей (этюдов, как он их называл) по общей теории лексикографии, в которых намеревался обсудить такие важные проблемы, как основные типы словарей, природа слова, значение и употребление слова, построение словарной статьи в связи с семантическим, грамматическим и стилистическим анализом слова и др. Однако преждевременная смерть помешала осуществлению этого замысла. Л.В. Щербой был написан лишь первый этюд «Основные типы словарей», который начинался следующим хорошо известным сейчас положением: «Одним из первых вопросов лексикографии является, конечно, вопрос о различных типах словарей. В основе его лежит ряд теоретическихпротивоположений, которые и необходимо вскрыть». С тех пор тезис о том, что лексикография — это не только практика составления словарей, но и теоретическая научная дисциплина, прочно вошел в ряд отправных положений советской лексикографической школы.