Мы проводили моделирование семантики статьи из журнала "Мир Авионики" №1 за 2004 год "Методы обработки информации в бортовых радиолокационных станциях обнаружения наземных объектов" (авторы - Г.Н. Ульянов, В.А. Шпенст). Она, как и большинство специальных текстов, написана по строгим правилам, принятым среди специалистов в любой области.
Как указывает И.С. Алексеева в своей книге "Профессиональное обучение переводчика" (СПб, 2000; стр.110-111), в специальных текстах присутствуют одни и те же синтаксические и морфологические структуры, одинаковые обороты речи, одинаковый стиль. Специальный текст служит для передачи когнитивной информации. Многочисленные языковые средства обеспечивают её оформления как объективной информации:
Семантика подлежащего;
Безличные и неопределённо-личные предложения и пассивные конструкции;
Преобладание настоящего времени глагола;
Обилие слов, построенных по словообразовательной модели с абстрактным значением;
Отчётливая номинативность текста.
Характерной чертой специального текста является обилие терминов, передающих основную часть когнитивной информации.
Остальная лексика в специальном тексте достаточно однообразна по составу. Её иногда называют общенаучным слоем терминологии или лексикой общенаучного описания. Подчеркнём её особенности в тексте:
Она лишена эмоциональной окраски;
Её можно отнести к нейтральному варианту современной письменной литературной нормы;
В ней широко развита синонимия.
В специальном тексте всегда имеются средства, повышающие уровень плотности когнитивной информации. Это прежде всего разного рода сокращения.
Абсолютное преобладание когнитивной информации в специальном тексте диктует логический, а не ассоциативно-образный путь его построения. Он обеспечен особыми языковыми средствами, которые организуют связность текста - средства семантической и формальной когезии.
Логичность изложения обеспечена также высоким уровнем сложности и разнообразием синтаксических структур. Дополнительным средством логической организации специального текста являются графические средства, прежде всего шрифтовые.
Мы видим, что моделирование семантики любого специального текста - сложная и многоаспектная задача. В этой работе мы сосредоточили своё внимание преимущественно на частотной составляющей анализа статьи из области радиолокации.
Приведём некоторые цифровые данные. Рассматриваемая статья содержит 2181 словоупотреблений, из них 1576 употреблений фоновой (неспециальной) лексики и 605 - терминологической (специальной), 87 пунктуационных, математических и других знаков. Абсолютным рекордсменом по числу употреблений, как и ожидалось, является точка - 134 вхождения. Среди терминов самым частотным является "Радиолокационное изображение" - 62вхождения, среди нетерминологической лексики - союз "и" - 64вхождение.
Основными методами работы с текстом являлись частотный и семантический анализ лексики, в результате чего были составлены таблицы, характеризующие частотность лексем в тексте, и терминологическая лексика была распределена по понятийным или семантическим группам.
В тексте статьи содержатся 605 терминов, из которых 407 являются существительными, 192 - прилагательными, 4 - предлогами, 1 - наречие, 1 - глагол.
Структура большей части этих терминов сложная. Чаще всего они представляют собой словосочетания типа "прилагательное + существительное" (76 терминов) или "существительное + существительное в родительном падеже" (41 термин). Однословные или простые термины занимают лишь второе по частотности место - их в тексте 56 единиц. Возможно, термины такого типа позволяют выразить больше признаков понятия, чем однословные, однако, требованию краткости они не удовлетворяют.
Нами было посчитано количество вхождений существительных в единственном и множественном числах. В соответствии Академической грамматикой русского языка (М., 1982) единственное число существительного является признаковой категорией и, следовательно, должно встречаться в 1,5 - 2 раза реже, чем множественное число. Нами установлено, что преобладают существительные в единственном числе (344 вхождения). Это можно объяснить большой степенью абстрактности и обобщённости излагаемой информации, поскольку одним из переносных значений категории единственного числа является обобщающее значение.
Анализ вхождений существительных в различных падежах показал существенное преобладание родительного падежа (252 существительных из 407). Это явление типично для русского языка. По сведениям Академической грамматикой русского языка (М., 1982) родительный падеж в отличие от остальных, имеющих одно центральное и несколько периферийных значений, имеет в качестве центральных значений целых три: субъектное, определительное и объектное.
Что касается терминов-синонимов и омонимов, то в тексте анализируемой статьи их нет. Но мы предполагаем, что это отнюдь не значит отсутствие их в данной области науки. Как правило, термины - синонимы употребляются разными авторами или в различных статьях. Следовательно, материала одной статьи не достаточно для полного анализа этого аспекта.
Большинство терминов моносемичны, что, наверное, можно отнести к заслугам учёных - терминологов, которые провели длительную работу по стандартизации терминологии, отбору терминов и составлению правил и рекомендаций по созданию новых. Однако, встретились в тексте статьи и полисемичные термины, такие как "борт" (совокупность элементов обшивки летательного аппарата и сам аппарат), "земля" (3 планета Солнечной системы и наземная радиолокационная станция), "высота" (угол между горизонтом и светилом, измеряемый вдоль дуги вертикала и перпендикуляр, опущенный к стороне многоугольника), "оператор" (понятие, означающее соответствие между элементами двух множеств X и Y и член боевого расчёта, занимающийся наблюдением за полученным изображением). И хотя их неоднозначность в данном случае снимается контекстом, эти термины всё же можно признать не вполне удовлетворительными с точки зрения требований, выдвигаемых лингвистами.
Для обработки массива терминов данной статьи потребовалось определить все его элементы, используя словари и учебники по данному вопросу. На основе проделанной работы имеющиеся термины были разделены на 9 семантических групп:
вычислительная техника - процессор, ОЗУ, ЦВМ;
география - карта, Земля (планета), азимут;
изображение - геометрическое искажение, комплексирование, плотность почернения;
математика - интерполяция, коэффициент, оператор;
методы познания - эвристический алгоритм;
общенаучная лексика - синтезирование, коррекция;
общетехническая лексика - вход (приёмника), шаг;
радиолокация - дальность обзора, значение радиолокационного изображения, многолучевая обработка;
физика - доплеровская частота, поляризация, траектория.
В десятку самых частотных терминов входят 5 терминов из области радиолокации, 2, связанных с изображением, 1 - с математикой, 1 - с вычислительной техникой и 1 с географией.
При ближайшем рассмотрении 3 семантические группы - методы познания, общенаучная лексика и общетехническая лексика - оказываются схожими. Все они включают достаточно малое количество элементов (4, 2 и 3 соответственно), обладающих самой низкой частотностью - 1. Группа терминов методов познания целиком состоит из составных терминов, построенных по самой частотной модели "прилагательное + существительное", остальные две - преимущественно из однословных терминов, также одной из самых частотных моделей. Можно с уверенностью назвать эти группы вспомогательными.
Наиболее многочисленной является группа "радиолокация". В неё входит 95 одно - и многословных терминов. Частотное соотношение по их частеречным составам совпадает с общим частотным соотношением по тексту. Эта группа содержит 3 многозначных термина из имеющихся в тексте четырёх, а также единственный термин, который мы определили как действительный или однозначущий по классификации Д.С. Лотте. Сюда же входят 2 самых длинных термина, которые авторы статьи предпочли употреблять в виде аббревиатур - функция распределения эффективной поверхности рассеяния (ЭПР) и радиолокационная станция с синтезированной апертурой (РСА) и самый частотный термин - радиолокационное изображение. Примечательно, что более половины состава (конкретно 63 элемента) встречаются в статье только 1 раз. Здесь это соотношение выражено даже ярче, чем во всём тексте, где доля терминов, встречающихся 1 раз, составляет чуть больше 1/6 от общего количества. Наблюдения, приведённые выше, дают нам основание утверждать, что данная семантическая группа является самой репрезентативной из 9 имеющихся и что лексемы, входящие в неё, являются ядерными, ключевыми в данном тексте.
Семантические группы "математика", "изображение" и "физика" состоят из терминов областей, смежных с радиолокацией, сравнительно часто используемых в тексте, поэтому они достаточно многочисленны.
Также представляется интересным следующее наблюдение. Более половины терминов (конкретно 144), употребляемых в данной статье, упоминаются в ней только 1 раз. К ним относятся термины из всех выделенных семантических групп. Ещё один факт, привлекающий внимание, - огромный разрыв между первым и вторым по частотности термином - в 53 употребления. На наш взгляд это связано с тем, большинство терминов в этой статье "обслуживают", поясняют и раскрывают понятие, определённое термином "Радиолокационное изображение".
Слова в научном тексте, не относящиеся к терминологической лексике, можно условно называть фоновой или нетерминологической, которую составляют лексика общенаучного описания и общенациональная лексика. Её в данной статье несоизмеримо больше, чем терминологической. Она относится скорее к нейтральному варианту современной письменной литературной нормы. Всего в статье встречается 393 существительных, 273 глагола, 266 прилагательных, 67 наречий.