Единственной реальностью, с которой лингвист имеет дело, является текст, подлежащий "дешифровке". Все сведения о "коде" (языке), лежащем в основе этого текста, должны быть выведены исключительно из анализа последнего. Но в тексте непосредственно не содержатся данные о значениях слов языка, его грамматике, его истории и генетических связях с другими языками. Непосредственно в тексте даны лишь некоторые элементы (части, отрезки), и для каждого их них мы можем установить распределение или дистрибуцию — сумму всех окружений, в которых он встречается, т. е. сумму всех (различных) позиций элементов относительно других элементов.
Описать структуру языка исчерпывающим образом — значит установить: 1. Его элементарные единицы на всех уровнях анализа; 2. Классы элементарных единиц; 3. Законы сочетания элементов различных классов. Элементарные единицы — это фонемы и морфемы.
Выделение элементарных единиц языка достигается с помощью экспериментальной техники сегментации текста и дистрибутивного анализа текстовых единиц, обнаруженных в результате сегментации. Классы элементарных единиц строятся на основе экспериментальной техники субституции (замещения), а законы сочетания элементов различных классов устанавливаются с помощью анализа по непосредственно составляющим. Первые три техники могут применяться, по мнению их создателей, для анализа любого аспек-
275
Идея о том, что единицы языка, классы единиц и связи между единицами могут быть определены исключительно через их окружение, т. е. через их отношение к другим единицам того же порядка, и составляет существо дистрибутивного подхода к языку.
Сегментирование текста на элементарные единицы (звуки или фоны на фонологическом уровне и морфы на морфологическом) является лишь первым шагом в процедуре выделения соответствующих единиц языка — фонем или морфем. Вторым шагом является идентификация — установление того, какие из элементарных текстовых единиц тождественны между собой, т. е. являются вариантами одной и той же единицы языка (аллофонами одной фонемы или алломорфами одной морфемы), а какие различны, т. е. являются представителями разных единиц языка. Для решения этой задачи используется дистрибутивный анализ в собственном смысле слова.
Устанавливаются три типа дистрибуции элементов: 1. Текстовые единицы находятся в дополнительной дистрибуции, если они никогда не встречаются в одинаковых окружениях. Этого условия в большинстве случаев достаточно, чтобы признать ряд звуков вариантами (аллофонами) одной фонемы. Таковы различающиеся степенью закрытости — открытости гласные звуки в словах семь, день (наиболее закрытый вариант, произносимый в позиции после мягкого согласного и перед мягким согласным); сел, дел (более открытый вариант, произносимый после мягкого перед твердым); шерсть, жесть (еще более открытый вариант, произносимый после твердого и перед мягким), шест, жест (наиболее открытый вариант, произносимый после твердого согласного перед твердым);
2. Текстовые единицы находятся в контрастной дистрибуции, если они могут встречаться в одних и тех же окружениях, различая значения. В этом случае они являются представителями разных единиц (фонем или морфем). Таковы началь-276
ные согласные в словах том — дом — ком — лом — ром, принадлежащие пяти различным фонемам; 3. Текстовые единицы находятся в свободном чередовании, если они встречаются в одних и тех же окружениях, не различая значений. Например, варианты морфемы творительного падежа -ею и -ей в русском языке (землей — землею). Во всех задачах лингвистической дешифровки, которые ставятся в достаточно общем виде, изучение дистрибуции элементов, правда с учетом их числовых характеристик и прежде всего частотности, остается едва ли не единственным средством, ведущим к цели. В дальнейшем выяснилось, что дистрибутивный анализ противоречив и не решает тех задач, для которых он был предназначен, поэтому общие основания его были уточнены на базе теории множеств, результатом чего явилась теоретико-множественная концепция языка. В дополненном и уточненном виде дистрибутивный анализ применялся для исследования всех уровней языка, включая синтаксис и семантику; в целом он привел к осознанию важности экспериментирования с языковым материалом и усовершенствованию техники лингвистического эксперимента.
Компонентный анализ
Данная методика применяется к анализу различных единиц языка. Продемонстрируем его на примере компонентного анализа слова (см., например, работы 3. Д. Поповой и И. А. Стернина).
Известно, что одна лексема может выражать несколько значений, каждое из которых называется семемой. Одни семемы в своей основе денотативные, т. е. отражают предметы внешнего мира, другие коннотативные. т. е. выражают оценки, эмоции и т. д. (так, например, компоненты хорошо/плохо содержатся в коннотативной части слов прогресс, энергичный, паника, галиматья; эмоциональные семы нравится/не нравится наблюдаем в словах доносчик (презр.), аппетитный; функционально-стилистические семы — в словах местожительство (официально-деловой), егоза (разговори.); сугубо конногативные семы в словах кабак (в знач. "грязь, беспорядок"), дичь (в знач. "бескультурье, бессмыслица, абсурд").
277
Сумка — Д1 — мешок, футляр из ткани, кожи и т. п. для ношения чего-нибудь;
Д2 (производно — номинативное значение) — полость в виде подбрюшного мешка у некоторых животных (кенгуру).
Коннотативные семемы бывают трех типов. К1 (коннотативная первая семема) находится в логически мотивированной связи со своей денотативной семемой). Например, хрустальный (К1) воздух — такой же прозрачный и сверкающий, как хрусталь. К2 (коннотативная вторая семема) утратила логическую связь с денотативными семемами, например, брать на пушку. КЗ (коннотативная третья семема) денотативной основы не имеет и наблюдается только в составе идиом (попасть впросак).
Совокупность семем, выражаемых одной лексемой, образует се-мантему. Семемы, входящие в одну семантему, находятся между собой в иерархических отношениях, исходной является семема Д1. Рассмотрим семантическую структуру слова журавль. Д1 — большая болотная птица с длинными ногами и шеей. Д2 — длинный шест у колодца, используемый как рычаг для подъема воды. Опускается с ведром в колодец и вынимается из него подобно тому, как журавль вынимает ее из воды, поймав лягушку. К1 — "экий журавль шагает!" — можно сказать о высоком нескладном мужчине.
Лексемы разных языков, которые эквивалентны по семеме Д1, как правило, неэквивалентны по семемам Д2 и К1, тем более по семеме К2. Например, русская лексема хлеб имеет семему Д2 "зерно" и Д2 "растущие хлебные злаки". Эквивалентные ей по семеме Д1 немецкая лексема Brot, английская bread, французская pain таких Д2 не имеют. Зато фр. pain имеет семему Д2 "кусок" (pain de savon — кусок мыла, pain de sucre — голова сахара).
Межъязыковые различия в семантемах отчетливо проявляются при анализе лексической сочетаемости разноязычных лексем, эквивалентных по Д1. Так, прилагательное глубокий по семеме Д1 эквивалентно англ. deep, но deep grass ("глубокая трава") — русск. 278
русск. скрыт-
"высокая трава", deep person (глубокий человек) ный, не показывающий своих чувств человек".
Различия по семемам К1 и К2 проявляются в больших расхождениях разных языков в области фразеологии. Например, чехи сравнивают худую женщину с лапшой, о неинтересном и ненужном деле говорят дословно "это для меня сарделька", о несведущем человеке — "понимает в этом деле как коза в петрушке", пустяковое дело символизируется "грибами": "это для него грибы", "он грибы из этого делал", т. е. это для него пустяки. Русские лексемы лапша, сарделька, петрушка, грибы таких семем К1 и К2 не имеют. То же касается и их украинских эквивалентов.
Основы компонентного анализа заложил Л. Ельмслев, затем его развивали Б. Потье, А. Греймас и др.
Семемы дробятся на семы. Сема понимается как отражение в сознание человека отдельного признака, какой-то детали того объекта, который целиком представлен в семеме. Членение семемы на семы бесконечно, его предел становится лишь мерой познания свойств и качеств денотата. Компонентный анализ показывает, что число сем, существенных для общения, в семеме вполне исчислимо и не очень велико. Оно выясняется из сопоставлений и противопоставлений разных семем друг другу. Сема, которая в одном контексте представляется далее неделимой, в другом контексте проявляет свою сложность и возможности дальнейшего деления. Например, в семеме Д2 слова перемена есть семы "время, отдых, конец урока, звонок, школа, среднее учебное заведение, время занятий в 45 минут, звуковой сигнал начала и конца урока" и т. д.
Семасиологи строят различные классификации сем.
Так, классемы — наиболее обобщённые по содержанию признаки, соответствующие значениям частей речи: предметность, признак и т. п. Архисемы — признаки, объединяющие группы слов внутри части речи, например одушевлённость/неодушевлённость, действие/состояние и т. п.
Дифференциальные семы — это признаки, по которым противопоставляются слова, сгруппированные в одной архисеме, и по которым можно отличить одну семему от другой. Например, для