В.Т. Титов, Воронежский государственный университет
Суть квантитативной лексикологии видится в следующем.
Квантитативная лексикология - не самоцель, а средство обнаружения факторов порядка в лексике, способ ранжирования ее по системной и функциональной значимости. Большинство современных лингвистов признает полевую организацию языка, предполагающую наличие ядра и периферии. В связи с этим важнейшим аспектом квантитативной лингвистики является количественно и качественно обоснованная стратификация словаря на ядро и периферию.
Как показала в своей докторской диссертации А.И. Кузнецова [2], наиболее реалистичным подходом к лексике является многомерный, полипараметрический подход, при котором каждый из параметров формирует своё ядро и свою периферию. Количество же параметров, существенных для лексико-семантической системы, конечно и хорошо известно:
1) функциональная активность (употребительность),
2) деривационная активность (межсловная и внутрисловная продуктивность),
3) синтагматическая активность (широкая сочетаемость),
4) парадигматическая поддержанность (вхождение в многочленные синонимические ряды).
Именно эти параметры испанского языка и исследуются в данной статье. Источником данных является компьютерная база данных (БД), созданная по инициативе и при участии автора статьи в Научно-методическом центре по компьютерной лингвистике факультета романо-германской филологии ВГУ (директор - проф. А.А. Кретов). БД содержит испанско-русскую часть словаря "Испанско-русский и русско-испанский словарь для школьников. - Киев: Логос, 1998. - 768 с. - (Серия "Словари для школьников"). ISBN 966-509-051-8 (11.000 слов в испанской части). Редактор В.П. Ховхун, отв. за выпуск. - В.В. Орехов, С. 15 - 409". Принципы отбора источников обсуждались в указанной выше публикации.
Целью нашего исследования является выделение на основании каждого из параметров лексических множеств мощностью около 1000 единиц каждое. Перемножение этих множеств дает два ядра: большое, представленное единицами, входящими не менее чем в одно из ядер, и малое, представленное единицами, входящими во все ядра. Выделение малого ядра испанской лексики и является конечным и самым главным результатом, получаемым квантитативной лексикологией испанского языка. На этом последняя слагает свои полномочия, предоставляя квалитативной лексикологии готовый к дальнейшему анализу материал.
§ 1. ФУНКЦИОНАЛЬНАЯ АКТИВНОСТЬ. Индикатором функциональной активности является длина слова в буквах. По этому параметру испанская лексика организована следующим образом. (См. таблицу 1).
Рис. 1. Соотношение между длиной слова и количеством слов данной длины по данным "Испанско-русского словаря"
Как и предполагалось, все 5 однобук-венных слов в испанском языке оказались служебными: а - в; у; на; к; за; по; до; е - и; о - или (перед о и ho принимает форму и); и - или; у -и, а (перед i и hi принимает форму е). Среди слов из двух букв уже встретилось 6 полнозначных лексем :fefl) вера; 2) доверие; ir vi 1) идти; ходить; 2) ехать; si II adv да; si III m согласие; te m чай; ya adv 1) уже, уж, прежде; 2) в настоящее время; 3) потом; 4) сию минуту, сейчас.
Кроме служебных слов, из дальнейшего рассмотрения исключим местоимения, включая личные, и числительные, ибо они составляют отдельную относительно замкнутую подсистему, обладая особыми функциями, а также слова, имеющие пометы -стилистические или терминологические.
Ядерная лексика, как известно, стилистически нейтральна - и в силу этого - универсальна, любая специализация слова ведет к ограничению сферы его употребления и уходу на периферию. Названия нот (do, re, mi, fa, la, si) - яркое тому подтверждение. Все они сопровождаются пометой (музыкальный термин). Поэтому, несмотря на свою краткость и номинативность, претендовать на статус ядерной лексики они не могут.
Еще одно ограничение, которое мы вводим при отборе ядерной лексики состоит в том, что из дальнейшего рассмотрения исключаются междометия - опять-таки в силу их особого статуса в языке - это не слово, не морфема, не предложение, а нечто предшествовавшее членораздельной речи - остатки архаичной пра-речи в современных индоевропейских (и не только) языках.
Именно поэтому из дальнейшего рассмотрения исключаются, в частности, междометия ha! ах!, аи! уа! inter] 1) да! 2) так! 3) наконец-то!
Под большим вопросом - правомерность включения в ядро лексической системы языка наречий, которые, как известно, являются разного рода "лингвистическими окаменелостями" морфологических форм, предложно-падежных конструкций и словосочетаний, выполняющих в предложении функцию разного рода обстоятельств.
Трехбуквенные слова, после исключения указанных выше категорий лексики дали 100 ядерных слов.
Четырехбуквенные слова дали еще 558 слов.
Таким образом, в сумме мы получили первое ядро в 664 слова. Это меньше 1000, но привлекать слова из пяти букв нет смысла, ибо только этих слов - 1256: 664 ближе к 1000, чем 664+1256.
§ 2. Деривационная активность
Как сказано выше, одним из индикаторов деривационной активности является количество значений у слова. Распределение слов в испанском словаре в зависимости от числа значений представлено в таблице 2.
Таблица 1.
Число значений | Число слов |
1 | 8762 |
2 | 2128 |
3 | 413 |
4 | 51 |
5 | 16 |
6 | 4 |
7 | 1 |
Как следует из таблицы 2, индекс многозначности испанских слов в словаре -1,28, но включать слова с двумя значениями в ядро мы не можем, ибо одних только слов с двумя значениями - 2128. Если мы намерены оставаться в пределах 1000 лексико-семантических единиц (а это единственный способ справиться с обилием материала), у нас есть только один вариант - включить в ядро все слова с количеством значений 3 и более.
Рассмотрим ядро продуктивности в порядке убывания числа значений.
7 ЗНАЧЕНИЙ
Максимальное количество значений в обследованном словаре имеет глагол pasar vt 1) перевозить, переносить; 2) переходить; переезжать; 3) передавать ~ aviso сообщать; 4) опережать; 5) миновать; 6) выносить, терпеть; 7) проводить (время).
6 ЗНАЧЕНИЙ
Это количество значений имеют слова: exposition /1) выставка; 2) экспонирование с;
3) муз. изложение с, экспозиция; 4) фото, экспозиция, выдержка; 5) представление с; 6) риск м, опасность.; pieza /1) часть, деталь; ~ de repuesto запасная часть; 2) штука; вещь; 3) комната; 4) монета; 5) шахм. фигура; 6) театр., муз. пьеса; revista f 1) пересмотр м; 2) просмотр м; проверка; 3) обзор м, обозрение с; ~ teatral театральное обозрение; 4) журнал м; 5) воен. смотр м, парад м; 6) ревю с; эстрадный концерт м; revolution f 1) революция; переворот м; 2) потрясение с; волнение с; 3) астр, полный оборот м (планеты); 4) тех. оборот м; 5) тех. перемешивание с; 6) мат. вращение с.
5 ЗНАЧЕНИЙ
Это количество значений имеет уже 16 слов: carga f 1) груз м; 2) бремя с, ноша; 3) погрузка; 4) заряд м; 5) налог м; casco т 1) череп; 2) черепок, осколок; 3) шлем; каска ж;
4) ко то с; 5) корпус (судна); о~ de la po-blacien центр города; colocacion f 1) размещение с; 2) местоположение с; 3) устройство на работу; 4) место с, должность; 5) помещение с (капитала); composition f 1) сочинение с; 2) состав м; 3) составление с; 4) муз., жив. композиция; 5) полигр. набор м; equipo ml) снаряжение с; 2) оборудование с; 3) комплект; 4) спорт, команда ж; ~ de futbol футбольная команда; 5) бригада ж; ~ de montaje бригада монтажников; grado ml) ступень ж; 2) степень ж; en sumo ~ в высшей степени; 3) ученая степень, звание с; 4) градус; diez ~s bajo сего десять градусов мороза; 5) класс (в школе); ode ~ en ~ постепенно; medio т 1) середина ж, половина ж; 2) средство с, мера ж; ~s de comunicacion средства сообщения; 3) среда ж (окружающая); 4) спорт, полузащита ж; 5) средний палец; opor ~ de посредством; oen ~ de среди, между; oposicionfl) противоречие с; 2) оппозиция; 3) конкурс м (на замещение должности и т. п.); 4) противопоставление с; 5) возражение с; palo ml) палка ж; 2) ствол; 3) бревно с; 4) дерево с; древесина ж; de ~ деревянный; 5) удар палкой; andar a ~ s ссориться, драться;plaza fl) площадь; 2) рынок м; 3) место с; 4) место с, должность; 5) арена; ~ de toros арена для боя быков; pruebaf 1) доказательство с; 2) попытка, проба; 3) опыт м, испытание с; 4) полигр. корректура; 5) примерка (одежды); punto т 1) точка ж dos ~ двоеточие с ~s suspensivos многоточие с; 2) пункт, точка ж; 3) спорт, очко с; 4) балл (на экзамене); 5) петля ж (в вязании) articu-los de ~ трикотажные изделия hacer ~ вязать (на спицах); о~ de vista точка зрения; oestar a ~ de... быть близким (готовым) к...; oal ~ тотчас; оа ~ вовремя; <>en ~ точно; оа ~ fijo точно, достоверно; <>! ~ en boca! молчать!; г ay о ml) луч ~s equis (X) рентгеновские лучи; 2) молния ж; 3) сияние с, блеск; 4) радиус; 5) спица ж (колеса, зонта) о! ~ si черт побери!; sindicar vt 1) обвинить; 2) доносить; 3) подозревать; 4) оговаривать; 5) объединять в профсоюз; tabla 1) доска; 2) список м; каталог м; 3) мат. таблица; указатель м; 4) р! сцена ж, подмостки; 5) р! шахм. ничья ж; tiempo т
1) время с а ~ вовремя con ~ заблаговременно, заранее hace ~ давно; 2) пора ж, период; 3) спорт, тайм; 4) погода ж hace buen ~ хорошая погода; 5) грам. время.
Слов с 4 значениями оказалось на одно меньше, поскольку было исключено из рассмотрения служебное слово que conj 1) что
2) чтобы 3) чем 4) пусть, да ocon tal ~ если только оа nienos ~ если только не о~ hoy ~ manana сегодня или завтра.
Со словами, имеющими 3 значения, ядро продуктивности составили в общей сложности 483 слова
Содержательный анализ этого ядра позволяет сделать вывод о его меньшей информативности по сравнению со словами, выделенными по признаку употребительности (длины). Видимо, трактовка многозначности в двуязычном словаре носит не объективный, а зеркально-отражательный характер, указывая не столько на многозначность во входном языке, сколько на количество способов истолковать его словами выходного языка.
§ 3. Синтагматическая активность
Поскольку число слов, имеющих фразеологизмы: 464, а число фразеологизмов -685, есть смысл взять их все в качестве ядра, выделенного по признаку синтагматической активности. После отсева служебных слов в этом ядре осталось 440. Содержательный анализ указывает на хорошую разрешающую силу данного критерия.