Департамент комп’ютерних технологій
Кафедра інформатики
Контрольна робота
з курсу
Лінгвістичне забезпечення інтелектуальних систем
за осінній триместр 1999/2000 н.р.
в моделях класу “Смисл - текст”
Київ 1999
План
Вступ.............................................................................................................. 3
Семантичне представлення.................................................................................................... 4
Лексичні функції...................................................................................................................... 5
Тлумачно-комбінаторний словник........................................................................................ 5
Типи лексикографічної інформації у тлумачно-комбінаторному словнику 8
Вхід словникової статті........................................................................................................... 8
Зона перекладів........................................................................................................................ 8
Зона частин мови..................................................................................................................... 9
Зона визначень....................................................................................................................... 10
Зона обмежень........................................................................................................................ 10
Зона синтаксичних ознак...................................................................................................... 10
Зона дескрипторів.................................................................................................................. 10
Зона синтаксичних ознак та дескрипторів типового власника........................................ 11
Зона моделей керування....................................................................................................... 11
Зона лексичних функцій....................................................................................................... 13
Зона неформальних коментарів та ілюстрацій................................................................... 14
Висновок...................................................................................................... 14
Література................................................................................................... 15
Лінгвістична модель типу “Смисл -Текст” – це засіб опису природної мови, що передбачає створення системи правил, механічне застосування котрих дозволяє встановлювати відповідність між даним смислом та всіма текстами мови, які виражають цей смисл.
Визначають три самих загальних вимоги, які пред'являють до моделей типу “Смисл -Текст”:
1. Модель “Смисл -Текст” повинна бути діючою моделлю. Вона являє собою пристрій, що має вхід і вихід, і який перероблює те, що подається на вхід (задача), в інше, що видається на виході (результат). Принципова динамічність цих моделей протиставлена статичності більш традиційних класифікуючих(таксономічних) описів.
Опис відповідності між смислами та текстами повинно містити такі три компоненти:
· інвентар елементарних одиниць смислів (сем) та правила їх комбінації в складні смислові одиниці (семантичні представлення).
· інвентар елементарних одиниць тексту (морф) та правила їх комбінації в складні текстові одиниці (словоформи, словосполучення, речення, …)
· правила, що співставляють будь-якій смисловій одиниці відповідні текстові і навпаки.
2. Модель “Смисл -Текст” повинна бути задана абсолютно формально - за допомогою однозначних та логічно послідовних формулювань, що не потребують залучення якоїсь додаткової інформації. У якості контрольного критерію висувається принципова здійсненність моделі, або будь-якого її фрагменту на обчислювальній машині.
3. Модель “Смисл -Текст” є не породжуючий, а перетворюючий пристрій – не генератор текстів, а транслятор смислів в тексти і назад. Необхідно підкреслити таку неасиметричність: модель “Смисл -Текст” по-різному ставиться до неправильності тексту і неправильності смислу. Будучи моделлю мови, а не мислення, модель “Смисл -Текст” повинна реагувати на будь-яку мовну неправильність тексту, проте необов’язково реагувати на аномальність заданого “смислу” або смислу, що був вихвачений з тексту (“круглий квадрат”).
Таким чином, не займаючись самим смислом, модель типу “Смисл -Текст” відповідає за формальну правильність текстів і за правильну відповідність текстів і смислів. Таким чином така модель зобов’язана:
а) при русі від смислу до тексту виключати побудову “абсолютно” невірних фраз, а при зворотньому напрямку – виявляти “абсолютну” невірність пред’явлених фраз;
б) забезпечувати приписування будь-якому заданому смислу ’Ф’ всіх правильних відносно цього смислу фраз ’Фі’ і тільки таких фраз, ф також приписування будь-якій заданій фразі Ф всіх смислів ’Ф’і , відносно яких ця фраза є вірною, і тільки таких смислів.
У рамках моделі “Смисл -Текст” при русі від смислу до тексту як вхідні дані повинні виступати семантичні представлення (Сеп) – особливі експліцитні представлення загального змісту множини рівнозначних висловлювань. При зворотньому напрямку – від тексту до смислу – семантичне представлення вхідного тексту є кінцевим результати роботи системи в цілому.
Оскільки модель є описом відношення між смислами та текстами, а “смисли” ми ототожнюємо з “семантичними представленнями”, то питання про СемП виявляється надзвичайно важливим.
Передбачувана для даної моделі “Смисл -Текст” семантична мова може бути характеризована заданням таких трьох множин:
Словник, який містить символи трьох типів:
· елементарні семантичні одиниці – семи, чи “атоми смислу”, які утворюють базовий алфавіт семантичної мови. Семи поділяються на імена (класів) предметів та предикати (одно- та двомісні).
· проміжні семантичні одиниці – крупніші, ніж семи, а саме – семантичні графи, що мають у вершинах семи та інші проміжні одиниці. Вони є семантемами мови, яка розглядається. Тим самим словник семантичної мови переростає в семантично-природній словник, в котрому в кінці повинна бути втягнута вся лексика природної мови, причому кожна лексична одиниця отримує точний семантичний опис.
· символи, що характеризують комунікативну організацію смислу: старе – нове, виділити – не виділити. Ці символи виступають як метапредикати, визначені на підграфах семантичного графу.
Правила утворення, у відповідності з якими з символів словника можуть будуватися семантичні представлення висловлювань. Ці правила тривіальні, так як стосуються суто зовнішньої, формальної правильності семантичних представлень.
Правила перетворення, які задають синонімічність, або рівносильність двох семантичних представлень – зокрема, за рахунок згортки підграфів семантичного графу до проміжних одиниць і розгортки останніх.
Крім цього, для успішного використання охарактеризованої семантичної мови у моделі “Смисл -Текст” необхідні відомості ще двох типів, які не належать самій семантичній мові.
По-перше, це семантичні аксіоми, чи універсальні закони дійсності. По-друге, це “семантична комбінаторика” – правила розчленування/з’єднання семантичних представлень у процесі переходу від смислу до тексту і навпаки.
Модель “Смисл -Текст” суттєвим чином використовує більшу кількість відомостей про кожне слово мови, яку розглядаємо. Ці відомості можуть бути представлені в спеціальному словнику, який ми називаємо тлумачно-комбінаторний словник (ТКС). Словникова стаття цього словника повинна в ідеалі містити всі словозмінюючі, словоутворюючі, синтаксичні, семантичні та стилістичні характеристики заголовного, або ключового слова С0; крім цього, для С0 необхідно вказати всі слова (або словосполучення), визначеним чином зв’язані з ним за смислом, а саме: 1) його “парадигматичні варіанти”, чи “заміни” – засоби, які можуть чи повинні заміняти С0 у тих чи інших контекстах та при тих чи інших умовах, та 2) його “синтагматичні партнери”, чи “параметри” – засоби, за допомогою яких ідіоматично, тобто невільно, висловлюються при даному слові деякі смисли.
Для позначення парадигматичних варіантів та синтагматичних партнерів слова ще використовується термін “лексичні кореляти”.
Залежності, які зв’язують слова з їх лексичними корелятами описується за допомогою лексичних функцій. Лексичні функції, як правило, позначаються абревіатурами, що утворюються від латинських слів.
Наприклад, функція, що відповідає смислу “дуже”, позначається Magn – від латинського magnus – “великий”, функція Syn – синонім слова.
Magn (брюнетка) = жагуча. Syn (арештовувати) = затримувати.
Magn (знати) = напам’ять.
Тлумачно-комбінаторний словник.
Тлумачно-комбінаторний словник (ТКС), який буде розглядатися, є складовою частиною системи автоматизованого перекладу. Будемо розглядати спрощений варіант моделі “Смисл -Текст”. В цьому варіанті буде всього три рівня формального представлення речень: морфологічний, поверхово-синтаксичний та глибинно-синтаксичний.
Морфологічний компонент системи забезпечує перехід (встановлення відповідності) “Речення - МС”. Під МС розуміємо послідовність імен лексем, що входять в речення, при цьому імені кожної лексеми приписана певна граматична характеристика.
Поверхнево-синтаксичний компонент забезпечує перехід “МС - ПСС”. Під ПСС розуміємо дерево залежностей, вузли котрого відмічені іменами лексем, які забезпечені наборами семантично змістовних граматичних характеристик, стрілки котрих відповідають одному з специфічних для даної природної мови поверхнево-синтаксичних відносин.
Глибинно-синтаксичний компонент забезпечує перехід “ПСС - ГСС”. Під ГСС розуміємо дерево залежностей, вузли котрих можуть бути відмічені іменами конкретних лексем чи фразем та двох типів фіктивних лексем: іменами потенційних (фіктивних) слів, які у данній мові неможливі, та іменами глибинно-синтаксичних слів, які репрезентують на глибинному рівні смисл семантично змістовних поверхнево-синтаксичних відносин.