Таким чином, ми можемо сприймати даний текст як зв'язний.
Отже, ми розглянули поняття “фрейм” і фрейм “жіночності” з точки зору когнітивної лінгвістики.
1.2 Фреймовий підхід в дослідженнях семантики
Провідним напрямком сьогоднішньої когнітивної лінгвістики є когнітивна семантика, для якої характерне прагнення так чи інакше співвіднести мовні форми з їх ментальними репрезентаціями, встановити способи представлення інформації в людській свідомості і описати взаємозалежності, що існують між ними і мовою [2, c. 12].
Тому не дивно, що значна частина робіт з когнітивної лінгвістики присвячена змістовним аспектам мовних форм.
Як і Е. Кибрік, ми вважаємо, що до області семантики (у широкому сенсі) відноситься вся інформація, яку має той хто говорить, при розгорненні вислову і яку необхідно відновити адресатові для правильної інтерпретації цього вислову» [3, c.36].
Для повного і успішнішого дослідження семантики мовних одиниць необхідно надати енциклопедичну інформацію, тому одним з ключових постулатів когнітивної лінгвістики А.Н. Баранів і Д.О. Добровольський називають тезис про нерелєвантність зіставлення лінгвістичного і екстралінгвістічеського знання [4,c.56].
Перспективним методом когнітивного дослідження, що дозволяє описати семантику мовних одиниць, об'єднуючи мовну і немовну інформацію, є метод фреймової семантики. За його допомогою можна спробувати представити когнітивну структуру – фрейм, що лежить в основі значення визначеної групи лексем.
Система асоціативно-семантичного контекстного аналізу текстів розроблена на основі глобальної мультилінгвістичної лексико-семантичної онтологічної бази знань UkrRusWordNet, що підтримує лексикони української, російської й англійської мов.
Функції й процедури семантичного аналізу реалізовані на базисі гіпермережі даної онтології. Процес асоціативно-семантичного аналізу в системі можна умовно позділити на три етапи:
- перехід від слів і словосполучень речень до відповідних семантичних значень – концептів онтології;
- збірка семантичних фреймів речень тексту;
- об'єднання семантичних структур речень тексту в єдину семантичну мережу тексту.
На першому етапі система визначає в семантичній мережі онтологічної бази знань концепт, що відповідає коректному значенню слова або словосполучення в тексті.
Це завдання вирішується пошуком того значення слова з множині можливих альтернатив концептів, що семантично є найбільш близьким до значень слів-сусідів з локального оточення даного слова.
Ступінь близькості знаходиться пошуком найкоротшого шляху між концептами в мережі онтології [12,с.2].
Таким чином, обчислюється відстань в онтології між передбачуваним значенням слова й концептами-значеннями слів найближчого оточення. У системі реалізована алгоритмічна модель контекстного аналізу.
Другий етап – побудова семантичного фрейму поточного речення вхідного тексту. Він полягає в заповненні слотів фреймової структури речення.
Вибір типу слота для заповнення значенням концепту слова залежить від синтаксичної позиції цього слова в граматичній структурі речення. Заповнення слотів виконується шляхом аналізу дерева розбору речення й синтаксичних позицій слів і словосполучень для кожного концепту з використанням семантико-синтаксичних таблиць модально-рольових відмінків, подібних до відмінків Філмора [33,с.123].
Третя фаза значеннєвого аналізу – об'єднання ізольованих семантичних фреймів речень у зв'язну семантичну мережу тексту. Об'єднання двох структур в одну мережу виконується за принципом об'єднання семантично тотожних вершин, тобто якщо в структурах G1 і G2 є вершини, які посилаються на один семантичний концепт, ці вершини поєднуються в одну.
На виході системи генерується семантична мережа вхідного тексту, що містить у вершинах концепти тексту, пов'язані дугами семантичних відносин. Подальша значеннєва обробка отриманої семантичної мережі тексту дозволяє вирішувати широкий клас завдань комп'ютерної лінгвістики.
Був запропонований метод моделювання семантичного контексту й обчислення семантичної контекстної близькості значень слів з використанням онтологічної бази знань.
Онтологія є основою семантичного аналізу, тим семантичним полем, у рамках якого можна обчислювати значеннєву близькість семантичних інтерпретацій лексем тексту щодо найближчого оточення, тобто контексту.
Це і є відправною точкою для моделювання такого ключового явища, як язиковий контекст взагалі, і контекстного аналізу ЕЯ текстів зокрема.
Онтологія є ієрархічною семантичною мережею, вершини якої містять концепти (значеннєві одиниці), а дуги – це семантичні відносини між концептами.
Семантика (зміст) концепту описується його значеннєвими відносинами з іншими концептами мережі. Реляційна позиція концепту в онтологічній мережі описує його семантичне значення, властивості, відносини з іншими концептами й всі інші характеристики, які можливо передати природною мовою. Онтологічні технології використовують лінгвістичні моделі уявлення знань про навколишній світ і предметні галузі для ефективного запису й обробки інформації ЕЯ типу[42.с.18].
Слова й словосполучення мови зберігаються в лексиконі системи. Кожна лексема в системі посилається на безліч значень, які їй відповідають у даній мові.
Слово, ужите поза контекстом, може мати будь-яке значення з безлічі концептів, які прописані йому в онтологічній базі знань. Якщо слово вживається в контексті певного речення, то його значення повинне узгоджуватися зі значеннями слів, які стоять поруч.
Семантичні значення слів речення повинні створювати значеннєву єдність у структурі семантичного фрейму речення. Тому значення концептів слів, які стоять поруч у реченні, повинні бути семантично якнайближче один до одного.
На вхід блоку контекстного аналізу подається послідовність слів w1 w2 … wn... Кожному слову послідовності відповідає безліч значень-концептів з онтологічної мережі – {s1i}{s2i} … {sni}...
З кожної безлічі в процесі контекстного аналізу необхідно вибрати по одному значенню таким чином, щоб вони перебували на максимально близькій відстані один від одного. Тобто, щоб сума відстаней від кожного концепту до всіх інших була мінімальною [56,с. 70].
Семантична відстань між двома концептами може бути проінтерпретована як довжина найкоротшого шляху між відповідними вершинами в графі онтологічної мережі.
Окремого розгляду заслуговує алгоритм пошуку найкоротшого шляху в онтологічному графі між вузлами концептів слів. Чи можна будувати шляхи, не з огляду на типи зв'язків-відносин між вузлами й уважаючи їх однотипними?
Якщо ні, то які послідовності типів зв'язків-відносин у шляху можна вважати коректними, а які ні? Залежно від відповіді на ці питання можна запропонувати два підходи до визначення семантичної відстані:
Простий пошук шляху. Тоді вирішується класичне завдання пошуку найкоротшого шляху в графі. Типи зв'язків-відносин не враховуються. Вважається що всі дуги одного типу. Ще одним варіантом цього підходу є числове ранжирування зв'язків-відносин, де дугам різного типу привласнюються різні вагові коефіцієнти, але сам алгоритм пошуку найкоротшого шляху залишається без змін.
Евристичний пошук. При побудові найкоротшого шляху дозволяються тільки деякі послідовності типів зв'язків-відносин (Наприклад, у ланцюжку шляху дозволена послідовність типів зв'язків гіпернімія-голонімія-гіпонімія, і не дозволена послідовність гіпернімія-антонімія-гіпонімія). Такі послідовності пропонується називати евристиками шляхів. Процедура пошуку найкоротших шляхів управляється автоматом евристик, що як фільтр відбирає тільки ті зв'язки-відносини, які відповідають закладеним евристикам.
Коли найкоротший шлях знайдений, його довжина приймається як семантичну відстань між даною парою концептів.
Коли на вхід блоку контекстного семантичного аналізу надходить пари слів W1 і W2, потрібно з безлічей їхніх семантичних значень S1 і S2 вибрати відповідно парі значень концептів, який буде відповідати мінімальна семантична відстань, тобто мінімальна довжина найкоротшого шляху в мережі онтології.
Якщо побудувати найкоротший шлях в онтології між лексемами W1 і W2, він пройде через дану пару концептів, розташованих ближче всього один до одного. Якщо на вхід надходить послідовність із n лексем, то для кожної з них потрібно виконати (n-1) операцію пошуку найкоротшого шляху до лексем-сусідів за даним контекстом.
Тобто при рішенні завдання контекстного аналізу вхідної послідовності довжиною в n лексем необхідно виконати n(n-1)/2 операцій пошуку.
Пошук найкоротшого шляху між вершинами в графі є алгоритмічно дуже складною операцією, тому дана оцінка є, мабуть, украй неприйнятною.
Немає необхідності будувати найкоротші шляхи в онтологічній мережі між всіма лексемами вхідного речення. Здійснювати контекстну прив'язку в онтології з визначенням значень концептів лексем потрібно, якщо ці лексеми пов'язані синтаксичними відносинами в структурах дерева розбору речення.
У випадку існування правила, що пов'язує деяку пару слів вхідної послідовності в єдину синтаксичну групу, дані лексеми пов'язуються побудовою найкоротшого шляху між ними в онтологічній мережі.
Серед безлічей значень даних лексем вибираються ті вершини-концепти, через які знайдене найкоротший шлях в онтології.
Таким чином, відпадає необхідність побудови надлишкових ланцюжків найкоротших шляхів між всіма словами речення. Перевіряються тільки ті пари лексем, які мають зв'язок у синтаксичній структурі речення.
Результати роботи синтаксичного аналізу враховуються асоціативно-семантичним контекстним аналізом для оптимізації процесу побудови асоціативних зв'язків контексту між словами й словосполученнями речення в ієрархічній мережі онтологічної бази знань. Синтаксична структура вхідного речення є фундаментом і каркасом для етапу семантичного аналізу.