Кроме моделей, разработанных в рамках каждого из этих подходов, отдельно выделяют (относя к обоим подходом сразу) бионическое направление, представленное генетическими алгоритмами и нейронными сетями.
В каждом подходе мы увидим свое отношение и к тому, что является знанием, и к тому, как его представлять. Если в теоретических моделях знания строго формализованы, то эмпирические призваны дать некоторую свободу. Однако, ценой за эту свободу будет потенциальная невыводимость некоторых решений и невозможность найти ответ на поставленный вопрос, когда теоретические модели это гарантируют.
Рассмотрим каждую из моделей.
Это одна из самых распространенных моделей представления знаний. В ее основе лежит набор правил вида «если условие, то действие», описывающих знания. Оперируя этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию.
Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.
Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а построение выводов и получение новых знаний сводится к реализации процедуры логического вывода. Этот процесс может быть строго формализован, так как в его основе лежит классический аппарат математической логики.
Сложности могут возникнуть при описании неоднородных миров (объекты относятся к разным категориям и их связывают различные отношения). Для преодоления этой и других сложностей в конкретных предметных областях используют расширенные модели, использующие нечеткую логику, оперирующие эмпирическими кванторами.
Такие расширенные модели объединяют возможности логического и лингвистического подходов, в результате чего называются логико-лингвистическими моделями данной предметной области.
Сетевая модель (или семантическая сеть) в инженерии знаний представляется направленным графом, узлы которого соответствуют понятиям и объектам, а дуги — отношениям между ними. В сетевой модели основными отношениями являются is-a и part-of, с помощью которых можно описать большой объем знаний.
Семантическая сеть позволяет снизить объем хранимых данных, обеспечивает реализацию ассоциативных связей. Проблема гибкости модели и существования бесконечного множества возможных связей решается добавлением новых типов отношений. В проектах, посвященных моделированию человеческой памяти, также было предложено при использовании расширяемой подобным образом семантической сети также строить модель, хранящую все типы соединений и отношения подобия и взаимозаменяемости между ними.
Форальная грамматика (теория) состоит из алфавита (словаря), множества синтаксических правил, которые позволяют определить истинность или ложность выражений, построенных в данном языке, базовой системы подобных выражений, которые всегда истинны и называются аксиомами, множества правил вывода, позволяющих преобразовывать одно выражение в другое.
В основе этой модели лежит исчисление высказываний, которое можно считать классическим примером аксиоматических систем. Эта система хорошо исследована и имеет разработанную модель логического вывода. Эти свойства переносятся и на модель, ее использующую.
Главным недостатком является отсутствие гибкости системы. В случае модификации или расширения модели может потребоваться перестроить всю систему, что для практических систем неприемлемо. Как следствие, формальные грамматики используются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов.
Фреймовая модель основана на концепции Марвина Мински — профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания. В отличие от других моделей в ней фиксируется жесткая структура информационных единиц, которая называется протофреймом (конкретным фреймом).
Сам фрейм представляет собой структуру данных для представления некоторого объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Значением слота может быть практически что угодно: числа или математические соотношения, тексты на естественном языке или программы, правила вывода (в случае терминального слота), либо ссылки на другие фреймы. Это позволяет реализовать систему отношений между фреймами и даже рекурсию.
Каждый фрейм состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.
Иерархия фреймов может описывать либо объект (тогда фреймы — составные части объекта, а слоты описывают его свойства), либо ситуацию или процесс (тогда фреймы — факты или этапы, а в слотах содержатся еще и вызываемые процедуры).
Комбинаторные модели основаны на рассмотрении дискретных объектов, конечных множеств и заданном на них отношении порядка. В рамках комбинаторики также рассматриваются все возможные изменения, перестановки и сочетания, в рамках заданных множеств.
Комбинаторные модели используются в задачах топологии (например, поиск пути), задачах прогнозирования поведения автоматов, при изучении деревьев решений, частично упорядоченных множеств.
Основная проблема указана еще в определении этой модели: она оперирует только дискретными объектами и конечными множествами, связанными однородными отношениями.
Ленемы представляют собой смешанный тип модели, являющийся как бы «развитием» других моделей (фреймы, семантические сети и т.д.).
Ленема предназначена для структурного комплексного описания понятий предметной области. По изобразительным возможностям ленемы более совершенны, чем такие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это такие понятия, в описании которых очень большую роль играет внутренняя динамика. Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:
1) логическую (продукционная и логическая модели);
2) структурную (семантические сети и фреймы); 3) процедурную.
Для некоторых ситуаций это очень удобно, так как при реализации сложных моделей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.
Алгебраическая модель подразумевает представление знаний в виде некоторых алгебраических примитивов, над которыми определено множество действий (некоторые из которых можно задать таблично). Для набора знаний представленного в таком виде действуют правила алгебраических множеств, такие как аксиоматизация, определение подсистем и отношений эквивалентности. Также возможно построение цепей множеств (множества, для которых определен порядок отношения «быть подсистемой»).
Изначально предполагалось использовать подобную модель в качестве формализованной системы построения аналогий (за счет определения эквивалентности). Однако, на эту формальную модель очень сложно отобразить весь набор знаний, поэтому от этой идеи отказались.
Эти модели нельзя строго отнести к эмпирическому или теоретическому подходам. Их относят, как было сказано ранее, к бионическому направлению. Оно основывается на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком.
Так, в нейронных сетях моделируются персептроны и их поведение, призванные скопировать дейтельность мозга, а генетические алгоритмы несут в себе принципы естественного отбора и эволюции (за счет внесения изменений через мутации и смешение наследственностей).
Особенностью моделей этого типа является широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.
Мы рассмотрели основные подходы к построению моделей представления знаний. У каждой из них есть свои достоинства и свои недостатки, которые делают каждую из них наиболее эффективной в конкретной области и при определенных условиях.
Однако, после рассмотрения этих моделей становится очевидно, что создание интеллекта, подобного человеческому в плане самостоятельных обработки информации и использования знаний, пока невозможно. По крайней мере, не в чистых моделях. Логично предположитель, что требуется совместить некоторые из этих моделей для получения основных качеств, свойственных человеческому разуму.
Но даже в случае создания подобного интеллекта останется еще несколько качеств, которые практически невозможно запрограммировать (о чем неоднократно говорят, например, создатели и исследователи экспертных систем) — такие как неординарность мышления и способность к творчеству, умение строить предположения и догадки, создавать теории и идеи. И, как ни странно, именно эти качества в свое время подтолкнули человечество к идее создания искусственного интеллекта.
Список литературы
[1] http://ru.wikipedia.org/
[2] http://aiportal.ru/
[3] http://makhfi.com/
[4] http://uni-dubna.ru/~mazny/students/upr_zn/
[5] http://hr-portal.ru/