Смекни!
smekni.com

Изобретание, проектирование, разработка и сопровождение) Том Интеллектуальные системы (Системы решения проблем)  Альберт Александрович Красилов (стр. 14 из 85)

С.Лец

Глава 4. Представления понятий

Главные вопросы этого тома имеют отношение к представлению сведений в памяти ВМ. Здесь касаемся только представлений тех объектов, которые рассматриваются в концептуальной информатике. Термин представляется в соответствии с правилами лингвистики для понятий (по СиГ и СеГ). При этом учитываются и свойства средств написания терминов, символики и технических средств и методов хранения термина или его атрибутов. Понятия или его определения (лексемы и термины) имеют средства для представления в современной информатике. Современная концептуальная информатика выработала определенные методы представления указанных объектов. Кратко рассматриваются некоторые методы представления имен, понятий и определений понятий.

Очевидно, имеется два вида представлений – внешнее (для пользователя) и внутреннее (в памяти ВМ) представление. Первое связано с восприятием информации человеком, второе - с возможностью обработки информации на машине. К первому предъявляются требования - ясности и четкости восприятия человеком, ко второму - возможности обеспечения эффективного использования памяти и обеспечения быстродействия алгоритмов обработки сведений и знаний. Кратко рассмотрим эти виды представлений. Рассмотрение никоим образом не претендует на полноту и обеспечивает лишь очерчивание круга тем.

Внешнее и внутреннее представления сопровождаются словарями, с помощью которых осуществляется создание, анализ или распознавание и синтез или точное конструирование текстов. Словари играют фундаментальную роль в информатике. Они также должны иметь два способа представлений: внешнее для человека и внутреннее для эффективной работы Интеллсист.

4.1. Некоторые соображения о внешних представлениях

Одна из проблем концептуальной информатики состоит в разработке методов представления знаний всех видов. (Пока временно абстрагируемся от графического и предметного видов.) Эта проблема продвинута во многом в программировании, на него и нужно в большей части ориентироваться. Как уже было сказано, имя (это обозначение понятия, которое имеется во всех языках представления данных, программ и текстов) предназначено для человека, как главная составная и элементарная часть знаний, которая имеет известную форму представления последовательностью символов (букв, цифр или еще каких-либо символов или знаков). Внешнее и внутреннее представления имени можно считать известными вещами. Внешние имена обычно представляются в таблицах имен (таблица идентификаторов, слов или терминов), внутреннее представление - это некоторая байтовая структура.

Похожая на проблему представления имен разрешается проблема представления терминов. Термин является именем понятия, но термин существенно расширяет понятия имени. Имеются некоторые проблемы внутреннего представления многословных терминов (словосочетаний или последовательности слов и знаков), поскольку понятие термина по-новому толкуется в информатике. В каждом представлении термина необходимо указать на связи между различными терминами. При этом необходимо учитывать, что в различные термины могут входить одинаковые имена (слова или знаки).

Представление словарей или лексиконов характеризуется проблемами относительно их внутреннего представления. Словари для многословных терминов (лексиконы) имеют особенности, связанные с указаниями ссылок от одного имени к другому имени с учетом факта совпадения некоторых имен в составе многословных терминов. Словарь терминов в информатике, приведенный в конце книги является иллюстрацией его внешнего представления. Понятие имеет внешнее представление в самых разнообразных видах и формах. Это подробнее рассматривается в главе 5. Внутреннее представление - это представленные каким-либо методом данные в различных видах и формах, программы на самых различных языках, БД и БЗ и др. кодированные сообщения.

Определения понятий имеют известное для человека внешнее представление в форме суждений, а соответствующее ему внутреннее представление состоит из логических формул, представление которых складывается из представлений составных частей определения - терминов.

Для представления смысла не существует известных специальных средств. Здесь проблемы вытекают из того факта, что смысл термина, понятия или его определения должен учитываться при выборе методов кодирования информации об этих объектах. Например, для эффективного учета смысла понятия обычно используют семантические сети или фреймы, а также логические формулы некоторых языков внутреннего представления выражений и их составных частей. Известные способы представления сетей и фреймов укладываются в структуры языка Лейбниц. Для Интеллсист смысл представляется лексемами или структурами из лексем.

При выборе методов внешних и внутренних представлений необходимо учитывать еще и следующие факторы:

- сохранение установившихся традиций для представлений, что обеспечивает преемственность в информатике по программам и данным, сохранность программного обеспечения и его применимость к новым данным (именам, терминам, словарям и лексиконам);

- использование преимуществ единообразия, одинаковости синтаксических правил в представлениях для обеспечения экономии операций ввода, хранения, обработки и вывода имеющихся или новых данных рассматриваемого сорта;

- применение методов сокращения представлений или введения заменителей (синонимов), принятых в данной области знания, для обеспечения эффективности использования памяти и быстродействия программ;

- максимальное использование в текстах фиксированных, понятных или общеупотребительных слов для обозначения имен и терминов для обеспечения плотной упаковки информации, связанной с этим зарезервированными словами;

- принятие во внимание более сложных методов сокращения представлений, методы должны базироваться на ортогональности и независимости понятий, на недопущении тавтологических определений типа «данное понятие есть данное понятие»;

- учет ближайшего или далекого контекста в представлениях данных и программ их обработки для обеспечения точности передачи в Интеллсист понятий, их определений и смысла;

- максимальный учет имеющихся ФЯ, а также ЕЯ, или методов представления данных и программ обработки имен, терминов, словарей и лексиконов для обеспечения эффективности труда программиста и пользователя различными системами.

Ограничимся указанными требованиями к внешнему (да и, пожалуй, частично к внутреннему) представлению указанных объектов. Концептуальная информатика выработала массу разнообразных методов и приемов для реализации представлений. В особенности внешние представления рассматриваются при описании грамматики ФЯ. Она точно определяет все внешние представления понятий вместе с описанием их смысла.

4.2. Внутренние представления

Многолетняя практика применения ВМ выработала множество приемов, способов и методов формирования внутреннего представления данных, программ и знаний. Упаковка чисел, массивов, записей, списков и стеков, формул и программ известна в самых разнообразных языках программирования и представления данных. В конечном счете, стандартизация представлений привела технические и программные средства к формам, которые именуются теперь байтовыми представлениями. Байт - это место для кода одного внешнего символа. Если необходимо представление числа, то используется один или несколько байтов, если необходимо представление двоичной информации, то используется один байт (при кодировании двоичных векторов длины не более восьми) или несколько байтов (при кодировании двоичных векторов длины более восьми). Массивы, таблицы и записи для внутреннего представления используют композицию из представлений их элементов.

Для структурного данного (массива, записи, списка, стека и др.) используется понятие паспорта данных, который содержит все значения атрибутов этого данного. Структура паспорта известна, но обратим внимание на одну особенность представления паспортов. Паспорт содержит следующие атрибуты:

1. Внешнее имя с атрибутами (дата, состав термина, ссылки на определение).

2. Размерность объекта и его структурность.

3. Размер по каждому измерению в каких-либо единицах.

4. Размер элемента в битах.

5. Свойства представлений (упаковка, система кодов).

6. Адрес расположения значения.

7. Состояния данного (загрузка, начальное присваивание, возможность доступа, даты последнего вызова и формирования, число обращений и др.).

Атрибутами внешнего имени являются все имена, которые относятся к внешней спецификации объекта.

Существенное отличие имеют представления графической и предметной информации. Иногда используется символьное представление, с помощью которого можно автоматически генерировать изображения на экране. Графическая информация кодируется чаще всего двоичным вектором. Если вместе с кодом представления точки экрана необходимо передавать окраску этой точки, то используется байтовая организация памяти ВМ.

Специальные и проблемно-ориентированные ВМ могут использовать другие кодировки для обеспечения выполнения требований по надежности, быстродействия, эффективности и защищенности информации. Использование несовместимых со стандартами универсальных форматов представлений может вызвать затруднения при создании инструментария для программирования проблемно-ориентированных ВМ.

Словари представляются двумя методами: древовидно для быстрого поиска и таблично (коллекция) для создания внешних представлений при печати результатов. В первом методе используется граф «и-или» с подходящей интерпретацией операций «и» и «или». Кроме словарей в Интеллсист представляются таблицы для наборов однотипных лексем.

4.3. Словари из символов и слов

Издревле принято изобретать символы для обозначения предметов, явлений или процессов. Предметная символика постепенно была заменена алфавитом или набором унифицированных символов, которые используются для быстрого составления текстов и просто имен самих предметов. Каждая народность составляла свой алфавит, возможно иногда ориентируясь на известные алфавиты. Такие алфавиты в информатике называют таблицами символов или словарями символов.