Буква | Число слов | % | Буква | Число слов | % | Буква | Число слов | % |
А | 560/40 | 3.8 | к | 940/95 | 6.3 | Ф | 250/15 | 1.7 |
Б | 410/57 | 2.7 | л | 270/15 | 1.8 | Х | 130/15 | 0.9 |
В | 1100/45 | 7.4 | м | 590/85 | 4.0 | Ц | 80/10 | 0.5 |
Г | 460/75 | 3.1 | н | 940/35 | 6.3 | Ч | 140/20 | 0.9 |
Д | 570/25 | 3.8 | о | 1180/35 | 7.9 | Ш | 130/ 5 | 0.9 |
Е | 45/15 | 0.3 | п | 2270/40 | 15.2 | Щ | 30/ 0 | 0.2 |
Ж | 75/ 5 | 0.5 | р | 830/65 | 5.6 | Э | 220/ 5 | 1.5 |
З | 580/15 | 3.9 | с | 1440/85 | 9.7 | Ю | 40/ 5 | 0.3 |
И | 500/30 | 3.4 | т | 540/50 | 3.6 | Я | 110/10 | 0.7 |
й | 5/ 5 | 0.03 | у | 480/20 | 3.2 |
Общее число английских слов из исходного текста, включая собственные имена, составляет 2570. Они возникали в различных текстах из 1145 текстовых фалов. Заметим, что в исходный словарь добавлены стандартные слова ЯЛ и их английские переводы.
Приведенная таблица имеет значительную выборку, поэтому можно предположить, что она характерна для любого ЯПП. Исключение может составить ЯПП в юриспруденции, в работе следователя или в управлении отраслями деятельности человека. Большим числом слов отличается словарь почти каждой естественной науки (геологии, биологии, лингвистики, истории и др.).
Определим смысл текста следующим образом. Смысл понятия определен выше как совокупная запись термина понятия и его полной характеристики (определение, тип, вид, состав из слов и знаков для термина, дата введения в БЗ). Каждый абзац - осмысленное высказывание - являет собой логическое выражение, или композицию терминов. Абзац является новым (по отношению к составляющим его частям) понятием, термин которого (или наименование) умалчивается или можно сказать подразумевается. Новые подразумеваемые понятия образуют иерархию входящих в него понятий. Текст состоит из абзацев, которые представляют внутри некоторого раздела логические выражения (их композицию) из подразумеваемых понятий. Образовано новое более высокого уровня подразумеваемое понятие. Оно поименовано термином, являющимся наименование раздела. Процесс такого анализа текста завершается после рассмотрения всех разделов (или разделов более высокого ранга). В результате процесса получается понятие, поименованное названием всего текста. Имя текста задано явно (название статьи, книги или БЗ), а термин можно считать полностью определенным всей иерархией понятий или композицией понятий. Например, весь текст об информатике определяет это понятие, обозначенное словом «информатика».
Смысл текста определяется свойствами составленного таким образом понятия. Если текст состоит из одного абзаца, то он имеет смысл определения подразумеваемого понятия. То же можно сказать о разделах или обо всем тексте, состоящем из разделов. Таким образом, смысл текста - это сущность определяемого им понятия вместе со всеми его характеристиками. Иерархия понятий образует иерархию смысла текста, которая может быть полезной для подробного анализа понятия смысла текста. Заметим, что некоторые определения новых подразумеваемых понятий могут оказаться рекурсивными (как, например, построено определение смысла информатики). Здесь может быть обнаружено противоречие, которое состоит в авторекурсии, не имеющей «выхода». Лучше всего проиллюстрировать эту ситуацию на математическом примере.
Пусть Х определяется рекурсивно как Х = Р(Х), т.е. понятие с термином Х определяется через себя (в частности). Конечно, если это равенство разрешимо, тогда Х вполне определяется. Чаще всего имеют дело с неразрешимыми равенствами. Необходимо определение начального значения Хо. Тогда имеется шанс получения значения Х в итерационном процессе: Х1 = Р(Хо), Х2 = Р(Х1),... Хi должно сходиться к Х. Опять может возникнуть коллизия при расходимости процесса итерации. Нужно быть уверенным, что итерационный процесс сходится. Возникает интересная проблема корректности знания (смысла) данного понятия. С нескольких точек зрения можно рассматривать корректность: имеется ли решение для определения Х, имеется ли исходное значение Хо, сходится ли итерационный процесс, какова область применения понятия и какова область его значений. И еще один подводный камень состоит в том, что определения понятий могут быть связаны самым причудливым образом. Например, Х=Р1(Х, У), У=Р2(Х, У) или цепью взаимных ссылок одного определения на другой, а оно по цепочке связано с исходным определением понятия Х. Число проблем корректности увеличивается во много раз.
Все высказанные соображения практически не порождаются в ЯПП, чаще всего такие образцы определений встречаются в математике, которые находятся под полным контролем математиков. В практических (но только не в философских) ЯПП исследование корректности не необходимо. К этому надо добавить, что принятая в ИИС автоматическая отладка знаний разрешает большую часть перечисленных проблем.
6.5. Приемы построения определений в ИП
Под приемами построения определений понимается указание на то, как оно должно строится во избежание неточностей или ошибок самого определения. Под приемами построения понимается конкретное предписание для формирования определения. В целом, правила и приемы формируют метод построения определения некоторого понятия. Приемы описаны формально в языке Лейбниц, именно они будут предметами рассмотрения в этой главе. Практика не придерживается данных ниже правил и приемов, определения понятий вытекают естественным образом из знаний, которые вводятся в БЗ или находятся в текстах. Тем не менее, правила и приемы построения важны для ввода более точных знаний, обеспечивающих получение новых фактов и полного ответа на всю совокупность запросов пользователя.
Перечисления и метапонятия. Наиболее простым формализмом является перечисление. Определение некоторого понятия (например, конкретного множества предметов) составляется из указания наименований конкретных значений определяемого понятия. Так определяются в языках программирования перечислимые типы данных. Например, понятие типа «движение» определяется так:
раздел типа движение = (влево, неподвижно, вправо).
Если ясна закономерность получения каждого значения определяемого понятия, тогда отпадает необходимость фактического перечисления всех значений. В определении тогда помещаются только представительные значения. Например, определение натурального ряда чисел обычно строится так:
раздел типа натуральное число = (1, 2, 3,...).
В языке Лейбниц такая конструкция отсутствует.
В других случаях можно указать только начальные и конечные значения данного понятия. Может указываться и шаг - расстояние между двумя соседними значениями. Когда определяется отрезок натурального ряда, то записывают начальное значение, шаг и конечное значение:
индекс = 1 (1) 10,
буква = «а»..«я».
Многие определения строятся аналогично приведенным примерам. Конечно, это относится к определениям ФЯ записи программ, данных и различных структур знаний.
6.5.1. Языки определений понятий. Определения понятные человеку, если используется ЕЯ или ЯПП. Такие определения годятся для ввода знаний о понятиях в Интеллсист. Однако в Интеллсист имеются средства для более детального описания определений своими специальными средствами. ФЯ Лейбниц точно определяет приемы и средства определения понятий. Они могут оказаться недоступными для пользователя (из-за оправданного нежелания изучать ФЯ). Поэтому определение каждого понятия для Интеллсист строится с помощью меню или оконной техники интерфейса инструментария Интеллсист. Следовательно, языком ввода понятий является язык Лейбниц, который работает неформально через меню.
Определение понятий через меню инструментария составляет первый шаг ввода знаний о понятии. Вторым шагом является ввод текстов, которые содержат взаимосвязи понятий, которые (взаимосвязи) передают содержательную часть определений. В ИЛ принято, что определение каждого понятия дается аксиоматически. Аксиомами являются фразы и абзацы ЯПП, имеющие истинные значения. Именно аксиомы в ИЛ являются средством ввода знаний о понятиях, а языком определений является ЯПП.