Теперь, если с помощью выбранных средств диагностики состояний сердца оценены признаки, характеризующие его деятельность, то сопоставление полученных апостериорных данных (по результатам опытных измерений) с априорными (доопытным описанием классов) позволяет произвести распознавание конкретного класса заболеваний или отсутствие заболеваний вообще.
Эти два примера показали, что подходы к построению систем распознавания практически ничем не отличаются, несмотря на специфику самих создаваемых систем.
В результате мы получили общие представления о последовательности решения и составляющих задачи создания системы распознавания. В результате отмечаем, что несмотря на различие предметных областей подходы к построению СР - одинаковы. Система распознаваний заболеваний сердца строилась также, как и система распознавания самолетов, но заменить ее она не позволяет. Точно также СР самолетов не может применяться для решения задач распознавания заболеваний сердца.
Системы распознавания объектов (явлений), создаваемые человеком всегда узко специализированы в отличии от его собственных природных возможностей.
Что же касается общего подхода к построению любой системы, то теперь, если у нас имеется некоторая совокупность объектов или явлений, которые необходимо распознавать (классифицировать), на основе обобщения действий при создании СР в 2-х рассмотренных примерах мы знаем, что последовательность решения соответствующих задач следующая:
-в соответствии с выбранным принципом совокупность объектов или явлений подразделяется на ряд классов (говорят: назначается алфавит классов);
-разрабатывается совокупность признаков (говорят: словарь);
-на языке словаря признаков описывается каждый класс;
-выбираются и (или) создаются средства определения признаков;
-на вычислительных средствах реализуется алгоритм сопоставления апостериорных и априорных данных и принимается решение о результатах распознавания.
В то же время, несмотря на выполненное определение последовательности действий, проведенное рассмотрение не позволяет ответить на следующие вопросы:
-как лучше производить разбиение объектов (самолеты, заболевания и пр.) по классам;
-как накапливать и обрабатывать априорную информацию;
-из каких соображений выбирать признаки;
-как описывать классы на языке признаков;
-на основе каких методов сравнивать априорную и апостериорную информацию;
-когда и как появляется вся система распознавания.
Все эти вопросы являются предметом рассмотрения в пределах читаемого курса. Мы будем их детализировать все более глубоко по мере освоения предмета.
На последний вопрос следует дать предварительный ответ до того, как мы проведем упомянутое углубленное изучение. Система должна появляться с самого начала изучения вопроса. Этот вариант ее должен представлять собой модель-прообраз будущей системы распознавания. Сейчас мы должны понять только одно - без такой модели создание СР чаще всего невозможно вообще. Без нее мы не сможем выбрать ни набор классов, ни перечень признаков, ни средства измерений их, ни решающие правила, обеспечивающие в комплексе, во взаимосвязи требуемое качество решений о принадлежности. Это обусловлено тем, что полная информация для создания СР на момент начала ее создания всегда отсутствует и без экспериментальной отработки всего процесса принятия решений не всегда ясно, какая информация может вообще потребоваться. Поэтому модель должна позволить методом последовательных приближений внутренней структуры системы к требуемой достигнуть желаемого результата. В то же время вопросы моделирования СР не могут быть рассмотрены на нынешнем уровне полученных знаний. Поэтому моделирование СР - предмет дальнейшего изучения курса "Основ построения систем распознавания образов"
Итак, главные выводы:
1. Задачи, решаемые в процессе создания систем распознавания, инвариантны относительно предметной области, имеют много общего, основываются на едином методологическом подходе.
2. Каждая система распознавания индивидуальна и предназначается только для одного вполне конкретного вида объектов или явлений.
Если найдена сфера применения распознавания, то соответствующая система должна разрабатываться заново с учетом новых специфических свойств объектов (явлений), определяющих как систему измерений характеристик, так и словарь признаков, алфавит классов и алгоритм принятия решений.
3. СР должна создаваться методом последовательных приближений внутренней структуры на ее математической модели по мере накопления необходимой информации.
Теперь, после того как мы на качественном уровне рассмотрели проблематику распознавания, можно провести дополнительную детализацию и определить последовательность задач создания соответствующих систем.
Л Е К Ц И Я 2.2
Формулировка задач создания систем
распознавания и методы их решения
ЗАДАЧА № 1
Определение полного перечня признаков (параметров), характеризующих объекты или явления, для которых данная система разрабатывается.
В решении этой задачи - главное найти все признаки, характеризующие существо распознаваемых объектов (явлений). Любые ограничения, любая неполнота, как мы в последующем убедимся, приводят к ошибкам или полной невозможности правильной классификации объектов (явлений).
Можем себе представить такую неполноту в уже рассмотренной нами задаче распознавания самолетов как использование одного признака - потолок высоты полета самолетов. В результате - бомбардировщики не удастся отличать от истребителей ( при создании бомбардировщиков стремятся к обеспечению максимально возможной высоты полета, а при создании истребителей добиваются, чтобы они могли уничтожать бомбардировщики).
Реально даже целая группа признаков может оказаться неэффективной.
Поэтому для решения 1-ой задачи создания СР необходимо найти все возможные признаки, описывающие объекты распознавания, с тем, чтобы при оценке эффективности решений системы не возвращаться к этой задаче, обнаружив ограниченность выбранных признаков на последующих этапах разработки.
Но чтобы назначать признаки распознавания, необходимо, во-первых, понять, что не существует способов их автоматической генерации. На сегодня это под силу только человеку. Поэтому говорят, что выбор признаков - эвристическая операция. Во-вторых, выбор признаков можно осуществлять, имея представление об их общих свойствах. С этих позиций достаточно принять, что признаки могут подразделяться на:
-детерминированные;
-вероятностные;
-логические;
-структурные.
А. Детерминированные признаки - это такие характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения.
Примерами детерминированных признаков могут быть, например, ТТХ бомбардировщиков и истребителей США (таблицы № 1, 2).
Числовые значения признаков по каждому из самолетов можно интерпретировать как координаты точек, представляющих каждый самолет в 11-мерном пространстве признаков.
Необходимо иметь в виду, что в задачах распознавания с детерминированными признаками ошибки измерения этих признаков не играют никакой роли, если, например, точность измерений такого признака, как размах крыльев самолета значительно выше (например, 1 мм), чем различие этого признака у разных классов самолетов (например, 10 м).
Представить такую систему, где используются детерминированные признаки не так трудно:
-распознавание принадлежности самолета, данные которого получены разведкой или из открытой печати и не привязаны к классам (бомбардировщик- А1, истребитель-А2 и т.п.);
-распознавание на конвейере деталей по отличию геометрических характеристик, если ошибки измерений существенно меньше разметов этих деталей.
Распознавание осуществляется путем сравнения полученных размеров с имеющимися в базе данных характеристиками деталей.
Б. Вероятностные признаки - это характеристики объекта (явления), носящие случайный характер.
С такими признаками в основном и имеют дело в природе и технике.
Отличаются эти признаки тем, что в силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов, каждый из которых подлежит распознаванию в системе.
Таблица № 1
Характеристики | Т и п ы с а м о л е т о в | |||
В-1А | В-52 | В-57А | FB-111 | |
Экипаж (чел.) | 4 | 6 | 2 | 2 |
Vmax (км\ч) при H=15 км | 2330 | 1020 | 935 | 2330 |
Vmin (км\ч) при H=0.3 км | 1200 | 500 | 500 | 1350 |
Потолок (м) | 15240 | 15000 | 13750 | 20000 |
Бомб.нагрузка (т) | 22 | 34 | 14 | 16 |
Макс.взлетная масса (т) | 180 | 221 | 25 | 45 |
Размах крыльев (м) | 42 | 56 | 19 | 21 |
Длина самолета (м) | 44 | 48 | 20 | 22 |
Кол-во двигателей | 4 | 8 | 2 | 2 |
Тяга двигателей (т) | 13.6 | 7.7 | 3.3 | 9.2 |
Дальность полета (км | 11000 | 20000 | 4380 | 6600 |
Таблица ¹ 2
Характериcòèêè | Т и п ы с а м о л е т о в | ||||
F - 4 E Фантом | F - 105 E Тандер-чиф | F - 15 Игл | F - 100 D Супер-сейбр | Хантер | |
Экипаж (чел.) | 2 | 2 | 1 | 1 | 1 |
Vmax (км\ч)при H =15 км | 2330 | 2230 | 2655 | 1400 | 1000 |
Vmin (км\ч) при H =0.3 (км) | 1470 | 1400 | 1470 | 1220 | 1150 |
Потолок (м) | 19000 | 15000 | 21000 | 15000 | 17000 |
Бомб.нагр. (т) | 7.2 | 6.4 | - | 3.4 | 0.9 |
Макс.взлетн. масса (т) | 26 | 24 | 25 | 18 | 11 |
Размах крыльев (м) | 12 | 11 | 14 | 11 | 10 |
Длина самолета (м) | 18 | 21 | 19 | 12 | 13 |
Кол-во двигателей | 2 | 1 | 2 | 1 | 1 |
Тяга двигателей (т) | 5.4 | 12 | 10.9 | 5.3 | 4.5 |
Дальность полета (км) | 885 | 760 | 1100 | 860 | 560 |
Если признак не может принять значений в области соответствующих значений для других классов, то, следовательно, имеем дело не с вероятностным, а с тем же детерминированным признаком. Это как раз подчеркивает, почему вероятностные системы являются системами более общего порядка.