Смекни!
smekni.com

Построение систем распознавания образов (стр. 23 из 36)

Решение задач построения компьютерных моделей систем распознавания образов основывается на

-пониманиипринципов классификации и структуры систем распознавания;

-способов описания классов на языке словаря признаков;

-подходов к формализации показателей эффективности распознавания.

Начиная с декомпозиции, как одного из важнейших принципов построения моделей, можно заметить, что блочный состав моделей систем распознавания грубо уже определяют их схемы, рассмотренные при изучении принципов классификации. Поэтому модель СР первого приближения должна включать следующие основные элементы:

-распознаваемый объект (явление, процесс);

-технические средства (средства измерений);

-многоуровневая (в общем случае) система обработки измерений;

-алгоритм классификации.

Ну, а так как моделирование систем распознавания, как это было сформулировано выше, преследует целью проведение испытаний и получение оценки выполнения ими задач - эффективности -, то последним венчающим модель элементом в перечисленный состав должен быть включен блок оценки этого показателя (эффективности).

Рассмотрим более подробно все перечисленные элементы модели, стремясь к их детализации и определению принципов компьютерной реализации во взаимодействии друг с другом.

5.5.1. Моделирование распознаваемого объекта

Сложность модели распознаваемого объекта (явления, процесса) определяется полностью степенью физико-химической сложности его самого, условий его наблюдения и степенью доступности необходимых измерений.

Исходя из определения назначения системы распознавания ,- получение информации, необходимой для принятия решения о принадлежности неизвестного объекта (явления, процесса) к тому или иному классу ,- ничего другого не остается, как получить по возможности всю информацию, имеющую отношение к его распознаванию. Незнание или плохое знание описания объекта во всем диапазоне интересующих сторон, свойств, характеристик, факторов поведения не дает оснований надеяться на эффективность получаемых решений.

Заметим, что соответствующая задача (получение всей информации) не противоречит самой первой задаче, с которой начинается создание СР, - определение полного перечня признаков распознавания.

Говоря слова “модель объекта” (а равно “модель явления”, “модель процесса”) условимся, что при этом будем иметь в виду “модель объектов распознавания”, которые могут относиться к различным классам. Но так как в системе в каждом акте ее применения всегда имеют дело с одним неизвестным объектом, подлежащим распознаванию, а также имея в виду, что принципы моделирования всех объектов данной СР одинаковы (различны лишь характеристики), чаще всего используется термин “модель объекта распознавания”.

Исходя из этого определим модель объекта как цифровой имитатор совокупности его свойств, характеристик и состояний. Заметим, что, на первый взгляд, число моделируемых (имитируемых) свойств, характеристик и состояний объекта равно размерности словаря признаков распознавания. Так действительно, если в СР используется один простой признак распознавания, то и моделью соответствующего объекта должно имитироваться поведение этой одной характеристики, одного свойства, одного состояния объекта. Точно также, если СР использует несколько простых признаков, то имитатор объекта должен обеспечивать получение такого же количества характеристик (свойств, состояний) каждого моделируемого объекта. Однако если признак распознавания один, но комбинированный, то цифровой имитатор соответствующего объекта должен выдавать системе столько и таких его характеристик (свойств, состояний), сколько и каких используется для расчета этого комбинированного признака во многоуровневой системе. То есть, размерность вектора имитируемых свойств может быть больше или равна размерности вектора признаков распознавания.

Примеры.

1)Пусть в СР в качестве признака распознавания используется один - масса объекта. Значит моделью каждого из объектов, подлежащих распознаванию, будет в простейшем случае запись в банке данных каждого из них всего одного соответствующего числа в принятой размерности (тонна, килограмм, грамм и т.п.).

2)Пусть в качестве признаков распознавания в СР используются геометрические размеры объекта. Тогда модель каждого объекта, подлежащего распознаванию, будет представлять в простейшем случае три числа в соответствующем банке данных - длина, ширина, высота (м, дм, см, мм).

3)Пусть в СР метеоосадков в качестве признака дождей (а дожди бывают разными хотя бы по интенсивности) используется количество воды, попадающей на определенную поверхность земли. Тогда моделью любого класса дождей может быть всего одно число - количество мм осадков в час (месяц, год).

4)Пусть в СР распознаются звуки по высоте их тона. Тогда моделью каждого звука будет число, характеризующее частоту основного тона его и имеющее размерность - Гц.

5)Пусть в СР распознаются звуки по ряду признаков:

-высота основного тона;

-наличие низкочастотной модуляции основного тона;

-изменение интенсивности.

Тогда модель такого в данном случае сложного явления должна содержать по каждому классу, подлежащему распознаванию, по крайней мере, такие параметры как частота основного тона;

-частота модуляции;

-изменение амплитуды основного тона во времени (вид модуляции).

Чем сложнее свойства объекта, отражаемые в составе вектора признаков распознавания, тем сложнее модель этого объекта. Так, если для распознавания требуется знание геометрических характеристик объекта более полно, чем для определения длины, ширины и высоты, то такой объект должен уже представляться чертежами его в трех проекциях. Соответствующая модель - внешние контуры указанных проекций, представляемые

-либо в виде набора дискретных точек координат;

-либо в виде набора параметров сплайнов, аппроксимирующих указанные контуры;

-либо в виде радиально-круговых разверток указанных контуров, то есть , величин радиус-векторов, имеющих начало в некотором центре чертежа проекции и конец на границе контура.

Так или иначе мы имеем и здесь и в рассмотренных простейших случаях наборы числовых характеристик распознаваемых объектов, которые для каждого из объектов и представляются как его модель.

Утверждая, что чем больше размерность вектора признаков, тем сложнее модель объекта, мы как бы все и усложняем сами вполне сознательно. Действительно формирование словаря признаков, а значит размерности соответствующего вектора, - эвристическая операция. Причем эта задача обычно нацелена на то, чтобы как можно всестороннее охарактеризовать выбранным словарем объект распознавания. Ведь от количества и качества признаков распознавания зависит эффективность классификации. Поэтому получающееся отсюда усложнение модели следует считать естественным состоянием при стремлении к созданию высокоэффективной системы.

Для четкости последующего изложения вопросов построения моделей СР назовем банк данных с числовыми характеристиками распознаваемых объектов, соответствующими признакам распознавания, модулем статических характеристик объектов в составе модели объекта.

Этим модель не исчерпывается.

Следующий важный шаг анализа состава модели объекта (явления, процесса) основывается на представлении о том, как объекты распознавания появляются на входе системы распознавания. Достаточно трудно представить себе системы, на вход которых объекты попадают в строгой очередности. Обычно имеем дело с некоторым вероятностным распределением, то есть, каждый объект или группа достаточно близких объектов, образующих класс, предъявляются СР с конкретной априорной вероятностью.

Изоморфно этому одним из составляющих модель СР модулей должен быть элемент, осуществляющий вероятностный выбор предъявляемого объекта в каждом запуске программы модели распознавания. Таким образом каждый модельный эксперимент по распознаванию при наличии такого модуля должен начинаться со статистической задачи выбора объекта определенного класса, подлежащего в этом эксперименте распознаванию.

Логико-математические принципы построения модуля выбора объекта - это принципы генерации случайных событий методом статистических испытаний (Монте-Карло). При этом, если каждый класс, для которого определена априорная вероятность, представляется одним объектом, то имеем дело с одним датчиком случайных событий (появлений объектов на входе СР). Если же каждый класс содержит несколько однотипных объектов, то соответственно модуль должен иметь и второй датчик случайных событий, заключающихся в появлении на входе системы одного конкретного объекта из набора их (полной группы событий), входящих в имитируемый класс.

В итоге для наиболее общего случая функциональная схема рассмотренной части модели объекта имеет следующее строение (Рис.5.5.1).

Рассмотренная часть модели распознаваемого объекта является достаточной, если мы имеем дело с объектами, явлениями или процессами в статике или если располагаем наблюдениями их для измерения характеристик в фиксированные моменты времени.

Однако чаще всего реальные СР имеют дело с объектами, характеризующимися некоторой кинематикой.

Например, нами рассматривалась такие характеристики звука как высота и громкость, соответствующие признаки которых - частота и амплитуда. В представленном на схеме модуле статических характеристик указанные параметры были бы записаны в виде двух чисел по каждому классу.

Но звук одного тона - это периодический во времени процесс, кинематическая характеристика которого

,

где A - амплитуда; f - частота.