Смекни!
smekni.com

Построение систем распознавания образов (стр. 4 из 36)

Фотография формируется квантами света, отраженного от картины, прошедшего через линзовую систему фотоаппарата и попавшего на фотопленку. Такое формирование изображения приводит к потери качества за счет искажений и несовершенства приемного устройства, и следовательно, в этом случае f и g не равны друг другу. И только если известен закон потери качества, то можно провести компенсацию искажений путем соответствующей обработки изображения.

Другим примером могут быть двухмерные изображения g распределения f радиационного препарата в организме человека, полученные с помощью гамма-камеры, поворачивающейся последовательно на определенные углы относительно пациента. Здесь надо избавиться от иллюзии того, что полученные детали изображения соответствуют областям интереса врача-диагноста. Дело в том, что рассмотренное визуализированное изображение - это не распределение активности поглощения в теле пациента, а распределение интенсивностей только в элементах изображения.

То есть, изображение g есть некоторое представление (описание) объекта f, которое, хотя и располагается в том же месте, но может иметь отличия не только качественные, но и такие количественные как размеры. В данном случае приходится констатировать, что процессы в гамма-камере, с помощью которой производится регистрация исходных данных, на сегодняшний день не имеют математического описания, позволяющего связать объект с его изображением. Это еще раз заставляет подчеркнуть, что врач не видит изменений интенсивности поглощения гамма-излучения в теле пациента, а только - распределение интенсивностей на изображении, полученном с помощью системы регистрации. А отсутствие математического описания связей изображения и процесса не позволяет строго трактовать результаты медицинского наблюдения. Остается надеяться только на опыт врача.

Разумно считать, что объект и его изображение физически совпадают и связаны друг с другом соотношениями, характеризующими конкретный метод визуализации, хотя в ряде случаев могут иметь отличающиеся размеры.

Таким образом, в общем случае не существует идеального (1:1) соответствия между информацией, содержащейся в какой-либо точке с координатами (a, b), и информацией, соответствующей точке (x, y). В принципе информацию от каждой точки объекта можно “рассеять” по всем точкам изображения. Однако в любом полезном методе визуализации главный вклад в каждую точку (a, b) будет давать отдельная конкретная точка (x, y). Другие, соседние точки будут вносить меньшее количество информации, причем уменьшение указанного вклада происходит достаточно резко по мере удаления от основной точки с координатами (x, y). Эти выводы известны как принцип близости, а распределение по изображению некоторой точки из пространства объекта может зависеть как от значения поля в точке объекта, так и от поля в точках, расположенных около этой точки и удаленных на бесконечное расстояние от нее.

Какая же существует физическая связь между пространством объекта и пространством изображения?

В плоскость изображения попадает информация исходя из наличия информации в плоскости объекта, а также в зависимости от того, какой кодирующий носитель информации используется в данном методе визуализации (фотография формируется за счет переноса фотонов, яркостная картина УЗИ - за счет рассеяния продольных ультразвуковых волн, степень поглощения радиационных препаратов - путем счета испущенных g-квантов, рентгенограмма - за счет линейного затухания рентгеновских квантов и т.п.).

Введем функцию h(x,y,a,b), которая описывает пространственные связи для точечного процесса, то есть процесса, который отличен от нуля лишь в точке с координатами (a' ,b' ). Тогда зарегистрированное изображение будет иметь вид:

Здесь зависимость распределения изображения от амплитуды сигнала точечного источника учтена введением в функцию h пятого аргумента.

Рассмотрим теперь сигнал от второго точечного объекта, расположенного там же, где и первый:

Согласно принципу суперпозиции излученные энергии сигналов суммируются:

Это - нелинейная суперпозиция в силу нелинейности слагаемых в правой части равенства. В итоге, как видим, суммированию измеряемых распределений в плоскости изображения не соответствует сложение функций в плоскости объекта.

Если же система линейна, то

а суперпозиция будет иметь следующий вид

То есть, в случае линейности системы сложение функций в плоскости объекта приводит к суммированию распределений в плоскости изображения с точностью до единственной функции преобразования h.

Математически последнее является очень важным упрощением, так как линейность в рассматриваемых задачах предполагается всегда в первом приближении, даже когда это, строго говоря, не соответствует действительности.

Теперь можно перейти к обобщенным соотношениям, связывающим пространства объекта и его изображения. Для нелинейной системы визуализации имеем:

а для линейной

Функция h, используемая для связи распределений f и g, называется функцией отклика точечного источника (ФОТИ). Зависимость ее от всех четырех пространственных координат определяет ФОТИ как пространственно-зависимую. Если же точечный процесс одинаков для всех точек плоскости объекта, то h - пространственно-инвариантна. При этом h зависит лишь от разности координат (x-a,y-b). Для пространственно-инвариантной системы

при этом для линейной пространственно-инвариантной системы

Последнее выражение известно как интеграл свертки, согласно которому распределение по изображению представляет собой свертку распределения по объекту с ФОТИ. Именно функция h описывает процесс переноса информации от объекта в пространство изображения и характеризует все геометрические искажения, присущие процессу визуализации.

Окончательное упрощение обобщенных соотношений, описывающих процесс формирования изображений, получается в том случае, когда свойства системы в двух перпендикулярных направлениях не коррелируют друг с другом. Это означает, что двухмерную ФОТИ можно представить в виде произведения двух одномерных ФОТИ. Так для пространственно-зависимой системы имеем

а для пространственно-инвариантной

Это свойство системы называется разделимостью.

В итоге для линейной, пространственно-инвариантной разделимой системы получаем

Учитывая рассмотренное, легко понять, что, наблюдая изображение, мы не можем считать его точным представлением распределения по объекту. Это можно заметить путем внимательного рассмотрения изображения и сравнения его с объектом или явлением. Причина - несовершенства системы визуализации.

Именно поэтому в теории обработки изображений большое внимание уделяется методам исключения соответствующих искажений, получившим название обращение свертки (Вытекает из рассмотрения хотя бы последнего интеграла свертки!).

В соответствующих задачах интеграл свертки рассматривается с учетом искажения изображений шумами. Так для линейных систем полное представление о задаче создает выражение

где n(x,y) - распределение шума в изображении.

* * *

Теперь сконцентрируем внимание на следующем важном термине распознавания образов - “класс”. Здесь, прежде всего, обратим внимание на то, что как человек, так и автомат принимают решение на основе отождествления совокупности конкретных значений характеристик объектов или явлений не просто друг с другом, а обычно с некоторым классом, в который объединяются объекты или явления, имеющие общие свойства (например: характеристики выхода из строя агрегатов и систем той же АЭС - класс опасных отказов или класс отказов, требующих определенного технического вмешательства, но неопасных).

Таким образом, классы - это объединения объектов (явлений), отличающиеся общими свойствами, интересующими человека.

Всегда, имея в виду цель распознавания, в конечном итоге принятое решение об отнесении объекта к тому или иному классу определяет реакцию соответствующей системы на данную входную ситуацию однозначно.

Таким образом, в самых общих чертах распознавание можно определить как соотнесение объектов или явлений на основе анализа их характеристик, представляющих образы этих объектов, с одним из нескольких, заранее определенных классов.

И следует обратить внимание на то, что термин “распознавание” в равной мере относится как к процессам восприятия и познания, свойственным человеку и живым организмам, так и к техническим попыткам человека реализовать “электронные” или “вычислительные” аналоги этих процессов, то есть к решению задач в рамках предмета распознавания как раздела информатики.