Смекни!
smekni.com

Техническое зрение роботов (стр. 3 из 8)

Итак, если известны функциональные зависимости p1(z) и р2(г),. это уравнение можно использовать для нахождения оптималь­ного порога, который отделяет объекты от фона. Если этот порог известен, уравнение может быть использовано для сегментации данного образа.

2.2.3.Определение порогового уровня на основе характеристик границы.

Одним из наиболее важных аспектов при выборе по­рогового уровня является возможность надежно идентифициро­вать модовые пики для данной гистограммы. Это важно при автоматическом выборе порогового уровня в ситуациях, когда характеристики образа меняются вследствие большого разброса интенсивности. Из изложенного выше очевидно, что возможность выбора «хорошего» порогового уровня может быть существенно увеличена в случае, если пики гистограмм являются высокими, узкими, симметричными и разделены глубокими провалами.

Одним из подходов для улучшения вида гистограмм является рассмотрение только тех пикселов, которые лежат на границе (или около нее) между объектами и фоном. Одно из очевидных улучшений состоит в том, что этот подход позволяет получать гистограммы менее зависимыми от отношения между объектом и фоном. Например, гистограмма интенсивности образа, состав­ленного из маленького объекта на большой площади постоян­ного фона, определялась бы большим пиком вследствие концент­рации пикселов фона. С другой стороны, результирующие гисто­граммы имели бы пики с более сбалансированными высотами, если бы рассматривались пикселы, лежащие только на (или около) границе между объектом и фоном. Кроме того, вероят­ность расположения пиксела на границе объекта практически равна вероятности того, что он лежит на границе фона, чтоулучшает симметрию гистограммных пиков. Окончательно, как показано ниже, использование пикселов, которые удовлетво­ряют некоторым простым критериям, основанным на операторах градиента и Лапласа, приводит к увеличению провалов между пиками гистограммы.

Выше мы неявно подразумевали, что граница между объек­тами и фоном известна. Очевидно, что во время проведения сег­ментации эта информация отсутствует, поскольку нахождение раздела между объектами и фоном является окончательной целью приведенной здесь процедуры. Однако, что, вычислив градиент пиксела, можно определить, ле­жит ли он или не лежит на контуре. Кроме того, лапласиан мо­жет дать информацию о том, лежит ли данный пиксел на темной (т. е. фон) или светлой (объект) стороне контура. С внутренней стороны идеального контура лапласиан равен нулю, поэтому на практике можно ожидать, что провалы гистограмм, образованных пикселами, выбранными по критерию градиент/лапласиан, будут располагаться достаточно редко и иметь желаемую высоту.

ГрадиентG[f(x,y)] любой точки образа и лапласианL[f{x, у)]. Эти два свойства можно использовать для фор­мирования трехуровнего образа:

(где символы 0, +, - представляют три различных уровня осве­щенности, а Т—пороговый уровень. Предположим, что темный объект располагается на светлом фоне, тогда применение уравнения дает образs(x, у), в котором все пикселы, не лежащие на контуре (для них значе­ние G[f (х, у)] меньше Т, помечены 0, все пикселы на темной стороне контура помечены + и все пикселы на светлой стороне контура помечены —. Для светлого объекта на темном фоне символы + и- в уравнении (8.2-24) меняются местами.

Только что изложенная процедура может применяться для создания сегментированного, бинарного образа, в котором 1 со­ответствует объектам, представляющим интерес, и 0—фону. Отметим, что перемещение (вдоль горизонтальных или вер­тикальных линий сканирования) от светлого фона к темному объекту должно характеризоваться заменой знака - фона на -1- объекта s(x, у). Внутренняя область объекта состоит из пикселов, помеченных либо 0 либо +. Окончательно перемещение от объекта к фону характеризуется заменой знака + на . Таким образом, горизонтальные или вертикальные линии сканирования, содержащие части объекта, имеют следующую структуру:

(...)(-, +)(0 или +)(+,-)(•••),

где (...) является произвольной комбинацией +, - или 0. Остальные скобки содержат точки объекта и помечены 1. Вседругие пикселы вдоль той же линии сканирования помечаются 0, за исключением всех последовательностей из (0 или +), огра­ниченных (-,+) и (+, -).

2.2.4.Определение порогового уровня, основанное на нескольких переменных.

Изложенные выше методы связаны с определением порогового уровня для единст­венного переменного значения интенсивности. В некоторых приложениях можно исполь­зовать более одной перемен­ной для характеристики каждо­го пиксела образа, увеличивая таким образом не только сте­пень различия между объек­том и фоном, но и между сами­ми объектами. Одним из наи­более значимых примеров явля­ется цветное зрение, где исполь­зуются красные, зеленые и голубые компоненты (КЗГ) для формирования составно­го цветного образа. В этом случае каждый пиксел характеризуется тремя переменными и это позволяет строить трехмерную гистограмму. Основнаяпроцедура та же, что и для одной переменной. Пусть, например, даны три 16-уровневых изображения, соответствующие КЗГ компонентам датчика цвета. Сформируем кубическую решетку 16х16х16 и поместим в каждый элемент пикселы, КЗГ ком­поненты которых имеют интенсивности, соответствующие коор­динатам, определяющим положение этого элемента. Число то­чек в каждом элементе решетки может быть затем разделено на общее число пикселов образа для формирования нормированной гистограммы.

Теперь выбор порога заключается в нахождении групп точек в трехмерном пространстве, где каждая «компактная» группа аналогична основной моде гистограммы одной переменной. На­пример, предположим, что мы ищем две значимые группы точек данной гистограммы, где одна группа соответствует объекту, а другая—фону. Принимая во внимание, что теперь каждый пик­сел имеет три компоненты и может быть рассмотрен как точка трехмерного пространства, можно сегментировать образ с по­мощью следующей процедуры. Для каждого пиксела образа вычисляется расстояние между этим пикселом и центром каж­дой группы. Тогда, если пиксел располагается рядом с центром группы точек объекта, мы помечаем его 1; в противном случае мы помечаем его 0. Это понятие легко распространить на боль­шую часть компонентов пиксела и соответственно на большую часть групп. Основная сложность состоит в том, что определение значимых групп, как правило, приводит к довольно сложной задаче, поскольку число переменных возрастает.

2.3.Областно-ориентированная сегментация

2.3.1.Основные определения.

Целью сегментации является разде­ление образа на области. Рассмотрим методы сегмен­тации, основанные на прямом нахождении областей.

ПустьR область образа. Рассмотрим сегментацию как процесс разбиения R на n подобластейR1,R2,...,Rn, так что

1.

2.Piсвязная область, i= 1, 2, ...,п,

3.Ri

Ri=
для всехi и j,i
j,

4.P(Ri) есть ИСТИНА дляi= 1, 2, ..., n;

5.P(Ri U Ri) есть ЛОЖЬ дляi

j, где P(Ri)— логический предикат, определенный на точках из множества Ri,и
-пу­стое множество.

Условие 1 означает, что сегментация должна быть полной, т. е. каждый пиксел должен находиться в образе. Второе усло­вие требует, чтобы точки в области были связными. Условие 3 указывает на то, что области не должны пересекать­ся. Условие 4 определяет свойства, которым должны удовлетво­рять пикселы в сегментированной области. Простой пример: Р(Ri) = ИСТИНА, если все пикселы вRi имеют одинаковую интенсивность. Условие 5 означает, что области Ri и Ri разли­чаются по предикату Р.

2.3.2.Расширение области за счет объединения пикселов.

Расшире­ние области сводится к процедуре группирования пикселов или подобластей в большие объединения. Простейшей из них яв­ляется агрегирование пикселов. Процесс начинается с выбора множества узловых точек, с которых происходит расширение области в результате присоединения к узловым точкам сосед­них пикселов с похожими характеристиками (интенсивность, текстура или цвет). Пусть цифры внутри ячеек указывают интенсивность. Пусть точки с координатами (3, 2) и (3, 4) используются как узловые. Выбор двух начальных точек приведет к сегментации образа на две области: области R1, свя­занной с узлом (3, 2), и области R2, связанной с узлом (3, 4). Свойство Р, которое мы будем использовать для того, чтобы от­нести пиксел к той или иной области, состоит в том, что модуль разности между интенсивностями пиксела и узловой точки не превышает пороговый уровень Т. Любой пиксел, удовлетворяю­щий этому свойству одновременно для обоих узлов, произвольно попадает в область Ri. В этом случае сегментация проводится для двух областей, причем точки в R1 обозначаются буквой а, точки вR2 буквой b. Необходимо отметить, что независимо от того, в какой из этих двух областей будет взята начальная точка, окончательный результат будет один и тот же. Если, с другой сто­роны выбрать Т = 8, была бы получена единственная область