Смекни!
smekni.com

Інформаційний синтез системи автоматичного розпізнавання бланків документів (стр. 3 из 11)

1.2.7 Метод маркування зображень

Метод маркування зображень [9, 11, 12] полягає в тому, що зображенню штучно надаються ознаки, що визначають його в процесі розпізнавання. В натуральних зображеннях дуже важко автоматично виділити ознаки для якісного розпізнавання любого зображення. Разом з тим присутня можливість промаркувати кожне із зображень, що розпізнається.

Припустимо, що при друкуванні цифр біля кожної з них буде надрукована група точок з різним для кожної точки інтервалом. Тоді система розпізнавання може аналізувати не самі зображення, а супроводжуючі їх групи точок. Поява кожної точки фіксується, наприклад, одиничним фоторецептором, а вся група перетворюється в послідовність імпульсів. Цю послідовність подають на дешифратор, котрій видає сигнал, що характеризує дану цифру. На формування сигналу не впливають ні якість надрукованої літери, ні зміна її положення в рядку, ні зміна стилю написання. Задача розпізнавання зображень зводиться до задачі розпізнавання кодів, подібних азбуці Морзе.

Основний недолік методу заключається в тому, що кожне зображення, яке необхідно розпізнати, повинно до представлення системі пройти спеціальну обробку в маркувальному приладі. Тому даний метод не знайшов широкого застосування на практиці.

1.2.8 Квазітопологічний метод розпізнавання

Основна складність розпізнавання полягає в тому, що один і той же образ може бути представлений зображеннями, що суттєво відрізняються між собою. Наприклад, для одного і того ж алфавіту існує велика кількість написання одних і тих же знаків. Не дивлячись на це, система розпізнавання повинна завжди ототожнювати всі написання однієї літери в один образ. Для цього необхідно скласти таке описання зображення, яке було б інваріантним до вказаних змін.

Для аналізу зображень можна використати математичний апарат топології. Так як проекційні перетворення, що розглядаються в топології, дуже широкі, то використовується лише одна математична категорія – графи. Граф – це множина, що складається з підмножини елементів, що називаються ребрами, і підмножини елементів, що називаються вершинами. Кожному кінцю ребра відповідає одна вершина, а кожному ребру відповідає дві вершини. Якщо є можливим взаємно неперервне і взаємно однозначне відображення графа

на граф
, то таке відображення називається гомеоморфним.

Такі зображення, як літери латинського алфавіту, можна розглядати як плоскі графи, а різні написання однієї і тієї ж літери – як гомеоморфні перетворення деякого ідеального знаку.

Гомеоморфність двох графів встановлюється за допомогою топологічних інваріантів, тобто ознак, які не змінюються при гомеоморфних перетвореннях. Простіше всього користуватися інваріантами, котрі можуть бути виражені за допомогою чисел. Для цього необхідно встановити правило, за яким кожному графу ставиться у відповідність деяке число, що залишається незмінним при гомеоморфних перетвореннях. Частіше всього в якості топологічного інваріанту використовують індекс вершини, котрий визначається як кількість ребер, що входять у вершину. Індекс вершин встановлюється при послідовному обході графа за певним правилом. Це правило може бути сформоване так: обхід відбувається по ребрам, при чому напрям обходу змінюється на протилежний у випадку попадання на вершину з індексом 1; у випадку, якщо індекс вершини більше 2, далі рух з цієї вершини необхідно продовжувати по першому ребру, розміщеного за годинниковою стрілкою відносно ребра, по якому рухома точка потрапила в цю вершину. Таке правило дозволяє проводити послідовний обхід любого графа по зовнішнім ребрам при умові, що обхід почався з випадкової точки будь-якого зовнішнього ребра.

Метод квазітопологічного розпізнавання [9, 13] може бути реалізований за допомогою слідкуючої розгортки, коли обхід відбувається по зовнішньому контуру зображення. До слідкуючої розгортки повинен бути добавлений пристрій, який визначає індекси вершин в місцях згину зовнішнього контуру. Далі схема логіки повинна проводити декодування отриманих кодових комбінацій. Крім цього, повинен бути присутній або пристрій для фіксації початку обходу, або пристрій, який би забезпечував декодування кодових комбінацій в циклічних перестановках.

Таким чином квазітопологічний метод можна успішно застосовувати для побудови читаючих автоматів. Але використання цього методу не може принципово забезпечити повного розподілу літер алфавіту, так як деякі зображення літер є гомеоморфними одному і тому ж еталонному графу. Це стосується літер П, С, Г. Вони є гомеоморфними відрізку прямої. Крім того, метод не може забезпечити якісного розпізнавання при наявності нечіткого зображення літери, що розпізнається, та потребує багато часу.

1.3 Постановка задачі та формування завдань дослідження

Виходячи з аналізу методів розпізнавання образів (табл. 1.1), та перспектив розвитку методів розпізнавання [14, 17], в даній роботі запропоновано розробляти систему розпізнавання рукописних символів у рамках інформаційно екстремальної інтелектуальної технології (ІЕІТ), що ґрунтується на максимізації інформаційної спроможності системи, шляхом оптимізації її параметрів функціонування за умов апріорної невизначеності інформаційних і ресурсних обмежень. В рамках ІЕІТ, завдяки самонавчанню системи та шляхом оптимізації просторово-часових параметрів функціонування системи розпізнавання, можна побудувати безпомилкові вирішальні правила.

Розглянемо постановку задачі загального синтезу систами розпізнавання. Нехай ефективність навчання розпізнаванню реалізацій класу

, характеризується значенням
критерію функціональної ефективності. Відома навчальна матриця
де
- кількість ознак розпізнавання і випробувань відповідно. Рядок матриці
утворює
-ту реалізацію образу, а стовпець
- навчальну вибірку з генеральної сукупності значень
-ї ознаки розпізнавання. Треба для структурованого вектора параметрів функціонування системи розпізнавання
, які будемо називати параметрами навчання і для яких відомі обмеження
, шляхом організації послідовних ітераційних процедур знайти екстремальні значення координат вектора
, що забезпечують максимум КФЕ навчання системи розпізнавання:

,

де

- область допустимих значень параметрів навчання.

Треба на етапі екзамену визначити з наближеною до асимптотичної повної достовірності належність зображення, що розпізнається до одного з класів розпізнавання із сформованого на етапі навчання алфавіту класів

.

Об’єктом дослідження є слабо формалізований процес розпізнавання зображень.

Предметом дослідження є метод розпізнавання зображень у рамках МФСВ.

Метою роботи є підвищення достовірності та оперативності розпізнавання рукописних символів у рамках ІЕІТ.

Для досягнення поставленої мети необхідно вирішити такі завдання:

- розробити базовий алгоритм навчання та екзамену за ІЕІТ;

- сформувати навчальну матрицю для зображень в декартових і полярних координатах;

- розробити та програмно реалізувати алгоритм навчання системи розпізнавання рукописних символів за ІЕІТ з оптимізацією контрольних допусків на ознаки розпізнавання;

- програмно реалізувати алгоритм екзамену та оцінити достовірність результатів;


2 ОПИС МЕТОДУ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ

2.1 Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів

Базовим методом ІЕІТ є метод функціонально-статистичних випробувань (МФСВ) [18, 19, 20] – непараметричний інформаційно-екстремальний метод аналізу та синтезу здатної навчатися системи керування, який ґрунтується на прямій оцінці інформаційної здатності системи за умов нечіткої компактності реалізацій образу, та обмеження навчальної вибірки, яка є прийнятною для задач контролю і керування. Метод призначено для розв’язання практичних задач контролю та управління слабо формалізованими системами і процесами шляхом автоматичної класифікації їх функціональних станів за умови невизначеності.