Смекни!
smekni.com

Інформаційний синтез системи автоматичного розпізнавання бланків документів (стр. 1 из 11)

Реферат

Записка: 68 стр., 7 рис., 1 табл., 1 додаток, 41 джерел.

Об’єкт дослідження – система розпізнавання рукописних символів.

Мета роботи – розробити інформаційне та програмне забезпечення системи розпізнавання рукописних символів.

Методи дослідження – інформаційно–екстремальна інтелектуальна технологія.

Результати – розроблено алгоритм та програмне забезпечення системи розпізнавання символів, що навчається в рамках інформаційно-екстремальної інтелектуальної технології.


Зміст

ВСТУП.. 4

1 АНАЛІЗ ПРОБЛЕМИ ТА ПОСТАНОВКА ЗАДАЧІ5

1.1 Огляд методів розпізнавання образів. 5

1.2 Методи оброблення та розпізнавання рукописних символів. 8

1.3 Постановка задачі та формування завдань дослідження. 16

2 ОПИС МЕТОДУ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ.. 19

2.1 Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. 19

2.2 Математична модель системи розпізнавання рукописних символів. 23

2.3 Критерій оптимізації параметрів функціонування системи розпізнавання. 25

2.4 Базовий алгоритм навчання. 26

2.5 Алгоритм екзамену. 30

3 ІНФОРМАЦІЙНЕ ТА ПРОГРАМНЕ ЗАБЕЗПЕЧЕННЯ СИСТЕМИ РОЗПІЗНАВАННЯ РУКОПИСНИХ СИМВОЛІВ.. 32

3.1 Оброблення рукописних символів. 32

3.2 Оптимізація контрольних допусків на ознаки розпізнавання системи розпізнавання. 34

3.4 Короткий опис програми. 36

3.5 Результати фізичного моделювання. 37

4 ОХОРОНА ПРАЦІ42

4.1 Характеристика приміщення. 43

4.2 Аналіз стану охорони праці в приміщенні45

4.3 Висновки. 55

ВИСНОВКИ.. 57

СПИСОК ЛІТЕРАТУРИ.. 58

Додаток. 61


ВСТУП

Незважаючи на те, що електронні методи знайшли широке впровадження при автоматизації документообігу і діловиробництва, але існує велика кількість підприємств та організацій, в котрих надходження інформації ззовні неможливе без участі паперових документів. Ця проблема особливо актуальна в банках, податкових інспекціях та інших подібних закладах. У зв’язку з цим загострилась проблема автоматичного введення і розпізнавання рукописної інформації.

У теперішній час технічно не складно перетворити паперовий документ в цифровий формат. Для цього можна скористатися сканером, цифровою фото або відео камерою. Якщо перетворення паперових документів в цифровий вигляд можна вважати вирішеною проблемою, то розпізнавання введеного документа все ще залишається актуальним. Хоч і створені програми розпізнавання друкованих документів з прийнятною якістю розпізнавання, але більшість розроблених систем дають великі похибки при обробці текста низької якості, чи текста з різним рівнем яскравості. Якщо ж говорити про розпізнавання рукописних документів, то можна сказати, що результатів, задовільних на практиці, ще не отримано.

Тема дипломної роботи є актуальною, оскільки вона присвячена розпізнаванню рукописних символів, що до теперішнього часу залишається невирішеною проблемою. У дипломній роботі розглядається задача підвищення функціональної ефективності системи розпізнавання рукописних символів, що дозволяє з більшою достовірністю і оперативністю приймати управлінські рішення, обробляти великі масиви текстової інформації, здійснювати факсимільну передачу оригіналів підписів і фінансових документів.


1 АНАЛІЗ ПРОБЛЕМИ ТА ПОСТАНОВКА ЗАДАЧІ

1.1 Огляд методів розпізнавання образів

Найбільш ефективними методами виведення нових знань є методи розпізнавання образів на основі навчання (самонавчання) [1, 2, 3].

Виділяють такі способи відображення знань:

1. Інтенсіональне відображення – у вигляді схеми зв’язків між атрибутами (ознаками).

2. Екстенціональне відображення – за допомогою конкретних фактів (об’єкти, приклади).

Інтенсіональне відображення фіксує закономірності і зв’язки, якими пояснюється структура даних. Відповідно до діагностичних задач така фіксація полягає у визначенні операцій над атрибутами (ознаками) об’єктів, що призводять до потрібного діагностичного результату. Інтенсіональне зображення реалізуються за допомогою операцій над значенням атрибутів і не припускають операцій над відповідними інформаційними фактами (об’єктами).

У свою чергу, екстенціональне відображення знань пов’язане з описом і фіксацією конкретних об’єктів з предметної галузі і реалізоване в операціях, елементами котрих являються об’єкти як цілісні системи.

Описані вище два фундаментальні способи зображення знань дозволяють запропонувати таку класифікацію методів розпізнавання образів (табл. 1.1):


Таблиця 1.1 Класифікація методів розпізнавання

Класифікація методів розпізнавання Область застосування Обмеження (недоліки)
Методи розпізнавання Інтенсіональні методи Методи, основані на оцінках плотності розподілу значень ознак (або подібність і розбіжність об’єктів) Задачі з відомим розподілом , як правило нормальним, необхідна наявність великої кількості статистичних даних Відсутність ототожнення. Необхідність в переборі всієї навчальної вибірки при розпізнаванні, висока чутливість до непредставницької навчальної вибірки та артефактів.
Методи, основані на припущеннях про клас вирішальних функцій Класи повинні бути добре роздільними, система ознак - ортонормованою Відсутність ототожнення. Повинен бути попередньо відомий вид вирішальної функції. Неможливість врахування нових знань про кореляцію серед ознак
Логічні методи Задачі невеликої розмірності простору ознак Відсутність ототожнення. При відборі логічних вирішальних правил (кон’юнкцій) необхідний повний перебір. Висока обчислювальна робота
Лінгвістичні (структурні) методи Задачі невеликої розмірності простору ознак Відсутність ототожнення. Задача відновлення(визначення)граматики по певній множині висловлювань (опису об’єктів), являється важкою для формалізації. Невирішеність теоретичних проблем.
Методи порівняння з прототипом Задачі невеликої розмірності простору ознак Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики)
Метод k-найближчих сусідів Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Висока залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Трудоємність при обчисленні.
Алгоритм обчислення оцінок (голосування) АОО Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Залежність результатів класифікації від міри відстані (метрики). Необхідність повного перебору навчальної вибірки при розпізнаванні. Висока технічна складність методу.
Колективи вирішальних правил Задачі невеликої розмірності по кількості класів та ознак Відсутність ототожнення. Висока технічна складність методу,невирішеність ряду теоретичних проблем, як при виділенні області компетенції часткових методів, так і самих часткових методах

Аналіз перспективних напрямів розвитку методів розпізнавання показує, що для успішного досягнення мети дослідження необхідно вирішити (або обійти) такі проблеми:

1) комбінаторного вибуху;

2) досягнення незалежності часу розпізнавання від обсягу навчальної вибірки;

3) корекція зниження розмірності простору ознак без відчутної втрати значимої інформації;

4) досягнення високої валідності результатів аналізу;

1.2 Методи оброблення та розпізнавання рукописних символів

1.2.1 Двовимірне дискретне косинусне перетворення

Надійність розпізнавання значною мірою залежить від якості зображення символів, яке визначається формою символів або стилем написання і способом виконання.

Алгоритм двомірного дискретного косинусного перетворення [4, 5, 7] реалізується наступним виразом:

,

де

,
;

;

ФункціяB=dct2(A)повертає результат двомірного дискретного косинусного перетворення для матриці А. Матриця В має той же розмір, що і матриця А, і відображає коефіцієнти дискретного косинусного перетворення.

Функція B=dct2(A,m,n)повертає результат двомірного дискретного косинусного перетворення для матриці Арозміром mхn. Якщо розмір матриці А менший, вона доповнюється нульовими елементами до заданого розміру.

МатрицяА може включати елементи класу double або любого класу integer. МатрицяВ має елементі класу double.