Смекни!
smekni.com

Перечень сокращений, символов и специальных терминов 8 (стр. 1 из 15)


Содержание

Реферат................................................................................................................................... 6

Перечень сокращений, символов и специальных терминов .......................................... 8

Введение................................................................................................................................ 9

1 Оптическое распознавание текста................................................................................ 10

1.1 Понимание изображения документа..................................................................... 10

1.1.1 Анализ проекционных профилей.................................................................. 11

1.1.2 Преобразование Хафа..................................................................................... 11

1.1.3 Кластеризация ближайших соседей.............................................................. 12

1.1.4 Корреляция строк............................................................................................ 12

1.1.5 Другие методы................................................................................................. 13

1.2 Логический анализ разметки................................................................................. 13

1.3 Оптическое распознавание символов................................................................... 14

1.4 Применение нейронных сетей для оптического распознавания символов...... 17

1.4.1 Перцептрон...................................................................................................... 17

1.4.1.1 Классификация перцептронов............................................................... 20

1.4.1.2 Обучение перцептронов......................................................................... 22

1.4.1.2.1 Обучение с пощрением.................................................................... 23

1.4.1.2.2 Обучение без поощрения................................................................. 24

1.4.1.2.3 Метод обратного распространения ошибки.................................. 25

1.4.1.3 Ограничения перцептронов................................................................... 25

1.4.1.4 Применение перцептронов для оптического распознавания символов 27

1.4.2 Сети Джордана и Элмана............................................................................... 28

1.4.2.1 Применение сетей Джордана и Элмана для OCR................................ 29

1.4.3 Сети Хопфилда и Хэмминга.......................................................................... 30

1.4.3.1 Архитектура сети Хопфилда.................................................................. 31

1.4.3.2 Обучение сетей Хопфилда...................................................................... 33

1.4.3.3 Процесс работы сетей Хопфилда и Хэмминга..................................... 37

1.4.3.3.1 Синхронный режим работы сети................................................... 40

1.4.3.3.2 Асинхронный режим работы сети................................................. 41

1.4.3.4 Ограничения сетей Хопфилда и Хэмминга.......................................... 43

1.4.3.5 Применение сетей Хопфилда и Хэмминга для оптического распознавания символов................................................................................................................................ 43

1.4.4 Сети Ворда....................................................................................................... 44

1.4.5 Сети Кохонена................................................................................................. 44

1.4.6 RBF-сети........................................................................................................... 45

1.5 Выводы..................................................................................................................... 46

2 Неокогнитрон.................................................................................................................. 47

2.1 Архитектура неокогнитрона.................................................................................. 47

2.2 Обучение неокогнитрона....................................................................................... 52

2.3 Выводы..................................................................................................................... 55

3 Модульная система распознавания текста................................................................... 56

3.1 Выводы..................................................................................................................... 59

4 Программная реализация............................................................................................... 60

4.1 Генерация обучающих последовательностей....................................................... 60

4.2 Обучение сети и распознавание текста................................................................ 63

4.3 Выводы..................................................................................................................... 66

5 Экспериментальное исследование разработанной системы распознавания текста 67

5.1 Выводы..................................................................................................................... 69

6 Организационно-экономическая часть......................................................................... 70

Введение......................................................................................................................... 70

6.1 Описание продукта................................................................................................. 70

6.2 Анализ рынка сбыта............................................................................................... 71

6.3 Конкурентоспособность......................................................................................... 71

6.4 Маркетинг................................................................................................................ 72

6.5 План работ............................................................................................................... 73

6.6 Организационный план......................................................................................... 74

6.7 Расчет договорной цены........................................................................................ 78

6.8 Оценка экономической целесообразности проведения работ............................ 81

Выводы по главе «Организационно-экономическая часть»..................................... 81

7 Экологическая безопасность и безопасность жизнедеятельности ............................ 83

Введение......................................................................................................................... 83

7.1 Требования к производственным процессам и оборудованию.......................... 83

7.2 Требования к отоплению, вентиляции и кондиционированию воздуха.......... 86

7.3 Требования к организации рабочих мест............................................................. 87

7.4 Требования к естественному и искусственному освещению............................. 90

7.5 Требования к шуму и вибрации............................................................................. 92

7.6 Требования к организации режима труда и отдыха............................................ 92

7.7 Организация оптимального рабочего места программиста............................... 95

7.8 Расчет освещенности.............................................................................................. 96

Выводы по главе «Экологическая безопасность и безопасность жизнедеятельности» 99

Заключение........................................................................................................................ 101

Литература......................................................................................................................... 102


Реферат

Объем расчетно-пояснительной записки составил 103 страницы, из которых специальная часть – 59 страниц, организационно-экономическая часть – 12 страниц и экологическая безопасность и безопасность жизнедеятельности – 17 страниц. Число страниц приложения с исходным текстом программы составило 123 страницы. Число иллюстраций в расчетно-пояснительной записке – 10, таблиц – 4.

В рамках дипломного проекта была разработана система распознавания текста СиРТ.

В первом разделе дипломного проекта был проведен анализ принципов построения систем оптического распознавания текста и обзор существующих архитектур нейронных сетей и их применимости для решения задач распознавания символов.

Во втором разделе детально рассматривается архитектура нейронной сети «неокогнитрон» и процесс обучения этой сети.

В третьем разделе дипломного проекта содержится описание модульной системы распознавания текста. Предложены различные комбинации модулей для изменения функциональности системы.

В четвертом разделе дипломного проекта описана программная реализация предложенной системы и её пользовательский интерфейс

В пятом разделе дипломного проекта программная реализация предложенной системы подвергается экспериментальному исследованию, приведены результаты этого исследования.

Далее, в восьмой и девятой главах представлены разделы по организационно-экономической части и части экологии безопасности жизнедеятельности. Здесь приведен бизнес-план по внедрению данного проекта, рассчитана его оценочная стоимость. В части безопасности жизнедеятельности спроектировано оптимальное рабочее место программиста.

В конце пояснительной записки приведено приложение с текстом разработанного программного продукта, а также обучающая и тестирующая последовательности в полном объёме.

Перечень сокращений, символов и специальных терминов

OCR – Optical Character Recognition, Оптическое Распознавание Символов;

ПО – программное обеспечение;

СОПО — свободное и открытое программное обеспечение — ПО, которое распространяется с условием передачи каждому пользователю прав на запуск/использование ПО, адаптацию/модификацию ПО, распространение ПО и распространение модифицированных версий ПО. СОПО гарантирует передачу этих прав каждому пользователю и делает невозможным отчуждение этих прав. Открытость подразумевает гарантию предоставления исходного кода программы;

СиРТ — Система Распознавания Текста — название разработанной в рамках проекта системы;

ИНС — искусственная нейронная сеть.

Введение

Оптическое распознавание символов (Optical Character Recognition, OCR) – это механическое или электронное преобразование изображения рукописного или отпечатанного текста (обычно полученного путём сканирования) в текст, поддающийся обработке текстовыми процессорами.

Оптическое распознавание текста — более общее понятие, которое включает в себя не только распознавание собственно символов, но и анализ разбивки страниц и выделение нетекстовых элементов (рисунки, таблицы). Часто под OCR подразумевают распознавание текста и называют системы распознавания текста OCR-системами.

Проблема OCR становится всё более актуальной в связи с активным внедрением цифровой вычислительной техники и широким использованием текстовых процессоров. Уже существует ряд систем, способных распознавать печатный текст с достаточно высокой эффективностью, однако проблема распознавания рукописного текста остаётся предметом активных научных исследований в областях распознавания образов, искусственного интеллекта и машинного зрения. Однако некоторые решения, предлагаемые для распознавания рукописного текста, могут быть применены и для распознавания печатного текста. Целью данной работы является разработка новой системы распознавания текста, которая использует наиболее передовые алгоритмы распознавания образов, обладает гибкой структурой и может распространяться в качестве СОПО.

1 Оптическое распознавание текста

Проблема распознавания текста обычно решается в три этапа:

1) Выделение текста из изображения — включает в себя определение угла наклона страницы, выделение абзацев, удаление декоративной графики, определение таблиц и так далее