Смекни!
smekni.com

Перечень сокращений, символов и специальных терминов 8 (стр. 10 из 15)

КаК-бьI резВяся И Играя

Грохочет В небе голубом.

Liberation Mono:

Люблю грозу в начале Мая,

Когда весеннИИ- первЬIИ- гром

Как-бЬI резвяся И Играя

ГрохочеТ в небе голубом

Наибольшее число искажений регистра показал текст, набранный шрифтом Courier, поскольку этот шрифт не участвовал в обучении. Наименьшее число искажений регистра показал текст, набранный Times New Roman, поскольку этот шрифт относится к классу Serif и обладает дополнительными характерными чертами, позволяющими правильно отличать символы разного регистра по форме.

Однако функция определения регистра не входит в число функций модуля распознавания символов вообще и неокогнитрона — в частности. Вместо этого в системе должен существовать модуль пост-обработки текста, который в том числе исправляет регистр символов, анализируя их размеры друг относительно друга.

5.1 Выводы

Разработанная система способна распознавать текст, составленный как из образов обучающей последовательности, так и из образов проверочной последовательности.

Для корректного распознавания любых форм символов требуется значительно расширить разнообразие обучающей последовательности, чтобы она покрывала всё множество входных образов.

6 Организационно-экономическая часть

Введение

Система оптического распознавания текста служит для автоматического преобразования содержащих текст изображений в пригодную для обработки в текстовых процессорах форму.

В данной части дипломного проекта будет проведена оценка экономической целесообразности разработки такой системы, расчет стоимости самой разработки и конечной цены программного продукта, который появится на рынке.

6.1 Описание продукта

В 1974 году Рэй Карзвейл основал компанию Kurzweil Computer Products, Inc и возглавил разработку первой шрифто-независимой системы оптического распознавания символов — компьютерной программы, способной распознавать текст, напечатанный любым нормальным шрифтом. Он решил, что лучшим применением этой технологии будет создание читающей машины для слепых, которая бы позволила слепым людям понимать напечатанный текст, слушая как его для них читает вслух компьютер. Однако для этого устройства потребовалось изобрести две технологии — сканер и речевой интезатор. Тринадцатого Января 1976 первый продукт был показан на конференции, которую возглавлял Карзвейл и лидеры Национальной Федерации Слепых США. Устройство именуемое «Читающая Машина Карзвейла» занимало весь стол, но функционировало именно так как и предполагалось. В 1978 Kurzweil Computer Products, Inc начала продавать коммерческую версию компьютерной программы для оптического распознавания символов. LexisNexis стал первым клиентом и купил программу для преобразования в цифровую форму юридических и публицистических документов. Через два года Карзвейл продал свою компанию компании Xerox, которая заинтересовалась дальнейшей коммерциализацией аналого-цифрового преобразования текста. Сейчас Kurzweil Computer Products известна как Nuance.

Целью дипломного проектирования является создание программной системы для оптического распознавания текста. Система предназначена для преобразования содержащих текст изображений в текстовую форму, которая может быть использована в текстовых процессорах.

6.2 Анализ рынка сбыта

Потенциальными клиентами моего продукта являются работники научной сферы (поскольку система представляет определённый научный интерес), любые организации, чья работа связана с использованием как бумажных, так и цифровых текстовых документов, а также простые пользователи, обладающие необходимым для сканирования текста оборудованием.

6.3 Конкурентоспособность

На рынке уже существуют подобные системы, и проблема распознавания текста успешно решается уже более 20 лет. Однако большинство предложенных систем обладает определёнными недостатками:

1) Относительно высокая цена

2) Недостаточно гибкая интеграция со сторонними приложениями (в том числе — с текстовыми процессорами)

3) Практически полное отсутствие контроля за процессом работы системы

4) Невозможность обучения системы

Недостаток 1) присущ всем коммерческим системам (к коим относятся практически все успешные системы распознавания текста). Недостаток 2) также присущ только коммерческим системам — они расчитаны на использование совместно со строго определённым набором сторонних приложений (как правило — тоже коммерческих). Недостаток 3) выражается в отсутствии механизмов управления процессом распознавания и также присущ в основном коммерческим системам из-за их закрытости. Недостаток 4) присущ большинству систем, поскольку не все системы созданы на основе технических решений, поддерживающих концепцию обучения.

Разработанная система будет лишена перечисленных недостатков.

6.4 Маркетинг

Разработанная система является кросс-платформенной, а статус СПО позволяет использовать инфраструктуру СПО для рекламы и освещения системы в прессе. Это позволит заинтересовать системой как пользователей, так и потенциальных разработчиков. Не исключается возможность участия в разработке таких корпораций как Google, которая в последнее время интересуется системами распознавания текста.

6.5 План работ

Сроки выполнения работ не должны превышать 86 дней. В проекте занят один разработчик и один Ведущий инженер. Организационная структура представляет собой вырожденный случай иерархической структуры и изображена на рис 6.1.

Такая схема взаимодействия была выбрана из опыта ранее разработанных дипломных проектов. Руководителем проекта является ведущий инженер, ответственным исполнителем — инженер-программист 3й категории.

6.6 Организационный план

Выделим следующие этапы разработки:

1. Техническое задание

1.1. Постановка задачи – 2 дня

1.2. Выбор и обоснование критериев эффективности и качества разрабатываемой программы – 5 дней

1.3. Предварительный выбор методов решения задачи – 10 дней

1.4. Выбор языков программирования – 1 день

2. Эскизный проект

2.1. Предварительная разработка структуры входных и выходных

данных – 5 дней

2.2. Разработка общего описания алгоритма решения задачи – 5 дней

3. Технический проект

3.1. Разработка алгоритма решения задачи – 10

3.2. Определение формы представления входных и выходных

данных – 5 дней

4. Рабочий проект

4.1. Программирование и отладка программы – 25 дней

4.2. Разработка порядка и методики испытаний – 2 дня

5. Тестирование

5.1. Итоговое тестирование программного средства – 1

5.2. Корректировка программы и программной документации по результатам испытаний – 5 дней

6. Разработка документации

6.1. Руководство системного программиста – 1 день

6.2. Руководство программиста – 1 день

6.3. Руководство пользователя – 1 день

Итого: 79 дней.

Таблица 6.1 Расчёт трудоёмкости

103 14 55 58 111 114

Этап разработки

Продолж.

Исполнитель

Трудоёмк. ч/дн

1

Постановка задачи

2

Ведущий инженер

2

2

Выбор и обоснование критериев эффективности и качества разрабатываемой программы

5

Ведущий инженер

5

3

Предварительный выбор методов решения задачи

10

Ведущий инженер

10

Инженер-программист 3-й кат.

10

4

Выбор языков программирования

1

Ведущий инженер

1

Инженер-программист 3-й кат.

1

5

Предварительная разработка структуры входных и выходных данных

5

Ведущий инженер

2

Инженер-программист 3-й кат.

5

6

Разработка общего описания алгоритма решения задачи

5

Инженер-программист 3-й кат.

5

7

Разработка алгоритма решения задачи

10

Инженер-программист 3-й кат.

10

8

Определение формы представления входных и выходных данных

5

Ведущий инженер

3

Инженер-программист 3-й кат.

5

9

Программирование и отладка программы

25

Инженер-программист 3-й кат.

25

10

Разработка порядка и методики испытаний

2

Ведущий инженер

2

11

Итоговое тестирование программного средства

1

Ведущий инженер

1

Инженер-программист 3-й кат.

1

12

Корректировка программы и программной документации по результатам испытаний

5

Инженер-программист 3-й кат.

5

13

Руководство системного программиста

1

Инженер-программист 3-й кат.

1

14

Руководство программиста

1

Ведущий инженер

1

Инженер-программист 3-й кат.

1

15

Руководство пользователя

1

Ведущий инженер

1

Итого, дней:

79

Итого, человек/дней:

97

Представим этапы разработки в виде диаграммы Гранта на рис. 6.2.