Смекни!
smekni.com

Методические рекомендации по созданию школьных электронных библиотек Методические рекомендации разработаны по заказу (стр. 3 из 14)

Важным фактором принятия решения о целесообразности заимствования электронного документа является статус издающей организации (владельца сайта), которым определяется легитимность, качество, авторитетность издания.

При заимствовании электронного документа из Интернета, требуется проводить анализ сайта с точки зрения выделения самостоятельных объектов комплектования. Методика анализа предполагает, что каждый URL должен быть проверен для принятия решения. Одновременно ведется оценка документа с точки зрения его целостности и самодостаточности. При этом проверяется характер ссылок. Несущественными считаются ссылки, которые можно поменять в момент сохранения, для того, чтобы документ выглядел как целое. Некритичные ссылки-связи требуют проверки их актуальности.

2.2. Технология комплектования ШЭБ

Комплектование электронных библиотек может осуществляться несколькими способами несколькими способами:

· Оцифровка документов, имеющихся в распоряжении создателя;

· Получение электронных версий документа от автора;

· Заимствование документов, имеющихся в свободном доступе в Интернет;

· Закупка законно распространяемых электронных изданий на переносимых носителях;

· Комплектование ШЭБ на основе технологии электронной доставки документов (ЭДД).

.

Создатели ШЭБ могут выбрать один из названных способов, однако на практике происходит сочетание большинства из них. Каждый из методов имеет свои достоинства и недостатки, критичность которых проявляется только с учетом специфики каждой конкретной электронной библиотеки.

Оцифровка документов, имеющихся в распоряжении создателя школьной электронной библиотеки

Рассматривая возможные подходы к содержательному формированию фондов электронных изданий методом оцифровки, можно выделить несколько модельных форм, предпочтительность которых зависит от типа школы (городская, сельская, гимназия, с углубленным изучением предмета и т.д.), финансово-экономической возможности, кадрового потенциала и системы фондов традиционных библиотек.

Каждая из моделей позволяет организовать электронный фонд как открытого типа (доступный через Интернет), так и предназначенный для работы только в локальной сети или на одном компьютере.

Модель 1. Сплошная оцифровка фондов библиотеки школы. Целью подобного подхода является максимальное расширение доступности фондов библиотеки для неограниченного числа пользователей и решение некоторых проблем их сохранности (в первую очередь за счет выставления в электронном виде особо ценных и редких изданий, чем снимается нагрузка на оригинал).

Модель 2. Перевод в электронную форму активно используемой части документного фонда. На первый взгляд, это удачный вариант для ЭБ, поскольку здесь есть однозначный критерий отбора изданий для перевода в цифровой формат и ясная цель — сделать доступными для широкого круга пользователей наиболее актуальные документы.

Модель 3. Формирование коллекций по типам документов и отдельным темам. На наш взгляд, именно данная модель является одним из самых приемлемых вариантов для большинства ШЭБ. Основной проблемой видится определение тех электронных документов, на которые можно предположить наличие активного и устойчивого спроса в течение длительного времени. С другой стороны, в силу современных реалий, возможно формирование электронных коллекций по специальным заказам или согласно повышенной актуальности определенной темы.

В мировой практике есть примеры, когда школьные, специальные, публичные и университетские библиотеки провинций создают массивы электронных документов по определенному кругу проблем (история, новости, спорт, культура, литература, и т.д.).

Модель 4. Формирование комплексной культурно-образовательной программы. Речь идет о создании целостной мультимедийной базы данных определенной тематики, включающей, помимо печатных изданий, архивные материалы, изображения вещественных памятников, звуковой ряд и т.д. Самым распространенным и рекомендуемым является создание мультимедийной коллекции по краеведению.

К несомненным достоинствам создания ШЭБ методом оцифровки можно отнести два фактора. Во-первых, электронный документ изначально подготавливается в виде, определенном в техническом задании и других требованиях, предъявляемых к электронной библиотеке. Во-вторых, правовые вопросы решаются только с правообладателем на произведение, не требуя согласований с правообладателями на программные средства, веб-дизайнерами и т.д.

Наряду с определением цели создания ЭБ и ее моделей, важнейшим вопросом является выбор способа оцифровки, которых известны два:

· хранение документов после оцифровки в графических форматах,

· распознавание документов и представление их в символьных форматах.

Принятие решение по этому вопросу является достаточно непростым. Распознавание предоставляет возможность посимвольной обработки текста и, следовательно, разнообразных способов работы с текстами (поиск, редактирование, экспорт, импорт, и т.д.).

Совершенно нераспознанный текст таких возможностей не дает: поиск документа возможен только по данным, содержащимся в метаинформации, затруднена навигация по документу, невозможно использование блоков текста документа без их распознавания. Однако представление электронных документов в виде графических образов позволяет сохранить индивидуальные особенности исходного издания и полностью обеспечивает адекватность электронного представления и печатного оригинала. Поэтому оцифровка древних рукописей, особо ценных документов, или текстов, к достоверности которых предъявляются особые требования, осуществляется в виде графических образов. В случае необходимости символьного представления таких документов, возможен вариант клавиатурного ввода.

Кроме того, перевод текста из бумажного варианта в символьные форматы значительно дороже, поскольку сначала осуществляется сканирование с переводом текста в графический образ, а затем производится распознавание знаков текста при помощи программ оптического распознавания символов (OCR). Программы OCR работают не идеально, допуская определенное количество ошибок, поэтому для качественной подготовки текста требуется еще и ручная корректура. Количество ошибок при работе программ OCR зависит от качества текста. Хороший четкий текст позволяет достичь 1 % ошибок и даже меньше. В то же время, например, при оцифровке старых геологических отчетов количество ошибок достигало 50 %. Для текстов «неоптимальных» для распознавания, например, рукописей, текстов с математической нотацией, нетрадиционных алфавитов и др., проблема зачастую не может быть решена достаточно удовлетворительно в обозримом будущем.

Альтернативой технологии “сканирование – распознавание - корректура” является технология ручного ввода (перепечатка) текста, которая во многих случаях оказывается дешевле.

С другой стороны, представление текста в виде образа требует очень много машинной памяти для хранения, особенно при использовании сканирования с высоким разрешением. Например, при достижении качества электронного документа, сопоставимого с художественной фотографией, возникают файлы, достигающие 1Гб на один рисунок. Но даже обычная страница черно-белого текста требует в 50-100 раз больше места, чем тот же текст в символьном виде.

В этих условиях, кажется оптимальным решать вопрос о глубине распознавания каждого объекта индивидуально. Практически во всех случаях должен быть распознан справочный аппарат книги, что даст возможность организации поиска и навигации. Для наиболее важных и востребованных объектов распознавание должно максимально полным. При этом наличие распознанного текста не должно являться основанием для исключения из депозитарной копии графических образов данных частей объекта. Более того, возможно в некоторых случаях включать в коллекцию автоматически распознанный текст без дополнительной вычитки и приводить отсылку к графическому изображению на случай необходимости проверки точности распознавания, что даст полную информацию для поиска, навигации и обеспечит возможности заимствований (цитирования) с сохранением возможности контроля адекватности распознавания.

При выборе способа оцифровки (графического или символьного) следует также иметь в виду возможность получения документов по другим технологиям. Так, если ЭБ наряду с оцифровкой, будет комплектоваться, скажем, электронными рукописями или оригинал-макетами изданий, то эти документы практически всегда будут поступать в символьных форматах. В этом случае перед разработчикам ЭБ встает альтернатива: или иметь несколько коллекций в различных форматах (что очевидно нетехнологично), или выбрать единый формат, что влечет дополнительные затраты.

Мы рекомендуем при подготовке цифровых копий печатных и рукописных объектов придерживаться технологической политики, обеспечивающей возможность сохранности электронных копий в течение длительного времени и основанной на следующих принципах:

1. Создание базовой (депозитарной) электронной копии объекта с использованием открытых форматов данных с возможностью сложной разметки текста и характеризующихся четко определенным синтаксисом и семантикой.

2. Автоматическое формирование на основе депозитарной копии необходимых пользовательских представлений в различных форматах, удобных для работы конечного пользователя.

3. Возможность итеративного возврата с целью модификации и развития депозитарной копии в процессе ее эксплуатации.