Лингвистическое обеспечение (ЛО) определяется как совокупность применяемых в технологии АИС информационно-поисковых языков, лингвистических словарей, а также их средств поддержки. Основные функции лингвистического обеспечения таковы:
Параметрами лингвистического обеспечения регламентируются:
Метаданные - предварительные данные, создаваемые как минимальная информация об информации. Метаданные могут быть категориальными, описательными или определяемыми пользователем. Они должны отражать отношения, рабочие условия и особенности, содержание или структуру описываемых ресурсов.
Выбор системы метаданных определяет набор задач, решаемых на основе этой системы. В конечном счете, он формируется на основании требуемой функциональности электронной библиотеки, для которой эта система метаданных создается. Формализация метаданных является их обязательным условием.
Общим свойством метаданных является их относительный характер. Сведения, которые в одной информационной системе являются метаданными, в другой — собственно данными. Аналогично, метаданные могут являться и данными в рамках одной системы, присутствуя в явной форме как в метаописании объекта, так и в самом объекте.
В ЦБОР объектами метаданных являются произведения печати и/или их электронные копии, хранящиеся в фондах библиотек-участниц ЦБОР
В этом случае метаданные рассматриваются в качестве более эффективного электронного аналога традиционных сводных каталогов, с помощью которого осуществляется поиск в фондах библиотек и управление им. Наборы метаданных и их формулировки приводятся в соответствии с отечественными и международными стандартами и правилами описания изданий. Структурно метаданные реализованы в соответствии с форматом Machine-Readable Cataloging Records, MARC - одним из первых, наиболее известных и распространенных международных форматов библиотечных метаданных. В процессе обмена информацией достигается совмещение с любым из вариантов формата MARC, в том числе и с Российскими коммуникативными форматами семейства MARC.
Система метаданных является центральным логическим компонентом любого электронного каталога как реальной, так и электронной библиотеки.
На основе системы метаданных строятся следующие основные технологические процессы ЦБОР:
Выделяются следующие основные типы метаданных:
В рамках ЦБОР реализуется стандартизация метаданных как в содержательном, так и структурном аспектах на основании нормативно-методической документации - ГОСТов, правил каталогизации, методических материалов по формальной и содержательной обработке документов, а также дополнительных соглашений между библиотеками-участницами ЦБОР.
Основной формат метаданных ЦБОР - MARC (Машиночитаемые библиографические записи (Machine-Readable Cataloging Records, MARC)) - формат метаданных для подготовки данных о данных в электронной форме. Сфера применения данного формата:
· Библиографические метаданные;
· Метаданные, раскрывающие содержание;
· Технологические метаданные .
Метаданные в формате MARC, размещаются вне информационного ресурса, что позволяет с равным успехом использовать их для описания как печатных изданий, так и их электронных версий.
ИЯ АИС являются формальными языками и в функциональном аспекте подразделяются на:
Информационно-поисковый язык обладает системой средств, позволяющих выполнять коммуникативную функцию (создавать тексты на данном языке), однако его лексика и грамматика носит формальный характер. Морфология ИЯ (правила формирования лексических единиц (ЛЕ)), синтаксис (правила комбинирования ЛЕ), парадигматика (взаимоотношения ЛЕ) строится в соответствии с общими требованиями к ИПЯ.
Требования к ИЯ (ГОСТ 14.409-75):
· Полно и точно передавать смысл любого документа (запроса);
· Допускать строго однозначную запись, имеющую только одно истолкование;
· Отождествлять смыслового содержания документа.
Высказывание на ИПЯ - описание смыслового содержания документов и запросов. Лексические единицы (ЛЕ), использованные для такого описания, организуются по правилам синтаксиса, принятыми в данном ИЯ, и становятся элементами не языка, а текста. Для поиска по широкотематическим запросам наиболее эффективными являются классификационные ИПЯ; для поиска по детальным запросам - вербальные ИПЯ.
Выбор ИПЯ, используемых в ЦБОР должен обеспечить не только максимальную эффективность поиска, но и внутрисистемную лингвистическую совместимость электронных каталогов библиотек – участниц ЦБОР, а также лингвистическую совместимость системы с наиболее развитыми библиотечно-информационными центрами зарубежных стран.
Можно сказать, что библиографическое описание документа также является специфическим вербальным информационно-поисковым языком с максимальной формализацией структуры.
Обеспечение доступа к массивам ЦБОР обеспечивается с помощью индексов различных классификационных систем. Классификационный индекс определят тему конкретного документа и раскрывает содержание фонда по отрасли знаний в целом или научной дисциплине. Группировка БЗ в соответствии с классификационными делениями ББК (или иной иерархической классификации) является средством тематического/ отраслевого подхода к раскрытию содержания библиотечных фондов.
В отечественных библиотеках особенно широко применяются следующие классификационные схемы:
Классификационные системы регламентируются и имеют соответствующие центры, обеспечивающие методическую поддержку, регулярное внесение изменений и дополнений, переиздание и т.д.
Систематизация документов и организация полноценного поиска по классификационным индексам в электронном каталоге предполагает применение машиночитаемой версии таблиц классификации и методов организации поиска с их использованием.
Использование классификационных индексов с ЦБОР осложняется двумя обстоятельствами:
Вербальные ИПЯ – это поисковые языки, лексика которых строится на основании лексики естественного языка. Вербальные ИПЯ могут быть предкооординированными и посткоординатными:
В зависимости от степени нормируемости используемой терминологии вербальные ИПЯ могут быть: