Смекни!
smekni.com

Средства лингвистического обеспечения АИС вузовских библиотек Беларуси (стр. 4 из 11)

Интеллектуальная обработка требует значительных временных затрат, что несовместимо с необходимостью оперативного анализа текстовых документов. Поэтому в рассматриваемой сфере реализуются разработки технологий автоматической обработки текста (в частности автоматического смыслового анализа), автоматического индексирования текстов, аннотирования или реферирования и смыслового поиска в информационных ресурсах на естественном. Таким образом, лингвистическое обеспечение в этой сфере идет по пути интенсивного развития лингвопроцессорной компоненты, которая сопровождается развитыми тезаурусными и грамматическими словарями. Следует отметить, что классификационные и вербальные информационно-поисковые языки в электронных библиотеках практически не используются, что является, на мой взгляд, неоправданным упущением.

Глава 3. Анализ лингвистических средств библиотек Беларуси

Перманентность развития информационно-технологической среды ставит перед библиотеками Беларуси важные и сложные задачи, такие как: формирование распределенных информационных ресурсов, вхождение в единое информационное пространство, выход на новый технологический и качественный уровень процес-сов получения, обработки и распределения создаваемых информационных ресурсов.

Известно, что обеспечение доступа к информационным массивам осуществляется благодаря средствам лингвистического обеспечения (ЛО), от качества которых зависит эффективность поиска, выигрывает имидж конкретной библиотеки. Интеграционные процессы в библиотечной сфере Беларуси находятся на начальном этапе. Делая первые шаги в направлении создания единого информационного пространства, необходимо осознать важность решения проблем соотношения общесистемных и локальных лингвистических средств, а также их совместимости. Тем не менее, в настоящее время в Беларуси нет единого научно-исследовательского, научно-методического центра по разработке и ведению лингвистических средств (ЛС), и как следствие, отсутствуют экспериментальные исследования в сфере лингвистического обеспечения для формирования теоретической базы. Библиотеки на практике сталкиваются с целым рядом проблем: выбора информационно-поисковых языков (ИПЯ), нормализации лексических единиц, необходимой глубины индексирования документов и т.д.

Был проведен анализ лингвистических средств 8 библиотек вузовской сети.

Объектом изучения являлись:

1. Фундаментальная библиотека БГУ (ФББГУ);

2. Библиотека БГЭУ (ББГЭУ);

3. Библиотека БГУИР (БГУИР);

4. Научная библиотека БНТУ (НБ БНТУ);

5. Библиотека Могилевского государственного университета продовольствия (БМГУП);

6. Библиотека Полоцкого государственного университета (БПГУ);

7. Библиотека Гродненского государственного университета имени Янки Купалы;

8. Библиотека Белорусского государственного медицинского университета (БГМУ).

Целями данного анализа являлись:

· выявление состава лингвистических средств;

· подходов к их формированию;

· пределение качества ЛС;

· наличие контроля за ведением ЛС;

· наличие БД авторитетных/нормативных записей.

Я надеюсь, что полученные результаты будут полезны при определении степени возможной совместимости лингвистических средств в интеграционных процессах в Беларуси.

В результате анализа были получены данные, которые можно сгруппировать в несколько блоков:

1) ЛС, используемые для стандартизации при формировании основных полей библиографических записей (БЗ);

2) ЛС, используемые для выражения основного содержания документов и информационных запросов;

3) структура ЛС;

4) степень контроля за ЛС;

5) наличие авторитетного контроля.

БЛОК 1. Задача стандартизации при формировании основных полей библиографических записей в АБИС решается путем создания и использования ряда словарей различной структуры. Анализ дал следующие результаты: словари авторов формируются во всех представленных организациях. В 4 – ведутся словари коллективов. Из 8 представленных организаций в 2 (ФББГУ, БМГУП) к вышеперечисленным добавляются словари языков, регионов, серий. Это не означает, что АБИС в исследуемых библиотеках не позволяют формировать большее количество словарей. Опыт показывает, в некоторых библиотеках максимально возможности АБИС не используют. При этом не стоит забывать, что важнейшим показателем качества массивов библиографической информации с использованием АИБС является именно степень стандартизации при формировании основных полей БЗ, в том числе и поисковых полей.

БЛОК 2. Для выражения основного содержания документа и информационных запросов используются различные системы классификаций и вербальные ИПЯ.

В исследуемых библиотеках используются следующие классификационные ИПЯ:

УДК – в 8 библиотеках,

ББК – в 5,

Государственный Рубрикатор научно-технической информации – в 5,

локальные рубрикаторы собственной генерации – в 3,

Т.о., ассортимент классификационных ИПЯ по всем библиотекам составляет 4 наименования.

В результате анализа выяснилось, из вербальных ИПЯ, используемых в исследуемых библиотеках, наибольшей популярностью пользуются языки ключевых слов, их используют 5 библиотек. В 3 организациях применяется язык предметных рубрик.

Вероятно, что причина популярности языка ключевых слов связана с тем, что формирование языка ключевых слов осуществляется путем свободно выбираемых из лексикона специалистов-пользователей слов и ввода их в базы данных в нормализованной лексикографической форме. Однако необходимо учитывать, что неконтролируемое и неуправляемое применение ключевых слов приводит к значительным потерям в характеристиках полноты и точности поиска. Поэтому специалисты все больше говорят сегодня об использовании информационно-поисковых тезаурусов, в которых лексические единицы характеризуются смысловыми связями друг с другом, а это, в свою очередь, позволяет проводить содержательный поиск информации, не ограничиваясь выдачей материалов по формальному совпадению слов запроса и документа.

Необходимо отметить, что ни в одном из исследуемых учреждений в перечне ЛС не встречается объектно-признаковый язык, ориентированный на решение задач фактографического поиска. Тем не менее, теория ЛО утверждает существование жесткой зависимости между ЛС с одной стороны и набором и качеством информационных продуктов и услуг с другой стороны. Если мы говорим о создании корпоративных систем, то необходимо изначально закладывать разнообразные возможности набора создаваемых продуктов и услуг актуальных сегодня. [5, с.30]

Результаты анализа показывают, что в наших библиотеках используются различные таблицы классификации и различные словари терминов. Связано это с тем, что процесс смысловой содержательной обработки документов – это интеллектуальная деятельность, которую стандартизировать практически невозможно. [6, С. 19]

Белорусскими библиотеками накоплен достаточный опыт в области создания собственных лингвистических средств, от которого сложно отказаться, поэтому построение единого информационного пространства должно основываться на уважении правил и традиций друг друга. При этом, необходимо понимать, что состав ЛО корпоративной сети должен быть шире, чем состав ЛО АИБС отдельной библиотеки. На пути к интеграции необходимо осознать важность использования всеми будущими участниками сетевого взаимодействия одних и тех же средств и инструментов. Конечно, оптимальным было бы наличие единого контролируемого словаря терминов. Гипотетически, выходом может стать создание национального тезауруса, для которого необходима серия отраслевых тезаурусов. Многие посчитают это утопией, ведь создание тезауруса – процесс трудоемкий и затратный, но, как заявляют ведущие российские специалисты в области ЛО, «предпочтительно иметь тезаурус и использовать его для обогащения поисковых предписаний» [4, с.7]. Так или иначе, на сегодняшнем этапе нам необходима общая договоренность по системе ЛО.

БЛОК 3. Набор используемых лингвистических средств в наших библиотеках определяется их функциональным назначением, типо-видовой и отраслевой структурой документально-информационного потока, информационных запросов обрабатываемого системой и т.д.

Большинство формируемых ЛС (в 5 библиотеках) имеют иерархическую структуру, обеспечивающую наличие смысловых связей между лексическими единицами.

БЛОК 4. В связи с тем, что проблемы комплексного управления качеством являются в настоящее время важнейшими в экономике любого государства, хотелось бы остановиться на проблеме качества ЛС, т.к. от этого зависит качество библиотечных продуктов и услуг. В 4 организациях – ФБ БГУ, ББГУИР, НББНТУ, БМГУП существуют организационные структуры, ответственные за ведение и поддержку ЛС в рабочем состоянии. На вопрос: «Осуществляется ли контроль (лексикографический и терминологический) за ведением ЛС?» положительно ответили 3 из 4 библиотек. При этом статистический учет лексических единиц осуществляется лишь в 2 библиотеках –ФБ БГУ, БМГУП. Непонятно, как в остальных библиотеках решается вопрос об актуализации словарных баз данных. Ведь именно на основе анализа статистики употребления словарных единиц в поисковых образах документов идет исключение устаревших словарных статей из баз данных тезаурусов и грамматических словарей. На

наличие справочного аппарата в ЛС, обеспечивающего раскрытие смысла понятия и /или уточнение сведений о нем, указали только 5 библиотек.

В процессе анализа не была изучена нормативно-справочная база ЛО АИБС библиотек, в частности нормативные документы, устанавливающие правила ведения, поддержки и актуализации ИПЯ, словарей и правила индексирования. Практика показывает, что в различных библиотеках применяется разный набор аспектов при индексировании. В состав ЛО сегодня необходимо включать методики индексирования документов и запросов, правила, методики и алгоритмы создания и ведения ЛС, это та часть ЛО, которая полностью зависит от нас, нашей компетентности и профессионализма. У многих из них уже немалые базы данных электронных каталогов, вопрос их качества является наиважнейшим в преддверии объединения. Необходимо этому уделять большое внимание именно сейчас, ведь чем больше проходит времени, тем масштабнее предстоит редактирование, поэтому проведение исследований качества электронных каталогов и поиска в них сегодня просто необходимы. [7, С. 19-21]