Специфический метод хранения реализован в пакете Lotus Notes в виде так называемой базы документов. База документов может хранить как однотипную так и разнотипную информацию в виде одного файла. Документы допускают внутреннюю структуризацию на основе формуляров путем выделения и добавления полей в документе. Навигацию в базе документов упрощает наличие страниц баз документов и категорий документов. Почтовые сообщения также хранятся в виде базы документов, файлы произвольного вида допускается присоединять к текстовым документам.
Многие современные системы электронных документов используют в дополнение к файловой системе так называемые библиотеки документов, содержащие в БД карточки документов с атрибутами и ключевыми словами. Для логической группировки документов применяются папки.
Поиск и фильтрация документов производится по запросам на основе контекстного поиска: по атрибутам, по ключевым словам и по полному содержанию текста на основе индекса. При использовании механизма четкого поиска (например, DOCS OPEN) в запросе не должно быть орфографических ошибок, а в тексте документа - ошибок распознавания. При этом может морфологический разбор позволяет упростить
Недавно на основе нейронных сетей и искусственного интеллекта реализована технология нечеткого поиска по полному содержанию документа (например, технология адаптивного распознавания образов APRP в пакете Excalibur EFS). Нечеткий поиск не требует полного соответствия искомых фраз с содержимым документов, кроме того, исключает потребность в исправлении ошибок после распознавания текста. Система поиска всегда выдает пользователю ответ, наилучшим образом согласованный с терминами или фразами запроса.
Фирмы-производители реляционных СУБД (в частности ORACLE) проповедуют другие схемы хранения - текстовые и универсальные БД. Тексты документов хранятся в символьных полях переменной длины, расширенные средства SQL-поиска позволяют формировать смешанные запросы для поиска по атрибутам и контекстного поиска, а дополнительные функции обеспечивают обработку текста Для хранения произвольной информации, в том числе мультимедиа, можно использовать поля бинарных объектов большой длины BLOB и/или гипертекст. СУБД, расширенные для поиска и обработки такой информации, образуют универсальные сервера БД. Другой способ хранения документов произвольного содержания реализуют объектно-ориентированные БД (например, Informix Illustra).
Феномен распределенного гипертекста составляет основу широко внедряемой Web- технологии. Хранилище информации представляет собой совокупность гипертекстовых страниц, распределенных по узлам сети Internet или корпоративной сети (Intranet). Каждая страница размещается в отдельном файле и представляет собой текст, размеченный с помощью языка HTML. Структуризация документа осуществляется путем форматирования, выделения полей, создания форм для диалогового заполнения документа и организацией внутренних гипертекстовых ссылок. Допускается создание гипермедиа включением любой мультимедиа-информации (растровая графика, аудио, видео). Навигация по хранилищу гипертекста осуществляется с помощью внешних гипертекстовых ссылок URL на документы, расположенные на различных узлах сети (Web-серверах). Кроме того, для определения местонахождения документов служит контекстный поиск. Для ускорения поиска информации в “паутине” применяются специальные программы-роботы, сканирующие Web- сервера и строящие некое подобие индекса. Использование гипертекста позволяет создать информационную инфраструктуру территориально распределенного учреждения и упростить диалоговый интерфейс пользователя, что наиболее важно при разработке информационных приложений для руководителей.
Организация и автоматизация в офисе коллективной работы с документами строятся на технологиях groupware и workflow.
Технологии groupware ориентированы на небольшие рабочие группы, характеризуются поддержкой выполнения одной коллективной задачи и отсутствием структуризации в организации работ. Поддержка ограничивается обеспечением коллективного доступа к информации с помощью различных методов доступа:
•сетевой доступ к файлам и базе данных;
•локальная и глобальная электронная почта (включая конференции и дискуссии);
•терминальный доступ, пересылка файлов и электронная доска объявлений;
•просмотр и интерпретация гипертекста (гипермедиа).
Нужно отметить, что Web-технологии помимо гипертекстового протокола HTTP включают в себя ряд других методов доступа.
При коллективной работе важно наличие блокировок для разрешения конфликтов при совместном использовании ресурсов, санкционирование доступа по идентификаторам и паролям, защита информации с помощью прав доступа. Дополнительный уровень безопасности обеспечивается методами и средствами шифрации и электронной подписи.
Технологии класса workflow служат для автоматизации документооборота в средних и крупных офисах и для них характерно:
•поддержка многопользовательской работы с несколькими задачами одновременно;
•четкая структуризация выполнения работ по ролям и документам с контролем исполнения.
Деловой процесс формализуется как совокупность состояний и переходов, необходимых для описания взаимодействия, как минимум двух субъектов (в частном случае сотрудников предприятия) для достижения выполнения заранее заданного условия. Частным случаем такого взаимодействия является простая пересылка документа из точки в точку.
Одной из реализаций технологии workflow является так называемая “система графов”, где каждый шаг представляет собой вектор и отражает движение задания, связанного с документом, или просто передвижения документа от одного субъекта к другому. При этом на человека, отвечающего за правильность функционирования схемы, ложится ответственность учета всевозможных непредвиденных (или отказных) ситуаций, которые могут возникнуть на пути движения документа. Другая реализация основывается на понятии “цикл” (“loop”) или “стол”. В этом случае подразумевается, что наименьшим элементом в схеме взаимодействия является цикл, учитывающий всю гамму взаимодействия между двумя произвольными субъектами. При этом система сама отслеживает замкнутость процесса и, в случае ошибки, указывает место некорректности с указанием ее причины, после чего прекращается генерация нового процесса.
Регламентации взаимоотношений субъектов документооборота дополняется заданием безусловной и условной маршрутизация документов (по электронной почте) и времен обработки документа для контроля и учета исполнения.
Обработка информации базируется на методах и средствах офисной автоматизации:
•обработка текста,
•электронные таблицы,
•деловая и презентационная графика,
•планирование работ и совещаний,
•генерация отчетов из базы данных, •мультимедиа.
Для комплексирования разных видов информации и интеграции пакетов программ используются несколько методов, среди которых центральное место занимает методы OLE для связывания и встраивания объектов.
Вывод информации осуществляют путем печать документов, публикация их на Web- серверах, в общих почтовых папках и электронных досках объявлений или рассылки по телекоммуникациям.
Обзор средств автоматизации учреждений
Информационно-программные средства автоматизации учреждений делятся на следующие категории:
•функциональные и интегрированные пакеты офисной автоматизации;
•системы для организации групповой работы;
•системы управления электронными документами;
•средства управления документооборотом.
Средства офисной автоматизации и коллективной работы в сети
Пакет Microsoft Office for Windows 95
Microsoft Office for Windows 95 представляет собой набор прикладных программ для автоматизации работы современного офиса, которые объединены в один пакет и работают как единое целое.
Microsoft Office for Windows 95 поставляется в двух различных вариантах, что позволяет удовлетворить потребности всех пользователей. Microsoft Office Standard имеет в своем составе электронную таблицу Microsoft Excel, текстовый процессор Microsoft Word, систему подготовки презентаций Microsoft PowerPoint и планировщик Microsoft Schedule+. Microsoft Office Professional, помимо вышеперечисленных приложений, включает в себя также СУБД Microsoft Access.
Microsoft Office for Windows 95 использует все преимущества Windows 95: поддерживаются длинные имена файлов, “горячие клавиши” и многозадачность. Пользователь получает доступ к почтовой станции Microsoft Exchange для обмена факсами и электронными письмами.
Microsoft Office for Windows 95 - это не только набор приложений, но и платформа для разработки. Разработчики могут использовать Microsoft Office в качестве основы для создания собственных приложений, предназначенных для удовлетворения конкретных нужд заказчика.
Microsoft Office for Windows 95 содержит мощные инструментальные средства для разработки:
Система Lotus Notes
Система Lotus Notes представляет собой платформу типа клиент-сервер, служащую для разработки и размещения прикладных программ группового обеспечения.
Благодаря тому, что система Lotus Notes объединяет важные технологии, необходимые для подготовки этих приложений, она предлагает разработчикам наиболее производительную платформу, ориентированную на совместное использование информации.
Система Lotus Notes позволяет пользователям получать, отслеживать, совместно использовать и создавать информацию, предназначенную для документов. Эта информация может поступать в различных форматах, таких как тексты, изображения, видео и звук, и от различных источников, таких как компьютерные прикладные системы, оперативные системы или системы деловых линий (Line of Business Systems), сканеры или факс-аппараты. Пользователям система Lotus Notes обеспечивает доступ к сети через любой применяемый ими графический пользовательский интерфейс (Windows, Mac, OS/2, Unix).