Однако несмотря на то, что работа в Интернете не представляет сложности даже для неискушенного в этом отношении пользователя, проблема использования информации, распределенной в этой сети, не потеряла актуальности. Она перешла из области организации доступа к нужным сайтам к проблеме обобщения огромного объема информации, ставшего доступным для любых пользователей. Это связано, прежде всего, с тем, что, с одной стороны, человек имеет естественные ограничения по переработке информации, а с другой – каждый текстовый документ, рассматриваемый как источник информации, содержит огромную избыточность. Поэтому очень сложно с помощью простого просмотра документов, содержащихся в Интернете, получить нужные знания. Для решения этой проблемы на рубеже 90-х годов была выдвинута идея «навигации» в едином информационном пространстве – «навигации знаний» /75/.
«Навигация знаний» стала возможной по мере развития интеллектуальных технологий поиска и обработки текстовой информации для поддержки работы соответствующих аналитиков, одним из средств которых является гипертекст. Использование гипертекста для этого стало возможным в результате того, что в рамках концепции гипертекста возникли подходы, использующие достаточно строгие интеллектуальные процедуры, правила и алгоритмы для анализа содержащейся в гипертекстах информации. Речь идет о проблеме линеаризации гипертекста: построении в гипертекстовой сети путей, обладающих свойством когерентности (связности).
При использовании гипертекста каждый элемент информации осознается в его взаимосвязях, поэтому появляется возможность, выделяя группы тесно взаимосвязанных элементов информации, выявлять основные аспекты проблемы, структурировать ее, определяя пробелы в имеющейся информации, а в конечном счете, осмыслить проблему в целом и приблизиться к ее решению.
Важным является то, что гипертекстовая сеть может наращиваться за счет все новых элементов информации с их связями. Гипертекст принципиально открыт для добавления новых элементов, поскольку в процессе развития такой сети не нарушается ее структура, и добавление новых записей просто расширяет гипертекст как единую, непрерывную ткань: в нее могут включаться и элементы ранее созданных линейных текстов.
При построении гипертекстовой сети фактически повторяется логическая процедура деятельности любого аналитика, состоящей из следующих этапов:
- чтение источников (текущих новостей, научных статей и т.д.);
- выписка из этих источников фрагментов и помещение их в определенные емкости (картотеки);
- обобщение и написание аналитического доклада.
Использование гипертекстовой технологии позволяет отдельные фрагменты постепенно группировать в более крупные концептуальные модели благодаря устанавливаемым между ними связям. Это обеспечивает поддержку аналитической деятельности специалистов.
В настоящее время разработаны различные варианты гипертекстовой технологии, основными из которых являются /73/:
- направление IBIS – реализует технологию многоаспектного рассмотрения проблем и является разновидностью групповой работы (в коллективно формируемый гипертекст включают аспекты решаемой проблемы, идеи, выдвигаемые в ходе ее решения, а также аргументы, обосновывающие или отвергающие эти идеи);
- направление NoteCards – предполагает интерактивную работу эксперта с гипертекстовой базой данных, при которой эксперт переходит от одного фрагмента текстовой информации к другим, двигаясь по схеме смысловых связей между фрагментами, заполняя пробелы в информации и прорабатывая систему аргументации с точки зрения полноты и последовательности;
- системы СЕМПРО и БАГИС – отечественные гипертекстовые системы аналитического назначения, ориентированные на организацию идей.
Например, БАГИС помогает установить между фрагментами информации логические и смысловые связи, на основе которых они могут быть упорядочены в соответствии с определенными целями (по отношению к какой-либо идее, предположению, соображению). БАГИС на каждом шаге указывает, какая информация может продолжить формируемый текстовый материал. Однако главная особенность этой системы в том, что она способна обеспечить автоматическое упорядочивание узлов гипертекста и представление их в форме связного дискурса.
Гипертекст формируется этими системами по принципу достаточной смысловой близости текстовых фрагментов (узлов) независимо от метода создания: вручную или автоматически. Другой принцип – принцип полноты связей, обеспечивается тем, что все узлы, которые могут быть связаны по принимаемым критериям, должны быть соединены связями. В результате структура этого гипертекста отражает фактически существующую систему семантических связей между когнитивными элементами (понятиями, связями), представленными в его узлах.
Все свойства такой гипертекстовой сети оказываются семантически значимыми, информативными и в определенной мере объективными. В целом возникает соответствие между топологической структурой гипертекстовой сети и смысловой связью содержащихся в ее узлах понятий или высказываний. Следовательно, участкам гипертекстовой сети, для которых характерна высокая степень топологической связанности узлов, соответствуют системы понятий или высказываний, тесно связанных по смыслу. Благодаря этому создается возможность строить достаточно связные по содержанию тексты, используя топологические (теоретико-графовые) критерии.
Важная особенность систем автоматической «навигации», подобных СЕМПРО и БАГИС, состоит в том, что при невозможности, в силу фрагментарности информации, обеспечить полностью связное рассуждение, эти системы фиксируют в соответствующих местах наличие смысловых разрывов. Идея автоматической «навигации» может быть применена к неограниченным совокупностям текста, в которых связи до начала «навигации» не установлены.
При «навигации» в открытом текстовом пространстве очередной текстовый фрагмент, кандидат на продолжение навигационного пути, включается в этот путь, если у него обнаруживается достаточная степень импликацитной связанности, т.е. семантического подобия с предшествующими, включенными в навигацию фрагментами. При таком подходе не требуется выбор текстового фрагмента, в наибольшей степени отвечающего определенным критериям, поскольку ставится задача выбора фрагмента, который отвечает такого рода требованиям на уровне «разумной достаточности».
Поэтому не возникает необходимость полного просмотра некоторого множества текстов. Как только программа автоматической «навигации» обнаруживает фрагмент , удовлетворяющий требованиям, она включает его в навигационный путь.
При выходе в открытое информационное пространство, например Интернет, особенно важно избежать хаотичности «навигации». Поэтому так важно придать ей осмысленный характер. Это может быть достигнуто путем использования специальных критериев. В этом случае очередной фрагмент должен иметь признаки семантического подобия определенному числу предшествующих фрагментов (с учетом их расположения в уже построенном навигационном пути).
Процесс «навигации» в открытом информационном пространстве может быть интерпретирован в терминах информационного поиска следующим образом:
1. Осуществляется каскадный (последовательный) поиск элементов информации. Исходный запрос при этом формируется пользователем, а последующие запросы – автоматически.
2. При автоматическом формировании очередного запроса в него включаются ключевые слова, отражающие содержание текстовых фрагментов, выбранных в предшествующих актах поиска.
3. При автоматическом формировании очередного запроса в него включаются такие слова, благодаря которым очередной выбираемый фрагмент окажется семантически связанным с несколькими предшествующими (с учетом их места в последовательности выбранных фрагментов). Таким образом, при выборе очередного фрагмента принцип релевантности соединяется с принципом когерентности.
4. После выбора очередного фрагмента он индексируется дополнительно, в нем выделяются семантические атрибуты, которые не являлись основанием для поиска, но будут использоваться для последующих поисков. Таким образом, обеспечивается не только «преемственность» по отношению к предшествующему материалу, включенному в навигацию, но и его развитие, обогащение новыми элементами семантики.
Программа автоматической «навигации» в открытом информационном пространстве принадлежит к типу программ, работающих автономно. Пользователь время от времени вступает в контакт с программой для ознакомления с результатами и внесения соответствующих корректив. К таким программам предъявляется много требований, но основными из них являются требование хорошего понимания пользователя, обучаемости и рациональной стратегии.
Рациональная стратегия должна заключаться прежде всего в целесообразной очередности просмотра массивов информации, исходя из данных, содержащихся в запросе. Пользовательский интерфейс такой системы – это интерфейс высокоуровневого диалога, существенным образом отличный от интерфейса прямой манипуляции. В этой системе должны быть предусмотрены /73/:
- организация выхода программы на связь с пользователем в назначенное время или при получении определенных результатов;
- уровень предъявления результата, например на уровне основных понятий сформированного текста или полного текста;
- указание смысловых разрывов в тексте при использовании ослабленных критериев связности;
- усиление или ослабление пользователем критериев релевантности или когерентности;