Большинство поисковых систем (Yahoo, AltaVista и др.) позволяют перед выполнением запроса уточнить область по тематическому каталогу категорий. Для этого следует вначале выбрать одну или несколько категорий, а затем выполнить запрос. Также существуют возможности для выбора языка, места поиска (Internet, UseNet, и т.д.), страны или домена. Можно задать и временные границы для даты последнего обновления информации об искомых объектах.
Из метакоманд сервера AltaVista, ограничивающих область поиска, полезны ограничение поиска заданным доменом domain:edu и узлом host:company.ru.
2.3 Управление процессом поиска
Обычно процесс поиска является циклической процедурой, состоящей из последовательно уточняемых запросов на поиск и просмотра найденной информации. Если найдена ссылка, максимально удовлетворяющая цели поиска, целесообразно выполнить поиск похожих документов, например, с помощью экранной кнопки More like this.
Стратегия поиска индивидуальна, но полезно учитывать определенные практические рекомендации.
Начинать поиск лучше с определения адресов поисковых серверов, специализирующихся на нужных темах. Первым объектом поиска могут быть обзоры ссылок, которые регулярно составляют многие пользователи Internet. Имеет смысл искать в первую очередь и документы с ответами на часто задаваемые вопросы FAQ (Frequently Asked Questions) по какой-либо теме. В этих случаях первый запрос на поиск должен включать фразы типа “Поиск ...”, “Обзор ...” или “FAQ ...”.
Если использование поисковых серверов не приводит к нужному результату, целесообразно найти и использовать сервера организаций (университетов, издательств, фирм), работающих в данной области. С помощью контактов с такими организациями, в том числе и по электронной почте, можно найти и получить даже информацию не представленную в Internet (рекламные материалы, копии публикаций, бесплатные CD).
Поисковый сервер в результате выполнения запроса выводит общее число найденных объектов и список их аннотаций. Каждый объект в аннотации описывается заголовком или именем объекта, адресом ресурса, где расположен объект, кратким описанием и характеристиками.
Характеристиками обычно являются размер, дата обнаружения объекта в сети и степень соответствия запросу, выраженная в процентах (!?) или в количестве использованных ключевых слов.
Можно управлять, объемом информации в аннотации, порядком аннотаций в списке и числом аннотаций на странице. Если список большой, то наиболее важным параметром является порядок. Возможны следующие варианты условий сортировки результатов поиска:
- частота использования заданных ключевых слов в документе;
- ключевые слова в заголовке Web-страницы;
- ключевые слова в списке ключевых слов Web-страницы (тег <META>);
- длина или дата документа.
Документ с результатами поиска не существует в сети - он стоится динамически в момент выполнения запроса. Поэтому повторное обращение с тем же запросом к одному и тому же серверу не гарантирует совпадение результатов. Следовательно, найденные ссылки и списки аннотаций целесообразно сохранять на локальном компьютере пользователя.
Иногда применение всех средств и возможностей поиска не дает результатов, даже когда информация заведомо есть в Internet. Для того чтобы Web-страницы были своевременно включены в каталог или индекс владельцу следует информировать о них поисковые сервера. Эту операцию можно выполнять самостоятельно или с помощью специальных Web-серверов.