1. Количество ключевых слов. То есть сколько раз встречаются указанные ключевые слова вдокументе. Чем их больше, тем более релевантным является документ.
Иногда желание добиться успеха на этом поприще толкает некоторых использовать неприглядные приемы искусственногоувеличения релевантности своей страницы - спамить поисковые системы. В основном, спам заключается в использовании неоправданно большого кол-ваключевых слов на странице. Часто для того, чтобы подобные дополнительные слова не портили посетителям впечатление от страницы, их пишут текстом, совпадающимпо цвету с фоном страницы, или мелким шрифтом, и т.д., такие приемы - это не на реклама, а антиреклама,по существу, ибо пользователь не только никогда не вернется на эту страницу, но у него еще и останется негатив от ее посещения.
Разумеется, администрация поисковиков не одобряет подобные действия. Системы поискапризваны находить и отображать документы в соответствии с тем, что содержит текст, предназначенный для посетителей, а не по "обогащенной смеси"ключевых слов. Западные системы уже имеют ряд автоматических средств слежения за подобным спамом, российские скоро планируют их ввести, поэтому такиеискусственные рейтинги делать не имеет смысла, и не следует злоупотреблять количеством ключевых слов на странице.
2. Месторасположение ключевых слов.
Для поисковой системы одно и то же слово может иметь различный "вес" в зависимостиот того, где оно встречается в HTML -документе.
a) Наибольший вес имеют слова в заголовке страницы (заголовок - это то, что указанно междупарным тегом <title></title>). Поэтому следует поместить ключевые слова в заголовок документа, однако не стоит делать заголовок бессмысленным ислишком длинным, перегружая его ключевыми словами. Не следует также забывать, что помимо поисковых систем заголовок будет изучен пользователями (он будетвиден в результатах поиска, помимо этого, если кто-либо захочет поместить такую страницу в свой bookmark, то там будет фигурировать как раз заголовок).
b) Большой вес и у выделенных в основном тексте ключевых слов (выделение тегами <H1-H6>,<B>, <STRONG>).
с) Поисковые системы придают больший вес словам, расположенным в начале страницы, нежелитем, что расположены в конце. Следует сделать так, чтобы ключевые слова встречались в первом параграфе страниц. Таблицыи java-апплеты отодвигаюттекст, следующий за ними, еще ниже, тем самым, уменьшая его значимость для поисковых систем.
d) В HTML-документах есть целый ряд служебных полей. Некоторые поисковые системы индексируют ихсодержание и учитывают при поиске и определении релевантности. К ним можно отнести мета-теги, поле ALT, комментарии к странице. Желательно также помещатьключевые слова в эти поля.
3. Густота ключевых слов.
При определении степени релевантности страниц заданным ключевым словам большинство поисковыхсистем учитывают не только количество ключевых слов, а еще и отношение количества ключевых слов ко всем остальным словам. Таким образом, страница,содержащая только два слова "зимняя рыбалка", будет идти впереди страницы, содержащей помимо сочетания слов "зимняя рыбалка" еще идругие слова.
После регистрации следует протестировать ключевые слова.
Большинство поисковых систем учитывают мета-теги. На примере, приведенном ниже, можновидеть два мета-тега, которые предназначены специально для поисковых систем: description и keywords.
<HEAD>
<TITLE>Мир стратегических компьютерных игр</TITLE>
<META name="description" content="На наших страницах Вы узнаете все о
стратегических играх. Вашему вниманию - обзоры новых игр, хит-парад стратегий,
советы по прохождению сложных уровней и многое другое...">
<META name="keywords" content="игры, компьютерные игры, стратегии,
стратегические игры, solutions, игрушки, новые, новинки, прохождение, games,
пошаговые, real-time, diablo, war craft, fallout" >
Тег "keyword". Сюда необходимо помещают ключевые слова. Этот тег позволяет повысить релевантность страницы. Помимо этого можно использоватьслова, которые релевантны тематике сайта, но по каким-либо соображениям не включены в сам текст страницы. Можноиспользовать не только ключевые слова, но и словосочетания. Пользователь обычно производит поиск не по одному слову, а именно по словосочетанию. Так что припрочих равных условиях при запросе "поисковые системы" страница, содержащая в "keywords" сочетание "поисковые системы",будет показана выше, чем страница, содержащая два слова отдельно: "поисковые" и "системы".
Количество разрешенных ключевых слов для этого тега колеблется от системы к системе (длинав среднем составляет 200 символов). Не следует использовать одни и те же слова в этом теге более семи раз (поисковая система их просто проигнорирует).Рекомендуемое количество - три, причем лучше не помещать их одно за другим, а перемежать с другими ключевыми словами. Если используются английскиеслова, то их чаще всего помещают во множественном числе - "cats" вместо "cat". Пользователь,производя поиск по слову "cat", всегда найдет страницу, содержащую слово "cats", а вот наоборот позволит найти далеко не каждая система.
Тег "description". При выдаче результатов поиска поисковые системы помимозаголовка показывают первые 100 - 200 символов текста с найденой страницы в качестве аннотации. Но первые слова на странице могут не подходить в качествеаннотации (например, в начале может стоять текст опции выбора кодировок и т.д.). Используя тег "description", можно указывать любое другоеописание (желательно уложиться в 200 символов), которое будет привлекательно для пользователя. Помимо всего прочего, включая в это описание ключевые слова,можно еще больше увеличить их процентное соотношение (густоту) на странице и, соответственно, улучшить ее релевантность. Этот тег также незаменим на странице,целиком состоящей из графических элементов, на которых просто нечего индексировать (без текста вообще).
Тег "robots". Стоит упомянуть еще об одном важном теге - "robots". Если владелец по каким-либо причинам не желает, чтобыстраница была проиндексирована, помещают туда данный тег: <META name="robots" content="noindex">. К сожалению, не каждыйспайдер понимает данный тег, и более надежным методом является помещение файла robots.txt в корневую директорию сервера со списком страниц, индексации которыхне желают.
Все вышеперечисленное верно для спайдеров, если на страницу наткнутся случайно, втом случае, если на web-сайт будут вести ссылки с других страниц. Но зачастую это происходит не скоро, поэтому следует проиндексировать web-сайт в как можнобольшем количестве поисковых систем самостоятельно. Индексирование можно проводить с помощью специальных бесплатных серверов-регистраторов: Submit It!,Add Me!, WWW Broadcaster, Sputnik ADDER, @Submit! - зарубежные, Система TAU – российская, но все же лучше регистрироваться повторно в ручную на наиболееважных серверах.
Сколько страниц надо регистрировать? В принципе, если с главнойстраницы по ссылкам можно попасть на любую из страниц web-сайта, можно зарегистрировать только главную страницу. Робот поисковой системы рано илипоздно обойдет весь сайт, но следует иметь в виду следующее:
- при регистрации поисковые системы обычно оперативно помещают в индексы указаннуюстраницу и ставят весь остальной сайт в очередь на индексацию. И разница по времени между индексацией указанной страницы и всего остального сайта можетсоставить несколько недель;
- некоторые поисковые системы не индексируют автоматически внутренние страницы сервераглубже четвертого уровня (т.е. когда для попадания на страницу надо совершить четыре перехода);
- организация навигации с помощью frames, imagemaps, java-скриптов может помешать роботу пройти вглубь web-сайта дляиндексации внутренних страниц.
Принимая во внимание вышеперечисленное, желательно регистрировать не только начальную страницусайта, но и ряд внутренних ключевых страниц. Конечно, во всем надо знать меру: не стоит регистрировать отдельно каждую страницу, если у их несколько десятков.
Через некоторое время после регистрации можно проверить, проиндекированы ли страницы сайта всистеме, в каком виде выдается результат и т.д. и если требуется изменить или подкорректировать регистрацию.
Многие поисковые системы позволяют проверять наличие страниц в индексах. Например, в AltaVistaпри следующих запросах получаем:
url:insurance.com - все проиндексированные страницы в этом домене;
url:insurance.com/firms/ - все проиндексированные страницы в этой директории;
url:insurance.com/firms/alco.htm - эту страницу, если она находится в индексах.
Желательно раз в месяц наведываться в стратегически важные поисковые системы и снова проверять,есть ли раскучиваемые страницы в индексах. Иногда случаются странные вещи, и страницы могут исчезнуть из индексов.
По ряду причин страницы могут вообще не попасть в индексы:
- например, AltaVista позволяет индексировать не более чем 600 страниц на один домен. Какследствие, страницы, расположенные в таком, например, обширном домене как geocities.com, имеют большой шанс быть вообще не проиндексированными;
- специализированные поисковые системы, например, Апорт, индексируют страницы только некоторых доменов (.ru,.su, .ua)
- содержание страницы может быть расценено системой как спам поисковой машины, и соответственно она не будет помещена в индекс.
1. Alta Vista - http://www.altavista.com
AltaVista была открыта в декабре 1995, уже более года принадлежит компании Compaq ComputerCorporation (до этого была в ведении DEC). В июне 1996 стала партнером Yahoo!, c этого времени AltaVistaявляется избранной поисковой системой этогознаменитого каталога. Alta Vista по праву считается самой большой и авторитетной поисковой системой.