МИНИСТЕРСТВО ОБЩЕГО И ПРОФЕССИОНАЛЬНОГО
ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Кафедра информатики
Аспиранта второго
года обучения
Незнановой С. Ю.
03.00.10.(ихтиология)
Научный руководитель
профессор, д.б.н.
Иванков В. Н.
Владивосток
2002
1. Основные протоколы в Internet и поиск в них
2. Инструменты поиска
2.1. Тематические каталоги
2.2. Автоматические индексы
2.3. Российские системы поиска
Список литературы
Введение.
Одно из главных отличий Интернета от всего остального, что связано с компьютерами, — это то, что для успешной работы с ним, вообще говоря, не нужно никаких книг. Сам Интернет может служить и справочником, и учебником, и энциклопедией самого себя. Однако на начальном этапе, как мне кажется, польза от книги, внятно и доступно излагающей основы, может быть весьма значительной. Именно такую книгу я и постарался написать. Но прежде чем вы познакомитесь с ней поближе, давайте попробуем ответить на самый главный вопрос, который, вероятно, вы себе уже задавали:
Интернет: что же это, наконец, такое
Более или менее научные (или просто наукообразные) определения Интернета, которыми заполнены книги и статьи на эту тему, конечно, имеют свою ценность. Но для наших целей пока достаточно самого простого объяснения: Интернет — это множество компьютеров, соединенных друг с другом каналами связи, плюс набор стандартных правил, по которым они обмениваются информацией. При этом сами каналы связи, пожалуй, даже менее важны, чем правила передачи данных по ним, называемые в Интернете протоколами. Если хотя бы два компьютера взаимодействуют по одному из таких протоколов — это уже настоящий Интернет.
Изобретение и совершенствование модемов — специальных устройств, позволяющих компьютеру посылать информацию по телефону, — открыло двери в Интернет огромному количеству людей, у которых нет. никакого специального сетевого оборудования, а есть лишь персональный компьютер и телефонная розетка поблизости.
Как сам Интернет, так и модемы для персональных компьютеров существуют уже довольно долго. Однако лишь совсем недавно — около 1990 года — Интернет набрал, наконец критическую массу пользователей и ресурсов, необходимую для происходящей на наших глазах сетевой революции. Скоростные модемы, позволяющие обычным пользователям персональных компьютеров без ограничений наслаждаться всеми благами Интернета, появились еще позднее. А система World Wide Web (WWW, или «Всемирная паутина»), изобретенная в 1993 г. и бывшая поначалу лишь одной из многих составных частей сети, заняла доминирующее положение и стала определять лицо Интернета буквально в последние год-два. Так или иначе, всемирный интернетовский бум сейчас в самом разгаре — и вам очень повезло, что вы почти не опоздали к началу представления.
Интернет — это, прежде всего огромное множество компьютеров и программ. Среди последних вы найдете не только такие, которые умеют хорошо решать ваши конкретные задачи, но и гораздо больше таких, чьи способности вам, вероятно, поначалу будет сложно даже представить. Выход в Интернет дает вам уникальную возможность, каким бы несовершенным ни был ваш компьютер, заглянуть в двадцать первый век и самостоятельно освоиться с такими понятиями, как «всемирный кибер-социум», «виртуальные деньги», «информационная среда обитания» и т. п., — словом, со всем тем, о чем так любят писать сейчас журналисты.
Однако это лишь часть ответа на вопрос «что такое Интернет». Интернет сегодня — это не только огромное количество компьютеров, но еще и невероятное количество людей, для которых сеть является принципиально новым способом общения, почти не имеющим аналогов в материальном мире. Человек — существо социальное, и общение с себе подобными — одна из первейших его потребностей. Пожалуй, до сих пор еще ни одно техническое изобретение (если не считать телефона) не производило такого переворота в этом древнем как мир занятии — общении человека с человеком.
Конечно, что именно заинтересует вас в Интернете в первую очередь — люди или компьютеры, — зависит только от вас. Древняя метафора книги как модели мироздания, пожалуй, заслуживает пересмотра — теперь на роль такой модели гораздо лучше подходит компьютер. Когда же речь идет о миллионах компьютеров и их пользователей во всем мире, связанных в единую сеть, метафора эта уже перестает быть просто метафорой. Вот почему не будет преувеличением сказать, что, выходя в Интернет, вы делаете для себя доступным целый мир.
1. Основные протоколы в Internet и поиск в них.
Internet содержит громадное количество информации, по этому в нем трудно найти то что нужно, если не знать где искать. Место нахождения (или адреса) каждого ресурса определяет его URL . В URL содержится тип протокола, указывающий на какой сервер осуществляется доступ: на WWW( на который указывает запись: http), Gopher, ftp, telnet, или WAIS, это зависит от того какой тип информации вы будете передавать. Сетевой протокол — совокупность четко определенных правил: как запрашивать, оформлять и высылать по сети данную разновидность информации (Кент, 1996).
telnet
К сети Internet присоединены миллионы компьютеров и многие из них обладают интересными возможностями.
Оказывается, вполне осуществимо добраться до этих компьютеров чтобы посмотреть имеющиеся в них базы данных и программы. Специальная программа telnet позволяет превратить ваш компьютер в клиента telnet для доступа к данным и программам в многочисленных серверах telnet. Например исследователь регулярно может работать на нескольких компьютерах, администраторы которых назначают ему специальное имя и пароль.
Сам по себе telnet — просто средство связи; ни какого-то собственного интерфейса, ни возможностей поиска он не предоставляет.
Связавшись с помощью telnet с удаленной машиной и введя в поле запроса свое входное имя (login) и пароль (password) вы дальше общаетесь именно с этой машиной и программами на ней, а telnet заботится лишь о поддержании связи между вами (Левин, 1996).
Разумеется, многие хранилища информации, которые первоначально обслуживались специальными программами с доступом по telnet теперь можно перевести на WWW , что не редко и делается. Однако остались и такие которые по прежнему предоставляют свои услуги только по telnet (особенно среди каталогов и информационных служб библиотек ).
Стандартизированная ссылка на telnet соединение с некоторым узлом Internet ( т.е. URL- адрес этого соединения) выглядит так:
telnet://< адрес сервера >
FTP
Практически вся информация в компьютерном мире хранится в виде файлов. По этому еще на самой заре Internet появилось специальное средство для обмена файлами по сети — сетевой протокол FTP (File Transfer Protocol).
Количество файлов, доступных на узлах всего мира по анонимному FTP измеряется астрономическими цифрами и постоянно растет. К тому же Word Wide Web позволяет без какой-либо переделки существующих FTP архивов, снабжать их описаниями любой степени детальности и удобным гипертекстовым интерфейсом.
Но как узнать куда обращаться в поисках нужного файла?
Archie.
Поиск по имени файла на всех анонимных FTP-узлах мира можно осуществить с помощью системы Archie. Она разработана несколькими программистами из университета МакГила в Канаде и осуществляет индексирование станций FTP, показывая доступные в каждой станции файлы. Archie сообщает о нескольких миллионах файлов находящихся в более тысячи станций FTP, и предоставляет удивительно быстрый способ поиска того места, куда нужно направиться для получения интересующего вас файла. Поиск в базе данных сервера Archie производится с помощью ключевых слов, которые в данном случае представляют собой просто имена файлов или фрагменты имен.
Сейчас Archie доступен через WWW. Это WWW страница с бланком в котором указываются ключевые слова и опции поиска.
Хотя имя файла почти всегда имеет некое отношение к его содержимому, пользоваться Archie для тематического поиска программ не стоит. Эта система будет полезна, если вы действительно знаете имя нужного файла или часть имени. С другой стороны если вы ищете программу, которая имеет общепринятое сокращенное название, то есть некоторая вероятность что это сокращение будет присутствовать и в имени файла, так что можно попробовать найти такой файл с помощью Archie. Результаты поиска представляют собой список FTP-узлов и полных имен файлов на этих узлах. Имя файла служит ссылкой на этот файл, так что щелчок по имени позволит сразу же получить файл с данного узла. А доменый адрес FTP-архива выделенный крупным жирным шрифтом, перенесет вас в исходный каталог файловой системы на этом архиве.
Archie не делит свой список на страницы и его удобнее всего просматривать прямо по мере получения (Хоникарт, 1996).
URL-адрес, указывающий на FTP-соединение, должен, как минимум, включать в себя слово “ ftp” в качестве левой части и адрес узла в правой:
ftp://< адрес сервера >.
WAIS
Почти все информационные ресурсы Internet предоставляют возможность автоматического поиска, но лишь в одной из них — в системе WAIS ( Wide Area Information Server, глобальный информационный сервер) — поиск по ключевым словам, является основным методом доступа к информации.