обеспечивает доступ практически ко всем информационным ресурсам Internet. В
этом смысле она выходитза обычные рамки работы клиента только с сервером
определенного протокола, как это происходит в telnet, например. Отчасти,
довольно широкораспространенное мнение, что Mosaic или Netscape, которые
являются WWW-клиентами, это просто графический интерфейс в Internet, является
отчасти верным.Однако, как уже было отмечено, базовые компоненты WWW-технологии
(HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и
поэтому мультипротокольные клиенты должны бытьотнесены именно к World Wide Web,
а не к другим информационным технологиям Internet. Фактически, клиент—это
интерпретатор HTML. И как типичныйинтерпретатор, клиент в зависимости от команд
(разметки) выполняет различные функции.
Схема 1.2
Схема 1.2 Структура ”клиент - сервер” .
В круг этих функций входит не только размещение текста на экране, но обмен
информацией ссервером по мере анализа полученного HTML-текста, что наиболее
наглядно происходит при отображении встроенных в текст графических образов.
Прианализе URL-спецификации или по командам сервера клиент запускает
дополнительные внешние программы для работы с документами в форматах,
отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для
запуска клиентом программ независимо от типа документа была
разработанапрограмма Luncher, но в последнее время гораздо большее
распространение получил механизм согласования запускаемых программ через
MIME-типы. Другуючасть программного комплекса WWW составляет сервер протокола
HTTP, базы данных документов в формате HTML,управляемые сервером, и программное
обеспечение, разработанное в стандарте спецификации CGI. До самого последнего
времени (до образованияNetscape) реально использовалось два HTTP-сервера:
сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов
расширилось. Появился оченьнеплохой сервер для MS-Windows и Apachie-сервер для
Unix-платформ. Существуют и другие, но два последних можно выделить из
соображений доступностииспользования. Сервер для Windows - это shareware, но
без встроенного самоликвидатора, как в Netscape. Учитывая распространенность
персоналок внашей стране, такое программное обеспечение дает возможность
попробовать, что такое WWW. Второй сервер -это ответ на угрозу коммерциализации.
Netscape уже не распространяет свой сервер Netsite свободно и прошел слух,
чтоNCSA-сервер также будет распространяться на коммерческой основе. В
результате был разработан Apachie, который по словам его авторов будетfreeware,
и реализует новые дополнения к протоколу HTTP, связанные с защитой от
несанкционированного доступа, которые предложены группой поразработке этого
протокола и реализуются практически во всех коммерческих серверах.
База данных HTML-документов—это часть файловой системы, которая содержит
текстовые файлы в формате HTML и связанные сними графику и другие ресурсы.
Особое внимание хотелось бы обратить на документы, содержащие элементы экранных
форм. Эти документы реальнообеспечивают доступ к внешнему программному
обеспечению.
Прикладное программное обеспечение, работающее с сервером, можно разделить на
программы-шлюзы и прочие. Шлюзы—этопрограммы, обеспечивающие взаимодействие
сервера с серверами других протоколов, например ftp, илис распределенными на
сети серверами Oracle. Прочие программы—это программы, принимающие данные от
сервера и выполняющие какие-либо действия: получение текущей даты,
реализациюграфических ссылок, доступ к локальным базам данных или просто
расчеты.
Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз
подчеркнуть, что ее компоненты существуютпрактически для всех типов
компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в
Internet, может создать свой WWW-сервер,или, по крайней мере, посмотреть
информацию с других серверов.
Основные компоненты технологии World Wide Web
К 1989 году гипертекст представлял новую, многообещающую технологию, которая
имела относительно большое числореализаций с одной стороны, а с другой стороны
делались попытки построить формальные модели гипертекстовых систем, которые
носили скорее описательныйхарактер и были навеяны успехом реляционного подхода
описания данных. Идея Т. Бернерс-Ли заключаласьвтом, чтобы применить
гипертекстовую модель к информационным ресурсам, распределенным в сети, и
сделать это максимально простым способом.Он заложил три краеугольных камня
системы из четырех существующих ныне, разработав:
язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);
• универсальный способ адресации ресурсов в сети URL (Universal Resource
Locator);
• протокол обмена гипертекстовой информацией HTTP (HyperText Transfer
Protocol).
Позже команда NCSA добавила к этим трем компонентам четвертый:
• универсальный интерфейс шлюзов CGI (Common Gateway Interface).
Идея HTML—пример чрезвычайно удачного решения проблемы построения
гипертекстовой системы припомощи специального средства управления отображением.
На разработку языка гипертекстовой разметкисущественное влияние оказали два
фактора: исследования в области интерфейсов гипертекстовых систем и желание
обеспечить простой и быстрый способ создания гипертекстовой базы
данных,распределенной на сети.
В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем,
т.е. способов отображения гипертекстовойинформации и навигации в гипертекстовой
сети. Значение гипертекстовой технологии сравнивали со значением
книгопечатания. Утверждалось, чтолист бумаги и компьютерные средства
отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма
представления информации тожедолжна отличаться. Наиболее эффективной формой
организации гипертекста были признаны контекстные гипертекстовые ссылки, а
кроме того былопризнано деление на ссылки, ассоциированные со всем документом в
целом и отдельными его частями.
Самым простым способом создания любого документа является его набивка в
текстовом редакторе. Опыт создания хорошоразмеченных для последующего
отображения документов в CERN_е был - трудно найти физика, которыйне
пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал
стандарт языка разметки—Standard Generalised Markup Language (SGML).
Следует также принять во внимание, что согласно своим предложениям Бернерс-Ли
предполагал объединить в единую систему имеющиесяинформационные ресурсы CERN, и
первыми демонстрационными системами должны были стать системы для NeXT и
VAX/VMS.
Обычно гипертекстовые системы имеют специальные программные средства
построения гипертекстовых связей. Самигипертекстовые ссылки хранятся в
специальных форматах или даже составляют специальные файлы. Такойподход хорош
для локальной системы, но не для распределенной на множестве различных
компьютерных платформ. В HTML гипертекстовые ссылки встроеныв тело документа и
хранятся как его часть. Часто в системах применяют специальные форматы хранения
данных для повышения эффективности доступа.В WWW документы—это обычные ASCII-
файлы, которые можно подготовить в любом текстовом редакторе. Таким образом,
проблема созданиягипертекстовой базы данных была решена чрезвычайно просто.
В качестве базы для разработки языка гипертекстовой разметки был выбран SGML
(Standard Generalised Markup Language).Следуя академическим традициям,
Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в
терминах формыБекуса-Наура). Естественно, что в HTML были реализованы все
разметки, связанные с выделением параграфов,шрифтов, стилей и т. п., т.к.
реализация для NeXT подразумевала графический интерфейс. Важным компонентом
языка стало описание встроенных и ассоциированных гипертекстовых
ссылок,встроенной графики и обеспечение возможности поиска по ключевым словам.
С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За
это время произошло довольно серьезноеразвитие языка. Почти вдвое увеличилось
число элементов разметки, оформление документов все больше приближается к
оформлению качественныхпечатных изданий, развиваются средства описания не
текстовых информационных ресурсов и способы взаимодействия с прикладным
программнымобеспечением. Совершенствуется механизм разработки типовых стилей.
Фактически, в настоящее время HTML развивается в сторону создания
стандартногоязыка разработки интерфейсов как локальных, так и распределенных
систем.
Вторым краеугольным камнем WWW стала универсальная форма адресации
информационных ресурсов. Universal ResourceIdentification (URI) представляет
собой довольно стройную систему, учитывающую опыт адресации и идентификации
e-mail, Gopher, WAIS, telnet,ftp и т. п. Но реально из всего, что описано в
URI, для организации баз данных в WWW требуется только Universal Resource
Locator (URL). Безналичия этой спецификации вся мощь HTML оказалась бы
бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к
распределеннымресурсам сети. В URL можно адресовать как другие гипертекстовые
документы формата HTML, так и ресурсыe-mail, telnet, ftp, Gopher, WAIS,
например. Различные интерфейсные программы по разному осуществляют доступ к
этим ресурсам. Одни, как напримерNetscape, сами способны поддерживать
взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW,
другие, как например Chimera,вызывают для этой цели внешние программы. Однако,
даже в первом случае, базовой формой представления отображаемой информации
является HTML, ассылки на другие ресурсы имеют форму URL. Следует отметить, что
программы обработки электронной почты в формате MIME также имеют возможность