Смекни!
smekni.com

Защита информации в Интернете (стр. 3 из 12)

обеспечивает доступ практически ко всем информационным ресурсам Internet. В

этом смысле она выходитза обычные рамки работы клиента только с сервером

определенного протокола, как это происходит в telnet, например. Отчасти,

довольно широкораспространенное мнение, что Mosaic или Netscape, которые

являются WWW-клиентами, это просто графический интерфейс в Internet, является

отчасти верным.Однако, как уже было отмечено, базовые компоненты WWW-технологии

(HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и

поэтому мультипротокольные клиенты должны бытьотнесены именно к World Wide Web,

а не к другим информационным технологиям Internet. Фактически, клиент—это

интерпретатор HTML. И как типичныйинтерпретатор, клиент в зависимости от команд

(разметки) выполняет различные функции.

Схема 1.2

Схема 1.2 Структура ”клиент - сервер” .

В круг этих функций входит не только размещение текста на экране, но обмен

информацией ссервером по мере анализа полученного HTML-текста, что наиболее

наглядно происходит при отображении встроенных в текст графических образов.

Прианализе URL-спецификации или по командам сервера клиент запускает

дополнительные внешние программы для работы с документами в форматах,

отличныхот HTML, например GIF, JPEG, MPEG, Postscript и т. п. Вообще говоря для

запуска клиентом программ независимо от типа документа была

разработанапрограмма Luncher, но в последнее время гораздо большее

распространение получил механизм согласования запускаемых программ через

MIME-типы. Другуючасть программного комплекса WWW составляет сервер протокола

HTTP, базы данных документов в формате HTML,управляемые сервером, и программное

обеспечение, разработанное в стандарте спецификации CGI. До самого последнего

времени (до образованияNetscape) реально использовалось два HTTP-сервера:

сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов

расширилось. Появился оченьнеплохой сервер для MS-Windows и Apachie-сервер для

Unix-платформ. Существуют и другие, но два последних можно выделить из

соображений доступностииспользования. Сервер для Windows - это shareware, но

без встроенного самоликвидатора, как в Netscape. Учитывая распространенность

персоналок внашей стране, такое программное обеспечение дает возможность

попробовать, что такое WWW. Второй сервер -это ответ на угрозу коммерциализации.

Netscape уже не распространяет свой сервер Netsite свободно и прошел слух,

чтоNCSA-сервер также будет распространяться на коммерческой основе. В

результате был разработан Apachie, который по словам его авторов будетfreeware,

и реализует новые дополнения к протоколу HTTP, связанные с защитой от

несанкционированного доступа, которые предложены группой поразработке этого

протокола и реализуются практически во всех коммерческих серверах.

База данных HTML-документов—это часть файловой системы, которая содержит

текстовые файлы в формате HTML и связанные сними графику и другие ресурсы.

Особое внимание хотелось бы обратить на документы, содержащие элементы экранных

форм. Эти документы реальнообеспечивают доступ к внешнему программному

обеспечению.

Прикладное программное обеспечение, работающее с сервером, можно разделить на

программы-шлюзы и прочие. Шлюзы—этопрограммы, обеспечивающие взаимодействие

сервера с серверами других протоколов, например ftp, илис распределенными на

сети серверами Oracle. Прочие программы—это программы, принимающие данные от

сервера и выполняющие какие-либо действия: получение текущей даты,

реализациюграфических ссылок, доступ к локальным базам данных или просто

расчеты.

Завершая обсуждение архитектуры World Wide Web хотелось бы еще раз

подчеркнуть, что ее компоненты существуютпрактически для всех типов

компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в

Internet, может создать свой WWW-сервер,или, по крайней мере, посмотреть

информацию с других серверов.

Основные компоненты технологии World Wide Web

К 1989 году гипертекст представлял новую, многообещающую технологию, которая

имела относительно большое числореализаций с одной стороны, а с другой стороны

делались попытки построить формальные модели гипертекстовых систем, которые

носили скорее описательныйхарактер и были навеяны успехом реляционного подхода

описания данных. Идея Т. Бернерс-Ли заключаласьвтом, чтобы применить

гипертекстовую модель к информационным ресурсам, распределенным в сети, и

сделать это максимально простым способом.Он заложил три краеугольных камня

системы из четырех существующих ныне, разработав:

язык гипертекстовой разметки документов HTML (HyperText Markup Lan-guage);

• универсальный способ адресации ресурсов в сети URL (Universal Resource

Locator);

• протокол обмена гипертекстовой информацией HTTP (HyperText Transfer

Protocol).

Позже команда NCSA добавила к этим трем компонентам четвертый:

• универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Идея HTML—пример чрезвычайно удачного решения проблемы построения

гипертекстовой системы припомощи специального средства управления отображением.

На разработку языка гипертекстовой разметкисущественное влияние оказали два

фактора: исследования в области интерфейсов гипертекстовых систем и желание

обеспечить простой и быстрый способ создания гипертекстовой базы

данных,распределенной на сети.

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем,

т.е. способов отображения гипертекстовойинформации и навигации в гипертекстовой

сети. Значение гипертекстовой технологии сравнивали со значением

книгопечатания. Утверждалось, чтолист бумаги и компьютерные средства

отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма

представления информации тожедолжна отличаться. Наиболее эффективной формой

организации гипертекста были признаны контекстные гипертекстовые ссылки, а

кроме того былопризнано деление на ссылки, ассоциированные со всем документом в

целом и отдельными его частями.

Самым простым способом создания любого документа является его набивка в

текстовом редакторе. Опыт создания хорошоразмеченных для последующего

отображения документов в CERN_е был - трудно найти физика, которыйне

пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал

стандарт языка разметки—Standard Generalised Markup Language (SGML).

Следует также принять во внимание, что согласно своим предложениям Бернерс-Ли

предполагал объединить в единую систему имеющиесяинформационные ресурсы CERN, и

первыми демонстрационными системами должны были стать системы для NeXT и

VAX/VMS.

Обычно гипертекстовые системы имеют специальные программные средства

построения гипертекстовых связей. Самигипертекстовые ссылки хранятся в

специальных форматах или даже составляют специальные файлы. Такойподход хорош

для локальной системы, но не для распределенной на множестве различных

компьютерных платформ. В HTML гипертекстовые ссылки встроеныв тело документа и

хранятся как его часть. Часто в системах применяют специальные форматы хранения

данных для повышения эффективности доступа.В WWW документы—это обычные ASCII-

файлы, которые можно подготовить в любом текстовом редакторе. Таким образом,

проблема созданиягипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML

(Standard Generalised Markup Language).Следуя академическим традициям,

Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в

терминах формыБекуса-Наура). Естественно, что в HTML были реализованы все

разметки, связанные с выделением параграфов,шрифтов, стилей и т. п., т.к.

реализация для NeXT подразумевала графический интерфейс. Важным компонентом

языка стало описание встроенных и ассоциированных гипертекстовых

ссылок,встроенной графики и обеспечение возможности поиска по ключевым словам.

С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За

это время произошло довольно серьезноеразвитие языка. Почти вдвое увеличилось

число элементов разметки, оформление документов все больше приближается к

оформлению качественныхпечатных изданий, развиваются средства описания не

текстовых информационных ресурсов и способы взаимодействия с прикладным

программнымобеспечением. Совершенствуется механизм разработки типовых стилей.

Фактически, в настоящее время HTML развивается в сторону создания

стандартногоязыка разработки интерфейсов как локальных, так и распределенных

систем.

Вторым краеугольным камнем WWW стала универсальная форма адресации

информационных ресурсов. Universal ResourceIdentification (URI) представляет

собой довольно стройную систему, учитывающую опыт адресации и идентификации

e-mail, Gopher, WAIS, telnet,ftp и т. п. Но реально из всего, что описано в

URI, для организации баз данных в WWW требуется только Universal Resource

Locator (URL). Безналичия этой спецификации вся мощь HTML оказалась бы

бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к

распределеннымресурсам сети. В URL можно адресовать как другие гипертекстовые

документы формата HTML, так и ресурсыe-mail, telnet, ftp, Gopher, WAIS,

например. Различные интерфейсные программы по разному осуществляют доступ к

этим ресурсам. Одни, как напримерNetscape, сами способны поддерживать

взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW,

другие, как например Chimera,вызывают для этой цели внешние программы. Однако,

даже в первом случае, базовой формой представления отображаемой информации

является HTML, ассылки на другие ресурсы имеют форму URL. Следует отметить, что

программы обработки электронной почты в формате MIME также имеют возможность