Смекни!
smekni.com

Государственные и региональные информационные системы (стр. 6 из 9)

Неотображаемые символы

Набор символов документа включает множество различных неотображаемых символов. Многие из них являются типографскими элементами, используемым в некоторых приложениях для достижения специальных визуальных эффектов отображения. В языке HTML только следующие символы определяются как неотображаемые:

· пробел набора символов ASCII ( )

· табуляция набора символов ASCII (	)

· ASCII form feed ()

· пробел нулевой ширины (​)

Символы перевода строки также являются неотображаемыми. Помните, что хотя символы 
 и 
 определены в спецификации [ISO10646] как разделители строк и абзацев соответственно, это не определяет символы перевода строки в HTML, а также в этой спецификации они не включены в более общую категорию неотображаемых символов.

В этой спецификации не определяется поведение, отображение и пр. символов пробелов, если они явно не определены как неотображаемые символы. По этой причине для достижения визуальных эффектов форматирования, использующих неотображаемые символы вместо пробелов, авторам следует использовать соответствующие элементы и таблицы стилей.

Форматирование может включать пробелы между словами (называемые межсловными пробелами), но соглашения относительно межсловных пробелов меняются в зависимости от сценария. Например, в латинских сценариях межсловный пробел обычно отображается как пробел набора символов ASCII ( ), в то время как в таиландской кодировке это разделитель слов нулевой ширины (​). В японской и китайской кодировке межсловный пробел обычно вообще не генерируется.

Помните, что последовательность неотображаемых символов между словами в исходном документе может вызвать отображение совершенно другого межсловного пробела (кроме элемента PRE). В частности, агенты пользователей должны прекращать ввод последовательностей неотображаемых символов при выводе межсловного пробела. Это можно и нужно делать, даже при отсутствии информации о языке (из атрибута lang, полях заголовка HTTP "Content-Language" (см. [RFC2068], раздел14.13), настроек агента пользователя и т.д.).

Элемент PRE используется для форматированного текста, в котором неотображаемые символы имеют важное значение.

Для того, чтобы избежать проблем с правилами переноса строк SGML и несоответствия между существующими применениями, авторы не должны полагаться на агенты пользователей при генерации неотображаемых символов непосредственно после начального тега или непосредственно перед конечным тегом. Таким образом, авторы и особенно средства разработки, должны писать, например:

<P>Мы предлагаем бесплатную <A>техническую поддержку</A> для зарегистрированных пользователей.</P>

и не должны писать:

<P>Мы предлагаем бесплатную<A> техническую поддержку </A>для зарегистрированных пользователей.</P>

Структурированный текст

Элементы фраз: EM, STRONG, DFN, CODE, SAMP, KBD, VAR, CITE, ABBR и ACRONYM. Начальный тег: обязателен, Конечный тег: обязателен

Фразовые элементы добавляют в текстовые фрагменты структуру. Обычное значение фразовых элементов следующее:

EM: Выделение.

STRONG: Более сильное выделение.

CITE: Содержит цитату или ссылку на другие ресурсы.

DFN: Указывает, что это является определением вложенного термина.

CODE: Фрагмент компьютерного кода.

SAMP: Вывод примера программ, сценариев и т.д.

KBD: Текст, который должен ввести пользователь.

VAR: Экземпляр переменной или аргумента программы.

ABBR: Сокращенная форма (например, WWW, HTTP, URI, Mass., и т.д.).

ACRONYM: Акроним (например, WAC, радар и т.д.).

Элементы EM и STRONG используются для выделения. Другие фразовые элементы имеют определенное значение в технических документах. В следующих примерах показано использование некоторых фразовых элементов:

Как сказал <CITE>Гари Трумэн</CITE>,<Q lang="en-US">The buck stops here.</Q>Подробнеесм. <CITE>[ISO-0000]</CITE>.В дальнейшем используйте следующий номер ссылки: <STRONG>1-234-55</STRONG>

Представление фразовых элементов зависит от агента пользователя. Обычно визуальные агенты пользователей представляют текст элемента EM курсивом, а текст элемента STRONG полужирным шрифтом. Синтезаторы речи могут изменять параметры синтеза, например, громкость, повышение тона и скорости соответственно.

Элементы ABBR и ACRONYM позволяют авторам явно показывать использование аббревиатур и акронимов. Западные языки широко используют акронимы, такие как "GmbH", "НАТО" и "ФБР", а также аббревиатуры типа "M.", "Inc.", "et al.", "etc.". В китайском и японском языках используются аналогичные механизмы аббревиатур, когда длинное название заменяется последовательностью символов Han из оригинала. Разметка этих конструкций предоставляет агентам пользователей и вспомогательным средствам, таким как средства проверки орфографии, синтезаторы речи, переводящие системы и индексаторы поисковых машин, полезную информацию.

Содержимое элементов ABBR и ACRONYM определяет саму аббревиатуру, как она обычно отображается в тексте. Атрибут title этих элементов может использоваться для указания полной развернутой формы выражения.

Несколько примеров использования элемента ABBR:

<P><ABBR title="World Wide Web">WWW</ABBR><ABBR lang="fr"title="Soci&eacute;t&eacute; Nationale des Chemins de Fer">SNCF</ABBR><ABBR lang="es" title="Do&ntilde;a">Do&ntilde;a</ABBR><ABBR title="Abbreviation">abbr.</ABBR>

Помните, что аббревиатуры и акронимы часто имеют различное произношение. Например, если слова "США" и "BBC" обычно произносятся побуквенно, слова "НАТО" и "ЮНЕСКО" произносятся фонетически. Другие формы аббревиатур (например, "URI" и "SQL") некоторыми людьми произносятся побуквенно, а другими - как слова. При необходимости авторам следует использовать таблицы стилей для указания произношения аббревиатур.

Кавычки

Элементы BLOCKQUOTE и Q: Начальный тег: обязателен, конечный тег: обязателен

Определения атрибутовcite = uri [CT]

Значением этого атрибута является URI, определяющий источник документа или сообщения. Этот атрибут предназначен для предоставления информации об источнике, из которого заимствована цитат.

Эти два элемента определяют текст в кавычках. Элемент BLOCKQUOTE предназначен для длинных цитат (содержимое уровня блока) и Q предназначен для коротких цитат (встроенное содержимое), в которых не нужно разбиение на абзацы.

В этом примере цитата из книги "Две твердыни" Дж. Р. Р. Толкиена отформатирована с помощью элемента blockquote.

<BLOCKQUOTE cite="http://www.mycom.com/tolkien/twotowers.html"><P>They went in single file, running like hounds on a strong scent,and an eager light was in their eyes. Nearly due west the broadswath of the marching Orcs tramped its ugly slot; the sweet grassof Rohan had been bruised and blackened as they passed.</P></BLOCKQUOTE>

Отображение информации в кавычках: Визуальные агенты пользователей обычно генерируют элемент BLOCKQUOTE как блок с отступом.

Визуальные агенты пользователей должны обеспечивать отображение содержимого элемента Q с кавычками в начале и в конце. Авторы не должны помещать кавычки в начало и в конец текста в элементе Q.

Агенты пользователей должны генерировать кавычки с учетом принятого в данном языке стиля (см. атрибуты lang). Во многих языках используются различные стили для внешних и внутренних (вложенных) кавычек, которые должны соответственно отображаться агентами пользователей.

В примере ниже показаны вложенные кавычки в элементе Q.

John said, <Q lang="en">I saw Lucy at lunch, she says <Q lang="en">Mary wants you to get some ice cream on your way home.</Q> I think I will get some at Ben and Jerry's, on Gloucester Road.</Q>

Поскольку в обеих цитатах используется английский язык, агенты пользователей должны генерировать их соответственно - одиночные кавычки во внутренних кавычках и двойные - во внешних:

John said, "I saw Lucy at lunch, she told me 'Mary wants you to get some ice cream on your way home.' I think I will get some at Ben and Jerry's, on Gloucester Road."

Примечание.В реализации таблиц стилей рекомендуется обеспечение механизма вставки кавычек перед цитатой, определяемой элементом BLOCKQUOTE, и после нее в соответствии с текущим языком и степенью вложенности кавычек.

Однако, поскольку некоторые авторы использовали элемент BLOCKQUOTE в основном для отступа текста, чтобы не нарушать намерения авторов, агенты пользователей не должны вставлять кавычки в стиль по умолчанию.

В связи с этим использование элемента BLOCKQUOTE для смещения текста нежелательно.

Верхние и нижние индексы

Элементы SUB и SUP: Начальный тег: обязателен, Конечный тег: обязателен

Часто для правильной генерации необходимы верхние и нижние индексы (например, во французском языке). В этих случаях для разметки текста должны использоваться элементы SUB и SUP.

H<sub>2</sub>OE = mc<sup>2</sup><SPAN lang="fr">M<sup>lle</sup> Dupont</SPAN>

Строки и абзацы

Авторы традиционно разделяют свои тексты на последовательности абзацев. Организация информации в абзацы не влияет на представление абзаца: абзацы с двойным выравниванием содержат те же мысли, что и абзацы с выравниванием влево.

Разметка HTML для определения абзаца проста: элемент P определяет новый абзац.

Визуальное представление абзаца не так просто. Имеется ряд проблем, стилистических и технических:

· Обработка непечатных символов

· Перенос строки и продолжение слов

· Выравнивание

· Перенос

· Соглашения относительного письменного языка и направления текста

· Форматирование абзацев относительно окружающего

Эти вопросы обсуждаются ниже. Выравнивание абзаца и плавающие объекты обсуждаются далее в этом документе.

Элемент P представляет абзац. В нем не могут содержаться элементы уровня блока (включая и сам элемент P).