Заметим, что все живые языки естественно обладают некоторой избыточностью. Эта избыточность часто помогает восстановить правильный текст «по смыслу» сообщения. Вот почему встречающиеся вообще нередко искажения отдельных букв телеграмм довольно редко приводят к действительной потере информации: обычно удается исправить искаженное слово, пользуясь одними только свойствами языка. Этого не было бы при отсутствии избыточности. Мерой избыточности языка служит величина
где
n– число применяемых символов (букв);
Расчеты, проведенные на материале наиболее распространенных европейских языков, показывают, что их избыточность достигает 50 % и более (т.е., грубо говоря, 50 % передаваемых символов являются лишними и могли бы не передаваться, если бы не опасность искажений).
Однако для безошибочной передачи сведений естественная избыточность языка может оказаться как чрезмерной, так и недостаточной: все зависит от того, как велика опасность искажений («уровень помех») в канале связи.
С помощью методов теории информации можно для каждого уровня помех найти нужную степень избыточности источника информации. Те же методы помогают разрабатывать специальные помехоустойчивые коды (в частности, так называемые «самокорректирующиеся» коды). Для решения этих задач необходимо уметь учитывать потерю информации в канале, связанную с наличием помех.
Рассмотрим сложную систему, состоящую из источника информации
Рис. 2.5 Направление передачи информации в условиях помех
Источник информации представляет собой физическую систему
Будем рассматривать эти состояния как элементарные символы, которые может передавать источник
Если бы передача сообщений не сопровождалась ошибками, то количество информации, содержащееся в системе Y относительно
Условную энтропию
Определив потерю информации в канале, приходящуюся на один элементарный символ, переданный источником информации, можно определить пропускную способность канала с помехами, т. е. максимальное количество информации, которое способен передать канал в единицу времени.
Предположим, что канал может передавать в единицу времени k элементарных символов. так как максимальное количество информации, которое может содержать один символ, равно
Рассмотрим канал с помехами. Его пропускная способность определится
где
k – количество передаваемых символов;
max
Максимальная информация зависит от того, как и с какими вероятностями искажаются символы; происходит ли их перепутывание, или же простое выпадение некоторых символов; происходят ли искажения символов независимо друг от друга и т.д.
Однако для простейших случаев пропускную способность каналa удается сравнительно легко рассчитать.
Рассмотрим, например, такую задачу. Канал связи
Определим сначала максимальную информацию на один символ, которую может передавать канал. Пусть источник производит символы
Определим информацию на один элементарный символ:
Чтобы найти полную условную энтропию найдем сначала частные условные энтропии:
вторая – вероятности того, что сигнал перепутан:
Условная энтропия
Найдем теперь условную энтропию системы Y при условии, что X ~ x2 (передан сигнал единица):
откуда
Полная условная энтропия