N | i | Pi, частотность букв русского языка | m, число символов | PilogPi | H(Si)=m·Pi·logPi |
2 | О | 0,09 | 13 | -0,31 | 4,06 |
3 | Е | 0,067 | 14 | -0,26 | 3,66 |
4 | А | 0,062 | 11 | -0,25 | 2,74 |
5 | И | 0,062 | 12 | -0,25 | 2,98 |
6 | T | 0,053 | 11 | -0,22 | 2,47 |
7 | H | 0,053 | 13 | -0,22 | 2,92 |
8 | Ё | 0,047 | 1 | -0,21 | 0,21 |
9 | C | 0,045 | 4 | -0,20 | 0,81 |
10 | P | 0,04 | 5 | -0,19 | 0,93 |
11 | B | 0,038 | 5 | -0,18 | 0,90 |
12 | Л | 0,035 | 6 | -0,17 | 1,02 |
13 | К | 0,028 | 4 | -0,14 | 0,58 |
14 | М | 0,026 | 7 | -0,14 | 0,96 |
15 | Д | 0,025 | 2 | -0,13 | 0,27 |
16 | П | 0,023 | 2 | -0,13 | 0,25 |
17 | У | 0,021 | 2 | -0,12 | 0,23 |
18 | Я | 0,018 | 1 | -0,10 | 0,10 |
19 | Ы | 0,016 | 2 | -0,10 | 0,19 |
20 | З | 0,015 | 1 | -0,09 | 0,09 |
21 | Ь | 0,013 | 3 | -0,08 | 0,24 |
22 | Ъ | 0,013 | 0 | -0,08 | 0,00 |
23 | Б | 0,013 | 0 | -0,08 | 0,00 |
24 | Г | 0,012 | 2 | -0,08 | 0,15 |
25 | Ч | 0,011 | 3 | -0,07 | 0,21 |
26 | Й | 0,01 | 0 | -0,07 | 0,00 |
27 | Х | 0,009 | 2 | -0,06 | 0,12 |
28 | Ж | 0,007 | 0 | -0,05 | 0,00 |
29 | Ю | 0,006 | 0 | -0,04 | 0,00 |
30 | Ш | 0,006 | 1 | -0,04 | 0,04 |
31 | Ц | 0,004 | 2 | -0,03 | 0,06 |
32 | Щ | 0,003 | 0 | -0,03 | 0,00 |
33 | Э | 0,003 | 0 | -0,03 | 0,00 |
34 | Ф | 0,002 | 2 | -0,02 | 0,04 |
Σ,N | 144 | Σ, Hреальн | 31,11 |
Идеальные сообщения, имеющие максимальную энтропию, оптимальны в том смысле, что в них на один символ (элемент, уровень квантования) приходится наибольшее количество информации.
Hоптим = n·log(N) = 34·log(144) = 73,38
В реальных сообщениях символы всегда коррелированны (после запятой не появляется точка, после гласной мягкий знак), вследствие чего количество информации, приходящееся на один символ будет меньше, чем в идеальных. Соотношение реальных и оптимальных сообщений выражается посредством коэффициента сжатия:
Количество информации в сообщении:
T = n·H(S) = 34·31,11[бит] = 1057,74[бит] = 132,23[байт]
2.5 Кодирование сообщения в вид, соответствующий 9-ричной системе счисления
Преобразуем исходное сообщение «Отчет выполнен студентом вечернего факультета специальности информационно измерительная техника и технологии Шаманаевым Александром Викторовичем» в вид, соответствующий десятеричной системе счисления, в 2 этапа:
1) представим исходный текст в кодировке 1251 согласно таблице 10;
2) переведем получившийся код в десятичную систему по схеме Горнера.
Таблица 10 – Кодировка 1251
Переведем полученный код из 10-тичной системы счисления в 9-ричную по следующему алгоритму:
1) выписываем степени 9 до тех пор, пока значение очередной степени не станет больше заданного числа в 10-тичной;
2) задавшись вопросом: «сколько раз входит следующая за найденной степень в 10-тичное число», фактически делим десятичное число на степень;
3) записываем результат деления и остаток;
4) задаемся вопросом: «сколько раз входит следующая степень в остаток?»;
5) повторяем пункты 3-5 до последней степени (нулевой).
На примере сообщения «Отчет», результаты кодирования представлены в табличном виде:
Таблица 11 – Перевод в десятичную систему по схеме Горнера
N | Символ | Кодировка 1251 | Перевод в десятичную систему по схеме Горнера | |
A | B | |||
1 | О | 206 | A1·256+A2 | 52978 |
2 | т | 242 | B1·256+A3 | 13562615 |
3 | ч | 247 | B2·256+A4 | 3472029669 |
4 | е | 229 | B3·256+A5 | 888839595506 |
5 | т | 242 |
Таблица 12 – Перевод сообщения из 10-тичной системы счисления в 9-ричную
N | Степени 9-ки по убыванию | Результат деления | Остаток | ||||
A | B | C | D | ||||
1 | 913 | 2541865828329 | D1/A1 | 0 | 0 | 10-я кодировка | 888839595506 |
2 | 912 | 282429536481 | D1/A2 | 3,15 | 3 | D1-A2·C2 | 41550986063 |
3 | 911 | 31381059609 | D2/A3 | 1,32 | 1 | D2-A3·C3 | 10169926454 |
4 | 910 | 3486784401 | D3/A4 | 2,92 | 2 | D3-A4·C4 | 3196357652 |
5 | 99 | 387420489 | D4/A5 | 8,25 | 8 | D4-A5·C5 | 96993740 |
6 | 98 | 43046721 | D5/A6 | 2,25 | 2 | D5-A6·C6 | 10900298 |
7 | 97 | 4782969 | D6/A7 | 2,28 | 2 | D6-A7·C7 | 1334360 |
8 | 96 | 531441 | D7/A8 | 2,51 | 2 | D7-A8·C8 | 271478 |
9 | 95 | 59049 | D8/A9 | 4,60 | 4 | D8-A9·C9 | 35282 |
10 | 94 | 6561 | D9/A10 | 5,38 | 5 | D9-A10·C10 | 2477 |
11 | 93 | 729 | D10/A11 | 3,40 | 3 | D10-A11·C11 | 290 |
12 | 92 | 81 | D11/A12 | 3,58 | 3 | D11-A12·C12 | 47 |
13 | 91 | 9 | D12/A13 | 5,22 | 5 | D12-A13·C13 | 2 |
14 | 90 | 1 | D13/A14 | 2,00 | 2 | D13-A14·C14 | 0 |
Полученный 9-ричный код сообщения «Отчет»: 3128222453352.