|   N  |    i  |    Pi, частотность букв русского языка  |    m, число символов  |    PilogPi  |    H(Si)=m·Pi·logPi  |  
|   2  |    О  |    0,09  |    13  |    -0,31  |    4,06  |  
|   3  |    Е  |    0,067  |    14  |    -0,26  |    3,66  |  
|   4  |    А  |    0,062  |    11  |    -0,25  |    2,74  |  
|   5  |    И  |    0,062  |    12  |    -0,25  |    2,98  |  
|   6  |    T  |    0,053  |    11  |    -0,22  |    2,47  |  
|   7  |    H  |    0,053  |    13  |    -0,22  |    2,92  |  
|   8  |    Ё  |    0,047  |    1  |    -0,21  |    0,21  |  
|   9  |    C  |    0,045  |    4  |    -0,20  |    0,81  |  
|   10  |    P  |    0,04  |    5  |    -0,19  |    0,93  |  
|   11  |    B  |    0,038  |    5  |    -0,18  |    0,90  |  
|   12  |    Л  |    0,035  |    6  |    -0,17  |    1,02  |  
|   13  |    К  |    0,028  |    4  |    -0,14  |    0,58  |  
|   14  |    М  |    0,026  |    7  |    -0,14  |    0,96  |  
|   15  |    Д  |    0,025  |    2  |    -0,13  |    0,27  |  
|   16  |    П  |    0,023  |    2  |    -0,13  |    0,25  |  
|   17  |    У  |    0,021  |    2  |    -0,12  |    0,23  |  
|   18  |    Я  |    0,018  |    1  |    -0,10  |    0,10  |  
|   19  |    Ы  |    0,016  |    2  |    -0,10  |    0,19  |  
|   20  |    З  |    0,015  |    1  |    -0,09  |    0,09  |  
|   21  |    Ь  |    0,013  |    3  |    -0,08  |    0,24  |  
|   22  |    Ъ  |    0,013  |    0  |    -0,08  |    0,00  |  
|   23  |    Б  |    0,013  |    0  |    -0,08  |    0,00  |  
|   24  |    Г  |    0,012  |    2  |    -0,08  |    0,15  |  
|   25  |    Ч  |    0,011  |    3  |    -0,07  |    0,21  |  
|   26  |    Й  |    0,01  |    0  |    -0,07  |    0,00  |  
|   27  |    Х  |    0,009  |    2  |    -0,06  |    0,12  |  
|   28  |    Ж  |    0,007  |    0  |    -0,05  |    0,00  |  
|   29  |    Ю  |    0,006  |    0  |    -0,04  |    0,00  |  
|   30  |    Ш  |    0,006  |    1  |    -0,04  |    0,04  |  
|   31  |    Ц  |    0,004  |    2  |    -0,03  |    0,06  |  
|   32  |    Щ  |    0,003  |    0  |    -0,03  |    0,00  |  
|   33  |    Э  |    0,003  |    0  |    -0,03  |    0,00  |  
|   34  |    Ф  |    0,002  |    2  |    -0,02  |    0,04  |  
|   Σ,N  |    144  |    Σ, Hреальн  |    31,11  |  ||
Идеальные сообщения, имеющие максимальную энтропию, оптимальны в том смысле, что в них на один символ (элемент, уровень квантования) приходится наибольшее количество информации.
Hоптим = n·log(N) = 34·log(144) = 73,38
В реальных сообщениях символы всегда коррелированны (после запятой не появляется точка, после гласной мягкий знак), вследствие чего количество информации, приходящееся на один символ будет меньше, чем в идеальных. Соотношение реальных и оптимальных сообщений выражается посредством коэффициента сжатия:
Количество информации в сообщении:
T = n·H(S) = 34·31,11[бит] = 1057,74[бит] = 132,23[байт]
2.5 Кодирование сообщения в вид, соответствующий 9-ричной системе счисления
Преобразуем исходное сообщение «Отчет выполнен студентом вечернего факультета специальности информационно измерительная техника и технологии Шаманаевым Александром Викторовичем» в вид, соответствующий десятеричной системе счисления, в 2 этапа:
1) представим исходный текст в кодировке 1251 согласно таблице 10;
2) переведем получившийся код в десятичную систему по схеме Горнера.
Таблица 10 – Кодировка 1251
Переведем полученный код из 10-тичной системы счисления в 9-ричную по следующему алгоритму:
1) выписываем степени 9 до тех пор, пока значение очередной степени не станет больше заданного числа в 10-тичной;
2) задавшись вопросом: «сколько раз входит следующая за найденной степень в 10-тичное число», фактически делим десятичное число на степень;
3) записываем результат деления и остаток;
4) задаемся вопросом: «сколько раз входит следующая степень в остаток?»;
5) повторяем пункты 3-5 до последней степени (нулевой).
На примере сообщения «Отчет», результаты кодирования представлены в табличном виде:
Таблица 11 – Перевод в десятичную систему по схеме Горнера
|   N  |    Символ  |    Кодировка 1251  |    Перевод в десятичную систему по схеме Горнера  |  |
|   A  |    B  |  |||
|   1  |    О  |    206  |    A1·256+A2  |    52978  |  
|   2  |    т  |    242  |    B1·256+A3  |    13562615  |  
|   3  |    ч  |    247  |    B2·256+A4  |    3472029669  |  
|   4  |    е  |    229  |    B3·256+A5  |    888839595506  |  
|   5  |    т  |    242  |  ||
Таблица 12 – Перевод сообщения из 10-тичной системы счисления в 9-ричную
|   N  |    Степени 9-ки по убыванию  |    Результат деления  |    Остаток  |  ||||
|   A  |    B  |    C  |    D  |  ||||
|   1  |    913  |    2541865828329  |    D1/A1  |    0  |    0  |    10-я кодировка  |    888839595506  |  
|   2  |    912  |    282429536481  |    D1/A2  |    3,15  |    3  |    D1-A2·C2  |    41550986063  |  
|   3  |    911  |    31381059609  |    D2/A3  |    1,32  |    1  |    D2-A3·C3  |    10169926454  |  
|   4  |    910  |    3486784401  |    D3/A4  |    2,92  |    2  |    D3-A4·C4  |    3196357652  |  
|   5  |    99  |    387420489  |    D4/A5  |    8,25  |    8  |    D4-A5·C5  |    96993740  |  
|   6  |    98  |    43046721  |    D5/A6  |    2,25  |    2  |    D5-A6·C6  |    10900298  |  
|   7  |    97  |    4782969  |    D6/A7  |    2,28  |    2  |    D6-A7·C7  |    1334360  |  
|   8  |    96  |    531441  |    D7/A8  |    2,51  |    2  |    D7-A8·C8  |    271478  |  
|   9  |    95  |    59049  |    D8/A9  |    4,60  |    4  |    D8-A9·C9  |    35282  |  
|   10  |    94  |    6561  |    D9/A10  |    5,38  |    5  |    D9-A10·C10  |    2477  |  
|   11  |    93  |    729  |    D10/A11  |    3,40  |    3  |    D10-A11·C11  |    290  |  
|   12  |    92  |    81  |    D11/A12  |    3,58  |    3  |    D11-A12·C12  |    47  |  
|   13  |    91  |    9  |    D12/A13  |    5,22  |    5  |    D12-A13·C13  |    2  |  
|   14  |    90  |    1  |    D13/A14  |    2,00  |    2  |    D13-A14·C14  |    0  |  
Полученный 9-ричный код сообщения «Отчет»: 3128222453352.