Смекни!
smekni.com

Определение оптимальной связывающей сети (стр. 9 из 10)

N

i

Pi, частотность букв русского языка

m, число символов

PilogPi

H(Si)=m·Pi·logPi

2

О

0,09

13

-0,31

4,06

3

Е

0,067

14

-0,26

3,66

4

А

0,062

11

-0,25

2,74

5

И

0,062

12

-0,25

2,98

6

T

0,053

11

-0,22

2,47

7

H

0,053

13

-0,22

2,92

8

Ё

0,047

1

-0,21

0,21

9

C

0,045

4

-0,20

0,81

10

P

0,04

5

-0,19

0,93

11

B

0,038

5

-0,18

0,90

12

Л

0,035

6

-0,17

1,02

13

К

0,028

4

-0,14

0,58

14

М

0,026

7

-0,14

0,96

15

Д

0,025

2

-0,13

0,27

16

П

0,023

2

-0,13

0,25

17

У

0,021

2

-0,12

0,23

18

Я

0,018

1

-0,10

0,10

19

Ы

0,016

2

-0,10

0,19

20

З

0,015

1

-0,09

0,09

21

Ь

0,013

3

-0,08

0,24

22

Ъ

0,013

0

-0,08

0,00

23

Б

0,013

0

-0,08

0,00

24

Г

0,012

2

-0,08

0,15

25

Ч

0,011

3

-0,07

0,21

26

Й

0,01

0

-0,07

0,00

27

Х

0,009

2

-0,06

0,12

28

Ж

0,007

0

-0,05

0,00

29

Ю

0,006

0

-0,04

0,00

30

Ш

0,006

1

-0,04

0,04

31

Ц

0,004

2

-0,03

0,06

32

Щ

0,003

0

-0,03

0,00

33

Э

0,003

0

-0,03

0,00

34

Ф

0,002

2

-0,02

0,04

Σ,N

144

Σ, Hреальн

31,11

Идеальные сообщения, имеющие максимальную энтропию, оптимальны в том смысле, что в них на один символ (элемент, уровень квантования) приходится наибольшее количество информации.

Hоптим = n·log(N) = 34·log(144) = 73,38

В реальных сообщениях символы всегда коррелированны (после запятой не появляется точка, после гласной мягкий знак), вследствие чего количество информации, приходящееся на один символ будет меньше, чем в идеальных. Соотношение реальных и оптимальных сообщений выражается посредством коэффициента сжатия:

Количество информации в сообщении:

T = n·H(S) = 34·31,11[бит] = 1057,74[бит] = 132,23[байт]

2.5 Кодирование сообщения в вид, соответствующий 9-ричной системе счисления

Преобразуем исходное сообщение «Отчет выполнен студентом вечернего факультета специальности информационно измерительная техника и технологии Шаманаевым Александром Викторовичем» в вид, соответствующий десятеричной системе счисления, в 2 этапа:

1) представим исходный текст в кодировке 1251 согласно таблице 10;

2) переведем получившийся код в десятичную систему по схеме Горнера.

Таблица 10 – Кодировка 1251

Переведем полученный код из 10-тичной системы счисления в 9-ричную по следующему алгоритму:

1) выписываем степени 9 до тех пор, пока значение очередной степени не станет больше заданного числа в 10-тичной;

2) задавшись вопросом: «сколько раз входит следующая за найденной степень в 10-тичное число», фактически делим десятичное число на степень;

3) записываем результат деления и остаток;

4) задаемся вопросом: «сколько раз входит следующая степень в остаток?»;

5) повторяем пункты 3-5 до последней степени (нулевой).

На примере сообщения «Отчет», результаты кодирования представлены в табличном виде:

Таблица 11 – Перевод в десятичную систему по схеме Горнера

N

Символ

Кодировка 1251

Перевод в десятичную систему по схеме Горнера

A

B

1

О

206

A1·256+A2

52978

2

т

242

B1·256+A3

13562615

3

ч

247

B2·256+A4

3472029669

4

е

229

B3·256+A5

888839595506

5

т

242

Таблица 12 – Перевод сообщения из 10-тичной системы счисления в 9-ричную

N

Степени 9-ки по убыванию

Результат деления

Остаток

A

B

C

D

1

913

2541865828329

D1/A1

0

0

10-я кодировка

888839595506

2

912

282429536481

D1/A2

3,15

3

D1-A2·C2

41550986063

3

911

31381059609

D2/A3

1,32

1

D2-A3·C3

10169926454

4

910

3486784401

D3/A4

2,92

2

D3-A4·C4

3196357652

5

99

387420489

D4/A5

8,25

8

D4-A5·C5

96993740

6

98

43046721

D5/A6

2,25

2

D5-A6·C6

10900298

7

97

4782969

D6/A7

2,28

2

D6-A7·C7

1334360

8

96

531441

D7/A8

2,51

2

D7-A8·C8

271478

9

95

59049

D8/A9

4,60

4

D8-A9·C9

35282

10

94

6561

D9/A10

5,38

5

D9-A10·C10

2477

11

93

729

D10/A11

3,40

3

D10-A11·C11

290

12

92

81

D11/A12

3,58

3

D11-A12·C12

47

13

91

9

D12/A13

5,22

5

D12-A13·C13

2

14

90

1

D13/A14

2,00

2

D13-A14·C14

0

Полученный 9-ричный код сообщения «Отчет»: 3128222453352.