Смекни!
smekni.com

Мультимедийные технологии (стр. 2 из 7)

,

а так как внутренняя сумма не зависит от i, то суммы можно поменять местами

. (5)

Но поскольку

, так как суммируются все вероятности
, формула (1.4) переходит в формулу (1.1), что и требовалось показать.

В рассматриваемом случае, когда элементы изображения взаимно коррелированы,энтропия

будет меньше, чем в случае, если бы значения сигнала были бы статистически независимы. Вследствие этого достижимый коэффициент сжатия возрастает. Поэтому первым шагом при сжатии данных обычно является декорреляция кодируемой последовательности, при которой, устраняются статистические связи между кодируемыми отсчетами, и уже затем производится энтропийное кодирование статистически независимых отсчетов.

3 Психофизическая избыточность изображений

Зрительная система человека имеет ряд особенностей - не все детали изображения одинаково воспринимаются зрителем. Детали малого размера, мало контрастные, из-за ограничений со стороны контрастной чувствительности зрения, не видны зрителю на изображении, поэтому без всякого ущерба для качества его воспроизведения могут не передаваться. Благодаря этому цифровой поток, которым передается изображение, может быть сокращен.

Психофизическая избыточность изображений - обусловлена особенностями зрительной системы человека.

Пример: кодирования изображения звездного неба. Пороговый контраст зрения в сильной степени зависит от угловых размеров наблюдаемых объектов. Так, например, если при наблюдении объектов, имеющих большой угловой размер, пороговый контраст составляет около 0,02, то при наблюдении точечных объектов, в нашем примере - звезд, он составляет не более 0,1. Поэтому, передавая изображение пиксел за пикселом, как обычно, можно квантовать яркость звезд всего на 16 уровней, расходуя на представление яркости каждой из них по 4 двоичных единицы, а не по 8. В этом случае благодаря уменьшению затрат двоичных единиц кода на представление яркости звезд имеет место сокращение кодовой последовательности и, следовательно, сжатие данных (изображения), которое в данном случае составляет 2 раза.

Описанный метод кодирования относится к группе методов сжатия данных с потерями информации. Смысл этого термина заключается в том, что после декодирования распределение яркости в восстановленном изображении отличается от того распределения, которое было до его кодирования, т.е. имеет место искажение изображения и соответственно потеря информации. Но следует иметь ввиду, что речь здесь идет о потере информации, которой зрительная система не в состоянии воспользоваться в силу присущих ей ограничений.

На практике при сжатии изображений применяются как методы сжатия данных с потерей информации (обычно эти методы основаны на сокращении не только психофизической избыточности, но статистической), так и методы сжатия данных без потерь информации.

4 Декорреляция сигнала изображения

Избыточность изображения обусловлена наличием сильных корреляционных связей между значениями яркости смежных пикселов, кроме того, избыточность обусловлена также тем, что неравномерность распределения плотности вероятности их значений мала. Различие в вероятности появления тех или иных уровней яркости невелико. Сказанное поясняется рис.2.1, на котором приведена плотность вероятности значений яркости в исходном изображении

.

Рис.2.1.

Первым шагом при сжатии изображений с использованием энтропийного кодирования является декорреляция кодируемой последовательности, при которой устраняются статистические связи между кодируемыми отсчетами и уже затем производится кодирование статистически независимых отсчетов. Простейшим, но не оптимальным способом декорреляции является преобразование последовательности отсчетов кодируемого сигнала, представляющего яркость пикселов изображения

, в последовательность отсчетов приращений этой яркости
при переходе с одного пиксела на другой, т.е.

,

где

- номер отсчета. В результате такого преобразования статистические связи между кодируемыми отсчетами сильно ослабляются, а распределение плотности вероятности их значений становится резко неравномерным. Отмеченное поясняется рис. 2.2, на котором приведена плотность вероятности приращения яркости
. Из сопоставления рис. 2.1 и рис. 2.2 видно, что во втором случае плотность вероятности распределения приращений резко неравномерна, благодаря чему сигнал последовательности приращений обладает большой избыточностью, а следовательно, может быть в большей степени сжат.

Рис.2.2

Рис.2.3

5 Кодирование длин серий

Кодирование длин серий или как его еще называют RLE (Run-Length Encoding) в настоящее время широко применяется при записи графических изображений в файлы либо как самостоятельный метод, либо в составе более сложных алгоритмов кодирования, применяемых в различных форматах графических файлов, например в JPEG. Этот метод применяется также в таких распространенных форматах, как PCX, TIFF и TARGA.

Многие графические изображения, например, чертежи, плакаты и т.п. включают в себя значительные однородные области, имеющие одинаковые яркость и цвет. При разложении таких изображений в растр наличие однородных областей приводит к появлению в строках последовательностей отсчетов, имеющих одни и те же значения, как показано на рис. 2.4. Эта особенность позволяет при их сжатии расходовать меньше двоичных единиц, чем при традиционном методе кодирования, записывая лишь длину серии (число повторений одинаковых отсчетов) и значение яркости, с которого начинается

Рис.2.4.

серия. Так при использовании метода кодирования длин серий для кодирования отсчетов яркости, показанных на рис. 2.4, получим следующую кодовую последовательность:

. Из изложенного следует, что при использовании этого метода в кодируемом сигнале устраняются (строго говоря, ослабляются) корреляционные связи.

Определим величину коэффициента сжатия, которое обеспечивается при использовании этого метода. Учитывая, что для записи числа повторений одинаковых отсчетов в последовательности, максимальная протяженность которой равна

, необходимо затратить
двоичных единиц, а также необходимо затратить
двоичных единиц для записи значения самой величины, где
- число уровней квантования яркости в кодируемом изображении, найдем, что затрата двоичных единиц для записи последовательности составит

.

Обозначая вероятность нового значения, т.е. вероятность появления последовательности, через

, а число строк в изображении и число отсчетов в строке, соответственно через
и
, найдем, что полная затрата двоичных единиц кода для записи изображения будет равна
. Принимая во внимание, что при традиционном кодировании для записи такого изображения потребуется
двоичных единиц, находим, что коэффициент сжатия
, обеспечиваемое от применения метода кодирования длин серий составит

.

Из этой формулы видно, что коэффициент сжатия сильно зависит от вероятности появления новых значений

. При малых значениях вероятности новых значений коэффициент сжатия оказывается большим, но быстро убывает при ее увеличении. К сожалению, статистика полутоновых изображений такова, что при 256 уровнях квантования практически каждый новый отсчет (пиксел) представляет новое значение, т.е.
. Обращаясь к формуле, видим, что при
коэффициент сжатия оказывается меньше единицы, т.е. применение описанного метода приводит не к сокращению числа двоичных единиц, а к увеличению. Объясняется это тем, что в этом случае дополнительная затрата двоичных единиц идет на представление длительности последовательностей, хотя их протяженность почти всегда равна единице.