Смекни!
smekni.com

Вокодеры с линейным предсказанием (стр. 1 из 9)

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

__________

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Московский авиационный институт

(государственный технический университет)

__________________________________________________________________________

Кафедра 402


РЕФЕРАТ

Дисциплина: «Информационная безопасность и защита информации»

Тема: «Вокодеры с линейным предсказанием»

Группа: КТ-515

Студент:___________ /Грачев А.А. /

Преподаватель: доц. каф. 402

_________ /Большов О.А./

Москва, 2010 г.

Оглавление

Перечень условных обозначений…………………………………………………………….. 3

Введение………………………………………………………………………………………. 5

Глава 1. Понятие «вокодер». Устройство и основные функции вокодера с линейным предсказанием………………………………………………………………………………... 6

1.1. Физическое обоснование…………………………………...…………………………... 7

1.2. Вокодеры с линейным предсказанием (липредеры)..…………………………………10

1.3. Принцип метода линейного предсказания..…………………………………………... 12

Глава 2: Способы преобразования информации в вокодерах с линейным предсказанием …….…………………………………………………………………………. 15

2.1. Преобразование коэффициентов…….………………………………………………… 15

2.2. Кодирование и декодирование………………………………………………………. 16

2.3. Передача параметров с переменной скоростью .........……….……………………….. 19

2.4. Возбуждение синтезатора и выбор коэффициента усиления ……………………….. 20

Глава 3: Виды липредеров на примере устройств с низкой скоростью передачи информации…………………….…………………………………………………………….. 23

3.1. Липредеры на основе ковариационного метода ……………..………………………. 24

Глава 4: Методы анализа речи на основе использования вокодеров с линейным предсказанием……………………………………………………………………………….. 29

Глава 5: Кодеки………………………………………………………………………………. 34

Глава 6: Вокодеры в современности……....……………………………………………… 41

Заключение………………………………………………………………………………...... 44

Список используемой литературы……………………………………………………...... 45

Перечень основных условных обозначений.

АДИКМ – адаптивно-дифференциальная импульсно-кодовая модуляция;

ВОТ – выделитель основного тона;

ГОТ – генератор основного тона;

ГШ – генератор шума;

ДИКМ – дифференциальная импульсно-кодовая модуляция;

ИКМ – импульсно-кодовая модуляция;

КС – канал связи;

МККТТ – Международный консультационный комитет по телефонии и телеграфии;

МСЭ – Международный союз электросвязи;

НЧ – низко-частотный;

ОТ – основной тон;

ПЗУ – постоянное запоминающее устройство;

Т-Ш – «тон-шум»;

УО – устройство объединения сигналов;

УР – устройство разделения сигналов;

ФНЧ– фильтр низких частот;

ЦАП – цифро-аналоговый преобразователь;;

ЦПОС – цифровые процессоры обработки сигналов;

ACELP – англ. Algebraic Code Excited Linear Prediction - возбуждениеоталгебраическогокода;

ADPCM– aнгл. Adaptive differentialpulse-codemodulation - адаптивно-дифференциальнаяимпульсно-кодоваямодуляция;

CELP –англ., Code Excited Linear Predictive – возбуждениеоткода;

CS-ACELP - Conjugate Structure - Algebraic Code Excited Linear Prediction - сопряженнаяструктурасуправляемымалгебраическимкодомлинейнымпредсказанием;

DSP - DigitalSignalProcessor- специализированные цифровые сигнальные процессоры;

GSM - (от названия группы GroupeSpécialMobile, позже переименован в GlobalSystemforMobileCommunications) (русск. СПС-900) — глобальный цифровой стандарт для мобильной сотовой связи;

ITU – англ.International Telecommunication Union– Международныйсоюзэлектросвязи;

LD-CELP – англ. Low Delay - Code Excited Linear Prediction - линейноепредсказаниескодовымвозбуждениеми низкойзадержкой;

LPC – англ., LinearPredictiveCoding – кодирование с линейным предсказанием;

LSF - linearspectralfrequency -линейныеспектральныечастоты;

MIPS - Million Instructions Per Second - миллионоперацийвсекунду;

MOS – aнгл. Mean Opinion Score - средняясубъективнаяоценка;

MPELP– англ., Multi Pulse Excited Linear Predictive – многоимпульсноевозбуждение;

MP-MLQ - Multy-Pulse - Multy Level Quantization - множественное импульсное;

PCM– aнгл. PulseCodeModulationимпульснаякодоваямодуляция;

QDU - Quantization Distortion Units - параметры ухудшения качества сигнала при квантовании;

RELP–англ., ResidualExcitedLinearPredictive– возбуждение от остатка предвидения;

VAD - Voice Activity Detector - детектор активности источника речевого сигнала

многоуровневое квантование.


Введение

Вокодеры – это системы параметрического кодирования речи, широко применяемые в современной цифровой телефонной связи, в том числе – Internet-телефонии. Причиной тому – высокая степень сжатия информации, а также хорошая согласованность вокодеров с системами канального кодирования и шифрования, в результате чего сравнительно легко обеспечивается высокая защищенность систем связи от помех и утечки информации. Недостатком вокодеров является невысокое качество речи, поэтому они применяются главным образом в военной связи, где главное – не натуральность речи, а ее высокая степень сжатия и хорошая разборчивость. В коммерческих системах связи, где ценится натуральность звучания речи, обычно применяют полувокодеры (гибридные вокодеры), сочетающие принципы непараметрического и параметрического методов кодирования. Иные области применения вокодеров – автоматизированная стенография, озвучивание текста, человеко-машинный диалог, биометрия (идентификация диктора).

Знакомясь с современным состоянием вокодерных технологий по литературным источникам и ресурсам Internet, можно выделить следующие области примениения вокодеров:

· программные и программно-аппаратные разработки вокодеров для промышленного, военного и бытового применения;

· программные экспериментальные вокодеры;

· другие перспективные и интересные направления.


Глава 1: Понятие «вокодер». Устройство и основные функции вокодера с линейным предсказанием.

Устройства для параметрического частотного сжатия речи получили название вокодеров.

Вокодер (от англ. voice - голос и coder – кодировщик голоса) представляет собой устройство (или алгоритм), осуществляющее параметрическое компандирование речевого сигнала.

Компандирование - способ преобразования речевого сигнала, при котором на передающем конце тракта происходит сжатие по одному или нескольким измерениям (частотный диапазон, динамический диапазон, временной интервал), а на приёмном - восстановление первоначального объёма сигнала путём соответствующего расширения. Компандирование включает преобразования: компрессию (сжатие) и декомпрессию (восстановление) речевого сигнала.

Общий принцип действия вокодера любой системы поясняется на рис. 1.

Анализатор А - анализатор спектра Т-Ш - выделитель сигнала тон-шум ВОТ - выделитель основного тона УО - устройство объедин. сигналов КС - канал связиСинтезатор УР - устройство разъед. сигналов С - синтезатор спектра П - переключатель вида спектра ГОТ - генератор основного тона ГШ - генератор шума

Рис. 1.Обобщенная блок-схема вокодера

Главными частями вокодерного тракта является анализатор, который осуществляющий выделение параметров речевого сигнала, система передачи, обеспечивающая прохождение информации об этих параметрах через канал связи в узкой полосе частот, и синтезатор, восстанавливающий первообразный речевой сигнал.

Анализатор вокодера состоит из устройства для выделения параметров речевого сигнала A1,A2,...,Ak и схемы выделения основного тона(тон(F0) или шум).

1.1. Физическое обоснование.

Работа вокодера (voice coder) основана на анализе характерных особенностей человеческой речи. На рис. 2 показаны условно частотные характеристики речи как функция от времени.


Рис. 2. Пример распределения энергии в частотных диапазонах

На рисунке изображены частотные полосы (от 0 до 1 КГц, от 1 КГц до 2 КГц и т. д.) и распределение энергии по ним при произнесении фразы.

Как видно из рисунка, энергия распределяется во времени только в некоторых частотных диапазонах и различается по величине. Отдельные пики энергии, возникающие в одном частотном диапазоне, называются фонемами.

Эта картина может изменяться в больших диапазонах, в зависимости от тембра голоса и особенностей произношения, но нам сейчас важно рассмотреть общие закономерности построения. На рисунке видно, что буквы отличаются не только частотным диапазоном, но и структурой. Для каждого звука характерны пики (резонансы) энергии в определенных частотных диапазонах и провалы в других. Частоты, на которых в данный момент возникают комбинации пиков (фонем), называются "частотами формант" или просто "формантами". Гласные и звонкие согласные звуки речи содержат обычно от трех до четырех формант. Эти свойства и иллюстрируются рис. 2.

Изображенная "спектрограмма" представляет собой распределение энергии речи в виде функции времени и частоты. Горизонтальная ось представляет время, вертикальная — частоту, уровень энергии условно показан частью синусоиды. Периоды между сменами формант составляют от 10 до 30 мс. Изучение образцов речи показало, что в русском языке содержится 42 фонемы: это 6 гласных звуков и остальные согласные. Чтобы закодировать их номера, достаточно 6 битов.