МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
__________
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Московский авиационный институт
(государственный технический университет)
__________________________________________________________________________
Кафедра 402
Дисциплина: «Информационная безопасность и защита информации»
Студент:___________ /Грачев А.А. /
Москва, 2010 г.
Оглавление
Перечень условных обозначений…………………………………………………………….. 3
Введение………………………………………………………………………………………. 5
Глава 1. Понятие «вокодер». Устройство и основные функции вокодера с линейным предсказанием………………………………………………………………………………... 6
1.1. Физическое обоснование…………………………………...…………………………... 7
1.2. Вокодеры с линейным предсказанием (липредеры)..…………………………………10
1.3. Принцип метода линейного предсказания..…………………………………………... 12
Глава 2: Способы преобразования информации в вокодерах с линейным предсказанием …….…………………………………………………………………………. 15
2.1. Преобразование коэффициентов…….………………………………………………… 15
2.2. Кодирование и декодирование…………………………………………………………. 16
2.3. Передача параметров с переменной скоростью .........……….……………………….. 19
2.4. Возбуждение синтезатора и выбор коэффициента усиления ……………………….. 20
Глава 3: Виды липредеров на примере устройств с низкой скоростью передачи информации…………………….…………………………………………………………….. 23
3.1. Липредеры на основе ковариационного метода ……………..………………………. 24
Глава 4: Методы анализа речи на основе использования вокодеров с линейным предсказанием……………………………………………………………………………….. 29
Глава 5: Кодеки………………………………………………………………………………. 34
Глава 6: Вокодеры в современности……....……………………………………………… 41
Заключение………………………………………………………………………………...... 44
Список используемой литературы……………………………………………………...... 45
Перечень основных условных обозначений.
АДИКМ – адаптивно-дифференциальная импульсно-кодовая модуляция;
ВОТ – выделитель основного тона;
ГОТ – генератор основного тона;
ГШ – генератор шума;
ДИКМ – дифференциальная импульсно-кодовая модуляция;
ИКМ – импульсно-кодовая модуляция;
КС – канал связи;
МККТТ – Международный консультационный комитет по телефонии и телеграфии;
МСЭ – Международный союз электросвязи;
НЧ – низко-частотный;
ОТ – основной тон;
ПЗУ – постоянное запоминающее устройство;
Т-Ш – «тон-шум»;
УО – устройство объединения сигналов;
УР – устройство разделения сигналов;
ФНЧ– фильтр низких частот;
ЦАП – цифро-аналоговый преобразователь;;
ЦПОС – цифровые процессоры обработки сигналов;
ACELP – англ. Algebraic Code Excited Linear Prediction - возбуждениеоталгебраическогокода;
ADPCM– aнгл. Adaptive differentialpulse-codemodulation - адаптивно-дифференциальнаяимпульсно-кодоваямодуляция;
CELP –англ., Code Excited Linear Predictive – возбуждениеоткода;
CS-ACELP - Conjugate Structure - Algebraic Code Excited Linear Prediction - сопряженнаяструктурасуправляемымалгебраическимкодомлинейнымпредсказанием;
DSP - DigitalSignalProcessor- специализированные цифровые сигнальные процессоры;
GSM - (от названия группы GroupeSpécialMobile, позже переименован в GlobalSystemforMobileCommunications) (русск. СПС-900) — глобальный цифровой стандарт для мобильной сотовой связи;
ITU – англ.International Telecommunication Union– Международныйсоюзэлектросвязи;
LD-CELP – англ. Low Delay - Code Excited Linear Prediction - линейноепредсказаниескодовымвозбуждениеми низкойзадержкой;
LPC – англ., LinearPredictiveCoding – кодирование с линейным предсказанием;
LSF - linearspectralfrequency -линейныеспектральныечастоты;
MIPS - Million Instructions Per Second - миллионоперацийвсекунду;
MOS – aнгл. Mean Opinion Score - средняясубъективнаяоценка;
MPELP– англ., Multi Pulse Excited Linear Predictive – многоимпульсноевозбуждение;
MP-MLQ - Multy-Pulse - Multy Level Quantization - множественное импульсное;
PCM– aнгл. PulseCodeModulation – импульснаякодоваямодуляция;
QDU - Quantization Distortion Units - параметры ухудшения качества сигнала при квантовании;
RELP–англ., ResidualExcitedLinearPredictive– возбуждение от остатка предвидения;
VAD - Voice Activity Detector - детектор активности источника речевого сигнала
многоуровневое квантование.
Введение
Вокодеры – это системы параметрического кодирования речи, широко применяемые в современной цифровой телефонной связи, в том числе – Internet-телефонии. Причиной тому – высокая степень сжатия информации, а также хорошая согласованность вокодеров с системами канального кодирования и шифрования, в результате чего сравнительно легко обеспечивается высокая защищенность систем связи от помех и утечки информации. Недостатком вокодеров является невысокое качество речи, поэтому они применяются главным образом в военной связи, где главное – не натуральность речи, а ее высокая степень сжатия и хорошая разборчивость. В коммерческих системах связи, где ценится натуральность звучания речи, обычно применяют полувокодеры (гибридные вокодеры), сочетающие принципы непараметрического и параметрического методов кодирования. Иные области применения вокодеров – автоматизированная стенография, озвучивание текста, человеко-машинный диалог, биометрия (идентификация диктора).
Знакомясь с современным состоянием вокодерных технологий по литературным источникам и ресурсам Internet, можно выделить следующие области примениения вокодеров:
· программные и программно-аппаратные разработки вокодеров для промышленного, военного и бытового применения;
· программные экспериментальные вокодеры;
· другие перспективные и интересные направления.
Глава 1: Понятие «вокодер». Устройство и основные функции вокодера с линейным предсказанием.
Устройства для параметрического частотного сжатия речи получили название вокодеров.
Вокодер (от англ. voice - голос и coder – кодировщик голоса) представляет собой устройство (или алгоритм), осуществляющее параметрическое компандирование речевого сигнала.
Компандирование - способ преобразования речевого сигнала, при котором на передающем конце тракта происходит сжатие по одному или нескольким измерениям (частотный диапазон, динамический диапазон, временной интервал), а на приёмном - восстановление первоначального объёма сигнала путём соответствующего расширения. Компандирование включает преобразования: компрессию (сжатие) и декомпрессию (восстановление) речевого сигнала.
Общий принцип действия вокодера любой системы поясняется на рис. 1.
Анализатор А - анализатор спектра Т-Ш - выделитель сигнала тон-шум ВОТ - выделитель основного тона УО - устройство объедин. сигналов КС - канал связиСинтезатор УР - устройство разъед. сигналов С - синтезатор спектра П - переключатель вида спектра ГОТ - генератор основного тона ГШ - генератор шума |
Рис. 1.Обобщенная блок-схема вокодера
Главными частями вокодерного тракта является анализатор, который осуществляющий выделение параметров речевого сигнала, система передачи, обеспечивающая прохождение информации об этих параметрах через канал связи в узкой полосе частот, и синтезатор, восстанавливающий первообразный речевой сигнал.
Анализатор вокодера состоит из устройства для выделения параметров речевого сигнала A1,A2,...,Ak и схемы выделения основного тона(тон(F0) или шум).
1.1. Физическое обоснование.
Работа вокодера (voice coder) основана на анализе характерных особенностей человеческой речи. На рис. 2 показаны условно частотные характеристики речи как функция от времени.
На рисунке изображены частотные полосы (от 0 до 1 КГц, от 1 КГц до 2 КГц и т. д.) и распределение энергии по ним при произнесении фразы.
Как видно из рисунка, энергия распределяется во времени только в некоторых частотных диапазонах и различается по величине. Отдельные пики энергии, возникающие в одном частотном диапазоне, называются фонемами.
Эта картина может изменяться в больших диапазонах, в зависимости от тембра голоса и особенностей произношения, но нам сейчас важно рассмотреть общие закономерности построения. На рисунке видно, что буквы отличаются не только частотным диапазоном, но и структурой. Для каждого звука характерны пики (резонансы) энергии в определенных частотных диапазонах и провалы в других. Частоты, на которых в данный момент возникают комбинации пиков (фонем), называются "частотами формант" или просто "формантами". Гласные и звонкие согласные звуки речи содержат обычно от трех до четырех формант. Эти свойства и иллюстрируются рис. 2.
Изображенная "спектрограмма" представляет собой распределение энергии речи в виде функции времени и частоты. Горизонтальная ось представляет время, вертикальная — частоту, уровень энергии условно показан частью синусоиды. Периоды между сменами формант составляют от 10 до 30 мс. Изучение образцов речи показало, что в русском языке содержится 42 фонемы: это 6 гласных звуков и остальные согласные. Чтобы закодировать их номера, достаточно 6 битов.