- минимизация вероятности ложной тревоги при воздействии только шума с высоким уровнем;
- высокая вероятность правильного обнаружения речи низкого уровня;
- высокое быстродействие распознавания речи, для исключения задержек включения:
- минимальное время задержки выключения. В стандарте GSM принята схема VAD с обработкой в частотной области. Ее работа основана на различии спектральных характеристик речи и шума. Считается, что фоновый шум является стационарным в течение относительно большого периода времени, его спектр также медленно изменяется во времени. VAD определяет спектральные отклонения входного воздействия от спектра фонового шума. Эта операция осуществляется инверсным фильтром, коэффициенты которого устанавливаются применительно к воздействию на входе только фонового шума. При наличии на входе речи и шума инверсный фильтр осуществляет подавление компонентов шума и, в целом, снижает его интенсивность. Энергия смеси сигнал+шум на выходе инверсного фильтра сравнивается с порогом, который устанавливается в период воздействия на входе только шума. Этот порог находится выше уровня энергии шумового сигнала. Превышение порогового уровня принимается за наличие на входе реализации (сигнал+шум). Коэффициенты инверсного фильтра и уровень порога изменяются во времени в зависимости от текущего значения уровня шума при воздействии на входе только шума. Поскольку эти параметры (коэффициенты и порог) используются детектором VAD для обнаружения речи, сам VAD не может на этой же основе принимать решение, когда их изменять. Это решение принимается вторичным VAD на основе сравнения огибающих спектров в последовательные моменты времени. Если они аналогичны для относительно длительного периода времени, предполагается, что имеет место шум, и
коэффициенты фильтра и шумовой порог можно изменять, то есть адаптировать под текущий уровень и спектральные характеристики входного шума.
VAD с обработкой в спектральной области удачно сочетается с речевым RPE/LTP-LPC кодеком, так как в процессе LPC анализа уже определяется огибающая спектра входного воздействия, необходимая для работы вторичного VAD.
1.7.4 Формирование комфортного шума
Формирование комфортного шума осуществляется в паузах активной речи и управляется речевым декодером. Когда детектор активности речи (VAD) в передатчике обнаружит, что говорящий прекращает разговор, передатчик остается еще включенным в течение следующих пяти речевых кадров. Во время первых четырех из них характеристики фонового шума оцениваются путем усреднения коэффициента усиления и коэффициентов фильтра LPC анализа. Эти усредненные значения передаются в следующем пятом кадре, в котором содержат информацию о комфортном шуме (SID кадр).
В речевом декодере комфортный шум генерируется на основе LPC анализа SID кадра. Чтобы исключить раздражающее влияние модуляции шума, комфортный шум должен соответствовать по амплитуде и спектру реальному фоновому шуму в месте передачи. В условиях подвижной связи фоновый шум может постоянно изменяться. Это значит, что характеристики шума должны передаваться с передающей стороны на приемную сторону не только в конце каждого речевого всплеска, но и в речевых паузах так, чтобы между комфортным и реальным шумом не было бы резких рассогласований в следующих речевых кадрах. По этой причине SID кадры посылаются каждые 480 мс в течение речевых пауз.
Динамическое изменение характеристик комфортного шума обеспечивает натуральность воспроизведения речевого сообщения при использовании системы прерывистой передачи речи.
1.7.5 Экстраполяция потерянного речевого кадра
В условиях замираний сигналов в подвижной связи речевые фрагменты могут подвергаться значительным искажениям. При этом для исключения раздражающего эффекта при воспроизведении необходимо осуществлять экстраполяцию речевого кадра.
Было установлено, что потеря одного речевого кадра может быть значительно компенсирована путем повторения предыдущего фрагмента. При значительных по продолжительности перерывах в связи предыдущий фрагмент больше не повторяется, и сигнал на выходе речевого декодера постепенно заглушается, чтобы указать пользователю на разрушение канала.
То же самое происходит и с SID кадром. Если SID кадр потерян во время речевой паузы, то формируется комфортный шум с параметрами предыдущего SID кадра. Если потерян еще один SID кадр, то комфортный шум постепенно заглушается.
Применение экстраполяции речи при цифровой передаче, формирование плавных акустических переходов при замираниях сигнала в каналах в совокупности с полным DTX процессом значительно улучшает потребительские качества связи с GSMPLMN по сравнению с существующими аналоговыми сотовыми системами связи.
2 Генерирование случайного процесса, нахождение оценок статистических характеристик сгенерированного процесса
Исходя из технического задания, параметры спектра генерированного сигнала следующие:
210 Гц, 20 Гц, Т=0,001 с.Кодирование речи в стандарте GSM основано на синтезе модели авторегрессии (АР) речевого сигнала с полюсной передаточной функцией. Применение метода LPC-LTP-RPE- линейного предсказания с возбуждением от регулярных импульсов с долговременным и кратковременным предсказанием позволило, применяя модель АР невысокого порядка, добиться высокого качества передачи речи. Модель АР описывается разностным уравнением вида:
,где
и – параметры модели АР, соответственно коэффициенты и порядок АР; – ошибки предсказания, представляющие собой некоррелированные случайные отсчеты. Сущность модели АР состоит в том, что текущий отсчет может быть спрогнозирован по предшествующим отсчетам с точностью до непрогнозируемого абсолютно случайного отсчета типа белого шума.Для второго порядка уравнение АР имеет вид:
Произведем расчет коэффициентов АР
и по следующим формулам :; -2<
<2; = 0.4671;; -1<
<1; = - 0.8819;Построим спектральную плотность по мощности (СПМ) процесса
АР.Оценку СПМ произведем исходя из следующей формулы:
На рис.2.1 представлен график СПМ процесса АР построенный на основе расчетных коэффициентов АР:
Рисунок 2.1 График СПМ процесса АР
Сгенерируем случайный процесс белого шума (БШ) график которого изображен на рис. 2.2:
Рисунок 2.2 –График гауссовского случайного процесса типа белый шум
Построим коррелированный процесс АР график которого изображен на рис.2.3 :
Рисунок 2.3-График коррелированного процесса АР
Из графика видно, что коррелированный процесс имеет некоторую периодическую закономерность в отличии от процесса типа БШ.
Построим корреляционную функцию случайного процесса типа БШ
График корреляционной функции показан на рис.2.4 :
Рисунок 2.4-График корреляционной функции случайного процесса БШ
Для белого шума корреляционная функция должна быть дельта - функцией (в идеальном случае), в реальном случае же будут наблюдаться некоторые колебания функции относительно нуля.
Коэффициенты
рассчитываются по значениям коэффициентов корреляции с помощью уравнений Юла – Уокера или по методу Левинсона – Дарбина. Порядок оценивается с использованием некоторого критерия. По критерию Барлетта можно полагать, что истинный порядок модели АР равен , если коэффициент модели АР -го порядка меньше величины . За порядок модели АР можно принимать значение , начиная с которого функция корреляции ошибок предсказания близка к нулю. АР модель обладает свойством минимизировать дисперсию ошибки предсказания. Поэтому за порядок модели можно принять такое , начиная с которого дальнейшее увеличение порядка не приводит к существенному уменьшению дисперсии ошибки предсказания.