Смекни!
smekni.com

Вокодеры с линейным предсказанием (стр. 3 из 9)

Коэффициенты предсказания, значения которых передаются по каналу связи на приемную сторону, используются в качестве переменных параметров в рекурсивном цифровом фильтре, на вход которого подаются сигналы возбуждения. При воспроизведении вокализованных звуков (гласных) – это последовательность импульсов с частотой основного тона, а при воспроизведении невокализованных звуков (согласных) – это случайная последовательность импульсов, формируемых генератором шума.

При кодировании с линейным предсказанием моделируются различные параметры человеческой речи, которые передаются вместо отсчетов речевого сигнала или их разностей. Это позволяет существенно снизить скорость передачи речевого сигнала по сравнению с методами ИКМ, ДИКМ, АДИКМ.

Рис.6.Структура синтезатора речи с линейным предсказанием.

Широко применяемый в настоящее время метод кодирования с линейным предсказанием предусматривает формирование блоков отсчетов (кадров), для каждого из которых вычисляется и передается частота основного тона, его амплитуда и информация о типе возбуждающего воздействия (гармоническое, негармоническое). Структура синтезатора речи с линейным предсказанием показана на рис. 6.

Здесь сигналы возбуждения имеют вид последовательности импульсов на частоте основного тона (для вокализованных звуков) или случайного шума (для невокализованных звуков).

Комбинации спектральных составляющих речи, возникающей, в частности, за счет работы голосовых связок, языка и губ человека, могут быть промоделированы цифровым фильтром с изменяющимися параметрами.

При линейном предсказании обычно производится спектральный анализ речи и выполняется построение систем анализа-синтеза. Во всех случаях параметры синтезатора обновляются при смене анализируемых кадров речевого сигнала.

Чтобы избежать эффектов, связанных со скачками значений параметров, необходимо плавно изменять параметры с помощью интерполяции при переходе от одного фрагмента (сегмента) речи к другому.

При кодировании речевых сигналов по методу LPC обычно применяют метод анализа через синтез (Analysis – by – Synthesis (AbS)).

Рис.7.Иллюстрация метода анализа через синтез (AbS), где:

а) кодер

б) декодер (l’(h) значение Pic для момента h, полученное после декодирования)

При этом синтезатор (основной элемент декодера речевого сигнала) используется как составная часть устройства кодирования (рис.7). На основе формируемых данных производится синтез речевого сигнала, который сравнивается в процессе передачи с реальным сигналом, поступающим на вход устройства.

Сигнал ошибки e (h), получаемый в результате вычитания истинного и синтезированного сигналов, используется для уточнения формируемых в кодере данных.

По существу системы, использующие метод LPC, отличаются лишь способами генерирования возбуждающего воздействия и выбора параметров моделирующего фильтра.

Глава 2: Способы преобразования информации в вокодерах с линейным предсказанием.

2.1.Преобразование коэффициентов.

Основным набором передаваемых параметров в вокодере с ли­нейным предсказанием являются М коэффициентов фильтра с ха­рактеристикой A(z) для каждого анализируемого сегмента. Эти коэффициенты действительно были использованы учеными Итакура и Саито в вокодерной системе, построенной на основе метода макси­мального правдоподобия, где каждый параметр кодировался с помощью 9 бит. Исследователи Атал и Ханауэр обсуждали использование коэф­фициентов фильтра для передачи и отметили, что требуется не только относительно высокая точность (8—10 бит на коэффициент), но, кроме того, при линейной интерполяции параметров в приемнике не гарантируется устойчивость синтезатора. Вычисляя корни A(z) и передавая их, можно восстановить информацию о спектре сигнала, заключенную в A(z), используя в среднем 5 бит на параметр. Кроме того, поскольку корни соответствуют устойчи­вым синтезирующим фильтрам, при их линейной интерполяции га­рантируется устойчивость.

Было исследовано и много других преобразований коэффициен­тов фильтра. Наиболее важным преобразованием является расчет коэффициентов частной корреляции или коэффициентов отражения {km}. Они вычисляются непосредственно в автокорреляционном методе и могут быть получены рекурсивно с помощью процедуры пошагового по­нижения порядка, если используется ковариа­ционный метод. Необходимым и достаточным условием устойчивос­ти при этом является ограничение этих параметров единицей по модулю. Более того линейная интерполяция параметров устойчи­вых фильтров приводит в результате к устойчивым фильтрам.

Параметры {km} связаны с площадями сечений неоднородной акустической трубы {Aт}.. В качестве параметров, удобных для передачи, используются как логарифм отношения функций площадей {ln(Aт /Aт -1}, так и сами функции площадей А{m}. Линейная интерполяция этих параметров приводит к устойчивым фильтрам.

Одним из преобразований, гарантирующих устойчивость синтезиру­ющего фильтра после интерполяции, основано на коэффициентах автокорреляции. При корреляционном методе анализ может быть разделен на вычисление коэффициентов автокорреляции в пере­датчике и решение автокорреляционных уравнений в приемнике. В ковариационном методе могут быть использованы процедуры по­шагового понижения и повышения порядка, , включая применение уравнения в процедуре пошагового по­вышения порядка получения коэффициентов автокорреляции {r(т)}. В приемнике решаются автокорреляционные уравнения, как если бы процедура была идентична автокорреляционному ме­тоду. Устойчивость синтезирующего фильтра, полученного с помо­щью интерполяции автокорреляционных коэффициентов, следует из того факта, что линейная интерполяция элементов двух поло­жительно определенных теплицевых матриц дает положительно оп­ределенную теплицеву матрицу. Такая гарантия устойчивости предлагает безошибочность вычислений, поскольку ошибки при вычислениях могут исказить свойство положительной определен­ности матриц.

К параметрам, гарантирующим устойчивость при их интерполя­ции между устойчивыми сегментами, относятся корни функции А(z), параметры {km}, функции площади, отношения площадей, логарифм отношения площадей и автокорреляционные ко­эффициенты. Параметрами, для которых неустойчивость, обусловленная ошибками вычислений, может быть легко обна­ружена, являются корни полинома (для обеспечения ус­тойчивости их модули должны быть меньше единицы), параметры {km} (для устойчивости их модули также должны быть меньше единицы), функции площади и отношения площадей (для устой­чивости их значения должны быть положительными). Ошибки вы­числения логарифма отношения площадей не могут привести к не­устойчивости, поскольку экспоненциальность всегда обеспечивает положительные отношения площадей.

2.2. Кодирование и декодирование.

Для вокодеров, возбуждаемых квазипериодическим сигналом, передаваемые параметры представляют собой обычно преобра­зования сигнала основного тона Р, коэффициента усиления а и коэффициентов фильтра i}. На практике кодирование сигнала основного тона и коэффициента усиления обычно осуществляется по логарифмическому закону. Типичным является логарифмиче­ское кодирование сигнала основного тона на 5 или 6 бит и лога­рифмическое кодирование коэффициента усиления на 5 бит. Ос­новное внимание далее будет уделено коэффициентам отражения {ki,}, представляющим собой преобразование от {ai}, и различ­ным нелинейным преобразованиям, поскольку их свойства недо­статочно известны.

В вокодерах с линейным предсказанием широко используются коэффициенты отражения (и такие параметры, как логарифм площадей). В автокорреляционном методе они легко получаются как часть результатов анализа, а в ковариационном методе — вычисляются с помощью процедуры пошагового понижения по­рядка. Необходимым и достаточным условием устойчивости син­тезирующего фильтра при этом является то, что значения моду­лей коэффициентов отражения должны быть меньше единицы. Поэтому линейная интерполяция коэффициентов отражения ус­тойчивых фильтров гарантирует устойчивость полученных в ре­зультате интерполяции фильтров.

Коэффициенты отражения имеют неразномерную спектраль­ную чувствительность, причем наибольшая чувствительность бу­дет, когда модуль коэффициента близок к единице. Это свойство было теоретически доказано Грэем и Маркелом. Они пока­зали, что в процедуре пошагового повышения порядка на т-м шаге изменение логарифмического спектра фильтра 1/Am(z), вы­званное изменением kmна Δkm, будет осциллировать (при измене­нии частоты от нуля до fJ2) между значениями

ln[1+Δkm /(1+km)] и ln[1-Δkm/(1-km)]

Таким образом, значения km, модули которых приближаются к единице, наиболее чувствительны к малым изменениям спектра. Неравномерная спектральная чувствительность была также под­робно изучена Висваназаном и Макхоллом.