Смекни!
smekni.com

Кодеры речи (стр. 11 из 16)

Функционирование декодера осу­ществляется по следующему алгорит­му. Сигнал возбуждения фильтра-син­тезатора кратковременного предсказа­ния формируется таким же образом, как и в синтезирующей схеме кодера:

по номерам

и
из кодовых книг выбираются векторы возбуждения, ко­торые умножаются соответственно на коэффициенты усиления
и
и складываются с выходным вектором фильтра-синтезатора долговременного предсказания, определяемого параме­трами
и τ.

Окончательно сигнал возбужде­ния фильтруется фильтром-синтеза­тором кратковременного предсказа­ния, выполненного в форме трансверсального фильтра, т.е. параметры фильтра преобразуются из коэффициентов частотной корреляции

в коэффициенты предсказания
. Для улучшения субъективного качества синтезированной речи выходной сигнал фильтра-синтезатора подвергается цифровой адаптивной постфильтрации и с выхода постфильтра получается восстановленный цифровой речевой сигнал.

Кодеры TETRA

TETRA (Trans-European Trunked Radio) представляет собой стандарт цифровой транкинговой радиосвязи, состоящий из ряда спецификаций, разработанных Европейским институ­том телекоммуникационных стандар­тов ETSI.

TETRA — открытый стандарт, т.е. доступ к спецификациям TETRA сво­боден для всех заинтересованных сто­рон. В связи с этим оборудование раз­личных производителей должно быть совместимо.

Стандарт TETRA создавался как единый общеевропейский цифровой стандарт. Стандарт разработай на основе технических решений и реко­мендаций стандарта GSM и ориенти­рован на создание систем связи, эф­фективно и экономично поддержива­ющих совместное использование сетей различными группами пользователей с обеспечением секретности и защищен­ности информации.

Речевой кодер TETRA основан на модели кодирования CELP – с ли­нейным предсказанием с кодовым воз­буждением. В этой модели блок из N речевых выборок синтезируется пу­тем фильтрации соответствующей об­новленной последовательности из ко­довой книги, масштабированной коэф­фициентом усиления

, с помощью двух изменяющихся во времени филь­тров.

Первый фильтр является филь­тром долгосрочного предсказания (фильтром основного тона), цель ко­торого – моделирование псевдоперио­дического речевого сигнала, а второй – фильтр краткосрочного предсказа­ния – моделирует огибающую речево­го спектра.

Передаточная характеристика долгосрочного фильтра (или фильтра синтеза основного тона) определяется формулой

где Т – задержка основного тона;

– коэффициент усиления основного тона. Фильтр синтеза основного тона вы­полнен как адаптивная кодовая книга, где для задержек, меньших чем дли­на подфрейма, повторяется последнее возбуждение.

Краткосрочный фильтр синтеза определяется формулой

где

,
, – параметры ли­нейного предсказания; р – порядок предсказателя. В кодере TETRA по­рядок р = 10.

При способе анализа-через-синтез синтезированная речь вычисляется для всех кандидатов – последователь­ностей, составляя особую последова­тельность, которая и формирует вы­ходной сигнал, наиболее близкий к исходному, в соответствии с взвешен­ной величиной измеренных искажений. Фильтр взвешивания, корректирую­щий ошибку предыскажений в области форманты спектра речи, определяется формулой

(5.1)

где

– обратный (инверсный) фильтр линейного предсказания;
(используется значение
). Для взвешивающего филь­тра
и фильтра синтеза формант
используются квантованные па­раметры линейного предсказания.

В алгебраическом CELP (ACELP) используется специальная кодовая книга, имеющая алгебраическую структуру. Эта алгебраическая струк­тура имеет некоторые преимущества в отношении сохранения, сложности поиска и устойчивости (робастности). Кодер TETRA использует специаль­ную динамическую алгебраическую кодовую книгу возбуждения, посред­ством которой, а также динамической матрицы формы образуются фиксиро­ванные векторы возбуждения. Матри­ца формы – это функция модели A(z) линейного предсказания. Главная ее роль – формировать векторы возбу­ждения в частотной области так, что­бы их энергии были сконцентрированы в наиболее важных частотных полосах. Используемая матрица формы являет­ся триангулярной Теплицевой матри­цей низшего порядка, сформированной из импульсного отклика фильтра:

(5.2)

где A(z) — инверсный фильтр линей­ного предсказания (в конкретных реа­лизациях

и
).

В кодере TETRA используются фреймы речи по 30 мс. Это требует­ся для того, чтобы параметры кратко­срочного предсказания вычислялись и передавались в каждом речевом фрей­ме. Речевой фрейм разделен на четы­ре подфрейма по 7,5 мс (60 выборок). Основной тон и параметры алгебраиче­ской кодовой книги также передаются в каждом подфрейме. В табл. 5.3 пред­ставлено распределение бит для коде­ра TETRA. Должно быть сформиро­вано 137 бит для каждого фрейма по 30 мс, что в результате дает скорость 4567 бит/с.

Таблица 5.3

Параметр Номер сегмента Всего в кадре
1 2 3 4
Коэффициенты линей­ного предсказания 26
Период основного тона 8 5 5 5 23
Индекс алгебраической кодовой книги 16 16 16 16 64
Коэффициенты уси­ления 6 6 6 6 24
Всего 137

Кодеры стандарта АРСО 25

АРСО 25 – стандарт транкинговой радиосвязи, описывающий струк­туру цифровой транкинговой систе­мы и некоторые ее интерфейсы. Для цифровой передачи речи стандарт АРСО 25 предусматривает использова­ние кодера IMBE (Improved MultiBand Excitation, модифицированный метод многополосного возбуждения). Кодер формирует цифровой поток со скоро­стью 4,4 кбит/с. Для исправления ошибок в цифровом речевом сигнале используется избыточное кодирование, порождающее дополнительный цифро­вой поток со скоростью 2,8 кбит/с.

Цифровой речевой сигнал переда­ется кадрами длительностью 180 мс. Два речевых кадра образует суперкадр длительностью 360 мс. Перед переда­чей речи следует преамбула длитель­ностью 82,5 мс, которая содержит синхропакет (48 бит), идентификатор сети (64 бита), служащий для предотвраще­ния конфликтов между радиостанци­ями, работающими на одной частоте; информацию для алгоритма шифрова­ния, идентификатор ключа алгоритма шифрования и другие служебные иден­тификаторы (всего 126 бит). Кадры ре­чи, кроме собственно речевой инфор­мации, содержат дополнительную ин­формацию (управления связью, кана­ла сигнализации и т.д.)

Речевой IMBE-кодер основан на модели речи, которая относится к моделям с многополосным возбужде­нием (МВЕ). Основная идея работы кодера состоит в разделении цифрово­го речевого входного сигнала на пере­крывающиеся речевые сегменты (или фреймы) с использованием окна Кай­зера. Затем для определенного фрей­ма оценивается набор параметров.

Речевой MBE-кодер является во­кодером, т.е. он не кодирует входной речевой сигнал выборка за выборкой, а синтезирует сигнал, который содержит ту же информацию для восприятия че­ловеком, что и исходный речевой сиг­нал. Заметим, что когда речь не явля­ется вокализованнной, исходный и син­тезированный сегменты речи могут не иметь никакого сходства во временной области.

Речевой MBE-кодер имеет два основных преимущества перед ра­нее используемыми вокодерами: во-первых, он основан на МВЕ рече­вой модели, которая является более устойчивой, чем традиционные речевые модели в рассмотренных вокодерах; во-вторых, данный метод использует более сложный алгоритм оценки параметров модели речевого синтеза речевого сигнала из параметров модели.