Смекни!
smekni.com

Музыкальные возможности ПК (стр. 6 из 11)

Таким образом, происходит передача только той звуковой информации, которая может быть адекватно воспринята подавляющим большинством слушателей, а вся остальная, увы, безвозвратно теряется.

Как уже упоминалось, все уровни имеют одинаковую базовую структуру, при которой кодер анализирует исходный сигнал, вычисляет для него гребенку фильтров (32 полосы) и применяет психоакустическую модель. С заранее выбранной частотой квантования, величиной потока и маскирования кодер производит квантование и кодирование сигнала.

Сравнительные характеристики способов кодирования для одного канала при частоте квантования в 32 кГц представлены в таблице 2.

Таблица 2.

Способ кодирования

Скорость передачи (кбит/с)

Коэффициент сжатия

Layer 1

192

1:4

Layer 2

128-96

1:6...8

Layer 3

64-56

1:10...12

Перед кодированием исходный сигнал разбивается на фреймы, каждый из которых кодируется отдельно с разными параметрами и помещается в конечном файле независимо от других. Последовательность воспроизведения определяется порядком расположения фреймов. Вся информация о фрейме содержится в его заголовке, а информация о фреймах содержится в заголовке файла. Для информации об артисте, альбоме, названии композиции, жанре и пр. предусмотрен ID3/ID2 tag - заголовок. Подавляющее большинство существующих проигрывателей используют данный заголовок для прокрутки этой информации во время проигрывания музыкального фрагмента.

Между фреймами может содержаться произвольная информация, допустим, авторские права, расположенные ровным слоем по всему файлу. Основное требование к последовательно расположенным фреймам заключается в том, чтобы отсутствовали совпадения с сигнатурой начала фрейма.

Частота следования фреймов называется битрейтом (BIT RATE - битовая скорость, чем она выше, тем ближе будет конечный результат к оригиналу).

Каждый битрейт имеет свою область применения. Для создания качественной копии, соответствующей качеству оригиналу применяются только высокие битрейты порядка 256 кбит/с. При битрейте 128 кбит/с качество конечного продукта кажется вполне нормальным, но заметить разницу между копией и оригиналом способны уже многие. В Интернете чаще всего содержатся как раз МРЗ файлы, закодированные битрейтом 128 кбит/с. Но для создания действительно качественной копии необходимо использовать скорость кодирования в 320 кбит/с, хотя конечный файл получается меньше лишь в 4,3 раза по сравнению с 10,8 раз на 128 кбит/с и 5,4 раза на 256 кбит/с. Поэтому выбирать битрейт необходимо самому, исходя из потребностей.

После фреймовой разметки исходный сигнал с помощью гребенчатых фильтров разделяется на составляющие, представляющие отдельные частотные диапазоны, в сумме дающие обрабатываемый сигнал. Для каждого такого диапазона определяется своя психоакустическая модель и участки фрейма, которые "выпадают" из процесса кодирования. Для оставшихся данных определяется максимально допустимая частота квантования, которая должна обеспечивать потери ниже величины маскирующего эффекта.

После обработки всех фреймов формируется итоговый поток, который дополнительно кодируется по методу Хаффмана. Этот алгоритм также используется в архиваторе ARJ, только с динамической, постоянно изменяющейся таблицей Хаффмана, что требует двух проходов по данным; при фиксированной же таблице Layer 3, сжатие происходит за один проход. Указанный метод позволяет "сжать" до 20 процентов от общего объема. В результате получаем конечный поток кодированных аудиоданных.

3.2.1. Модели кодирования сигнала

В рамках формата МРЗ для работы со стереозвуком существуют четыре основные модели кодирования сигнала:

1) Первая модель Dual Channel основана на том, что каждый канал получает половину потока и кодируется как моносигнал. Отсюда и ее название. Эта модель идеально подходит в случае, когда каналы содержат абсолютно разные сигналы;

2) В модели Stereo каждый из каналов кодируется отдельно, но кодеру "позволено" самому принять решение о передаче одному из каналов большего места, чем другому. Этим достигается кодирование "тишины" (либо уровень сигнала лежит ниже порога слышимости) в одном канале, когда в другом присутствует мощный сигнал;

3) Модель MS Stereo использует разложение стереосигнала на средний между каналами и разностный, который кодируется с меньшим битрейтом. Данный метод не рекомендуется использовать, если каналы не совпадают по фазе (наиболее часто встречается в записях, оцифрованных с аудиоленты);

4) Модель MS/IS Stereo позволяет несколько увеличить качество кодирования сигнала при использовании низких битрейтов. Суть метода заключается в использовании на некоторых частотных диапазонах отношения мощностей сигнала в разных каналах. Однако данный метод приводит к потере фазовой информации.

3.2.2. Продолжение Mp3 - Mp3Pro

14 июня 2001 года вышло продолжение MP3 – Mp3Pro. Создателем MP3Pro является частная компания Coding Technologies. Созданная в 1997 году, компания занимается разработкой и маркетингом кодеков на основе технологии SBR (Spectral Band Replication). За спиной у компании Coding Technologies стоят два очень солидных стратегических партнера - Fraunhofer Institute и Thomson Multimedia, а также достаточное количество инвесторов, среди которых такие люди, как профессор Heinz Gerhauser - глава института Fraunhofer. В связи с этим, следует также заметить, что Coding Technologies имеет доступ ко всем разработкам института Fraunhofer, а само название MP3Pro дала новому формату компания Thomson Multimedia, которая и занимается его продвижением совместно со своей дочерней компанией RCA.

Первый проигрыватель, поддерживающий новый формат, уже появился - это Thomson mp3PRO Audio Player 1.0.2 (Рис.). Помимо проигрывающей части этот плеер содержит ещё и демо-версию кодера, сжимающего wav-файлы в MP3Pro (правда только на 64 кбит/c).


Рис.12.

Достоинства и недостатки формата Mp3Pro:

1) Достоинства:

· достойное качество звука на низких битрейтах;

· достаточно низкие системные требования;

· высокая степень сжатия.

2) Недостатки:

· отсутствие поддержки высоких битрейтов;

· синтез высоких частот из средних.

4. МУЗЫКАЛЬНОЕ ПРОГРАМНОЕ ОБЕСПЕЧЕНИЕ

На наших глазах звуковые компьютерные технологии постепенно переходят из разряда хитроумных игрушек в класс профессионального инструментария, использующегося в серьезных аудиотрактах. Первая область, которую вычислительная техника завоевала много лет назад, это - контроль сложных комплексов самого различного применения. Специализированное программное обеспечение управляет трансформацией сценического пространства, световыми и звуковыми инсталляциями, аппаратурой усиления и передачи сигналов, радио- и телеэфирами, помогает архивировать ценнейшие материалы фонотек и видеотек. Однако, с наступлением эры цифрового звука программно реализованные алгоритмы вмешались в аудиозапись, обработку и микширование звука.

4.1. Классификация музыкального программного обеспечения

Постараемся классифицировать программы, задействованные в традиционной технологии создания современной музыки. Прежде всего это, конечно же, программы, участвующие в создании звуков. К ним в первую очередь стоит отнести продукты, позволяющие заменить небольшой малоудобный дисплей сэмплера или синтезатора большим компьютерным экраном. Такие программы обычно ничего не делают со звуком самостоятельно, предоставляя пользователю лишь достойный цветной графический интерфейс работы с тем или иным прибором. В качестве примера можно привести программное обеспечение Multi-Mode, прилагающееся к новому 128-голосному синтезатору Proteus 2000 фирмы EMU-ENSONIQ и позволяющее управлять громкостью, панорамой, выбором предустановок для всех 32 MIDI-каналов и моментально изменять конфигурацию инструмента при работе на сцене. Подобный сервис имеют инструменты компании Korg и многие другие звуковые модули. Также выпускаются универсальные редакторы звуков (например, Mark Of The Unicorn Unisyn Macintosh/PC), поддерживающие сотни MIDI-синтезаторов и позволяющие легко и наглядно создавать звуки, корректировать их и автоматически определять названия.

Следующий тип программ уже не просто управляет неким внешним модулем, но самостоятельно синтезирует звук или работает с волновыми таблицами. При этом подобные продукты могут иметь не только волновые, но и MIDI-функции. Здесь в качестве примера можно привести хорошо известный эмулятор аналогового звукового синтеза ReBirth, программный редактор звука WaveLab или программа обработки музыкальных фраз ReCycle! - все они не требуют дополнительного аппаратного обеспечения, используя в своей работе лишь стандартные ресурсы персонального компьютера. Появились и достойные внимания чисто программные сэмплеры, однако, пройдет еще некоторое время, прежде чем они смогут реально конкурировать со своими аппаратными собратьями.