Звук под давлением
Компьютерный звук давно вышел из того зачаточного состояния, когда он присутствовал лишь для галочки, будучи не в состоянии потягаться с со специализированной аппаратурой. Сегодня многие звуковые карты даже middle-end-класса на голову выше своих соперников в лице не-самого-такого-средненького hi-fi. С акустикой в последнее время проблем тоже все меньше и меньше; такими темпами за несколько лет весь воспроизводящий тракт станет, наконец, настоящим hi-hi. Но кроме тракта есть еще и формат файла, в выборе которого из-за своей неосведомленности пользователи зачастую фактически ограничены. Целью этой статьи является избавление от этих ограничений.
Давно минули те времена, когда на компьютерной акустике было невозможно отличить скрипку от виолончели, но присказка “CD-качество — MP3 128 кбит/с” осталась, и для некоторых не как архаизм. Между тем, самые распространенные форматы — либо Wav (он же CDA), либо MP3. Однако несжатый PCM (Wav и CDA) слишком велик размером файла, а MP3 жмет с потерей качества. Но альтернативы есть, и не одна. Давайте рассмотрим наиболее популярные и качественные форматы/кодеки.
Для начала разобьем все кодеки на две группы по признаку сжатия: без потери качества (lossless) и с потерей качества (lossy). Первые действуют по принципу архиваторов, например RAR: файл, сжатый таким образом, теряет в весе до 50%, а при воспроизведении играется полный оригинал, до сжатия. Алгоритмы сжатия с потерей качества исключают из исходного сигнала “лишнюю” информацию, а потом сжимают, из-за чего полному восстановлению исходный сигнал не подлежит; в качестве примера можно привести сжатие картинок JPEG. Теперь подробнее.
С потерей качества — lossy
MP3
Пожалуй, как с самого популярного, начнем с MP3, он же MPEG-1 layer 3. Мы сжимали тестовые фрагменты lame — наиболее качественным изо всех MP3-кодеков. На фрагменте с классикой мы видим, что верхняя частота среза как таковая отсутствует — это отлично! Однако на наиболее “мощных” (громких) местах верха (начиная с 18 кГц) съедаются. Такая динамическая обработка довольно странна для слуха и слуховой логики, но для компьютера легко объяснима: просто когда нарастает общая плотность сигнала, то растет она почти по всему диапазону, а, следовательно, требуется шире канал для пропускания потока целиком. Но поскольку канал фиксированный (мы сжимали в CBR — с постоянным битрейтом, 320 кбит/с), то для нормального кодирования середины и басов приходится ниже обрезать высокие. Фрагмент же с современной музыкой практически неотличим от оригинала — лишь небольшой срез на частотах, для которых нужен настоящий hi-fi, на котором вы уже точно не будете вспоминать о MP3 — помимо АЧХ есть еще немало характеристик, испорченных сжатием. Размер сжатых файлов: классика — 6,11 Мб, современная музыка — 6,11 Мб.
Современная музыка
Классическая музыка
WMA 9
Продвигаемый Биллом Гейтсом формат до сих пор не пользуется популярностью: во-первых, он поддерживает DRM (защиту от копирования), во-вторых, изо всех рассматриваемых здесь кодеков с потерей качества он обеспечивает самое слабенькое качество звука. При почти одинаковых с другими форматами размерах делать жесткий обрез по верхам свыше 20 кГц, а также еще резать верха в зависимости от общего уровня (по действию похоже на шумоподавители Dolby) — на наш взгляд, не очень-то хорошо. Сжимали с настройками 320 кбит/с, WMA 9 (не professional). Размер сжатых файлов: классика — 6,14 Мб, современная музыка — 6,12 Мб.
Современная музыка
Классическая музыка
OGG Vorbis
Opensource-кодек, обладающий неплохим качеством звука и уверенно занимающий второе место. Имеет плавающую (но в разумных пределах) частоту среза порядка 20 кГц. Правда, в данном случае битрейт мы выставляли в 350 кбит/с... Имеет еще один минус: повышенное время кодирования. Размер сжатых файлов: классика — 6,70 Мб, современная музыка — 6,65 Мб.
Современная музыка
Классическая музыка
В этой номинации победителем выходит тот, у кого сонограмма ближе всего к сонограмме wav-файла. Таким образом, победителем остается MP3. Однако стоит оговориться, что кодек кодеку рознь, причем даже те, которые работают по одному алгоритму. Например, тот же MP3 есть lame, есть Fraunhofer и Xing, причем последний самый быстрый, но и с самым ужасным качеством звука (срез идет с 16 кГц).
Без потери качества — lossless
Monkey’s Audio
Пожалуй, самым популярным в настоящее время кодеком, сжимающим информацию без потерь, является Monkey’s Audio. Обусловлено это, прежде всего, бесплатностью данного кодека и достаточно качественным сжатием аудиопотока, которое он обеспечивает. Единственным фактором, ограничивающим сферу его применения, является отсутствие поддержки мультиплатформенности: кодек Monkey’s Audio присутствует только на платформе Windows. Тем не менее поддержка данного формата реализована в ряде проигрывателей, а, например, плагин для проигрывателя Winamp поставляется вместе с Monkey’s Audio. Кроме того, существует возможность установки DirectShow-фильтров для других совместимых плееров. Плагин для воспроизведения поддерживает все распространенные функции и ID3-теги. Размер сжатых файлов: классика — 12,96 Мб, современная музыка — 13,16 Мб.
FLAC (Free Lossless Audio Compressor)
Одним из наиболее популярных форматов для сжатия звука без потерь качества является кодек FLAC. Основными достоинствами этого аудиокодека являются его постоянное обновление и, конечно же, многоплатформенность: FLAC портирован на множество платформ: *nix (Linux, BSD, Solaris, OS X), Windows, BeOS и OS/2. Такая всеобъемлющая поддержка операционных систем способствует широкому использованию данного аудиокодера. Интересная отличительная особенность FLAC состоит в том, что он позволяет делать архивную копию аудиодиска, записываемую в один файл. В дальнейшем такая копия может быть легко записана на диск в случае утери оригинального диска или его повреждения. FLAC использует восемь степеней сжатия. Как и в любом кодере, от степени сжатия зависит скорость кодирования и размер получаемого файла. К потоку FLAC могут быть добавлены теги ID3v1 и ID3v2. Эти данные не относятся к формату, однако декодер умеет их пропускать. Размер сжатых файлов: классика — 13,92 Мб, современная музыка — 13,96 Мб.
WavPack
WavPack — открытый кодек под Windows. При разработке данного формата предполагалось, что он будет использоваться для сжатия информации без потерь, и только впоследствии в него были добавлены функции кодирования с потерями. Кодек является бесплатным, что повышает его привлекательность. Обладает он также и плагинами под более распространенные плееры, установка которых осуществляется пользователем вручную. Поставляется в виде консольных exe-файлов. Основной особенностью WavPack является возможность создания сразу двух файлов, один из которых является файлом, полученным с потерей качества, а другой — корректирующим: с его помощью можно восстановить основной файл до оригинального состояния. Размер сжатых файлов: классика — 13,76 Мб, современная музыка — 13,78 Мб.
В этой номинации первое место занимает тот, у кого выше степень сжатия и, следовательно, меньше размер файла. Поэтому первое место присуждается Monkey’s Audio, второе — WavPack, а третье —
FLAC, хотя разница не доходит даже до 10%, что в зависимости от конкретного содержимого файла может кардинально изменить ситуацию.
Сжатое кодирование
Эта статья не претендует на полный охват выбора алгоритмов/программ сжатия, более того, все рассмотренные кодеки являются наиболее распространенными, и совершенно не факт, что где-нибудь в глубинке паренек не реализовал какой-нибудь мега-навороченный способ сжатия без потерь до 98%. Однако статья может послужить отправной точкой для поиска оптимального для вас кодека. Удачного сжатия!
Методика тестирования
Были отобраны два фрагмента с CD-дисков: с живой записью классической музыки, с максимальной макродинамикой, и с современной музыкой, где общий уровень очень сильно компрессирован, и практически нет живых инструментов. Длина фрагментов была подобрана одинаковая, “на ноль” фрагменты не выводились. Сравнение lossless проводилось по размеру файла, а lossy - по размеру файла и соответствию сонограммы оригинальной. Сонограмма — это диаграмма, на которой по оси абсцисс откладывается время, по оси ординат — частота, а амплитуда соответствующей частотной составляющей отмечается интенсивностью цвета в данной точке графика. Сонограмма позволяет учесть при сравнении изменение сигналов в динамике. Один немаловажный недостаток сонограмм — размытость сигнала во времени, то есть неточное совпадение (отставание либо опережение) спектральной картины с реальным спектральным составом сигнала в каждый конкретный момент времени. Такой феномен обусловлен принципом неопределенности, сопутствующим использованию Быстрого Преобразования Фурье (FFT): чем больше временнoе разрешение спектра, тем меньше спектральное разрешение, и наоборот. При построении сонограммы берутся относительно большие окна для FFT (промежутки времени, в которых анализируется спектр), и именно это и обуславливает эффект размазывания сигнала. Конечно, появления этого эффекта можно в какой-то мере избежать, применяя анализ с перекрывающимися окнами в несколько проходов, однако объем вычислений при этом крайне возрастет, и достичь одновременно высоких спектрального и временного разрешений не удастся. После проводилось слепое тестирование по три прослушивания на каждый фрагмент, в том числе и оригинального wav-файла. Если не было жесткой корреляции между сонограммами и прослушиванием, результаты не учитывались как незначительные.
Сонограмма оригинала,современная музыка
Сонограмма оригинала, классическая музыка
Berrymorr
Весь номер
Новости партнеров:
Что такое IP-телефония и как она работает, какие преимущества даёт
Валидация базы имейлов: как обеспечить доставку писем только реальным подписчикам
Промежуточные реле: особенности и применение в современных технологических системах
Инновации в медицине
как мы переехали
в Мексику
Правозащитники отчитались об ограничениях свободы в Рунете
Феноменальная история эволюции WordPress. Путь самой используемой системы управления контентом
SFP модули - лучшее решение для современных сетей
Кабельная компания ABB вносит вклад в экологию
Специальный новый режим съемки iPhone 15 Pro позволяет записывать видео в 3D
Риски использования одноразовых номеров
Сергей Лобанов ("Спарк"): компанию в 2011 году ждут большие дела!
Cерверы на усовершенствованных процессорах Intel для компаний малого бизнеса
«ТелеКом» уходит в интернет!
Как вернуть исчезнувшие контакты на iPhone после обновления iOS?
Мобильный телефон в отпуске – особенности использования и вероятные поломки
Brosco - модные аксессуары для вашего телефона
EmailMarket – онлайн платформа для поиска лучших специалистов в email маркетинге
Большие возможности при разумной цене смартфона Lenovo A Plus
Квадрокоптеры – история вдохновения
Больше возможностей для email-рассылок за умеренную стоимость с SendPulse
Mestel MO900 – семейная микроволновка
Сколько стоит ремонт ноутбуков и куда стоит обращаться в первую очередь?
Заряд бодрости и оптимизма
Внешние зарядные устройства для мобильных телефонов и девайсов
Аккумуляторы для фотоаппаратов и видеокамер
Как выбрать недорогой китайский смартфон
Возврат обеспечения заявки на участие в тендере
Оптические делители
Восстанавливаем потерянные данные программой EaseUS Data Recovery Wizard
Бронебойный высокопроизводительный смартфон Blackview BV 8000 PRO
Autodesk Vault – компоновка и возможности
Как защитить сайт от вирусов
SSL сертификат – зачем он нужен и какой тип выбрать
Как выбрать проектор для домашнего кинотеатра
Коротко о электрогриле Wollmer S807
Керамика в электротехнике и энергетике
Ремонт планшета Леново
В чем преимущество серверной стойки перед шкафом
Прочный деловой смартфон с неплохими характеристиками и стильным дизайном - Doogee T5S
Запчасти для ноутбуков: плюсы оригинальных комплектующих
Такие разные чехлы и аксессуары от Apple
От яичницы с беконом до шокера. Какими бывают чехлы для смартфона
Причины для замены дисплея на iPad Air 2
Картриджи для ленточной библиотеки – выход для хранения данных
Спидтест интернета с инструкцией устранения проблем представлен на новом ресурсе
Выбираем портативное зарядное устройство
Лучшие смартфоны от производителя Homtom
Выбор мастерских по ремонту гаджетов
Сопровождение 1С: быстрый способ избавиться от проблем
Риски использования одноразовых номеров
Как правильно построить и организовать техническую поддержку ИТ инфраструктуры компании?
Можно ли заправить картридж принтера самостоятельно?
Обмен Perfect Money: возможности собственного обменника и альтернатива порталов мониторинга – что выбрать?
Аренда звука – правильное решение при организации мероприятий
VK70604N: продуманная фильтрация и максимальная практичность
Winter is coming: как выбрать снегоуборочную машину для дома
Особенности выбора сервера 1С
Как ускорить старый ноутбук
Продвигаете сайт? Загляните в соцсети. 5 причин важности маркетинга в социальных сетях
Феноменальная история эволюции WordPress. Путь самой используемой системы управления контентом
ТОПовые игровые ноутбуки
Copyright © 2005-2017
technograd.com
Разработка проекта: Издательский дом RMG
E-mail:
[email protected]
Редактор:
[email protected]
Реклама:
[email protected]
Тел. +7 (863) 272-66-06
о проекте>>