2.3. Сжатие

При оцифровке звуковых сигналов необходимо помнить, что память компьютера не бесконечна, поэтому при оцифровке необходимо находить какой-то компромисс между качеством и размером файла оцифрованного сигнала. Для этого были разработаны различные алгоритмы сжатия. В основе алгоритмов сжатия лежит принцип восприятия звуков человеческим слухом (слуховой аппарат человека устроен так, что мы плохо различаем слабый сигнал на фоне сильного сигнала).

Если сигнал заданной длины разбивается на множество частей, и каждая часть обрабатывается таким образом, чтобы более слабый сигнал, трудно различимый на фоне сильного, отсекался, а более сильный сигнал оставался, то это и будет приблизительной моделью сжатия звукового сигнала. Уровень сжатия сигнала будет зависеть от того, на сколько именно частей будет разбиваться исходный файл и как много слабых сигналов в каждой отдельно взятой части будет удалено. Этот принцип сжатия называется сжатием с потерями. Следует также помнить о том, что большинство алгоритмов вырезают верхнюю часть слышимого диапазона, начиная приблизительно с 15 кГц (на рис. 2.8 обозначена пунктирной горизонтальной линией).

Отметим, что лучшие разработанные алгоритмы связаны со сжатием аудио в контексте стандартов MPEG.

2.3.1. Форматы

MP3

закрыть

MP3 − это совсем не MPEG3 (хотя так иногда пишут). Стандарта MPEG3 не существует.

МРЗ − аудио MPEG1 уровня 3 (level 3), как его обычно называют, предлагает сжатие с коэффициентом примерно 10:1, сохраняя высокое качество. МР3 имеет собственный файловый формат, в котором сжатый аудиопоток расщепляется на фрагменты, именуемые кадрами. Каждый из них имеет заголовок, в котором указываются скорость передачи, частота дискретизации и другие параметры. Файл также может включать теги метаданных, ориентированные на музыкальное содержимое и указывающие заголовок трека, его исполнителя, альбом, из которого взята композиция, и т. д. Файлы МР3 широко используются для загрузки и хранения музыки на компьютерах и mp3-плейерах, сотовых телефонах. Этот формат широко распространен в Интернете.

MP3pro

закрыть

Битрейт − это единица измерения данных, означающая количество бит, передающихся за определённое время. Обычно означает количество переданных бит в секунду.

Данный формат был создан вовсе не для того, чтобы заменить mp3, позволяя лишь добиться приемлемого качества звучания на низких битрейтах. Если "классический" битрейт в 128 Кb/s некоторыми слушателями и воспринимается как дающий качество, близкое к идеальному, то даже незначительное его понижение вызывает появление большого количества отчётливо слышимых искажений. Для передачи музыки в Интернете используются обычно именно низкие битрейты, которые являются далеко не сильной стороной "обычного" mp3. Здесь MP3pro и проявляет себя с лучшей стороны. Для хранения музыки высокого качества MP3pro совершенно не годится: даже при использовании максимально доступного для большинства кодеков битрейта 96 Кb/s слышны искажения, хотя по сравнению со многими другими форматами, поддерживающими низкие битрейты, результаты работы кодека MP3pro заметно лучше. При повышении битрейта качество файлов падает по сравнению с остальными форматами, и уже при битрейтах 128 Кb/s разумнее использовать mp3.

ACC

Формат Advanced Audio Coding (расширенное аудиокодирование), также известный как MPEG2, является преемником формата mp3. В отличие от MP3 у ААС большее сжатие при меньших скоростях передачи данных. Качество ААС всегда ставится выше качества MP3 при одинаковых скоростях передачи битов, а одинаковые оценки оба кодека получают, только если ААС используется при меньших скоростях передачи, чем MP3. Кодек ААС был встроен в MPEG4, где он является основой для кодирования природного аудио (в противоположность речи и синтезированным звукам). Тем не менее, в использовании AAC есть свои трудности: алгоритмы кодирования, используемые в данном формате, достаточно сложны, поэтому для создания AAC-файла требуется значительное количество времени и системных ресурсов.

AIFF

Это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Расшифровывается как Audio Interchange File Format (формат обмена звуковыми файлами). Если вам когда-нибудь потребуется пересылать аудиофайлы между персональным компьютером и компьютером Macintosh, используйте именно этот формат. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. В этом формате можно хранить не только сами звуковые файлы, но и информацию об используемых частотах и разрешении дискретизации.

WAVE

Формат Wave является форматом для операционной системы Windows, а это означает, что любой компьютер с операционной системой Windows может воспроизводить файлы Wave. Формат поддерживает множество различных типов аудиоданных, в том числе 8- и 16-битные, моно и стерео. Так же, как и в AIFF, в этом формате можно хранить звуковые файлы вместе со всеми частотами и разрешениями дискретизации звука. Wave эквивалентен AIFF по качеству и коэффициенту сжатия, и выбор из них зависит только от платформы, на которой создаётся звуковой файл. Файлы в формате Wave имеют расширение wav.

AU

Unix Audio − звуковые файлы, используемые в операционной системе Unix.