Какой лучший аудио формат. Форматы звуковых файлов

В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.

Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных – digital: OGG, Mp3, Flac, Wav форматов.

Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье постараюсь рассказать о наиболее популярных расширениях audio files, с которыми Вы сталкиваетесь.

Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов? Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows.

Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки – достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 “метров” – это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.

AA (Audible Audio Book File) – формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов – digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.

AAC (Advanced Audio Coding) – формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC – семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) – это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: [.m4a ], [ .m4b ], [ .m4p ] .

Также AAC - это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

На 2009 год распространён значительно меньше, чем MP3 и другие альтернативные решения. AAC (Advanced Audio Coding) изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Преимущества AAC перед MP3:

– до 48 звуковых каналов;

– большая эффективность кодирования как при постоянном, так и при переменном битрейте;

– частоты дискретизации от 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц);

– более гибкий режим Joint stereo.

ADX – основанный на АДИКМ проприетарный формат сжатия с потерями и хранения звукозаписи, разработанный CRI Middleware специально для использования в видеоиграх. Наиболее характерная особенность - возможность зациклить звукозапись, что делает применение формата удобным для использования в качестве фоновой музыки в различных играх, поддерживающих этот медиаконтейнер. Его поддерживают множество игр для SEGA Dreamcast некоторые игры для PlayStation 2 и GameCube.

В отличие MP3, в нём не применяется психоакустическая модель уменьшения объёма данных о звуке (уменьшения его сложности). Вместо этого модель ADPCM использует для сохранения образцов запись данных относительной ошибки функции предсказания, что означает бо́льшую сохранность исходного сигнала после кодирования; по существу, сжатие ADPCM, вместо использования полных переразмерянных образцов звукозаписи, предоставляет образцы отклонения сигнала от предыдущего значения, которые имеют гораздо меньший размер, обычно - 4 бита. Для человеческого уха такое отклонение находится на уровне шума, что делает потерю качества едва заметной.

AIFF – это стандартный формат файлов для сохранения аудиоданных на платформе Macintosh. Если вам когда-нибудь потребуется пересылать аудиофайлы между персональным компьютером и компьютером Macintosh, используйте именно этот формат. Он поддерживает 8- и 16-битные монофонические и стереофонические аудиоданные. Файлы этого формата могут содержать заголовок Mac-Binary, а могут и не иметь его. Если файл данного типа не содержит заголовка Mac-Binary, он, скорее всего, имеет расширение aif. Если файл данного типа содержит заголовок Mac-Binary, то Sound Forge откроет его, но идентифицирует как файл формата Macintosh Resource (см. следующий раздел). В этом случае файл, скорее всего, имеет расширение snd. Замечание При сохранении файлов на компьютерах Macintosh к ним добавляется так называемый заголовок Mac-Binary. Это маленький фрагмент информации, записываемый в начале файла, идентифицирующий тип файла для операционной системы Mac OS и других приложений. Таким способом компьютеры Macintosh сообщают, что содержит файл: текст, графику или, например, аудиоданные.

AMR (Adaptive multi rate) [. amr ] - адаптивное кодирование с переменной скоростью. Стандарт кодирования звуковых файлов, специально предназначенный для сжатия сигнала в речевом диапазоне частот. Стандартизован ETSI (European Telecommunications Standards Institute). Использование AMR позволяет обеспечить высокую ёмкость сети с одновременно высоким качеством передачи речи. AMR обладает широким набором скоростей кодирования/декодирования речи и позволяет гибко переключаться на различные режимы в зависимости от окружающих условий или загрузки сети, в любых условиях обеспечивая кристально чистую передачу голоса.

APE – (Monkey ‘ s Audio ) [. ape ] – разработчик Мэтью Т. Эшланд – формат цифрового звука без потерь качества (lossless ). Кодек Monkey’s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey’s Audio используют следующие расширения: .ape – для хранения аудио и.apl – для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.

Apple Lossless [. m 4 a ] – это аудио кодек, разработанный Apple Inc, для сжатия цифровой музыки без потерь данных.Apple Lossless данные хранятся в контейнере MP4 с расширением.m4a. Хотя Apple Lossless имеет такое же расширение файла, как AAC, это не AAC, кодек схож с другими Lossless кодеками, такими как FLAC и др. Плеер iPod с док разъемом (не shuffle) и последней прошивкой может проигрывать файлы в формате Apple Lossless. Он не использует какие-либо управления цифровыми правами (DRM), но, с учётом характера контейнера, считается, что DRM может применяться к ALAC.

Тесты показали, что сжатые в ALAC файлы получаются примерно от 40 % до 60 % размера оригиналов в зависимости от вида музыки, подобно другим Lossless форматам. Кроме того, скорость, с которой он может быть декодирован, делает его полезным для устройств с ограниченной производительностью, такие как iPod.

Apple Lossless Encoder был представлен в качестве одного из компонентов QuickTime 6.5.1 28 апреля 2004 года и как функция iTunes 4.5. Кодек используется также в AirPort Express в AirTunes осуществления.

Декодер для Apple Lossless формата теперь есть в открытых источниках библиотеки libavcodec. Это означает, что любой мультимедийный проигрыватель на основе этой библиотеки, включая мультимедиа VLC и MPlayer, может иметь возможность играть Apple Lossless файлы.

CDDA (Compact Disc Digital Audio ) - звуковой компакт-диск, международный стандарт хранения оцифрованного звука на компакт-дисках, представленный фирмами Philips и Sony. Звуковая информация представлена в импульсно-кодовой модуляции с частотой дискретизации 44,1 кГц и битрейтом 1411,2 кбит/с, 16 бит стерео.

С пецификация аудио в стандарте Red Book:

– максимальное время всех записей составляет 79,8 минут;

– минимальное время трека - 4 секунды (включая 2-секундную паузу);

– максимальное количество треков - 99;

– максимальное число точек отсчёта (разделов трека) - 99 без ограничений по времени;

– должен присутствовать International Standard Recording Code (ISRC).

DTS – (Digital Theater System ) , по сути – это Dolby Digital , а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby , так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате.

DTS это цифровая театральная система - семейство систем цифровой многоканальной звукозаписи, созданное компанией «Диджитал Тиэтер Систем» для демонстрации цифровых фонограмм в кинотеатрах синхронно с прокатными фильмокопиями. Кроме сопровождения плёночных фильмокопий, обе системы (DTS и Dolby Digital ) в упрощённом виде используются на оптических видеодисках для домашнего просмотра. DTS использует меньший уровень сжатия, чем Dolby , но абсолютного превосходства нет ни у одной из систем. Споры о преимуществах DTS или Dolby Digital не прекращаются по сей день. Формат DTS Stereo практически идентичен Dolby Surround . DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. DTS в домашних театрах допускает полный битрейт (1509,75 кбит/с).

FLAC (свободный кодек из проекта Ogg) [.flac ] – (англ. Free Lossless Audio Codec - свободный аудио-кодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, FLAC не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высокачественной звуковоспроизводящей аппаратуре, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID 3 v 1 и ID 3 v 2, поэтому их можно свободно добавлять и редактировать.

MIDI (Musical Instrument Digital Interface ) – цифровой интерфейс музыкальных инструментов. Это стандарт цифровой звукозаписи на формат обмена данными между электронными музыкальными инструментами.

Интерфейс позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т.п.

Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

MP 2 (MPEG -1 Audio Layer II или Musicam) [. mp 2 ] – один из трёх форматов (уровень 2) сжатия звука с потерями, определённых в стандарте MPEG-1. Применяется в цифровом радиовещании DAB и устаревшем стандарте Video CD, который в 90-е годы использовался для распространения фильмов на оптических компакт-дисках и существовал до широкого распространения DVD.

Кодер MPEG-1 Audio Layer 2 развился из аудиокодека MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing - универсальное полосное кодирование и мультиплексирование с адаптацией к шаблону маскировки), разработанного CCETT, Philips и IRT в 1989 как часть исследований EUREKA 147 европейских межправительственных разработок для систем цифрового радиовещания для стационарных, портативных и мобильных приёмных устройств. Основные параметры MPEG-1 Audio были унаследованы из MUSICAM, включая банк фильтров, обработку во временной области, размер аудиокадра и т.д. Однако, после дополнительного усовершенствования, алгоритм MUSICAM не был использован в финальной версии стандарта MPEG-1 Layer II.

MP 3 (MPEG Layer 3) [. mp 3 ] – третий формат кодирования звуковой дорожки MPEG - лицензируемый формат файла для хранения аудио-информации.На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG. Многие музыкальные гурманы, предпочитают сжимать музыку с максимальным качеством – 320 kbps , либо переходить на другие форматы, например FLAC , где битрейт в среднем ~1000 kbps .

MusePack [. mpc ] – нелицензируемый формат файла для хранения аудиоинформации, распространяемый по GNU General Public License .

В Musepack’е применяется разбиение на полосы частот, поэтому он относится к так называемым subband-кодекам. Основная особенность - точная настройка психоакустики, что позволяет работать с чистым VBR-кодированием (кодирование с переменным битрейтом). Основной задачей Musepack является прозрачность звучания закодированной музыки.

В современных форматах, таких как: MP3, Vorbis, AAC, AC3, WMA производится второе dct-преобразование, что позволяет им добиться лучшего качества на средних и низких битрейтах, но не позволяет добиться высоких результатов на более высоких. MusePack не производит второго dct-преобразования, что позволяет достичь непревзойденного качества на битрейтах выше 180.

Так же как в AAC и некоторых других современных форматах, в Musepack производится спаривание каналов по полосам частот, что незначительно отражается на качестве, но позволяет сильно сэкономить на размере. В MP3 спаривание каналов производится не по полосам частот, а для всей полосы целиком, разбивая сигнал на частотные подполосы, затем производит разложение сигнала в ряд косинусов (MDCT - частный случай преобразования Фурье) и записывает округленные (квантованные) значения полученных после преобразования коэффициентов (квантование происходит в соответствии с проводимым психоакустическим анализом). MPC же после разбиения сигнала на частотные подполосы просто производит переквантование (опираясь на психоакустику) амплитудного сигнала в каждой подполосе и полученные округленные (квантованные) значения записывает в выходной поток. Этим же фактом объясняется и большая скорость компрессии и декомпрессии MPC.

MOD – формат разработан для платформы Amiga. Каждый файл MOD содержит оцифрованные записи real звучания инструментов, так называемые сэмплы, чем-то похож на структуру MIDI. Cj или композитор, пишущий в формате MOD, применяет программу, называемую трэкером, в которой указывает, какой именно инструмент, в какое время, какой нотой и октавой должен прозвучать – эта последовательность нот записывается в список – трек, а несколько параллельно звучащих треков образуют блок, называемый паттерном. Совокупность паттернов образует модуль – файл в формате MOD, с расширением.mod. Одна линейка трекера соответствует одному реальному каналу, в котором cj может проиграть или отредактировать пронумерованные ноты. Нотам могут назначаться различные “орнаментами” – например: тремоло, глиссандо и т.д.

OGG [.ogv ], [.oga ], [.ogx ], [.ogg ] – открытый стандарт формата мультимедиа контейнера, являющийся основным файловым и потоковым форматом для мультимедиа кодеков фонда Xiph.Org, а также название проекта, занимающегося разработкой этого формата и кодеков для него. Как и все технологии, разрабатываемые под эгидой Xiph.Org, формат Ogg является открытым и свободным стандартом, не имеющим патентных или лицензионных ограничений.

Ogg является всего лишь контейнером. Музыка или видео сжимаются кодеками, а результат обработки хранится в подобных контейнерах. Контейнеры Ogg могут хранить потоки, закодированные несколькими кодеками. Например, файл с видео и звуком может содержать данные, закодированные аудио и видео кодеками.

В контейнере Ogg можно хранить звук и видео в различных форматах (таких как MPEG-4, Dirac, MP3 и другие).

RealAudio [. ra ],[. ram ] – Пропиарный стандарт на потоковое вещание и на формат медиафайлов, принадлежащий фирме « RealNetworks Products and Services ». RealAudio впервые представленный в составе пакета RealAudio 10, кодек для сжатия звука без потери качества.

Среди плюсов данного кодека - поддержка потокового вещания, очень быстрое декодирование. К минусам относят закрытость кода и отсутствие многоканальности. Доступен для Microsoft Windows , Macintosh и GNU / Linux .

RKAU [.rka ] – Среди всех аудиокодеков RKAU занимает совершенно особое место. Во-первых это – самый маленький (всего 25kB!) и самый быстрый кодер. Во-вторых помимо того, что он является программой сжатия звука без потерь (lossless), в нём предусмотрены режимы сжатия с потерями, обеспечивающие большую, нежели все известные lossless-алгоритмы, степень сжатия. Однако благодаря особенностям алгоритма, лежащего в основе rkau искажения, вносимые кодеком лежат не в спектральной (как в случае психоакустических моделей кодеров MP3, MP+, AAC и других), а в реальной области. То есть имеют, грубо говоря, нелинейную природу, как и искажения большинства трактов. При этом не происходит потери мелких деталей и микропланов фонограммы. Однако если “переусердствовать” в этом отношении, то звук может стать совершенно неудобоваримым: в звучании появятся жёсткие шумоподобные артефакты, а само звучание приобретёт ярко выраженное окрашивание.

В иерархии аудиокодеков программа rkau стоит стовершенно особняком. Она настолько оригинальна, что не имеет аналогов среди прочих алгоритмов сжатия аудиоданных. Малый размер программы-кодера (25kB) и высокая скорость работы при сходных с остальными lossless-алгритмами степенями сжатия выводят rkau в безусловные лидеры. И хотя самым эффективным lossless-кодером можно считать OptimFROG, рассмотренный в прдыдущей части статьи, rkau лишь ненамного отстаёт от него по эффективности. Однако при активации режима сжатия “с потерями”, rkau даже в режиме наивысшего качества оставляет далеко позади все lossless-алгоритмы, приближаясь по эффективности к программ, основанным на психоакустической модели (MP3, MP+, AAC, VQF и другие). При этом не происходит характерной для MPEG-подобных алгоритмов потери микропланов и нюансов исходного аудиоматериала, а неизбежно возникающие при этом артефакты можно заметить только на очень качественной аппаратуре при многократном сравнительном прослушивании.

Shorten [.shn ] – представляет собой формат, используемый для сжатия аудиоданных. Это форма сжатия файлов используется для сжатия CD-качества, tp gjnthm аудио файлов (44,1 кГц, 16 бит, стерео PCM ). Этот формат до сих пор используется некоторыми людьми, потому что по закону продаются концертные записи в, которые кодируются как Shorten файлы.

Speex [. spx ] – это свободный кодек для сжатия речевого сигнала, который может использоваться в приложениях «голос-через-интернет» (VoIP ). С высокой вероятностью он не имеет никаких патентных ограничений и лицензирован под последней версией лицензии BSD (без третьей статьи). Сжатые кодеком Speex данные можно хранить либо в формате хранения звуковых данных Ogg , либо передавать напрямую с помощью пакетов UDP / RTP .

Разработчики противопоставляют свою разработку другим открытым кодекам, например, кодеку Vorbis , утверждая, что именно кодек Speex лучше всего подходит для передачи голоса по сети с ненадёжной доставкой пакетов данных. При этом авторы разработки специально подчёркивают, что кодек подходит для использования в сетях с ненадёжной передачей пакетов, то есть либо пакет пришёл, либо нет.

Speex относится к классу так называемых Code Excited Linear Prediction (CELP )-кодеков, то есть кодеков, построенных на основе так называемого Линейного Предсказательного кодирования ЛПК. ЛПК использует для аппроксимации отрезка речевого сигнала цифровой фильтр только с обратными связями (т. н. «авторегрессионный фильтр»). Коэффициенты этого фильтра «подгоняются» под отрезок сигнала с помощью процедуры Левинсона (в западной литературе - Левинсона-Дурбина). CELP -модификация ЛПК предусматривает наличие т. н. «кодовой книги», которая содержит предопределённые наборы возбуждающих ЛПК-фильтр единичных импульсов.

Речевой сигнал в кодеке Speex разбивается на неперекрывающиеся отрезки длительностью 20 мс (160 отсчётов при 8 КГц). При этом, для оценки возбуждающего набора вышеуказанный отрезок разбивается на четыре подотрезка длительностью 5 мс соответственно. На каждом из подотрезков отыскиваются возбуждающие наборы импульсов как текущего подотрезка (из кодовой книги), так и двух предыдущих подотрезков. В отличие от других кодеков, с целью избежать патентных ограничений, Speex не использует алгебраическое кодирование, а только векторное. Возбуждения двух предыдущих подотрезков складываются с переменными весами, в отличие от ряда других кодеков, где используются переменные положения по времени.

По заявлению разработчиков, Speex оптимизирован для получения высококачественного речевого сигнала при низких скоростях. Кодек Speex также позволяет использовать переменную степень сжатия сигнала и поддерживает сигналы с различной шириной полосы: сверхширокополосный (частота дискретизации 32 кГц), широкополосный (16 кГц) и узкополосный (8 кГц).

TAK (Tom ‘ s lossless Audio Kompressor ) [. tak ] – Аудиокодек и формат сжатия цифрового звука без потерь. Отличается высокой степенью сжатия и скоростью кодирования и декодирования.Распространяется бесплатно вместе c набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам: Winamp, foobar2000 и др.Разработчик - Thomas Becker, Германия.Относительно новый кодек. Первая финальная версия 1.0 была опубликована 26 января 2007 года.

Формат продолжает активно развиваться (последняя версия 1.1.1) и в настоящее время, согласно проводимому опросу на форуме hydrogenaudio.org, входит в число трёх наиболее популярных форматов аудиосжатия без потерь (после FLAC и WavPack)

TTA (True Audio) – бесплатный, аудио кодек, осуществляющий сжатие музыкальных файлов без потерь в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает всеми улучшенными характеристиками, как и большинство современных кодеров. Сжатый размер файлов будет на 30 % – 70 % меньше, чем original music file. TTA формат поддерживает тэги ID3v1 и ID3v2. Используя True Audio кодек, можно разместить до 20 audio CD на одном DVD-R диске.

TwinVQ (Transform – domain Weighted Interleave Vector Quanization ) - векторное квантование с трансформными доменами и взвешенным чередованием), разработанной в Японии в лаборатории NTT Human Interface Labolatories .

VQF-файлы примерно на 30-35 % меньше, чем MP3, при одинаковом качестве звука. Потоку 128 Кбит/с у файлов MP3 соответствует поток 80 Кбит/с у файлов VQF. У этих достоинств есть и обратная сторона. При декодировании загрузка процессора также на 30 % выше, чем при декодировании MP3. Это определяет повышенные требования к компьютеру, на котором планируется проигрывать такие файлы.

Тесты показывают превосходство VQF по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра VQF на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит VQF на ступень выше по качеству звука по сравнению с MP3.

VQF (Interleave Vector Quanization) – разработан в Японии и основывается на технологии TwinVQ. Если сравнить VQF и MP3, то первый формат на 30-50% будет “компактнее”, при одинаковом качестве звука. Это дает VQF – значительное преимущество перед MP3 форматом. Но процесс при кодировании, декодировании (decoder) VQF, занимает примерно на 30% больше ресурсов процессора PC, чем Mp3 аудио.

Тесты показывают превосходство TwinVQ по всем параметрам на нижних частотах и гораздо меньшее искажение формы сигнала с большим динамическим диапазоном (реальная музыка). Однако по завалу верхних частот звукового спектра TwinVQ на 2-3 дБ уступает MP3 на частотах выше 15 кГц. Это впрочем, легко компенсируется настройкой эквалайзера плеера, что объективно ставит TwinVQ на ступень выше по качеству звука по сравнению с MP3.

Vorbis [. ogg ] – свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам как AAC, AC3 и VQF, превосходящим MP3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 500 до 1000 кбит/с. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то, что это самый молодой формат из всех конкурентов MP3, Ogg Vorbis имеет полную поддержку на всех популярных платформах (Microsoft Windows, Linux, Apple Mac OS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Однако несмотря на все свои преимущества перед конкурентами, популярность данного формата пока невелика.

WAV (Waveform audio format ) [. wav ], [. wave ] – разработан совместно с IBM . Формат записи (стерео- или моно-) звука без сжатия. Так всего одна минута стереозаписи звука сделанная с CD-качеством (частота дискретизации 44,1 КГц) содержит 60 с х 44100Гц х 2 канала = 5 292 000 отсчетов. На каждый отсчет может приходиться 8 или 16 бит. Таким образом, в варианте 8 бит на отсчет, одна минута звука займет в памяти 42 336 000 бит = 5 292 000 байт (около 5 Мб).

WavPack [.wv ], [.wvс ] – Бесплатный аудиокодек c открытым исходным кодом для сжатия аудио без потери качества. Разработан Дэвидом Бриантом.

WavPack формат позволяет сжимать (и восстанавливать) 8-, 16-, 24- и 32-битные аудиофайлы в.WAV формате. Он также поддерживает потоки звук вокруг и высокие частоты дискретизации (sampling rate). Как у других способов компрессии без потери качества, эффективность сжатия зависит от исходных данных, но обычно она лежит в диапазоне между 30 % и 70 % для обычной популярной музыки, немного выше для классической музыки и других источников с более широким динамическим диапазоном.

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого (точнее, указанного при кодировании) качества с потерей (.WV), который может проигрываться сам по себе, а также файл «коррекции» (.WVC), который (в комбинации с предыдущим.WV) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

WMA (Windows Media Audio ) [. wma ] – лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.Изначально формат WMA позиционировался как альтернатива MP3, но на сегодняшний день Microsoft противопоставляет ему формат AAC (используется в популярном онлайновом музыкальном магазине iTunes).

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft. Особенно стоит отметить что ранние версии формата (или его реализации) имели проблемы на низких скоростях потока. Также многие меломаны и владельцы цифровых плееров недолюбливают формат WMA за низкую стойкость к ошибкам. Если при кодировании/передаче файла WMA некоторая часть его повреждается, то воспроизведение файла становится невозможным, как после места повреждения, так и за несколько десятков секунд до него. (Для сравнения: при повреждении файла формата MP3, его всё ещё можно воспроизвести от начала до самого места повреждения, затем пропустить несколько секунд и воспроизвести дальше до конца; иногда же ошибки в несколько байт в файле MP3 бывают на слух малозаметны или не заметны вообще.) Однако данный формат постоянно развивается, так что можно предполагать, качество будет оптимизироваться.

Большинство портативных аудиоплейеров поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах (вследствие его закрытости).

Microsoft включила в WMA поддержку цифровой системы управления авторскими правами (DRM) (система защиты). Основным следствием ее является невозможность прослушивать защищенные композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина.

В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества англ. lossless, многоканальное кодирование объемного звука и кодирование голоса.

В данной статье я хочу дать неполный перечень самых распространённых музыкальных форматов. С некоторыми мы больше знакомы, с некоторые меньше, например, кто пользуется на своём компьютере операционной системой Windows, тому практически незнаком формат файлов AIFF для Mac OS - аналог более известному формату WAV. Но суть не в этом

Сегодня форматов музыки существует "великое множество", отличаются они друг от друга разными алгоритмами сжатия звука, при этом сама степень сжатия выражается таким понятием, как битрейт.

Несжатые форматы не сжимаются. Они просто разворачиваются во время открытия. Хотя размер этих файлов обычно очень большой. Недостатком файлов с сжатием с потерями является то, что он удаляет некоторые данные из исходного файла. Но преимущество в том, что они меньше, открываются быстрее и занимают меньше места.

Файлы с потерями могут быть высокого и низкого разрешения в зависимости от степени сжатия. Чем выше качество, тем меньше информации будет потеряно. Битрейт соответствует обрабатываемой информации в секунду. Более высокий битрейт означает больше информации в секунду. И больше информации в секунду означает лучший звук . Теперь вы понимаете основные моменты сжатия, типы файлов и битрейт, не так ли?

Чем ниже битрейт, тем хуже качество звучания сжатого, перекодированного файла. Измеряется битрейт звука в килобайтах за секунду. Чтобы было более понятно, что собой представляет звук в зависимости от его битрейта, ниже представлена таблица, проливающая свет на этот вопрос:

800 bps - 800 бит/сек - минимальное качество чтобы голос был узнаваем.

8 kbps - 8 кбит/с - качество передачи голоса по телефону.

32 kbps - 32 кбит/с - качество AM.

96 kbps - 96 кбит/с - качество FM.

128–160 kbps - 128-160 кбит/с - стандарт качества.

192 kbps - 192 кбит/с - качество DAB (Digital Audio Broadcasting) цифровое радиовещание. Становится новым стандартом для MP3 музыки. При этом битрейте, только профессионалы могут заметить разницу в звуке.

224–320 kbps - 224-320 кбит/с - качество приближённое к качеству CD.

1411 kbps - 1411 кбит/с - PCM аудио формат, похожий на CD “Compact Disc Digital Audio”.

Конечно, нужно помнить и понимать, что звучание будет зависеть ещё от одной характеристики цифрового звука такой, как частота дискретизации, отвечающей за представление спектра сигнала.

Если бы мы говорили о каждом из аудиоформатов, мы были бы здесь целыми днями. Конечно, у вас есть другие обязанности и много музыки для производства. Это лучшее применение для каждого из этих форматов. Они занимают много места на жестком диске. По простой причине: он имеет лучшее из обоих миров.

Они сжаты, что упрощает их обработку с точки зрения размера. Но они также предлагают приятный и насыщенный звук. Если вы слушаете потоковое воспроизведение музыки, это, скорее всего, будет. Они полезны при одновременной передаче нескольких файлов, просмотра всего каталога или совместного использования и ссылки на дорожки быстро.

8 000 Гц - телефон, достаточно для речи, кодек Nellymoser;

1 025 Гц;

22 050 Гц - радио;

44 100 Гц - используется в Audio CD;

48 000 Гц - DVD, DAT.

96 000 Гц - DVD-Audio (MLP 5.1)

192 000 Гц - DVD-Audio (MLP 2.0)

2 822 400 Гц - SACD Super audio CD 5.1

Наиболее распространённый формат, особенно в Интернете - это MP3. В его создании используется алгоритм сжатия таким образом, что при уменьшении размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения, потери качества звука минимальны. Размер файла зависит от степени сжатия.Так при создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с CD-Audio.

Кстати, не забывайте какой-либо формат

Проведите тест и судите сами. Выбор правильного формата зависит от каждого контекста. Поэтому подумайте о том, какой звук вы разделяете и где вы это делаете. Вы используете правильный формат? Поэтому сделайте разумный выбор и используйте правильный формат. Цифровой звук можно сохранить в разных форматах. Каждый из них соответствует определенному расширению файла, который содержит его.

Это не сам аудиоформат, поэтому его функции обсуждаются отдельно. Существует огромное количество аудиоформатов. Обычно тип формата соответствует расширению файла. Некоторым типам файлов назначается определенный кодек. Проще говоря, формат можно сравнить с контейнером, в котором может быть сохранен звук или видеосигнал с использованием данного кодека. Если вы не знаете, какую программу использовать для открытия формата или другого аудио, мы рекомендуем использовать наш аудио конвертер. Он совместим практически со всеми существующими форматами.

Для сравнения приведу информацию о формате Wav, который поддерживает звук высокого качества . При частоте дискретизации 44100 Гц его битрейт равен 1411 кб/с и 1 минута записанного файла в этом формате занимает места на жёстком диске приблизительно 10 м.

Итак, какие на сегодняшний день существуют наиболее распространённые форматы аудио:

Эта группа форматов записывает и сжимает звук таким образом, что позволяет сохранить его точное исходное качество при его декодировании. При сжатии с потерей звук подвергается определенной модификации. Например, сжатие вырезает звуковые частоты, которые не слышны для человеческого уха. Когда он декодируется, файл будет отличаться от оригинала с точки зрения сохраненной в нем информации, но он звучит практически так же.

Узнайте больше о наиболее распространенных аудиоформатах

Некоторые из наиболее распространенных форматов потерь. Однако это было скомпрометировано некоторыми независимыми тестами. Обычно он обеспечивает лучшее качество звука с тем же размером файла. Он не изменяет звуковую последовательность, и звук, закодированный в этом формате, идентичен оригиналу. Он часто используется для воспроизведения звука в высококачественных аудиосистемах. Совместимость воспроизведения на устройствах и проигрывателях ограничена, поэтому при желании она часто преобразуется в другие форматы перед воспроизведением на проигрывателе.

AAC (Advanced Audio Coding) - другие названия - MPEG-2 AAC и MPEG-2 NBC. Результат эволюции MP3-файлов. При меньшем битрейте, не уступают качеству MP3.
AIFF - формат файлов для Mac OS, данные без сжатия. Высокое качество звучания.
ASF (Advanced Streaming Format) - формат, стандартный для OC Mac. Большой размер файла при высоком качестве звучания, сравнимом с качеством AudioCD.
AudioCD (CDA) - аналоговое аудио, звук высокого качества.
FLAC (Free Lossless Audio Codec) - бесплатный аудиокодек, сжатие звука до 50 процентов без потери качества звучания.
Liquid Audio (LQT, LA1)- защищенный формат для платной загрузки музыки через сеть.
MP2 (MPEG-1, Layer2) - устаревший формат аудио, предшественник MP3.
MP3 (MPEG-1, Layer3) - формат аудио, обеспечивающий приемлемое качество звучания при высоком коэффициенте сжатия. Один из самых популярных в мире форматов.
VQF - формат аудио, устаревший аналог MP3.
WAV - стандартный файл Windows , поддерживается звук высокого качества. Занимает большое пространство на диске.
WMA (Windows Media Audio) - перспективный формат от Microsoft. При меньших размерах файла и меньшем битрейте не уступает качеству MP3.

Как правило, сегодня термином «аудио» обозначается все, что связано со звуком, будь то воспроизведение, обработка, сведение, мастеринг или прослушивание записей. Но мало кто знает, что аудио-форматы со времени своего возникновения постоянно претерпевали множество существенных изменений то в лучшую, то в худшую сторону. Беда в том, что по сравнению с начальными форматами, создатели новых форматов пытались улучшить качество звука, а это неизменно сказывалось на размере воспроизводимого файла. Уменьшение размера, наоборот, приводило к потере качества. Но так было не всегда.

Какие устройства поддерживают его?

Существует несколько форматов, поддерживающих музыку в высоком разрешении. Качество каждого формата может варьироваться в зависимости от того, как оно было записано и на каких частотах.

Есть много других брендов, которые уже флиртуют с карманными устройствами, которые якобы способны передавать аудио высокой четкости. Хорошо отметить, что воспроизвести звук в высоком разрешении недостаточно с файлом. Он требует адаптированной аудиоэлектроники и поддерживает эти скорости и частоты бит. Разумеется, также требуется устройство вывода высокого класса.

Первый формат аудио в компьютерных играх

Самое первое упоминание о компьютерном звуке пошло от создания примитивных на тот момент игр, в которых саунд воспроизводился посредством системного динамика. Но как ни старались разработчики такого ПО (программного обеспечения), нужного качества, совместимого с бобинными или кассетными магнитофонами или пластинок, добиться так и не удалось.

Цифровая музыка в высоком разрешении уже давно существует. Почему кажется, что сейчас он становится модным? Помимо тяги у них могут быть такие устройства, как один, ответ на рынке. Преступнику этого исчезновения не нужно искать его очень далеко. За исключением особых случаев, большинству пользователей более чем достаточно, чтобы их смартфон прослушивал музыку. Даже игроки, которые поселились, как они видят, уменьшают местность, которые они пробивают из года в год.

Именно поэтому многие производители занялись поиском решения, как поменять формат аудио, чтобы звук был натуральным. Откровенно говоря, это и привело к дальнейшей конкуренции, которую мы имеем сейчас. Это касается не только воспроизводимого материала, но также и студийного звука, «живых» выступлений, качества или настройки основных параметров с точки зрения знаний физики, акустики и т. д.

Мы приходим к миллионному вопросу. Это требует чувствительного уха и определенного образования. Если вы высокопоставленный энтузиаст, вы, вероятно, сначала узнаете разницу, но для обычных смертных, которые просто слушают музыку с помощью фонового метра, вероятно, слишком сложно заплатить разницу цен только для того, чтобы иметь такое качество.

Речь идет не только о музыкальном проигрывателе. Те, кто соответствует этому оборудованию, не дешевы. В довершение всего, есть музыка, которая продается в форматах высокой четкости, что также немного дороже.

Наконец, это технический раздел. Между самими аудиоспециалистами нет даже единого мнения относительно того, делают ли эти устройства такое важное различие. По крайней мере, на бумаге кажется, что музыка высокой четкости лучше слышится, но за этим стоит сильный маркетинговый компонент. Готовы ли мы платить за то, чтобы смотреть на публику как любителей музыки?

Появление формата WAV

Считается, что первое полноценное качество аудио-форматов было связано с появлением стандарта и расширения файлов.wav (такое сокращение было образовано от английского слова «волна» или wave). Как раз-таки он и стал тем первенцем, который мог обрабатываться в компьютерных программах на профессиональном уровне.

Как обычно в большинстве мультимедийных файлов, с которыми мы работаем почти ежедневно, мы ссылаемся на видео с фотографиями или аудиофайлами, в зависимости от типа использования, которое мы собираемся сделать из них, мы должны использовать в каком-то определенном формате, так что важно также знать основные различия между ними.

Но вот о чем мы поговорим, это несколько альтернатив, которые мы собираемся представить, и это будет очень полезно вам, когда речь заходит о попытке и преобразовании различных типов аудиофайлов, с которыми мы обычно встречаемся. Если вы хотите узнать основные различия между ними, мы рекомендуем вам взглянуть на эту запись, которую мы вам предлагаем.

Такие файлы уже имели свои характеристики: частоту дискретизации, глубину звука, битрейт и многое другое. Такой звук был совместим даже с тем, что можно было получить после обработки обычного звукового CD с помощью определенных инструментов типа обычного эквалайзера. Но размер был явно неоправданным. К примеру, трехминутный трек мог занимать от 20 до 50 Мб.

С помощью этой программы мы ссылаемся на подходящую альтернативу для осуществления конверсий между множеством аудиофайлов, помимо выделения звука из видеофайлов в самых обычных форматах. При этом он имеет очень интуитивно понятный пользовательский интерфейс, который делает его действительным даже для начинающих в этих задачах. Чтобы работать, просто добавьте этот файл, выберите формат вывода и нажмите кнопку «Преобразовать».

Прежде всего, одна из основных характеристик этого инструмента заключается в том, что помимо возможности конвертировать между различными аудиофайлами, что нас интересует в этом случае, у него также есть функции для преобразования видео и изображений. Благодаря функциональности, которую он предлагает, у нас будет возможность максимально адаптировать нашу музыку к воспроизведению как можно более оптимально в мобильных устройствах , используя простой процесс. Для этого просто перетащите файлы, которые нужно преобразовать в простой интерфейс приложения.

CD-диски

Формат аудио CD, точнее, расширение.cda, появилось практически в то же время.

В отличие от «волновых» файлов, сохраненных на винчестере, редактированию он не поддается. Его сегодня можно открыть в программе обработки звука, изменить формат аудио-перекодированием и сохранить в любом другом месте, кроме CD-диска.

После указания формата вывода и устройства, на котором мы будем воспроизводить их, начнется конвертация. Для всех этих задач нам просто нужно перетащить элементы, с которыми мы работаем над вашим пользовательским интерфейсом. Например, если мы воспроизведем файл с удвоенной скоростью, простой способ интерполяции будет состоять в том, чтобы воспроизвести один образец из каждых двух.

Если поставить объект на 50% высоты тона, он должен удвоить количество выборок, и для этого простым способом является поиск среднего значения двух реальных выборок. Ну, этот сигнал должен быть распакован, и это занимает пропорционально большую нагрузку процессора, которая может стать «насыщенной». И менее насыщенный процессор означает меньший риск «повесить». Мы проанализируем самые популярные форматы сжатия, которые позволят нам сжимать любые файлы без потери информации. Что быстро? Самый мощный?

Кодек MP3

С появлением кодека LAME MP3 Encoder музыкальная индустрия пережила настоящий шок, ведь «весили» такие файлы в десятки раз меньше, чем тот же файл WAV. Даже пятиминутная композиция при максимальном сжатии редко превышает размер в 5-7 Мб. Согласитесь, существенный прорыв, не говоря уже о том, позволяли не только корректировать вышеуказанные характеристики, но и некоторые дополнительные параметры в виде ID3-тегов, в которых содержалась информация, скажем, об исполнителе, названии альбома и треков, дате выпуска.

Что такое сжатие файлов? Что значит сжать?

И самое используемое? Вы когда-нибудь сталкивались с файлом, который был слишком занят и не знал, как заставить его заняться меньше, например, отправить его другу по почте? Сжатие файла позволяет нам уменьшить размер файла. Это займет меньше места на жестком диске и будет проще отправлять. В зависимости от типа используемого файла и типа сжатия его размер будет уменьшен более или менее.

Какие форматы сжатия есть и какие из них наиболее популярны

Как мы только что сказали, существует несколько типов методов сжатия. Например, это метод сжатия, используемый для сжатия видео, аудио - или графических файлов. Основная особенность этого метода сжатия заключается в том, что при сжатии аппроксимаций, поэтому мультимедийный файл уменьшает размер. Этот метод ищет шаблоны, которые повторяются в дополнение к другим более продвинутым методам. Это достигается за счет уменьшения размера файла без потери информации или качества, хотя, очевидно, размер файла не уменьшается. В отличие от предыдущего случая, эта информация не теряется. . Что касается форматов и методов сжатия, мы имеем широкий диапазон.

Такого типа стали наиболее популярными. Посмотрите, практически весь интернет заполнен именно этим универсальным форматом. В целом же, можно сказать, что формат аудио в MP3 стал настоящей революцией в звуке. Он остается одним из самых популярных и наиболее востребованных до сих пор, несмотря на то, что ему на смену идут и другие разновидности аудио. Но об этом несколько позже.

Файлы AIFF

Аудио-форматы имеют еще одну разновидность. Так называемый формат.aiff изначально был создан для применения на компьютерных системах Macintosh.

Только намного позднее произошла трансформация, которая предопределила совместимость звуковых форматов с их использование на платформах, различающихся между собой операционных систем .

Формат OGG

Музыка в формате аудио.ogg тоже встречается достаточно часто. Этот стандарт был разработан компанией Vorbis. Однако стоит заметить, что он имеет ряд существенных недостатков. Во-первых, это неоправданная нагрузка на системные ресурсы компьютера, несмотря на минимальный размер. Во-вторых, использование собственных кодеков и декодеров, которые система автоматически может и не устанавливать. К примеру, при работе в программе FL Studio Producer Edition (или XXL) в версиях ниже 9.x.x имелась папка с установочным файлом в формате.inf, который нужно было активировать для инсталляции после установки основного приложения вручную (иначе пресеты в таком формате просто не проигрывались).

Тем не менее сейчас аудио-форматы такого типа встречаются, а сам звук выглядит очень неплохим.

Стандарт AMR

Что касается этого формата, он, пожалуй, относится к самым низкопробным. Его возникновение связано с появлением первых неуклюжих мобильных телефонов , которые все еще не могли устанавливать на звонок мелодии в формате.mp3.

AMR тогда еще мог заменить натуральный звук с известной долей потери качества. Но это качество не идет ни в какое сравнение с тем, что предлагается более «продвинутыми» форматами.

MIDI

Как ни странно, MIDI тоже можно отнести к тому, что принято называть «аудио-форматы». Хоть и принято считать (а многие, собственно, так и думают до сих пор), что система MIDI это всего лишь набор команд, с этим можно поспорить. Расшифровка аббревиатуры MIDI - это Собственно, это система записи и редактирования неких нажатия клавиш, высоты тона, темпа, тональности, эффектов и т. д.

Тем не менее существуют файлы с расширением.mid или.midi, которые совершенно просто воспроизводятся в современных секвенсорах или студийных программах звукозаписи, используя стандартный набор звуков формата GM (General MIDI), GS (что то же самое) от компании Roland или XG (Extended MIDI) от корпорации Yamaha. В первых двух наборах присутствует 128 стандартных звуков, не считая эффектов, в третьем - почти втрое больше.

FLAC

Теперь мы подходим к одному из самых современных и уникальных форматов современности. Музыка в формате аудио FLAC сегодня получает все большее распространение. Связано это с качеством, на которое истинные меломаны обращают внимание, прежде всего.

Если разобраться, этот формат был создан на основе уже известного MP3. Вот только если ранее использовалось распределение на отдельные треки, в этом формате такого нет (до поры, до времени). Структура представляет собой один или два файла, один из которых является информационным. Воспроизвести такой формат могут только специализированные программные аудиоплееры. Самым известным можно назвать AIMP. Только в том случае, когда открывается основной файл, возникает и список дорожек, записанных в основном контейнере. В таком проигрывателе переключение между треками производится точно так же, как и в любом другом. Зато нет вероятности случайного удаления той или иной композиции (как уже говорилось, информация о них содержится в едином файле).

Совместимость форматов

Естественно, все форматы аудио сегодня совместимы между собой. Иными словами, любой стандартный домашний DVD-плеер или программный проигрыватель справится с этим без труда. То же самое относится и к программам обработки звука. Полупрофессиональные и профессиональные программы распознают все форматы, известные на сегодняшний день (даже несмотря на специфику операционных систем). Аудиоредакторы, секвенсоры, дополнительные модули типа VST, RTAS (для систем Windows) или AU (для Mac OS X) способны работать с такими форматами в так называемом кросс-платформенном режиме.

Преобразование форматов

Изменить аудио можно несколькими способами. К примеру, можно открыть «родной» формат, а сохранить файл в другом. Можно поступить еще проще. Для этого существуют специальные конверторы. В них можно просто загрузить из списка желаемый файл начального формата, а затем просто выбрать конечный. Как говорится, всего-то ничего.

Обработка качества звука

Другое дело, когда вопрос касается изменения некоторых частотных исходного файла. Тут без специализированных программных пакетов не обойтись. Именно с их помощью и можно изменить качество аудиофайлов. При этом можно поменять не только стандартную частоту дискретизации 44100 Гц, увеличив ее, скажем, до 96000 Гц, но и произвести настройку глубины от тех же 16 до 24 или 32 бит. И это мы уже не говорим о том, что можно настроить еще и битрейт, то есть, пропускную воспроизводимую способность, выраженную в килобитах в секунду. Стандартным значением считается 128 кбит/сек. Битрейт можно менять по своему усмотрению, однако наилучшее качество звука достигается на отметке 320 кбит/сек. Конечно, не каждый человек способен уловить разницу между стандартным звучанием и максимально выставленными характеристиками. Тем не менее, стоит один раз попробовать воспроизвести аудиотрек с разными данными на хорошей аппаратуре. Вот тут разница себя не заставит ждать.

Более того, кроме всех этих параметров, можно редактировать и многое другое. Чего только стоит использование программных эквалайзеров, лимитеров, компрессоров, кроссоверов, нормалайзеров, де-эссеров и т. д. и т. п. Каждый такой модуль позволяет настроить звук, как говорится, «под себя». И абсолютно все форматы, известные на сегодняшний день, программами такого типа и можно обрабатывать.

Итоговое сравнение

Попробуем сделать некое сравнение между используемыми форматами (хотя это еще далеко не все, что есть в мире звука).

Итак! Формат WAV хоть и «тяжеловесен», все равно может использоваться в качестве промежуточных файлов при последующем конвертировании в некоторых аудиореакторах. Форматы аудио-файлов такого типа чаще всего присутствуют при сохранении открытых проектов или при записи живых инструментов в студии. Понятно, что секвенсор потом обработает входящую информацию в виде звукового потока. А потом поменять формат аудио-файла или сохранить его в виде пресета или дорожки можно будет как угодно.

Форматы типа аудиодисков сегодня тоже неактуальны. Если взять в расчет AIFF или OGG, их лучше использовать в виртуальных студиях. О формате AMR вообще говорить не приходится. MIDI пригодится только музыкантам, знающим в этом толк.

Как считается, сегодня лучший аудио-формат - это все-таки FLAC. По мнению многих специалистов и музыкантов, он является не просто самым «продвинутым», но и даже революционным по сравнению с тем, что существовало или существует на сегодняшний день.

Однако стоит отметить, что и MP3 со счетов сбрасывать нельзя, ведь практически весь кодированный звук на тех же DVD-дисках или в MKV-файлах имеет именно этот формат. Разница только в версии кодека и декодера. Но и индустрия звука и видео в своем развитии на месте не стоит. Весьма вероятно, что мы скоро увидим и еще что-то новое.

На сегодняшний день существует около трех десятков распространенных цифровых аудиоформатов. Зачем понадобилось создавать такое количество видов звуковых файлов для хранения одного типа контента и как со всем этим управляться вы узнаете из этого материала.

Вступление

Наверняка многие пользователи предпочитают использовать домашний компьютер не только в качестве рабочей лошадки, но и как мультимедийный центр, на котором можно просматривать фильмы или семейные фотографии, а так же слушать любимую музыку. Хотя наверняка, для прослушивания музыкальных композиций более подходящими являются компактные цифровые плееры или мобильные телефоны, но в отличие от них, компьютер умеет не только проигрывать музыку.

Каким бы большим объемом встроенной памяти не обладал ваш музыкальный плеер, скорее всего, хранить в нем всю фонотеку вряд ли удастся. Более того, с помощью ПК можно создавать, редактировать, упорядочивать и искать музыку. Так же не стоит забывать, что на сегодняшний день существует около трех десятков распространенных цифровых аудио форматов, а большинство плееров далеко не всеядны, и способны воспроизводить только некоторые из них.

Так зачем же понадобилось создавать такое количество музыкальных форматов для хранения одного типа контента? Все дело в том, что звук в подавляющем большинстве случаев хранится в «сжатом» виде, так как одна минута несжатой композиции занимает на жестком диске около 10 Мб. С одной стороны это вроде бы не много, а с другой, если вы меломан и ваша коллекция состоит из нескольких сотен или даже тысяч песен, то становится ясно, что звук необходимо сжимать, для уменьшения занимаемого им места на электронных носителях информации.

Для сжатия музыкальных файлов используются различные особые алгоритмы, которые впоследствии определяют структуру и особенности представления звуковых данных или так называемые цифровые аудиоформаты файлов. Все звуковые форматы можно разбить на три группы: аудиоформаты без сжатия, со сжатием без потерь и с применением сжатия с потерями.

Без сжатия

Одним из самых распространенных форматов, относящихся к этому типу, можно смело считать известнейший WAV. Звук в файлах с таким расширением хранится без какого-либо сжатия и изменений. Правда места для хранения несжатых файлов требуется гораздо больше и поэтому наиболее широкое применение WAV находит лишь в профессиональных аудио и видео приложениях, где звук перед обработкой не должен иметь потери в качестве. Хранение же обычных музыкальных композиций в таком виде является неоправданной расточительностью.

Для воспроизведения WAV-файлов вам не потребуется какое-то специальное программное обеспечение, так как этот формат понимают все медиаплееры, включая и встроенный в систему Windows штатный проигрыватель аудиофайлов Windows Media.

Еще одним форматом, использующимся для хранения несжатого аудио, о котором стоит упомянуть, является разработка компании Appleпод названием AIFF (Audio Interchange File Format). Как вы, наверное, уже догадались, наиболее часто он используется в компьютерах Macintosh под управлением систем Mac OS X.

Сжатие без потерь (lossless )

Алгоритмы, осуществляющие сжатие аудиофайлов без потерь работают по принципу обычных архиваторов. Обеспечивая не самый высокий уровень сжатия (от 40 до 60%), при этом они практически не влияют на качество звука. Так же стоит отметить, что в этом случае, закодированные данные можно полностью восстановить до первоначального вида. Поэтому использование сжатия без потерь наиболее часто применяется в тех случаях, когда важно сохранить идентичность сжатых данных оригиналу.

Наиболее популярными аудиоформатами в этой группе являются FLAC (Free Lossless Audio Codec), APE (Monkey’s Audio), WMA (Windows Media Lossless) и ALAC (Apple Lossless Audio Codec). У каждого из них есть свои плюсы и свои минусы. Например, кодек APEдает несколько больший выигрыш в сжатии, а FLAC является более распространенным. В общем же, все настоящие меломаны хранят свои музыкальные коллекции именно в lossless-форматах, так как в них не удаляется никаких данных из аудиопотока, а созданные с помощью этих кодеков файлы, можно прослушивать даже на высококачественной звуковой аппаратуре.

Для воспроизведения сжатых без потерь форматов, как правило, используются сторонние плееры (кроме WMA), такие как MPlayer, foobar, AIMP, Winamp, VLC и прочие, так как в них уже встроены все необходимые кодеки. Другим вариантом является отдельная установка пакета дополнительных кодеков (например, K-Lite), после чего прослушивание файлов в lossless-формате становится доступным практически из любого аудиопроигрывателя.

Сжатие с потерями

Это самая популярная группа алгоритмов, которые обеспечивают максимальную (до 10 раз и даже более) степень сжатия звука. Правда в отличие от предыдущих форматов, здесь аудиофайл теряет в качестве, а насколько сильно - напрямую зависит от степени его сжатия.

Для определения качества оцифрованного звука наиболее часто применяется такой показатель, как битрейт - скорость звукового потока, получившаяся после сжатия и измеряемая в килобитах в секунду (kbps). Как мы уже говорили, в среднем минута несжатого звука занимает около 10 Мб, что соответствует аудиопотоку примерно в 1400 кбит/c. После кодирования с потерями, его битрейт может снизиться до 56 кбит/с. При этом, стоит учитывать, что для сохранения естественного звучания скорость потока должна быть не ниже 192 или 256 кбит/c. Если же битрейт потока составляет 320 кбит/c и более, то разница в звучании для большинства людей между сжатым и несжатым аудио практически исчезает.

Самым популярным форматом здесь однозначно считается знаменитый и всеми любимый MP3, разработанный специалистами известной группы MPEG (Moving Picture Experts Group). Наиболее широко он используется для кодирования аудиофайлов, размещаемых в интернете и различных файлообменниках из-за возможности существенно уменьшить размер передаваемых данных, что при низкой скорости подключения к сети немаловажно.

Другими известными форматами из этой серии являются AAC (Advanced Audio Coding) и OGG Vorbis. При этом, будучи менее популярными, их алгоритмы сжатия совершеннее, чем у основного конкурента. Так при одинаковом размере файла, они обеспечивают лучшее качество звукового ряда по сравнению с MP3. Еще одно серьезное преимущество данных форматов - возможность кодирования до 48 звуковых каналов у AAC и 255 у OGG, против всего двух у MP3.

Стоит отметить, что и формат WMA - собственность компании Microsoft, изначально создавался для хранения и трансляции аудиоинформации в сжатом виде с потерями, а кодирование без потери качества добавилось к нему не так давно, начиная с Windows Media Audio 9.1. Номинально этот формат обеспечивает лучшую степень сжатия, чем MP3, что дает возможность разработчикам противопоставлять его в качестве альтернативы конкурирующим алгоритмам AAC и OGG. Правда широкому распространению WMA мешает его закрытость и ограниченность применения на многих платформах (операционных системах). Да и встроенная поддержка цифровой системы управления авторскими правами (DRM) не добавляет популярности детищу Microsoft.

Не смотря на то, что MP3 проигрывает своим конкурентам, как по эффективности сжатия, так и по качеству звучания, он до сих пор продолжает оставаться самым популярным аудиоформатом. Секретом такого успеха, наверное, можно назвать банальную инерцию мышления, так как за многие годы к нему привыкло большинство пользователей, производителей аппаратуры и разработчиков программного обеспечения. Именно поэтому MP3-файлы можно прослушать вообще на всем, что способно проигрывать цифровой звук - будь то мобильный телефон, персональный компьютер с любой популярной операционной системой, портативный аудиоплеер, современный музыкальный центр или DVD-проигрыватель.

И хотя другие форматы пока что такой поддержкой похвастаться не могут, у них тоже все не так уж и плохо. Так AAC нашел широкую поддержку со стороны компании Apple, которая использует его алгоритмы для хранения аудиокниг, подкаст, музыкальных композиций в магазине iTunes и рингтонов. Так что для поклонников компьютеров Macintosh, планшетов iPad, смартфонов iPhone и плееров iPod этот формат можно считать «родным».

Файлы WMA легко воспроизводятся на любом ПК под управлением операционной системы Windows, которая является самой распространенной в мире. При этом многие производители портативных аудиоплееров и стационарных проигрывателей оптических дисков так же поддерживают этот формат. А вот для прослушивания файлов в форматах OGG Vorbis или AAC в Windows-системах придется установить специальные кодеки. Хотя это не проблема. Установка вышеупомянутого бесплатного пакета кодеков K-Lite Codek Pack позволит проигрывать на вашем компьютере с помощью любимого плеера практически любые звуковые файлы.

Заключение

В заключение давайте посмотрим, какой набор программного обеспечения вам понадобится, что бы превратить свой домашний компьютер в универсальный инструмент для работы с аудиофайлами. Для удобства, разделим все приложения на несколько основных групп.

Плееры - служат для непосредственного воспроизведения звуковых файлов, а так же часто используются для каталогизации и упорядочивания музыкальных коллекций. Их количество столь огромно, что и не сосчитать. Но все же, что бы несколько облегчить вам выбор, приведем, на наш взгляд, двенадцать самых популярных: Windows Media Player (встроен в систему), Winamp, KMPlayer, iTunes, GOM Player, jetAudio, VLC Media Player (VideoLAN), AIMP, BSPlayer, Real Player, WinDVD и Foobar2000.

Конверторы - приложения, способные осуществлять перекодировку из одного формата в другой. Для этой цели можно использовать большинство популярных плееров, не прибегая к использованию специальных программ. Хотя в некоторых случаях без этого не обойтись.

Рипперы (грабберы) - позволяют извлекать цифровую звуковую информацию с оптических носителей (Audio-CD, DVD) и сохранять ее в различных форматах. Несмотря на многочисленность всевозможным грабберов, на этом поприще наибольшую популярность снискало приложение EAC (Exact Audio Copy), позволяющее делать наиболее точные копии дисков. К другим популярным рипперам относятся: Audiograbber, Reaper, Easy CD-DA Extractor и прочие.

Редакторы - программы, предназначенные для создания, записи и редактирования звуковых данных. В этой группе существуют как довольно простые программы, позволяющие сделать элементарные операции с аудиофайлом (вырезать, обрезать, объединить, нормализовать и т.д.), так и настоящие монстры для профессиональной работы со звуком. Среди небольших редакторов можно выделить приложение Nero WaveEditor, за его скромный размер и при этом довольно высокую функциональность. К наиболее популярным профессиональным решениям обработки звука относятся: Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro и другие.

Конечно, чисто теоретически все эти необходимые функции может сочетать в себе только одна программа, но на практике использовать единственное приложение для всех задач не всегда удобно. Да и добиться от одной программы качественного выполнения всех задач практически невозможно.

В любом случае гораздо удобнее иметь под рукой несколько специализированных приложений, которые и места занимают меньше, и с задачами своими по отдельности справляются лучше.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.

IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Практически любой пользователь компьютера периодически слушает на нем музыку, которая хранится в электронном виде. Форматов для хранения музыки существует достаточно много, каждый из них был разработан для конкретных задач:

Воспроизведение с CD диска;
Звуковое сопровождение компьютерной игры;
Аудиодорожка в ;
Потоковое воспроизведение через Интернет;
Рингтоны для мобильных телефонов.

Попробуем разобраться в некоторых из них, также как и в …
Основные определения

Битрейт – объем информации, используемый при кодировании для воспроизведения 1 секунды. Чем он выше – тем меньше искажений, и звук максимально соответствует оригиналу.
Lossless – кодирование звука без потерь качества. При конвертировании в lossless-форматы и обратно получаем абсолютно одинаковый звук.
Lossy – форматы сжатия, рассчитанные на то, что человек просто физически не может слышать определенные частоты, которые пропускаются в процессе конвертации. При этом можно значительно сэкономить на объеме дискового пространства.

Audio-CD

Формат, положивший начало эпохе цифрового звука после перехода с виниловых пластинок. Был принят за стандарт в 1979 году компаниями Philips и Sony. В формате audio-CD физически музыка может храниться только на оптическом носителе, при записи на жесткий диск звуковая дорожка должна быть переконвертирована.

Благодаря высочайшему качеству звука и возможности воспроизведения на любом проигрывателе формат остается очень популярным, несмотря на то, что он достаточно устарел.

Flac

Пожалуй, самый распространенный формат для хранения музыки в losseless. По сравнению с остальными кодеками, обеспечивающими сжатие аудио без потерь, flac, разработанный компанией xiph.org , абсолютно бесплатен и дает минимальный размер выходного файла.

Mp3

Самый массовый музыкальный формат, принятый в качестве неофициального стандарта для любого устройства воспроизведения. Его популярность основана на том, что благодаря срезанию неслышимых ухом частот при практически том же качестве звука mp3 файл составляет 30% от оригинального losseless-файла.

Первая звуковая дорожка в mp3-формате появилась еще в 1994 году. Одна из причин популярности – возможность хранения разнообразной дополнительной информации в тегах аудиофайлов и удобство организации музыкальной библиотеки.

Ogg

Новый lossy-формат, увидевший свет в 2002 году как бесплатная альтернатива платным форматам. В отличие от своих предшественником, в частности mp3, допускает возможность многоканального кодирования и хранения многоканального аудио. Получил наибольшее распространение в видеоиграх.