Почему mp3 — это все, что вам нужно

Вы — Homo Sapiens в возрасте от 17 до 80? Консерваторию не заканчивали? Тогда losseless Вам не нужен — слушайте качественный mp3.

Очень часто встречаются индивиды, презирающие сжатые форматы в принципе. Не стоит ориентироваться на их мнение. Очередные модники, которые в исследовании с вероятностью 90% не услышат отличий сжатого звука от несжатого.

Что такое mp3

mp3_4_resize
MP3 придуман не только для того, чтобы резать качество. Его разработкой занималось Общество Фраунхгофера — объединение институтов прикладных исследований Германии. Они же позже придумали AAC, который мог бы стать главным форматом сжатого звука… Но не получилось.

А Вы знали, что MP3 бывает с переменным (VBR) и постоянным битрейтом (CBR)? Постоянный битрейт, ввиду работы алгоритма, кодируется каждый раз как в первый. Поэтому может выдавать неровное качество, а это значит — не всякий звук в таком раскладе будет качественно записан.

Поскольку MP3 появился довольно давно, он обладает массой ограничений. Разрядность — 16–24 бита. Частота дискретизации представлена следующим набором вариантов: 8; 11,025; 12; 16; 22,05; 24; 32; 44,1; 48. Максимальный битрейт не превышает 320 кбит/с. Максимальное число каналов — 2. Но мы все-таки о музыке говорим, мультиканальные записи еще поискать надо.
25104704-2
А таперь давайте посмотрим, как кодируется MP3. На иллюстрации — частотно-временное распределение звука. Одна и та же запись: Audio CD, OGG-файл, хорошо закодированный MP3. Что наблюдаем — первый и второй кусок совпадают практически полностью. Значит, MP3 файл звучит практически так же, как оригинальная запись на компакт-диске.

Человеческий слух и его пределы — психоакустика

mp3_5_resize
Дело в том, что основная задача Общества Фраунхгофера — разработка психоакустических моделей человеческого восприятия звука. И здесь есть много тонкостей. Главная — мы не дельфины.

Во-вторых, существуют определенные ограничения на количество одновременно воспринимаемых звуков. Человек одновременно способен слышать не более 250 звуков из 24 диапазонов (причем, количество одновременных звуков в диапазоне так же довольно мало).

Во-третьих, слышимый диапазон составляет от 16 Гц до 20 кГц и к 60 годам снижается почти в два раза. В идеальном случае и при тренировках (да-да, его необходимо тренировать!).

Все частоты ниже 100 Гц воспринимается не слуховыми клетками, а… кожей. Потом низкие волны переотражаются в слуховом канале — эти волны и воспринимаются как инфрабас. (Да, это что-то из сродни нашумевшей костной проводимости.)
mp3_7_resize
Более того — число регистрирующих акустические волны клеток у каждого различно. Да что там — у каждого отдельно взятого человека их число в правом и левом ухе отличается.

Кстати, и восприятие каждым ухом различается. Поменяйте местами каналы в любимой композиции — получите новое звучание.

Если копнуть глубже, оказывается, что каждая частота звука воспринимается только при определённой громкости. При её достижении, тишина сменяется резким и достаточно отчётливым звуком. После человек может слышать и более тихий звук этой частоты.
mp3_1_resize
Другое интересное свойство слуха — чем меньше уровень громкости, тем меньше его разрешающая способность, меньше число воспринимаемых звуков. При снижении громкости лучше воспринимаются высокие частоты, при увеличении — низкие. И они не дополняют, а сменяют друг друга.

Человек не воспринимает некоторые звуки, концентрируя внимание на других. Обратите внимание — отчетливо, осознаваемо слышен обычно один инструмент, или вокал. Все прочее превращается в фон или единое созвучие. И на чем бы мы не концентрировались в композиции, увеличить число воспринимаемых основных звуков нам не под силу.

Как создается mp3

mp3_6_resize
Все эти данные, полученные при экспериментальных исследованиях, сведены воедино и представлены в виде идеальной модели человеческого слуха. Именно на нее ориентирован стандарт MP3.

Все, что человек однозначно не слышит — обрезается сразу. Дальнейшая обработка ухудшает звучание в соответствии с пониманием этой модели.

Благодаря большой проведённой работе современные психоакустические модели достаточно точно оценивают человеческий слух и не стоят на месте.

На деле, несмотря на заверения любителей музыки, музыкантов и аудиофилов, для среднестатистического, нетренированного слуха MP3 в максимальном качестве обладает практически предельными параметрами.

Исключения есть, их не может не быть. Но они не всегда легко заметны при слепом прослушивании. И следуют они уже не из механизмов работы слуха, а из алгоритмов обработки звуковой информации мозгом.

И здесь играют роль только личностные факторы. Всё это и объясняет, почему мы любим разные модели наушников и почему численные характеристики аудио не могут однозначно определить качество звука.

В MP3 умещается все: качество аналоговых записей

mp3_2_resize
Настойчивость аудиофилов, требующих FLAC, стоит просеивать через еще одно серьезное сито. Большая часть аналоговых записей не содержит достаточного количества информации для losseless-форматов.

Все компакт-диски записаны с частотой дискретизации 44,1 кГц и квантованием 16 бит. Откуда здесь возьмутся 192 кГц и 24/32 бита, которые используются при кодировании во FLAC? Их же нет, это пустышка!

Вы возразите, что для аналогового звука эти параметры выше… Но для аудиокассеты и магнитной ленты (если, конечно, это не японский мастер-тейп) характеристики AudioCD НЕДОСТИЖИМЫ. Для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно.

Поэтому нет смысла оцифровывать с бешеным качеством запись из доцифровой эпохи, в особенности сделанные на магнитных носителях. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

В MP3 умещается все: цифра

mp3_3_resize
Строго говоря, с большинством цифровых записей — та же самая картина. В 90-е годы и позднее появились дешёвые пластмассовые бумбоксы. Звукорежиссёрам пришлось заботиться о едином звучании на всех устройствах — динамический диапазон записей порезали до 10–12 бит.

Еще один момент. До недавнего времени никто не записывался на студии слишком в высоком качестве. Потому что одновременно работать с несколькими десятками аудиодорожек с высоким качеством записи сложно, а иногда просто недостаточно человеческих и технических ресурсов.

Если все это кажется неубедительным — посмотрите результаты любого слепого теста. Например, здесь. Можно распознать систему, можно распознать наушники. Но вот отличить качественный MP3 (CBR 320 kbps, Lame 3.93) от FLAC удается только самым прокаченным гурманам.

Давайте посчитаемся, супергерои. Кто из вас может отличить lossless от lossy, на каком материале, и на какой аудиосистеме?

©  iphones.ru