Аудиофилькина грамота: несколько слов в защиту HI-RES
Среди людей с критическим взглядом на окружающий мир укоренился стереотип о том, что аудиоформаты высокого разрешения (с частотой дискретизации более 44,1 Гц и квантованием более 16 бит) в бытовой звуковоспроизводящей аппаратуре — это лишь маркетологическая уловка, которая создана для тех, кто не знает о порогах восприятия. Мол, там улучшения за пределами порогов человеческого восприятия.
Я долго склонялся к похожему мнению, пока не стал периодически отмечать то, что некоторые из хайрез записей мне субъективно (по необъяснимой причине) нравятся больше. Не могу сказать, что я с лёгкостью пройду слепой тест и с высокой точностью определить, где хайрез, а где mp3 с битрейтом 320 кбит/с. Но вслушиваясь в записи в формате AIFF с частотой дискретизации 192 кГц и разрядностью 32 бита, мне показалось, что я замечаю едва различимые улучшения в динамическом диапазоне и при воспроизведении низких.
Не очень доверяю своим ушам. Я засомневался в собственных выводах и решил раскопать что-нибудь по поводу теоретической возможности услышать эти различия.
К своему удивлению обнаружил не росказни маркетологов, а вполне себе авторитетные оценки специалистов AES (Audio Engineering society). Однозначный ответ мои поиски не дали, но я стал менее категорично относится к хайрезу.
Опираясь на личный опыт, я не раз писал, что Hi-res нужен только людям, которым недостаточно слушать, но нужно знать о том, что качество звука безупречное. Проанализировав выводы аудиоинженеров и специалистов по психоакустике, я понял, что теоретическая возможность услышать разницу все же есть.
Частота и другие параметры «разрешения»
Основным вопросом, который стоит перед исследователями в последние пару десятилетий: имеет ли смысл увеличивать частоту дискретизации записей и воспроизводящей аудиоаппаратуры? Вопрос ставился в связи с тем, что физиологический порог слышимости ограничен диапазоном от 16 Гц до 21 кГц.
По мнению одного из пионеров отечественной психоакустики, профессора петербургского университета, доктора технических наук, члена Координационного Совета по акустике РАН, председателя Санкт-Петербургского отдела AES Ирины Алдошиной, однозначного ответа на вопрос пока никто не дал.
Дело в том, что, несмотря на отсутствие доказательных результатов слепых тестов, где бы испытуемый однозначно определял хайрез, существует масса теоретических предпосылок считать, что высокое «разрешение» может влиять на субъективное восприятие.
Так профессор монреальского университета Макгилла В.Войчик писал о том, что одним из способов повышения реалистичности музыкального сигнала и создания эффекта «присутствия», повышения «прозрачности» является увеличение частоты дискретизации выше 44,1 кГц. Соответственно и расширения верхнего диапазона воспроизводимых частот за пределы 20 кГц. (прочитав это, я усомнился в его экспертном статусе, а зря)
Он также отмечал, что для создания реалистичного сигнала кроме частоты дискретизации необходимо увеличить «разрешающую способность воспроизводящих и (!)записывающих (!) систем во временной, пространственной и динамической областях. Такой вывод канадский профессор сделал на основании ежегодных докладов AES, а также опираясь на знания о сложности физиологии слуха и нейрофизиологии аудиального восприятия.
АЦП: интервал семплирования, филтры и «прозрачность»
Известно, что для превращения аналогового звукового сигнала в цифровой необходимо провести дискретизацию, квантование и кодирование. Эти процессы происходят при цифровой записи или при оцифровке аналогового материала. Для этого используется АЦП. Процесс такого преобразования проходит в соответствии с теоремой Котельникова-Шеннона-Найквиста.
В соответствии с этой же теоремой, точное восстановление исходного сигнала при обратном преобразовании возможно только когда частота дискретизации выше удвоенной максимальной частоты в спектре исходного сигнала.
Таким образом, казалось бы, что частоты дискретизации 44,1 кГц (СD DA формат) по идее должно хватать для точной передачи всего слышимого спектра т.е. fd > 2fв. Но не всё так просто, проблема таится в интервалах семплирования.
Эксперты AES пишут о том, что в момент семплирования сигнал должен быть постоянным и пропускаться через низкочастотный т.н. антиалайзинговый фильтр, который обрезает сигнал на частоте fd/2, чтобы предотвратить вероятное появление артефактов. Такие фильтры стоят во всех АЦП. Этот фильтр служит причиной дисперсии импульсных характеристик исходного сигнала, что происходит из-за неравномерности АЧ и AФ характеристик и фазовой нелинейности в полосе пропускания.
Результатом этого побочного действия фильтра становится временная дисперсия сигнала и присутствие в каждом семпле элементов информации от предыдущих. В связи с динамичностью и сложностью музыкального сигнала, эта дисперсия может оказать некоторое влияние на субъективное восприятие. Хотя специалисты отмечают, что для этого нужно быть очень внимательным и опытным слушателем с выдающимися «золотыми» ушами.
При преобразовании с частотой 44,1 используется интервал сэмплирования 22,7 мкс. Войчик, Алдошина и другие специалисты AES обращают внимание на проблемы временных характеристик формата. Динамические возможности трубы при исполнении форте позволяют достигать пиков 120–130 дБ в течение 10 мкс, цимбалы позволяют получить мгновенный подъём до 136 дБ за 7 мкс.
Соответственно, временные интервалы семплирования, которые используются при записи CD, очень далеки от динамических возможностей инструментов. У современных хайрез форматов эти интервалы короче (от 1 до 0,16 мкс) и поэтому на уровне динамики они способны точнее и реалистичнее передавать звук.
Также в качестве важной характеристики реалистичности («натуральности») звука при воспроизведении эксперты AES считают т.н. «прозрачность». Это субъективная тембральная особенность звучания присуща звуку, который по мнению многих специалистов ближе к естественному. Исследователи отмечают, что эта особенность также напрямую зависит от временных параметров записи, т.е. от интервала семплирования.
Ультразвук: нужен или нет?
Ученые и энтузиасты при проведении записей «живых» инструментов с использованием прецизионной аппаратуры начиная с 70-х годов стали отмечать присутствие в спектре этих инструментов ультразвуковых волн.
В качестве примера можно привести спектр трубы, где волны регистрируются составляющие с частотой 40 кГц и уровнем до 60 дБ, у скрипки и альта присутствуют ультразвуковые составляющие до 100 кГц, с уровнем до 85–90 дБ.
Несмотря на то, что человеческий слух не способен воспринимать волны с частотой выше 20 кГц (в редких случаях 22кГц — как правило, у детей), присутствие выраженных высокочастотных составляющих изменяет временную структуру сигнала.
Флетчер, Кузнецов и другие авторы, исследовавшие звуки живых инструментов, отмечали, что подобное временное влияние способно существенно отразиться на субъективном восприятии звука, несмотря на то, что сама частота не воспринимается на слух.
Такие сведения в теории отвечают на вопрос о целесообразности повышения частоты дискретизации. По крайней мере при записи воспроизведении живых акустических инструментов.
Сухой остаток
Несмотря на то, что слепые тесты пока не подтверждают существенных отличий восприятии обычных и хайрез-форматов, на теоретическом уровне они обладают более высокой верностью воспроизведения. Более того, интервалы семплирования, снижение уровня временной дисперсии, а также возможность воспроизведения ультразвуковых составляющих сигнала позволяют говорить о том, что разница между классическим CD DA и форматами высокого «разрешения» может быть заметна и существенна для субъективного восприятия.
Джинса
В нашем каталоге представлены мультирум системы, медиаплееры и другая аппаратура способная воспроизводить музыку в форматах высокого разрешения.