Сколько, реально, lossless треков в Яндекс Музыке

Хабр, привет!

Я Беслан, IT-шник по любви, искренне увлеченный этим всем.

Люблю ковыряться в коде, писать код, прошивать всё что можно, поднимать инфру на линуксах, собирать роботов, datascience, нейронки, LLM-ки, и много ещё всего такого, вы поняли.

Помимо всего этого, я очень люблю хороший звук.
Не могу назвать себя прям аудиофилом, ибо провода никогда не прогревал, и усилок на пирамидки не ставил.
Но всё равно люблю хороший звук:

  • Слушаю дома lossless музыку на напольных колонках и через хороший усилок (соседи иногда приходят)

  • Слушаю дома старый добрый винил через этот же усилок и колонки (знали бы, как звучит Юрий Антонов на виниле)

  • Ношу android телефон с USB ЦАП-ом как второй, чтобы слушать через него то, что скачал, как в старые добрые времена (неудобно жесть)

И когда вчера Яндекс, довольно тихо, выкатил lossless музыку, я прям заинтересовался.

Конечно же, я сразу обновил приложения, поставил лучшее качество музыки, и послушал — оно прям зазвучало!
Не, правда. Я пробовал Tidal через наушники, и Яндекс.Музыка проигрывала ему тогда по качеству звука.
Сейчас же я прям стал слышать СИЛЬНО больше деталей, а это даже через iPhone по bluetooth, с его кодеком AAC, который задушен на битрейт 320 килобит (а в реальности мои наушники могут только 256).
С Android телефоном разница так вообще улетела в космос, между тем что было, и тем, что стало — спасибо кодеку LDAC от Sony, который тащит 990 килобит и позиционируется как кодек без сжатия, но в реальности «почти без сжатия, но с сжатием».

Короче, стало сильно лучше, я обрадовался, что можно не носить теперь с собой здоровенный ЦАП и не хранить на флешке 100+ Gb всяких дискографий, а слушать прямо из стриминга и по воздуху — это же реально удобно, ибо рекомендации у Яндекса просто лучшие, и разнообразие решает.

Но вот один вопрос не давал мне покоя — какое реальное качество у треков, и сколько их каких.

В своем анонсе ребята писали, что добавили «flac, и другие высококачественные форматы» — вот эти «и другие» мне и захотелось посчитать.

Само приложение Я.Музыки не пишет ни битрейт, ни частоту дискретизации, ни кодек, ни даже просто «качество».

Штош, раз не пишет, мы попробуем узнать сами…

Сначала нужно выставить в приложении Я.Музыки максимальное качество, и скачать весь плейлист с лайками — у меня это чуть больше 1.5к треков.
Будем считать, что мои треки, это репрезентативная выборка, отражающая генеральную совокупность.

Далее, чтобы узнать качество, мы должны вспомнить, что каждое приложение хранит локально какие-то свои данные.
И если на телефоне есть права суперпользователя, эти данные можно посмотреть.

Благо, на моей кастомной прошивке android телефона права суперпользователя уже были встроены в ядро, и оставалось поставить только менеджер для управления этими правами.

Сказано — сделано, накатил KernelSU, проверил в Termux что всё работает.

Дальше, нам нужно поковыряться в данных, которые хранит Я.Музыка, и найти там какую-то базу, в которой есть табличка с треками, которые я скачал, и информацией о них.

Можно ковыряться руками, но это не очень удобно — давайте возьмем приложение MyAndroidTools. Хоть оно и не обновлялось 5 лет, но прекрасно работает и сейчас.
Для чего оно изначально создавалось, это отдельная история, но нас интересует та его часть, которая позволяет просматривать базы данных приложений, ей и воспользуемся.

Открываем MyAndroidTools, находим Яндекс Музыку (ту, которая именно android приложение, а не сайт, отображаемый через webview), проваливаемся в неё, смотрим базы.

151e50a53845beb7b10a90e3fd83c947.jpg

Хихикаем с базы chunk_norris, идём дальше)))

Скажу честно, я просто потыкал все подряд, и нашел нужное — информация о моих треках живет в базе UserDb_999999999, в табличке tracks_cache (ID пользователя я заменил, у вас будет свой).

3f44a19da3d52626085d9ba6ed0dabc4.jpg

Далее, нам нужно утащить эту базу на десктоп, чтобы её там покрутить.
Заходим в Termux прямо на телефоне, логинимся суперпользователем через sudo su, и копируем базу из папки приложения Я.Музыки в пользовательское пространство, например, на внутренний накопитель:
cp /data/data/ru.yandex.music/databases/userDb_999999999 /storage/XXY9-A77B/
(ID накопителя тоже радномный, свой посмотрите сами).

Потом, значит, копируем этот файл на компьютер. Можно просто по проводу, но я сделал через adb по wifi:
adb pull /storage/XXY9-A77B/userDb_999999999 /Users/windoozatnick/Desktop/

Теперь пора открыть эту базу, и начать писать к ней SQL запросы.

Ставим DBeaver, если у вас еще нет, создаем новое подключение, выбираем SQLite, выбираем нужны файл — всё готово, вы прекрасны.

Видим базу, видим таблички, пробуем выполнить SELECT * FROM tracks_cache — оно работает.

fbe92d1ab42a2e2544d089481f775fd0.png

Штош, пора писать запросы.

Нас интересуют следующие столбцы:

  • realQuality — столбец, в котором Яндекс пишет то, как они для себя определяют качество, я так понимаю

  • codec — собственно, кодек, в котором закодирован трек

  • bitrate — битрейт трека

Но, со столбцом bitrate есть прикол — для flac треков там указан нулевой bitrate. Почему так сделано, я не знаю, но давайте это исправим, и решим так — если битрейт 0, то мы будем считать, что он равен 1000 (средний битрейт для flac файлов).

Проверяем первым запросом, что 0 битрейт только у flac файлов — да, это так.

d6aa82687b6ecee803260bfa3dda53e6.png

Далее, делаем первый взгляд сверху, и смотрим, сколько треков в каждом из realQuality

8d96ea1cf04f9e16a40c52aec9e9e0cf.png

Если перевести realQuality в проценты, то будет так:
Lossless — 62%
High — 35%
Normal — 3%

Окей, мы поняли разбивку по ярлычкам Яндекса, теперь давайте посмотрим, что по кодекам

98efdc3b252d74ce5d7acbed7893763d.png

По кодекам оно так:
aac — 71%
flac — 27%
mp3 — 2%

Ну и теперь самое интересное — давайте посмотрим по битрейтам

5554c5997a6bb88bb27bc8e328f22ca8.png

По битрейтам расклад такой:
256 — 68%
1000 — 27%
320 — 2%
128 — 1.6%
192 — 1.4%

Видим, что больше половины треков в битрейте 256 — будто бы, звучит не очень.
Давайте проверим комбинации кодек + битрейт, и после я расскажу, зачем

3aa721f236910178f0737d69df759095.png

Видим следующее:
aac + 256 — 68%
flac + 1000 — 27%
mp3 + 320 — 2%
aac + 128 — 1.6%
aac + 192 — 1.4%

Видим, что большинство треков выложены в связке AAC + 256, и это хорошо, давайте расскажу, почему.

AAC позиционируется как «психоакустический кодек», то есть, как любой кодек с потерями, он откидывает часть музыкального потока, но откидывает именно то, что либо не улавливается человеческим ухом, либо улавливается слабо.

Говоря коротко, AAC выкинет то, что и так было сложно услышать.

В некоторых сравнениях кодеков утверждается, что AAC на битрейте 256 звучит не хуже, чем например flac через aptxHD на битрейте 512 (как ловко я сравнил кодек файла с bluetooth кодеком, а!).

Но тут пусть придут «настоящие аудиофилы», и напишут, почему все кодеки плохие, и почему нужно слушать по прогретому проводу через ламповый усилок.

Дальше давайте посмотрим еще комбинацию realQuality c bitrate

0a3530350fd5afafce8b8f27e706ad5e.png

И комбинацию всех трех столбцов

bb84d70d8b9dac78e074cb5b148ad8ed.png

Переводить в проценты мне лень, извинити))
Если хотить переводить сами, то 100% это 1631

Вывод

Яндекс — большие молодцы.
Чисто на слух — это стало звучать СИЛЬНО лучше, особенно через LDAC.
Цифры говорят нам, что битрейты не самые максимальные, но кодек выбран удачно, и звучит всё хорошо.
Официально заявляю, что уберу в тумбочку USB ЦАП, и буду слушать Яндекс Музыку в качестве.

Если хотите, чтобы я проделал такое с другими стримингами, пишите.
Думаю, такое возможно проделать с СберЗвуком, у них тоже заявлен hi-fi.
В теории, можно и с Tidal, но с ними менее интересно — у них и так написано, какой битрейт/кодек у какого трека (да и у них нет моей музыки, а у Яндекса есть).

Ребята из Яндекс Музыки — люблю вас, спасибо!
Надеюсь, вы не сильно обижаетесь, что я поковырялся в своих локальных данных))

© Habrahabr.ru