Дипфейки, реверс-инжиниринг, муз. программирование и аудиоинтерфейсы за рулем — что почитать аудиоману

Это подборка материалов по теме программирования, компьютерного железа и ПО для автомобильных аудиоинтерфейсов. Всех заинтересовавшихся темой, приглашаем под кат.

4bupyxd_vpeivv4j8-os5t06xzc.jpeg
Фото Jefferson Santos / Unsplash

Как «программируют» музыку. Прежде чем взять и влиться в тему музыкального программирования, стоит осмотреться. Предлагаем вашему вниманию компактный обзор специализированных инструментов. Первый из них называется Csound — наследник семейства MUSIC-N, прямиком из Bell Labs 1960-х годов. В середине 80-х его доработал специалист из MIT, а теперь на Csound «играет» легендарный BT. Расскажем о его особенностях, приведем примеры использования, плюс — обсудим SuperCollider и Pure Data, принадлежащих все к тому же языковому семейству MUSIC-N.

Кто занимается дипфейк-аудио. Обсуждаем Neural Voice Puppetry — разработку сотрудников Мюнхенского технического университета и Института информатики Общества Макса Планка. По записи голоса и фотографии она синтезирует речь и моделирует мимику. Аналогичное решение сингапурских коллег может нативно «прикрутить» реплики одного человека к видеозаписи с совершенно другим лицом. Рассказываем, где применяют такие наработки (конечно, не там, где вы подумали) и вспоминаем другие проекты по теме быстрого «редактирования» аудио.

Реверс-инжиниринг-пост. Вслед за материалами о Sound Blaster 1.0 и Innovation SSI-2001 — наш свежий разбор того, что удалось выяснить энтузиастам об усилителе в Nintendo Game Boy Color.

u52rfexxpxcxzknukv4wvlp7jky.jpeg

В статье мы напоминаем, чем известна эта консоль, показываем структуру чипа (схема выше), объясняем особенности транзисторов, использованных резисторов и конденсаторов, а еще — даем компактный обзор других реверс-инжиниринг-проектов по теме легендарного Game Boy.

Если дэт-метал, то «нейросетевой». Заменят ли алгоритмы музыкантов? Это вопрос, к которому мы возвращаемся в очередной раз. Обсуждаем возможности разработок по теме — синтезатор NSynth Super, систему ИИ Dadabots, тематический стартап Jukedeck и инструментарий OpenAI.

Аудиобиблиотеки для машинного обучения. Чтобы реализовать что-то похожее на вышеописанные проекты, потребуется собрать солидный массив записей — например, для обучения собственных «нейронок». Рассказываем про четыре библиотеки, распространяющих аудиоконтент по лицензии Creative Commons. Это значит, что его можно использовать даже в коммерческих проектах.

Не отвлекаться за рулем. В одном из недавних материалов мы разобрались, как и почему автомобильные инфотейнмент-системы провоцируют ДТП. На этот раз обсуждаем альтернативу в виде голосовых ассистентов. Говорим о примерах их внедрения на стороне автопроизводителей, исследованиях и потенциальных рисках, от которых будет не так и просто избавиться.

wv3gx0ys3rppegkkhsrfzjhfuw0.jpeg
Фото Miguel Ángel Hernández / Unsplash

Так можно было. Собрали здесь весьма необычные, но эффективные способы применения аудиотехнологий: от безумных «наушников» с ароматическим эффектом и творческих вариантов использования устройств с «джеком» до акустической левитации и роли звука в медицине.

Начать неделю правильно. Бонус-пост из прошлого. В нем мы обсудили аудиогаджеты, призванные защитить от шума и внешних раздражителей. Тогда речь шла об офисной работе, но многие решения могут быть применимы и в новых условиях. Например, специальные шлемы и маски. Что касается наушников — они остаются актуальными в любые времена и незаменимыми на «удаленке».


Дополнительные материалы:

1osf72wkwrjhzpl2bwl5hcmwnbq.pngДомашнее аудио — от песенных вечеров до механических проигрывателей
1osf72wkwrjhzpl2bwl5hcmwnbq.pngКак домашнее аудио становилось действительно массовым
1osf72wkwrjhzpl2bwl5hcmwnbq.pngКак развивалось домашнее аудио: эра винила

© Habrahabr.ru