«Сочини весёлую музыку»: чат-бот GigaChat Сбера сможет генерировать уникальную музыку по текстовому запросу

Команда СберБанка скоро существенно расширит возможности фирменной генеративной нейросети GigaChat. Пользователи GigaChat смогут генерировать музыкальные треки по произвольным текстовым запросам.  Об этом рассказал вице-президент по цифровым поверхностям «Салют» Сбербанка Денис Филиппов в рамках международной конференции по искусственному интеллекту AI Journey 2023.

«Сочини весёлую музыку»: чат-бот GigaChat Сбера сможет генерировать уникальную музыку по текстовому запросуСгенерировано нейросетью Midjourney

Для генерации музыки человеку будет достаточно сформулировать задачу, например, «Сочини весёлую музыку в стиле кантри» или «Напиши трек для лаундж-зоны бизнес-центра». В ответ GigaChat будет выдавать аудиофайл с уникальной музыкальной композицией и нотную партитуру в формате MIDI, который понимает любая DAW (Digital Audio Workstation). 

Пользователь сможет прослушать и скачать получившийся трек, а MIDI-файл использовать в собственных творческих проектах. 

Генерация музыки в GigaChat возможна благодаря интеграции нейросетей CLaMP и SymFormer. Для обучения SymFormer использовались платформа ML Space на базе суперкомпьютера Christofari и датасет из более 200 тысяч композиций разных стилей: от классики до современной электронной музыки и рока.

Денис Филиппов рассказал:

Новые возможности GigaChat будут полезны не только музыкальным энтузиастам и представителям творческих профессий. Одним из сегментов целевой аудитории сервиса мы видим представителей среднего и малого предпринимательства. Благодаря GigaChat они смогут быстро, качественно и, что важно, абсолютно легально решать задачи бизнеса: создавать фоновое музыкальное сопровождение для кафе, салонов красоты и залов ожидания, генерировать треки для рекламных видеороликов и соцсетей.

©  iXBT