Инженеры из «Яндекс Музыки» научили «Балабобу» писать романтическую лирику

Создатели «Яндекс Музыка» научили языковая модель YaLM «Балабобу» писать романтические куплеты, сообщили информационной службе Хабра в пресс‑службе сервиса. Создатели проанализировали различные тексты и оказало что в поп‑музыку более 72% песен посвящены любви. На втором месте оказался шансон, а реже всего о светлом чувстве поют рэперы и рокеры — 27% и 28%.

d94357325b0a7f3cec1b6baf55ec4c7d.jpg

Анализ проводился по характерным словам: у поп-музыки это «винишко», «наболеть» и «по-английски», у рэперов — «дилер» и «поделом», а у исполнителей шансона — «девчоночка» и «черемуха». 

Кроме того, по результатам анализа любовная лирика оказалась чаще печальная: позитивных треков чуть больше 10%, что в пять раз меньше, чем меланхоличных. Самыми оптимистичными жанрами стали поп и рэп, а самыми пессимистичными стали инди и рок. В грустных песнях   по анализу часто встречались глаголы, которые прощают и отпускают, убивают и умирают, молчат и кричат. Что касается радостных песен, в них чаще танцуют, нравятся, улыбаются, манят, крадут (любовь, сердца, сны), сияют и целуются. 

Ну и самым частотным словом стало «любовь». Оно встречается практически в каждом втором из отобранных текстов. Далее за ним идут слова «знать», «хотеть», «глаза», «один», «любить», «сердце» и «ночь». И конечно же, в любовной лирике эти слова встречаются чаще, чем в других текстах.

Среди часто встречающихся растений характерно упоминание ромашек, роз, а из животных в лиричных треках чаще упоминаются мотыльки. Из еды в лирических текстах больше всего встречаются шоколад, кофе и вишня.

После изучения «Балабобой» нескольких тысяч треков о любви на «Яндекс Музыке», она сама научилась сочинять куплеты. Если ввести первую строчку «Балабоба» сам закончит четверостишие.

База русскоязычной любовной лирики для исследования была создана пользователями «Толоки». Пользователи изучили 20 тысяч треков, где выделили около 8,5 тысячи песен о любви. Потом аналитики проанализировали тексты и нашли самые характерные и нехарактерные слова: действия, предметы одежды, продукты, даже животных и растения, которые встречаются в треках.

© Habrahabr.ru