Создан программный предсказатель навязчивых мелодий


Композиция Глена Миллера «In The Mood» показала рекордное значение по параметру неожиданных градиентов между местами, где мелодия меняет направление. Это один из трёх главных предсказателей в дереве принятия решений для навязчивой мелодии

Почему некоторые мелодии как будто застревают в голове? Эти прилипчивые песни словно обладают какими-то особенными свойствами, заставляя человека напевать или насвистывать их. В психологии они известны как навязчивые мелодии (в научной литературе — Involuntary Musical Imagery или INMI). По определению, такие мелодии непроизвольно и спонтанно повторяются в голове даже после воспроизведения.
Данный феномен довольно подробно изучен в научной литературе, в том числе сопутствующая феноменология, обстоятельства возникновения INMI и предпосылки возникновения INMI в индивидуальном мозге. В целом, учёные пришли к мнению, что INMI является довольно распространённым обыденным явлением, а различные ситуационные факторы могут являться триггерами для воспроизведения в виде INMI различных типов музыки.

Предыдущие исследования подтвердили несколько очевидных закономерностей. Например, что частота и узнаваемость песни увеличивают вероятность возникновения INMI, а самым распространённым триггером INMI является недавнее прослушивание мелодии.

Несмотря на длительный интерес к этой проблеме, ключевой вопрос по-прежнему остаётся в значительной степени непонятным. Почему некоторые песни чаще застревают в голове, а другие — реже? Этот вопрос особенно сложен, потому что на проявления INMI влияет ряд как интрамузыкальных факторов (характеристики мелодии, слова песни), так и ряд экстрамузыкальных, внешних факторов (контекст проявления INMI, предыдущие ассоциации с песней, индивидуальное понимание смысла и др.).

Непосредственно музыкальные характеристики INMI впервые изучила группа исследователей под руководством Финкеля в 2010 году, результаты опубликованы в работе «Involuntary musical imagery: Investigating musical features that
predict earworms»
. В этом и последующем исследовании 2012 года сравнивались 29 песен INMI и 29 песен, которые не относятся к классу навязчивых мелодий. Эти песни подвергли анализу в специальном программном обеспечении для музыкального анализа FANTASTIC (Feature ANalysis
Technology Accessing STatistics). Результат показал, что в навязчивых мелодиях обычно присутствуют ноты более длительной продолжительности и меньшие интервалы по высоте звука.

Исследователи Уильямсон и Мюлленсифен позже предположили, что такие характеристики навязчивых мелодий облегчают их напевание. Они также обратили внимание, что люди, которые чаще поют, одновременно испытывают более частые и продолжительные INMI.

Сейчас группа исследоваителей из Великобритании, Германии и Дании опубликовала новую научную работу, в которой расширяет исследование, проведённое предшественниками, используя бóльшую выборку респондентов (3000 человек) и бóльшее количество мелодий (200).

В первую очередь, респонденты заполнили опросник, в котором указали названия песен, которые они относят к типу навязчивых мелодий. Эти песни попросили отсортировать по степени навязчивости. По результатам опроса был составлен список самых навязчивых мелодий, для данной аудитории. Обращает на себя внимание трёхкратное упоминание в Топ-9 самых навязчивых мелодий сочинений интеллектуально одарённой певицы под сценическим псевдонимом Леди Гага.

1. «Bad Romance», Lady Gaga, 33 упоминания.
2. «Can«t Get You Out of My Head», Kylie Minogue 24 упоминания.
3. «Don«t Stop Believing», Journey 21 упоминание.
4. «Somebody That I Used to Know», Gotye 19 упоминаний.
5. «Moves Like Jagger», Maroon 5, 17 упоминаний.
6. «California Gurls», Katy Perry 15 упоминаний.
7. «Bohemian Rhapsody», Queen 14 упоминаний.
8. «Alejandro», Lady Gaga 12 упоминаний.
9. «Poker Face», Lady Gaga, 11 упоминаний.

Затем исследователи попытались определить интрамузыкальные особенности песен INMI. Мелодии в формате MIDI извлекли из музыкальной базы данных Geerdes MIDI со всеми характеристиками каждой из них. Всего в опроснике были упомянуты 101 песня INMI. Исследователи учитывали также, какой конкретно фрагмент песни чаще всего вспоминается участникам опроса. Соответственно, для анализа выбирали именно этот фрагмент MIDI. Если опрошенный не указал конкретного участка песни, то для исследования брали её припев, поскольку в предыдущих исследованиях выяснилось, что именно припев чаще всего встречается в INMI. Статистический анализ фрагментов провели с помощью того же программного обеспечения FANTASTIC.

Для сравнения музыкальных характеристик INMI по отношению к не-INMI использовали метод random forest («случайный лес») — алгоритм машинного обучения, заключающийся в использовании ансамбля решающих деревьев. Структура дерева принятия решений представляет собой «листья» и «ветки». На ребрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения целевой функции, а в остальных узлах — атрибуты, по которым различаются случаи.

Дерево принятия решений показало, что навязчивыми мелодиями с большей вероятностью становятся песни с одинаковым общим мелодическим рисунком для поп-музыки. На иллюстрации показаны примеры мелодий с наиболее высокими значениями переменной, которая соответствует общему мелодическому рисунку (B1 и B2), а также примеры мелодий с самым необычным мелодическим рисунком (A1 и A2).

185982226d464523a311f81757c2d4c2.png

Фактор общего мелодического рисунка — самый важный из 12-ти факторов, которые отличают навязчивую мелодию от обычной песни. Все остальные факторы и их важность указаны в таблице, составленной из дерева принятия решений.

fbf5de481cda4036a0b5d1e0ce224ae0.png

Фактически, только три первых фактора из этого списка удовлетворяют критериям важности, чтобы говорить об отличии песен INMI от обычных песен. Кроме общего мелодического рисунка, это относительно быстрый ритм и самые неожиданные градиенты между местами, где мелодия меняет направление (average gradients between melodic turning points), как показано на следующей иллюстрации в примерах A1 и A2.

78c26e3c1eaf4bcba60e556fb796024e.png

Учёные составили новое дерево принятия решений с учётом только этих трёх факторов. Данная модель позволяет предсказывать, станет ли конкретная мелодия навязчивой или нет, с надёжностью 62,5%.

0334c4818edc41f58c2e8f6daf205aa3.png
Дерево принятия решений с использованием трёх предсказателей

Дальнейшее совершенствование модели, вероятно, позволит автоматически генерировать мелодии, которые будут практически гарантированно принадлежать к классу INMI, то есть надёжно застревать в голове слушателя. Это позволит автоматически генерировать музыкальные хиты и миллионы просмотров на YouTube тем авторам, кто первым научится грамотно применять данную модель.

С другой стороны, обычные пользователи могут использовать данный предсказатель навязчивых мелодий в качестве своеобразного спам-фильтра, автоматически блокируя воспроизведение мелодий, которые потом трудно будет выбросить из головы.

Научная статья опубликована 3 ноября 2016 года в журнале Psychology of Aesthetics, Creativity and the Arts (doi: 10.1037/aca0000090).

© Geektimes