Девять избранных статей с конференции NeurIPS 2021. Часть 2

Мы продолжаем разбирать статьи с конференции NeurIPS 2021, крупнейшей конференции по машинному обучению. Первая часть разбора была посвящена около-рекомендательным статьям. Во второй части мы собрали работы, не объединенные общей тематикой: они просто показались нам интересными.

Из этой статьи вы узнаете:

  • Какие модели помогут оценить не только значение целевой переменной, но и вычислить доверительный интервал на него (читать).

  • Как модифицировать BERT, чтобы разделить музыкальный трек на отдельные дорожки, соответствующие разным музыкальным инструментам (читать).

  • Какая метрика позволит оценить качество сгенерированных машиной текстов (читать).

  • Как заставить робота исследовать новые стратегии поведения (читать).

Conformal Prediction using Conditional Histograms

ссылка 

Автор разбора: Коля Анохин, ведущий специалист по машинному обучению в ОК (@anokhinn)

В некоторых задачах важно уметь оценивать интервал, в котором находится целевая переменная Y для данных значений признаков X. Допустим, мы разрабатываем систему, которая анализирует резюме и предсказывает, какую зарплату стоит предложить соискателю. Рекрутеру будет удобнее, если система выдаст «зарплатную вилку», а не точечную оценку. Если предложить меньше нижней границы, кандидат даже не станет общаться. Верхняя граница позволяет понять, до какой зарплаты можно торговаться.

Формально требуется оценить интервал C (X), такой что

P(Y \in C(X)) \geq 1 - \alpha \qquad(1)

Эту задачу можно решить, заложив предположения о распределении P (Y | X) в модель. Когда такие предположения сделать не получается, на помощь приходит метод conformal prediction.

В статье применяется вариация split conformal prediction, в которой обучение состоит из трех шагов:

  1. Делим данные на две части: обучающую и калибровочную.

  2. На обучающей выборке тренируем базовый алгоритм, который может строить какие-то интервалы для Y.

  3. Используем калибровочную выборку, чтобы научиться преобразовывать эти интервалы так, чтобы новые интервалы удовлетворяли условию (1).

В качестве бейзлайна авторы рассматривают Conformalized Quantile Regression (CQR). В этом методе базовым алгоритмом служат две квантильные регресии: они предсказывают верхнюю и нижнюю границы интервала на Y. Интервал, определенный этими границами, не гарантирует выполнение условия (1), особенно когда используются сложные модели (нейросети). Поэтому проводится дополнительная калибровка: выучивается дельта, на которую нужно расширить базовый интервал, чтобы в среднем выполнялось условие (1).

59d32a232b1289fe4c80da5b905d30c4.png

В статье предлагается новый метод Conformal Histogram Regression (CHR). Множество возможных значений Y разбивается на последовательные интервалы i1, …iN. Базовый алгоритм обучается предсказывать вероятность P (Y ∈ ij | X) для каждого интервала — таким образом на выходе получается гистограмма вероятности Y для данного X. С помощью этой гистограммы можно вычислить минимальную последовательность интервалов, такую чтобы Y попало в один из них с вероятностью не меньше

© Habrahabr.ru