Яндекс опубликовал новый алгоритм градиентного бустинга.
Сегодня компания Яндекс представила новый алгоритм градиентного бустинга на деревьях решений CatBoost. Кроме того, опубликованы исходные коды и ряд утилит для обучения и визуализации результатов обучения под лицензией Apache 2.0.
Исходные коды можно найти по адресу: https://github.com/catboost
Градиентный бустинг активно используется в машинном обучении. Алгоритм CatBoost отличается поддержкой категориальных параметров из коробки, а на тестах (с открытыми датасетами и исходными текстами) демонстрирует лучшие результаты, чем основные конкуренты: LightGBM, XGBoost, H2O.
Ко всему прочему это неплохой шанс посмотреть на исходники из Яндекса: в репозитории можно найти CodeStyle.
>>> Подробности