Результаты AI-хакатона RAIF Hackathon 2018
На днях прошёл финал хакатона для AI/ML-разработчиков — RAIF Hackathon, — участники которого решали задачи компаний-партнёров. Под катом наш фотоотчёт и небольшой рассказ о победивших проектах.
Прежде всего, от лица оргкомитета мероприятия благодарим всех участников хакатона за их труд и представленные решения и, конечно, за обратную связь! Её было много, с самого начала. Она была разной: иногда нам просто задавали каверзные вопросы, иногда выражали сомнение. Порой было много эмоций J, но мы крайне признательны участникам за то, что им было не всё равно. За то, что они не давали нам спуску и мотивировали быть лучше.
Мы со своей стороны старались учитывать поступающие просьбы — где-то не соглашались, а где-то шли навстречу. Так, например, мы сделали две волны для предоставления работ в номинациях от «Утконоса» и Росреестра.
Также многие жаловались на неудобство XML-таблиц, в виде которых были предоставлены данные Росреестра, поэтому мы сделали стартовое решение, в котором один из скриптов выполнял черновой парсинг этих таблиц.
А теперь о результатах. Мы получили 322 заявки на участие от разработчиков из разных городов России и произвели отбор проектов. 42 команды прошли в финал в номинации от НМЛК, 4 команды боролись в номинации от «Утконоса» и 5 команд — в номинации от Росреестра.
Финал — как это было
23 октября. Несмотря на раннее начало хакатона, к 8.30 утра подавляющее большинство участников уже не просто приехали, а давно сидели в ожидании старта соревнования.
В 9 часов всем раздали флешки с дополнительными данными, и на следующие 3 часа 40 минут все погрузились в работу.
Большинство выбрали места за столами, некоторые предпочли сесть на пуфики.
Любопытно, что не все команды, решавшие задачу Росреестра, взяли предоставленные данные: некоторые стали решать более абстрактную задачу, обратившись к данным сторонних компаний.
Напомним, что на хакатоне было три задачи: одна от НЛМК — по ускорению производства стального проката, здесь применялась классическая регулярно обновляемая таблица лидеров; и две творческие задачи от «Утконоса» и Росреестра: анализ спроса на товары и прогноз кадастровой стоимости недвижимости соответственно. Здесь требовалось не просто предоставить решение, но и защитить свою работу перед жюри. Подробнее об условиях задач можно почитать здесь.
Когда закончилось выделенное на разработку время и участники пообедали, начался этап презентаций проектов по решению задач «Утконоса» и Росреестра. Каждой команде на защиту работ выделялось по 5 минут.
Свои решения задачи «Утконоса» предложили три команды:
Задачу Росреестра решали пять команд:
После всех презентаций жюри ушло на подумать.
И наконец, объявили победителей в каждой из трёх номинаций.
В номинации НЛМК победа была определена по абсолютному показателю — максимальной прогностической точности ML-модели. В результате упорной борьбы победу одержала команда Keksik.
«Утконос» отдал предпочтение решению команды с говорящим названием Help The Platypus. Ее участники сфокусировалась на анализе групп сопутствующих товаров и групп товаров-заменителей. Также была оценена экономическая эффективность решения.
А Росреестру больше всего понравилось решение команды r_test. Ребята провели глубокий анализ внешних данных и использовали такие параметры, как расстояние до ближайшей ж/д станции, водоёма и до точек интереса (POI).
Ещё раз поздравляем всех участников и победителей!
По завершении хакатона состоялась техническая секция, ведущим которой выступил Виктор Кантор, автор курса Data Mining in Action. Ученые, математики и эксперты Data Science ведущих российских компаний поделились опытом и новейшими кейсами в сфере ML/AI.
Константин Воронцов (МФТИ) рассказал о тематических векторных представлениях текстов, графов и транзакционных данных.
Эмели Драль (Mechanica.AI) выступила с докладом об искусственном интеллекте в сфере производства, что было особенно интересно после задачи от НЛМК по оптимизации производственных процессов в рамках хакатона.
Николай Князев («Инфосистемы Джет») провел сравнение метрик бизнеса и машинного обучения. Выбор правильной метрики был одним из параметров, по которым определялся победитель в номинации «Утконос».
Алексей Драль (BigData Team) раскрыл тему массового обучения по Big Data.
Дмитрий Бугайченко (Одноклассники) познакомил присутствующих с построением витрины контента с помощью потокового анализа данных и обучения с подкреплением.
Алексей Каткевич («Инфосистемы Джет») поделился с участниками, как правильно переносить ML-модели в продуктив,
А Евгений Бурнаев (Сколтех) привел кейсы по обнаружению аномалий и прогнозу неисправностей на транспорте.