Результаты AI-хакатона RAIF Hackathon 2018

fcbf185f7f50eb80e1172e67464cbb26.jpg

На днях прошёл финал хакатона для AI/ML-разработчиков — RAIF Hackathon, — участники которого решали задачи компаний-партнёров. Под катом наш фотоотчёт и небольшой рассказ о победивших проектах.
Прежде всего, от лица оргкомитета мероприятия благодарим всех участников хакатона за их труд и представленные решения и, конечно, за обратную связь! Её было много, с самого начала. Она была разной: иногда нам просто задавали каверзные вопросы, иногда выражали сомнение. Порой было много эмоций J, но мы крайне признательны участникам за то, что им было не всё равно. За то, что они не давали нам спуску и мотивировали быть лучше.

Мы со своей стороны старались учитывать поступающие просьбы — где-то не соглашались, а где-то шли навстречу. Так, например, мы сделали две волны для предоставления работ в номинациях от «Утконоса» и Росреестра.

Также многие жаловались на неудобство XML-таблиц, в виде которых были предоставлены данные Росреестра, поэтому мы сделали стартовое решение, в котором один из скриптов выполнял черновой парсинг этих таблиц.

7516fbdd6df3133ce33a6086e74a0dfa.jpg

А теперь о результатах. Мы получили 322 заявки на участие от разработчиков из разных городов России и произвели отбор проектов. 42 команды прошли в финал в номинации от НМЛК, 4 команды боролись в номинации от «Утконоса» и 5 команд — в номинации от Росреестра.

Финал — как это было


23 октября. Несмотря на раннее начало хакатона, к 8.30 утра подавляющее большинство участников уже не просто приехали, а давно сидели в ожидании старта соревнования.

459e08ff8c5cab09343ff70dbd8bb7d2.jpg

7dc3fed1caacc635cf4ca2a5a62f9d37.jpg

В 9 часов всем раздали флешки с дополнительными данными, и на следующие 3 часа 40 минут все погрузились в работу.

a29868a6f348610cba97bf06a82e987e.jpg

10a552ce3163b5ca678b90403ecd3958.jpg

Большинство выбрали места за столами, некоторые предпочли сесть на пуфики.

5153aa6c8c386533a387a01f53b7f754.jpg

781c48727c3215b3549a11b1b99cd42f.jpg

Любопытно, что не все команды, решавшие задачу Росреестра, взяли предоставленные данные: некоторые стали решать более абстрактную задачу, обратившись к данным сторонних компаний.

33d8dc10f78c1567754b9fd0ee9d2977.jpg

2d30d3511e3deedcd0fb686cd6aeca2f.jpg

0ab6067b15c1ffe9fdb986b2efcc619f.jpg

919aae8b130a7a009a83d1d5190775bb.jpg

Напомним, что на хакатоне было три задачи: одна от НЛМК — по ускорению производства стального проката, здесь применялась классическая регулярно обновляемая таблица лидеров; и две творческие задачи от «Утконоса» и Росреестра: анализ спроса на товары и прогноз кадастровой стоимости недвижимости соответственно. Здесь требовалось не просто предоставить решение, но и защитить свою работу перед жюри. Подробнее об условиях задач можно почитать здесь.

ef13f161cfc37fde0fd955c450c7630d.jpg

Когда закончилось выделенное на разработку время и участники пообедали, начался этап презентаций проектов по решению задач «Утконоса» и Росреестра. Каждой команде на защиту работ выделялось по 5 минут.

Свои решения задачи «Утконоса» предложили три команды:

28a94916f312c7589bd42dd725cb310a.jpg

4f02ab937f085eff5299038e72131502.jpg

d3513bc3f710a6cc66622d08ac83d70b.jpg

Задачу Росреестра решали пять команд:

8cfadd0c818286748d26ebcea797bb12.jpg

58458b9303c90761845543e1a6593bca.jpg

31dcb1e98d12e417abfa953179d193b2.jpg

5080f1535bbaef6931a91e4ad4fdb697.jpg

bbb8c7a1f4416aa099fc6c266cae33bf.jpg

d0cea06ffc6404224aba2dca376b221e.jpg

После всех презентаций жюри ушло на подумать.

4681129a6a7845837e8bace62fb05aad.jpg

2b91e8507d103fb73100dda44a2d6afe.jpg

И наконец, объявили победителей в каждой из трёх номинаций.

В номинации НЛМК победа была определена по абсолютному показателю — максимальной прогностической точности ML-модели. В результате упорной борьбы победу одержала команда Keksik.

11904a189227723539027afb2bee5513.jpg

«Утконос» отдал предпочтение решению команды с говорящим названием Help The Platypus. Ее участники сфокусировалась на анализе групп сопутствующих товаров и групп товаров-заменителей. Также была оценена экономическая эффективность решения.

44b08f8be8dd254e8c9cdc2e5db82e67.jpg

А Росреестру больше всего понравилось решение команды r_test. Ребята провели глубокий анализ внешних данных и использовали такие параметры, как расстояние до ближайшей ж/д станции, водоёма и до точек интереса (POI).

0f4492348fd1d8b011fbfaf3df0fdde3.jpg

45b37a3f91512cdac529cf49aeb13093.jpg

Ещё раз поздравляем всех участников и победителей!

dd96870503951fe9283dc9b315fdfca5.jpg

По завершении хакатона состоялась техническая секция, ведущим которой выступил Виктор Кантор, автор курса Data Mining in Action. Ученые, математики и эксперты Data Science ведущих российских компаний поделились опытом и новейшими кейсами в сфере ML/AI.

Константин Воронцов (МФТИ) рассказал о тематических векторных представлениях текстов, графов и транзакционных данных.

98ae04f00c16f30ea4c59d94026733fe.jpg

Эмели Драль (Mechanica.AI) выступила с докладом об искусственном интеллекте в сфере производства, что было особенно интересно после задачи от НЛМК по оптимизации производственных процессов в рамках хакатона.

848bc071ff9480c2d13631fecafd3cd9.jpg

ad30f9597edc3b930f8065876200c515.jpg

Николай Князев («Инфосистемы Джет») провел сравнение метрик бизнеса и машинного обучения. Выбор правильной метрики был одним из параметров, по которым определялся победитель в номинации «Утконос».

71d7d0ddff9ce0e2797e50af6ae05413.jpg

Алексей Драль (BigData Team) раскрыл тему массового обучения по Big Data.

ef7383ee21ab71e2dd5261c56695c2e8.jpg

Дмитрий Бугайченко (Одноклассники) познакомил присутствующих с построением витрины контента с помощью потокового анализа данных и обучения с подкреплением.

a5df6fa75232f17e308e1fa1292b3d67.jpg

Алексей Каткевич («Инфосистемы Джет») поделился с участниками, как правильно переносить ML-модели в продуктив,

3e579b1fb7b507f2206c47f09d195ec4.jpg

А Евгений Бурнаев (Сколтех) привел кейсы по обнаружению аномалий и прогнозу неисправностей на транспорте.

© Habrahabr.ru