Алексей Зиновьев о BigData + ML на jug.msk.ru

12 июля 2018 года в офисе компании КРОК прошла встреча московского сообщества Java-разработчиков jug.msk.ru, докладчиком на которой был Алексей Зиновьев. Темами встречи были Big Data и машинное обучение (machine learning).

esdmsnrvurqj_d9f36yci_e9mdu.jpeg

О докладчике


В сферу интересов Алексея входит Big Data и machine learning (ML). Проводит тренинги и делает доклады про Apache Spark и Apache Ignite. У Apache Ignite является активным контрибьютором. В настоящее время работает в компании EPAM Systems.

Принимает участие в качестве докладчика как на конференциях, проводимых JUG.ru Group, так и на других. Доклады действительно разнообразны по тематике, оригинальны не только по содержимому, но даже по названиям.

У Алексея есть YouTube-канал, на котором есть видео его докладов и по интересующим его темам (ниже приведены только доклады Алексея, упорядоченные в хронологическом порядке):

  • «GDG Omsk» (DevFest 2012: видео)
  • «Выбор NoSQL базы данных для вашего проекта: Не в свои сани не садись» (HappyDev 2013: видео)
  • «История одного портирования» (ИТ-субботник 2013: видео)
  • «Приглашение на Codefest» (CodeFest 2013: видео)
  • «MyBatis & Hibernate, давайте жить дружно!» (CodeFest 2013: видео)
  • «Google Maps API с начала времен и до наших дней» (DevFest Omsk 2013: видео)
  • «Говнокод-шоу» (ИТ-субботник 2014: видео)
  • «Big data algorithms and data structures for large scale graphs» (DUMP-2014: видео)
  • «First Steps in Data Mining Kindergarten» (День экспертизы ТАМТЭК 2014: видео)
  • «Thorny path to the Large Scale Graph Processing» (Highload 2014: видео)
  • «New features in Java 8» (JavaDay Omsk 2014: видео)
  • «Java as a fundamental working tool of the Data Scientist» (Joker 2014: видео, презентация)
  • «Мама, я так хочу Hibernate для NoSQL» (JPoint 2015: видео, презентация)
  • «Python’s slippy path and Tao of thick Pandas: give my data, Rrrrr…» (PiterPy 2015: видео)
  • «BigData Training: Данила, BigData Tool Master, с похмелья злой» (HappyDev 2015: видео)
  • «Как укротить буйного в отделении: смирительные Java рубашки для MongoDB» (Joker 2015: видео, презентация)
  • «Есть ли жизнь для студента математика в ледяном мире Java» (Joker 2015, University Day: видео)
  • «Java in production for Data Mining Research projects» (JavaDayKiev 2015: видео)
  • «Java in production for Data Mining Research projects» (JET 2015: видео)
  • «Выбор языка запросов для извлечения фактов из вашего Dataset» (День экспертизы ТАМТЭК 2015: видео)
  • «Android Geo Apps В Советской России широта и долгота ищут ТЕБЯ!» (Mobius 2015: видео, презентация)
  • «Spark 2. Первая кровь» (IT Subbotnik 2016: видео)
  • «Hadoop Jungle» (IT Subbotnik 2016: видео)
  • «Джунгли Hadoop мир диких алгоритмов и ядовитых JVM» (JBreak 2016: видео)
  • «Что Spark грядущий нам готовит? (Новые фичи в Spark 2)» (Joker 2016: видео, презентация)
  • «Kafka льёт, а Spark разгребает! (при помощи Structured Streaming)» (JPoint 2017: видео)
  • «Apache Spark Training [Spark Core, Spark SQL, Tungsten]» (презентация)
  • «Тонкости машобуча вместе со Spark ML» (JPoint 2018: презентация, видео доступно пока только участникам конференции)


Прочие ссылки: твиттер, Хабр, технический блог, GitHub, Java & JVM langs (Scala, Clojure, Kotlin) (VK, Telegram), Big Data Russia (VK, Telegram).

Доступно также руководство Spark Book: репозиторий книги, репозиторий примеров на GitHub (не стесняйтесь ставить звёздочки) и книга на GitBook.

О докладе


Открытие встречи. Андрей Когунь представляет докладчика и напоминает о ближайших конференциях, которые будут проходить в Санкт-Петербурге: TechTrain 2018 (1–2 сентября) и Joker 2018 (19–20 октября).

9rmdjghlhumzvfvjdpmdy1zfems.jpeg

Первая часть встречи до перерыва была посвящена Apache Spark, показанные примеры написаны на Scala. В качестве набора данных была использована информация о пассажирах «Титаника». Рассказанное — расширенная и улучшенная версия доклада с JPoint 2018.

upzcqn37xvvjotgtlsujv4x2wig.jpeg

Вторая часть демонстрировала возможности Apache Ignite на том же наборе данных. Примеры для демонстрации написаны на Java. Учитывая авторство Алексея у значительной части Apache Ignite ML, его замечания, комментарии и ответы на вопросы были особенно ценны.

2utq9c30uwr6577i9vpmh0hs40s.jpeg

Удивительно подготовленная аудитория у прошедшей встречи — значительная часть слушателей использует Apache Ignite. Вопросы и ответы на них были интересны как докладчику, так и другим слушателям.

nmalg8lj2fluh0h0biwkyscwoyg.jpeg

Фотографии со встречи скоро появятся здесь. Видео будет доступно на YouTube (с анонсом в VK и Google+). Можно подписаться на рассылку с анонсами следующих встреч jug.msk.ru.

© Habrahabr.ru