Курс по Machine Learning от Почты Mail.Ru

27 сентября начинается курс по машинному обучению от Почты Mail.Ru. Занятия будут проходить два раза в неделю в офисе Mail.Ru Group в течение трёх месяцев. Регистрация открыта для студентов московских ВУЗов.

В ходе курса специалисты Почты и Антиспама Mail.Ru расскажут об ML-технологиях, которые применяются для того, чтобы сделать Почту еще более удобным и современным продуктом. Под катом подробности о курсе: формат, программа, авторы и перспективы для выпускников.

571bd5aa583584828b07fd6f43b360bd.png

Формат


Курс состоит из 20 занятий: 18 лекций и 2 экзамена (промежуточный и финальный). Каждое занятие содержит теоретическую и практическую части; в ходе практической части слушатели разработают несколько классификаторов, основательно поработают с текстом и реализуют базовые алгоритмы, понимание которых необходимо в работе.

Также участников ждет 5 практических домашних заданий. По словам авторов, «сложность будет подобрана так, чтобы над задачей нужно было поломать голову, но не в ущерб учебе в университете».

Программа


  1. Регрессия от одной переменной и нескольких переменных. Переобучение и способы борьбы с ним.
  2. Логистическая регрессия. Бинарная и многоклассовая классификация. Классификатор kNN.
  3. Метод опорных векторов.
  4. Работа с текстом: препроцессинг и векторное представление, задачи классификации.
  5. Тематическое моделирование: pLSI, LDA.
  6. Векторное представление текста: word2vec, fastText.
  7. Алгоритмы понижения размерности: PCA, LSH.
  8. EM-алгоритм, k-means и s-means алгоритм.
  9. Иерархические алгоритмы кластеризации. Метрики оценки кластеризации.
  10. Деревья решений. Ансамбли деревьев: случайный лес.
  11. Градиентный бустинг над деревьями: xgboost.
  12. AB-тестирование.
  13. Интервальные оценки качества классификаторов в production.


Занятия будут проходить два раза в неделю (вторник, четверг) с 18:00 до 21:00 в офисе Mail.Ru Group с 27 сентября по 11 декабря.

Мы разработали этот курс, чтобы подробнее рассказать, как используем машинное обучение в реальных задачах. В отличие от большинства курсов по ML, делаем упор на практику, а не на академическую составляющую. Наша главная цель — чтобы после прохождения курса студенты могли решать типовые практические задачи.

Стажировка после обучения


Выпускникам будет предложена оплачиваемая стажировка в командах машинного обучения Почты и Антиспама, где методами ML решаются такие задачи, как фильтрация нежелательного трафика, определение взломов, отделение важных писем от неважных, классификация смысловой направленности писем и др. Видео о команде Почты.

Стажеры работают над боевыми задачами, их единственное отличие от опытных коллег — возможность выстроить гибкий график, работая 20 часов в неделю. На стажировку можно попасть только после завершения образовательных проектов компании Mail.Ru Group.

Как поступить на курс


Курс рассчитан на старшекурсников и аспирантов технических ВУЗов, обучающихся на математическом или физико-техническом направлении.

Чтобы попасть на курс, необходимо зарегистрироваться по ссылке до 10:00 (мск) 22 сентября и пройти онлайн-тестирование в любое время с 10:00 22 сентября по 10:00 24 сентября. Ссылка на тест придет на почту, указанную при регистрации, и будет доступна в течение двух суток. Занятия начнутся 27 сентября.

Необходимый минимум для поступления:

  • знания линейной алгебры и теории вероятностей;
  • умение программировать на Python;
  • знакомство с Numpy и Sklearn;
  • плюсом будет знание методов оптимизации.


Материалы для подготовки:

  1. книги: Зорич «Математический анализ», Ю.В. Прохоров, Л.С. Пономаренко «Лекции по теории вероятностей и математической статистике», Боровков А.А. «Теория вероятностей», Гмурман В.Е. «Теория вероятностей и математическая статистика»;
  2. курс лекций «Нейронные сети в ML» на обучающем канале Технострим: https://www.youtube.com/playlist? list=PLrCZzMib1e9oOGNLh6_d65HyfdqlJwTQP;
  3. полезная информация по Python: http://www.bafflednerd.com/learn-python-online/.


Первое занятие пройдет уже на следующей неделе. Регистрируйтесь на курс, проходите обучение и присоединяйтесь к ML-индустрии!

© Habrahabr.ru