Новый запуск курса Natural Language Processing

TL; DR: Этой весной сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Speech and SemanticsSpeech and Semantics

Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:

Это набор инструментов, но конечно мы рассмотрим и задачи — классификации текста, тэггирования (разметки последовательностей), генерации, включая и машинный перевод, и генерацию рассказов. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.

В этот раз будут обновленные семинары, надеюсь, что они будут более полезными для освоения практических навыков работы с инструментами.

В прошлый раз ввели дополнительную тему применения методов NLP в задачах разработки программного обеспечения (NLP4Code, AI4SE). Наверняка все слышали про ChatGPT, частично мы разберемся, как это устроено (наверняка никто за пределами OpenAI не знает).

Также в курсе традиционно будет два задания, одно про Word2Vec, и еще одно в виде соревнования наподобие Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.

Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект — это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут. Актуальные проекты можно посмотреть в списке проектов ODS.

Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.

В этом запуске все общение по курсу будет в группе в Telegram.

Лекции будут проходить по четвергам в 10:00 по Москве. Ссылки на занятия будут выкладываться в группе курса. Первое занятие — уже в следующий четверг, 9 февраля!

Если у вас не получается посещать лекции или семинары, не переживайте, записи и все материалы будут доступны на платформе курса. Надеюсь, я вас заинтересовал, так что еще раз ссылка на курс.

© Habrahabr.ru