Что нам стоит карьеру в Machine Learning построить: профессии, возможности и советы для начинающих специалистов

Привет, Хабр! Меня зовут Виктор Кантор, я директор центра Big Data МТС. В этой статье расскажу о треках и профессиях в ML. Дам общие рекомендации по развитию. Считайте, что эта статья — базовая инструкция, дающая понимание, как в этой сфере карьерно можно жить и профессионально развиваться.

Статья достаточно большая, но структура у неё не особо сложная. Так, сначала поговорим о карьерных треках в ML, после этого дам некоторые рекомендации и в самом конце поделюсь личным опытом с выводами. Подробности — под катом.

Этот материал — мой переработанный доклад с конференции True Tech Day 2.0. Записи уже сейчас можно посмотреть на truetechday.ru, а скоро мы продублируем их на наш YouTube.

c1d5777eb34571d7a0ec7795328d0707.jpg

Обзор карьерных треков

Думаю, многие на Хабре играли в RPG. В нашей профессии так же, как и там, нужно выбрать класс своего персонажа — воина, мага, авантюриста и т. п.

b6f5a103d65b7fe704a086f434e2e45a.png

В machine learning тоже придётся выбирать — будете ли вы индустриальным экспертом, исследователем или менеджером. Сейчас сфокусируемся на первых двух «классах». Не потому, что третий чем-то хуже. Всё дело в том, что про управленцев можно отдельно ещё несколько статей написать.

Индустриальные эксперты

2a7145720f700353dd4ff6a32cb1a860.png

Эта категория представлена в основном дата-сайентистами, дата-аналитиками, дата- и ML-инженерами. Понятно, что я имею в виду не чисто ML, а ML в обобщённом виде и то, что рядом. Дата-инженер может вообще никакие модельки никогда не строить, но в то же время иметь отношение к машинному обучению. Всего 14 лет назад вообще не существовало такой узкой специализации. Тогда можно было устроиться лишь разработчиком, который умеет в machine learning.

Аналитики были всегда, они назывались по-разному. А потом появилась профессия Data Scientist и специалисты с более узким образованием и подготовкой. В какой-то момент начался холивар, нужны ли вообще дата-инженеры, требуется ли дальнейшее разделение или Data Scientist сам себе данные готовит. В результате стали появляться дополнительные профессии.

Сейчас вот такие позиции есть почти в каждой компании, давайте их разберём.

Data scientist

635218b6bcc25b7a28f68802890467d9.png

Data scientist — специалист, который строит модели. Делается это не просто так, а с пониманием того, что нужно бизнесу, как модель в нём будет использоваться, как встроится в процессы до момента, когда эта уже история уйдёт в продакшн.

Что касается карьерного трека, он везде похожий: начинаем с джунов, затем мидл, сеньор, потом лид. Что интересно, лидом можно стать, минуя стадию сеньора, поскольку это более управляющая роль. Ещё есть вариант продвинуться и стать лидом лидов.

Если говорить про основные навыки, то нужен скилл разработки. Требуется знание математики и машинного обучения. Что касается стека, то сейчас всё практически в ML делается на Python, если только вам не нужно быстродействие какое-то там нереальное, тогда помогут «плюсы». В некоторых местах ещё остались нотки языка R, но это прям совсем очень выборочно и встречается не так часто.

Data Analyst

3c98154ed5d677eb4565c579d24f4ae9.png

Представителям этой профессии несколько проще. Дело в том, что вам необязательно быть мастером построения ML-моделей, хотя строить их всё же придётся. Но в основном здесь фокус на том, чтобы данные по-разному «покрутить», сгенерировать разные графики, диаграммы, срезы. Также предстоит создавать запросы, т. е. именно смотреть в данные и визуализировать. И карьерный трек похож на предыдущий.

Data Engineer

c9b410879d24720a034b09bbd5c79472.png

Представители этой профессии — люди, отвечающие за то, чтобы данные правильно собирались, перекладывались, форматировались в нужные таблички, над которыми уже работают дата-аналитики и дата-сайентисты. Стоит отметить, что здесь много интересных вызовов.

Например, когда вы начинаете думать ещё и о том, как вообще валидировать качество данных, продумать таблицы, чтобы они были максимально переиспользованы дата-сайентистами, то тут уже начинается инженерное творчество.

Machine Learning Engineer

04436b8a27264c1955a7e2d519ef5b44.png

ML-инженер — по сути специалист, который стремится «докатить» в продакшн в хорошем рабочем виде масштабируемую ML-модель. Подобная необходимость возникает только в компаниях, где есть какой-то суровый продакшн.

Data scientist обычно разбирается в математике, но не всегда может написать нормальный код. А вот ML-инженер, по крайней мере в российских компаниях, ближе к разработчикам. Естественно, в этом случае ML знать нужно обязательно.

Бывает, что дата сайентисты делают клёвые модели, которые потом нужно выкатить в продакшн, а специалист сортирует товары не по релевантности, а по ID. В итоге рекомендательная система не работает. Это лишь один пример, на самом деле их много. Чтобы действительно успешно катить ML-алгоритмы в продакшн, нужно разбираться в ML.

Исследователи (ML-research)

f4b2a4eca805cb5c6c0d740ea30c17f3.png

Есть ещё и научная деятельность, где как раз и нужен ML-research. И здесь можно выделить две большие ветки: академическая карьера и карьера в R&D-отделах компаний.

f231f87281a713b98c57cfa127554af9.png

В первом случае путь специалиста таков: сначала идёте аспирантом в какой-то вуз, после этого продвигаетесь по стандартным уровням. Есть такая западная классификация: сначала постдок, потом ассистент-профессор, потом ассошиейт-профессор, просто профессор и так далее.

В России ещё проще. Вы можете, в принципе, преподавать на уровне профессора, даже не обладая формальным набором всех научных «регалий». Просто потому, что область относительно новая. Мне кажется, что в AI построить академическую карьеру намного проще, чем в других направлениях.

Карьера в R&D отделах

3e748cfb156724b1127e0dfed5a4f301.png

Карьерный путь похож на все остальные направления: джун, мидл, сеньор и другие позиции. Всё так, но ваше основное занятие — исследования. Вы публикуете статьи, получаете за это деньги. Замечательная работа.

Например, потому что раньше многие не хотели в науку из-за уровня зарплат. А сейчас у учёного появилась возможность пойти в большую компанию. В МТС, например, есть замечательный МТС AI, где кто-то занимается наукой, кто-то ресёрчем. Есть и специалисты, которые пишут или читают публикации.

Кроме того, у нас в Big Data МТС есть те, кто регулярно публикует научные статьи, и эта деятельность поощряется. Сейчас вполне можно вести научную деятельность, не бедствовать, кормить семью, чувствовать себя хорошо и понимать, что занимаешься любимым делом.

Самое прекрасное для нас — если вы получили хорошее математическое или физмат-образование, уже можете работать по специальности. А ведь всего пару десятков лет назад люди, отучившись в институте, шли в экономисты, банкиры и другие сферы. Так что сейчас фактически золотое время.

Рекомендации по развитию

Что можно посоветовать? Здесь надо выделить две части. Первая — когда мы только приходим в какую-то область и начинаем учиться. В обучении тоже два подхода.

Один из них — поступить в профильный вуз.

8944c3b8f1a170eb4da287c461136ac1.png

Другой — обратить внимание на различные кафедры компаний, открывшиеся в магистратурах. Здесь хорошая новость: в магистратуру в российских вузах поступить гораздо легче, чем на бакалавриат. Почему? В первом случае желающих чуточку меньше. Мой совет: оцените, в каких вузах, включая МФТИ, Высшую школу экономики, ИТМО или где-то ещё, хотите учиться. Есть и кафедры компаний, которые занимаются AI. Поэтому выбрать просто.

Теперь вторая часть. У многих бизнесов есть свои образовательные проекты. У МТС, например, школа МТС.Тета, а она предлагает отдельный трек школы дата-аналитиков. И там как раз обучают работать с данными, строить модели, data science и т. п. Плюс в том, что здесь вы будете выполнять приближенные к реальности задачи.

eb9d96af96bdd9538b58cf2d39d92765.png

Выше показан скриншот задачи, которую мы даём нашим студентам на курсе рекомендательных систем в ИТМО. Они делают поиск по кинокартинам, основа которого — текстовое описание фильма.

dcc2542195b23d9361340dcaa5b86478.png

Ещё один пример — выше, и всё это реализовано силами самих учащихся. Наши учащиеся впервые видят рекомендательные системы, берутся изучать их, и уже через несколько недель обучения у них получается реализовать проекты, подобные тем, что я привёл выше.

Никоим образом не хочу сказать, что можно стать дата-сайентистом за три месяца, как нам сейчас говорит реклама в интернете, но базовые навыки и знания вы получаете быстро.

07a483530c2af96a619a2e4bf9912d12.png

Также стоит помнить, что большие компании часто вкладываются в развитие open source. У нас в МТС тоже есть открытые проекты. Пример — библиотека для рекомендательных систем.

Крупный бизнес этим занимается, чтобы понижать порог входа в область для желающих получить новую профессию. Перед тем, как принять решение, рекомендую поработать в определённом направлении в ML, посмотреть, какие компании предоставляют библиотеки, протестировать и попробовать. Заодно, если придёте на собеседование, будет о чём поговорить дополнительно с интервьюером, обсудив open-source-проекты компании.

Переходы между уровнями

В этом разделе поговорим о профессиональном пути и переходе с уровня на уровень — от джуна к мидлу, затем сеньору и т. д.

ac4ad1374625134136e7790dba45ec80.png

С чего всё начинается? С позиции мидла, куда попасть, в общем-то, можно без особых проблем. А потом? Сложность в том, что отличается сложность перехода.

3bf785225a516ae65bba75b703d0d0bc.png

Переход с абстрактного джуна на мидла — быстрый и естественный. У кого-то этот этап занимает три месяца, у кого-то год, но в целом обычно всё у всех получается.

А вот перейти из мидла в сеньоры гораздо сложнее. Многие разработчики жалуются, что остаются вечными мидлами. Одна из причин — убеждение, что переход занимает около двух лет. Я не знаю, кто и почему решил, что срок именно такой, но подобное убеждение встречается часто.

7baa8981a941453b7bf034d3b925b5ac.png

Наконец, этап, который не для всех, — из сеньора в лиды. Почему он не для всех? Головная боль, связанная с руководством другими людьми, нужна далеко не всем. И этот переход вовсе не обязателен. Ведь можно развиваться как специалист, эксперт, быть крутым сеньором, и это тоже хорошо.

ddc0c78f723c532031c5a1631efcd662.png

Переход из обычных лидов в лида лидов вообще лучше не реализовывать. Дело в том, что в этом случае объём различных проблем вырастает не то что на порядок, а сразу на два. Я помню, когда мы с товарищами впервые на позиции лидов попали. Мы уже буквально через месяц поняли, что здесь что-то не так.

Дело в том, что в команде был очень опытный коллега. Он руководил раньше крупным отделом аналитики в банке. Ему предложили переход в лиды, но он отказался, сообщив, что «уже попробовал и больше не хочется».

Мы удивлялись такому решению, а через несколько месяцев всё поняли. Но поделать было ничего нельзя, так что мы приступили к новым обязанностям.

b608f173bf24490e7c23f68b6ae6dfc6.png

А дальше? После лида лидов можно стать топ-менеджером, что, честно говоря, вообще неповторяемая история, поскольку на рынке не так много позиций такого класса. Это учитывая, что мы берём не всех «больших начальников», а только AI-отрасль. Здесь уже играет роль лишь терпение и удача.

Советы по переходу

Сначала поговорим о профессиональном развитии и карьере для специалиста, который занимается корпоративными задачами. А затем обсудим, что нужно для человека, решившего посвятить себя научно-исследовательскому пути.

Карьерный путь в компании

be10c23eda77038f753441435063ee46.png

Начнём с первого этапа — перехода от джуна к мидлу. Здесь главное — улучшение технических навыков и повышение надёжности работы. Кроме того, советую активно и проактивно участвовать в проектах, проявлять инициативу.

Всё потому, что мидл, в отличие от джуна, более самостоятельный и реже ошибается. Что касается снижения количества ошибок, то это становится возможным только после углубления навыков и наработки опыта.

Важен и пункт про получение обратной связи. В компании полезно спрашивать у руководства о качестве своей работы — что хорошо, что не очень, где и что нужно улучшить. Просто слухи собирать и сплетни не надо.

Интересный момент про менторство и наставничество. Отмечу, что он актуален для всех переходов, но в разных качествах. Ментором может быть вовсе не ваш руководитель или тот сотрудник, которого к вам приставили помогать, но и любой коллега. Скажу больше: нужно искать, откуда получать знания.

ee4ea943a27a0e1a572a193963555284.png

Что касается перехода из мидла в сеньоры, то здесь много пунктов. Но главное — это помощь младшим коллегам. Мидл — это про лидерство и наставничество.

Также нужно уже с бизнесом беседовать, проявлять инициативу. И заметьте: сначала вы начинаете соответствовать уровню, а потом делаете переход. Очень редко бывает так, что вас повысили, и нужно потом «дотягивать». Обычно специалисты сначала получают новые навыки и опыт, а потом уже это формально закрепляется.

Ещё скажу про вклад в бизнес. К сожалению, мы не всегда выбираем задачи для реализации. Здесь нужно помнить, что сотрудник, который решил важную проблему компании, получил, как правило, больше ценных навыков и стал еще больше интересен бизнесу. Поэтому, если мы говорим про карьеру, корпоративную или научную, стоит пытаться попадать в те проекты, которые важны для компании. Просто отсидеться — плохая стратегия в плане роста.

80a9f9c4ab5431229d971465dc181942.png

Весьма сложный переход в лиды. Требуется организовывать людей вокруг себя, подбивать их на какие-то инициативы, реализовывать какие-то задачи. В этом случае вы получаете шанс на то, чтобы стать лидом. Рекомендация очень похожа на переход между мидлом и сеньором, просто здесь немного больше социальной составляющей.

Карьерный путь исследователя

0cafbc3b1779424fb755dd48b2bdb05a.png

В исследовательском треке есть небольшие отличия. Например, если для работы в индустрии достаточно помнить, что такое градиент, статзначимость, то в науке нужна серьёзная математика, поскольку требования здесь выше.

Читатель может со мной поспорить, заявив, что бывают статьи, где автор решил квадратное уравнение — и всё, публикация уже на НИПС. Действительно, такое есть — вот пример.

d0301760afff4bef4ba663927368770d.png

Её авторы по большому счёту решили квадратное уравнение, показали эквивалентность двух подходов — и всё, статью приняли для топовой конференции.

451abe2549a85de5e03a16dc8f155013.png

Но в то же время бывают и другие работы. Возьмём статью про понимание глубокого обучения через Риманово многообразие. Если читатель не знает, что такое Риманова геометрия, то материал понять не сможет.

cbe83f88ab5ce98f3a20b6dc5a8f1dd4.png

Советы для старта карьеры исследователя довольно простые, но важные. Знание базового курса математики на уровне топовых факультетов — очень полезно и важно, равно как и отсутствие страха перед сложными областями.

Может показаться, что это не требуется. Допустим, зачем нужны дифференциальные уравнения человеку, который занимается AI? Но ответ на вопрос простой. Если вы откроете статью про нейронное дифференциальное уравнение, вы её не поймёте без знания того, что же такое дифуры. Поэтому не бойтесь математики.

Важна ещё профильная кафедра в магистратуре рядом с сильной научной группой — это хороший стимул для развития.

Ещё один совет — это трудоустройство в R&D-отдел либо в какой-то научно-исследовательский институт. Как правило, это происходит через научрука или преподавателя.

Но самое главное качество — нужно быть готовым очень долго получать негативные результаты и не демотивироваться. Это крайне важно для исследователя.

Кем я хочу стать?

561ccdbf872550ad731ee65b1fe466ca.png

Остаётся в этом разделе ещё один вопрос. Мы уже понимаем, как попасть в профессию, как развиваться и продвигаться. Но какую специальность выбрать?

Ответ очень простой — пробуйте разное. Тогда можно понять, что вам подходит, а что — нет. Случается, что люди много чего умеют. В целом, общего рецепта здесь нет, надо пробовать. Но обратите внимание, что на начальной стадии мы быстро обучаемся, достигаем первых успехов. Кажется, что вот это — моя специальность.

e7ec9c82d6effd80f0fc750b22bcc250.png

Затем наступает момент выхода на плато. Учиться уже тяжело, поскольку базовый опыт накоплен. Окно возможностей откроется как раз на этапе «плато», и тогда вы действительно станете хорошим специалистом.

Мой личный опыт, карьера и проекты в МТС

86d2e8a94ec8e8724d2edff7e1069f19.png

Теперь буквально пара слов про мой личный опыт и про то, какие выводы я из него сделал. Начинал в небольшом городе на 70 тысяч жителей с железорудным карьером.

В определённый момент я задумался о другой карьере, профессиональном развитии и своём будущем. Поступил в МФТИ и спустя 3–4 года после поступления внезапно оказался среди преподавателей, вернее, ассистентов. У нас также было много различных студенческих активностей.

Потом я поступил на работу — сначала в компанию ABBYY. На первых порах C++-разработчиком, затем менеджером образовательных проектов, поскольку мне всегда нравилось и то и другое.

В Яндексе прошёл путь от Data Scientist до Chief Data Scientist. Запустил с коллегами специализацию на Coursera по машинному обучению на 200+ тысяч слушателей, которая пользовалась популярностью. Основал Академию Больших Данных в тогда ещё Mail.ru Group, а потом пришёл в МТС.

В МТС я прошёл трансформацию из Chief Data Scientist уже в человека, который возглавил все направление Big Data в компании. Параллельно стал номинантом в рейтинге 30 самых перспективных россиян до 30 лет по версии Forbes в 2020 году в категории «Наука и технологии». Достаточно смешно звучит, но подобные достижения оказывают некоторое влияние.

Чем это важно? Тем, что, например, топ-менеджеры обычно не знают о вашем существовании. А вот если попадать в подобные рейтинги, «мелькать» в СМИ, то тебя начинают уже узнавать, появляются новые возможности — например, попробовать себя в какой-то карьерной роли. При этом нужно понимать, что сами эти рейтинги не являются достижениями. Просто дополнительный фактор.

3754bf20950cf2226d3298145679ba12.png

У меня в МТС отличная команда из разных компетенций. Например, 650 специалистов работают в Big Data. Есть там Data Scientists, Data Engineers, ML Engineers, аналитики. Множество замечательных людей, которые решают задачи бизнеса МТС, связанные с Big Data. У нас много интересных проектов.

b5fb01e500c78e4d62340ce89c050a78.png

Мы планируем размещение базовых станций и улучшаем нашу сеть. Потому что ресурсов всегда конечное количество, а сеть должна быть надёжной, так что нужно понимать, где поставить вышки, чтобы обеспечить связь для максимального числа пользователей.

41c15add031b3f5278277046c9f2a5ef.png

Кроме того, с помощью машинного обучения мы разрабатываем систему блокировки спама. Может казаться, что всё просто — достаточно спарсить какой-нибудь сайт с отзывами на номера и заблокировать спамеров. Но нет, всё гораздо сложнее. Нужно детектить новые сим-карты спамеров, определять паттерны поведения злоумышленников и не банить нормальных абонентов. Машинное обучение здесь очень сильно помогает.

8f6386b42d17750773120e6b41bed744.png

Еще мы разрабатываем рекомендательные системы для наших приложений, онлайн-кинотеатра KION, сервиса МТС Строки, МТС Банка. Так, алгоритмы рекомендуют, какие платежи сейчас сделать, услуги подключить и т. п.

4c6db4e572515ac9c7cad0e122ffacfd.png

Ещё мы проводим скоринги для других компаний. То есть это, с одной стороны, классическая задача, вернёт человек кредиты или нет. С другой — более творческая — «антифрод-скоринг». Сейчас мы реализуем проект по борьбе с мошенниками, то есть теми, кто звонит и обманным путём пытается выманить у людей сбережения. Здесь также помогает машинное обучение.

2b81da391dc52cdf0853214d309c4cc2.png

Мы помогаем развивать инфраструктуру городов. Например, даём понимание администрациям разных регионов о турпотоках, скоплениях людей и т. п.

Все эти задачи безумно интересные. Но стоит понимать, что когда вы становитесь руководителем, то меньше работаете руками. Например, за время управления задачами, перечисленными выше, я не написал ни строчки кода. Так что если у вас стоит выбор — стать менеджером или остаться разработчиком, подумайте, что вам приносит больше удовольствия.

Основные рекомендации из личного опыта

0ec0e150d4426e708babaeeed915f3c8.png

В качестве заключения — рекомендации из опыта, основные выводы:

  1. Чтобы не перегорать в процессе, очень полезно чередовать какие-то сферы работы. В моём случае это постоянное «перетекание» из образования в созидательную деятельность. У меня часто возникает желание поделиться новым опытом, например, на лекции. У вас это может быть что-то другое, но здорово, когда эти области друг друга дополняют.

  2. Важно заниматься заметными вещами в сообществе — в том случае, если вы хотите быстро развиваться. Всё это рано или поздно действительно оценят. Они дают вам какие-то новые возможности, а вы сможете попробовать себя в новой роли.

  3. Не ждите, что вас сразу заметят. Например, в моём случае между списком Forbes и Coursera прошло 4 года. Если бы я всё это время сидел и ждал признания, то, наверное, просто похоронил бы свою карьеру. Нужно работать, а всё хорошее рано или поздно случится.

  4. Не зазнавайтесь, не надевайте на себя «корону». У меня иногда возникало желание так поступить, но по разным причинам я отказывался от подобных идей. И это тоже принесло свои плоды: новые знакомства с людьми, приглашения на новые роли. Всем очень рекомендую вести себя естественно и скромно, на определённом уровне.

И последнее, что хочу сказать: будущее действительно за вами. Надеюсь, что вот эти базовые рекомендации пригодятся кому-то из вас. Если есть вопросы или замечания, оставляйте комментарии.

Habrahabr.ru прочитано 3693 раза