«Начинают отмирать целые области человеческой деятельности»
Интервью с профессором университета Гумбольдта Владимиром Спокойным.
«Технологическая революция, которая нас ждет, полностью основана на науке о данных. В ряде областей компьютер уже эффективнее человеческого разума. Очень важно, чтобы человек во всем этом не потерялся», — рассуждает доктор физико-математических наук, профессор университета Гумбольдта в Берлине Владимир Спокойный.
В 2017 году НИУ ВШЭ совместно со «Сколтехом» открывают прием на магистерскую программу «Статистическая теория обучения», которая будет готовить студентов к научной деятельности на стыке математики и компьютерных наук.
В интервью vc.ru академический руководитель программы Владимир Спокойный рассказал о том, как она сформировалась, для кого предназначена и чему должна научить.
Образовательные программы в сетевой форме — это возможность использовать ресурсы нескольких образовательных или исследовательских организаций в процессе обучения, а также получить два диплома («Сколтеха» и партнерского университета) после прохождения программы.
При этом часть образовательной программы студенты осваивают в «Сколтехе», часть — в партнерском вузе.
Преимущества программ:
1. Возможность использовать ресурсы нескольких организаций.
2. Единая образовательная программа.
3. Возможность получить два диплома после прохождения программы (в случае зачисления и в «Сколтех», и в партнерский университет).
4. Одна дипломная работа.
С чего началась магистерская программа «Сколтеха» и НИУ ВШЭ?
Два года назад мы запустили магистерскую программу в Высшей школе экономики, на факультете компьютерных наук. Программа называлась «Математические методы оптимизации и стохастики». Эта программа была ориентирована на подготовку специалистов в науке о данных с углубленным изучением математических дисциплин, таких как оптимизация, статистика, стохастический анализ.
Программа вызвала большой интерес, но мы столкнулись со сложностью её наполнения. Нужно было покрыть большой спектр математических дисциплин. В условиях Москвы это оказалось нетривиальной задачей — собрать нужный набор квалифицированных преподавателей оказалось довольно сложно.
Прошлым летом ко мне обратились коллеги из «Сколтеха». Они предложили сделать совместную программу на базе разработанной в ВШЭ. Мы ухватились за это предложение по двум причинам:
- Можно было привлечь преподавателей и из «Высшей школы экономики», и из «Сколтеха».
- Увидели возможность сделать программу более привлекательной для студентов. Мы надеемся получить преимущества обучения и в НИУ ВШЭ, и в «Сколтехе», особенно для студентов бакалавриата ВШЭ.
Наша основная цель — предложить студентам полный спектр курсов, покрывающих современную теорию статистического обучения. На выходе, через два года, мы рассчитываем получить специалистов высокого уровня по одной из самых востребованных областей знаний.
Почему вы считаете, что эта область настолько востребована?
Теория машинного обучения, искусственного интеллекта — это динамичные и бурно развивающиеся области современной науки. Если раньше во главе угла находились финансы, биоинформатика, то теперь все обратились к теме искусственного интеллекта. Вдруг выяснилось, что этим занимаются сотни тысяч людей, возможно даже миллионы, но все это относится к решению каких-то специфических инженерных задач. А специалистов, которые понимают математическую сущность этой науки, очень мало.
Курсы по теории статистического обучения уже существуют в разных местах. Это Беркли, Стэнфорд, университеты Парижа, Берлина и другие научные центры. Мы, следуя этой волне, решили открыть такую программу в России. И очень надеемся, что будет большой интерес к поступлению на программу со стороны сильных студентов из разных вузов России.
Какой бэкграунд и какие знания должны быть у студентов, чтобы попасть в программу?
Отбор серьезный. Нормальным бэкграундом мы считаем уровень вузов, из которых набираем студентов. То, чему учат в НИУ ВШЭ на факультете компьютерных наук или факультете математики, в Физтехе на факультете управления и прикладной математики, на ВМК и мехмате МГУ.
Ничего суперспециального не требуется, но курсы матанализа, линейной алгебры, функционального анализа, теории вероятности, статистики требуется знать если не в совершенстве, то на очень хорошем уровне. Потому что если человек не владеет понятийным базовым аппаратом, ему на нашей программе делать нечего.
Сколько курсов в программе?
Мы составили список курсов по трём градациям: обязательные курсы, полуобязательные — которые можно выбирать, —, а также факультативные курсы, включая те, которые читаются приглашенными профессорами.
Всего в списке 28 курсов, разбитых по этим трем категориям. Думаю, любой студент сможет собрать набор по своим интересам. Надо закрыть обязательное количество курсов, а посещать можно их неограниченное количество.
Образование построено так, что мы в начале даём студентам посетить один или два вводных курса — что-то вроде погружения. А уже потом начинается настоящий хардкор.
Это все — теория или есть и практические курсы?
Совершенно понятно, что теоретические курсы должны быть, но далеко не все курсы должны быть теоретическими. У нас в этом смысле широкий спектр. Есть курсы очень теоретические, а есть вполне практические. Но обязательными являются именно теоретические курсы — это и современная статистика, и методы вычислительной линейной алгебры, и методы оптимизации. Это те основы, которые должен знать любой специалист, занимающийся современной теорией машинного обучения и искусственного интеллекта. Дальнейшее зависит от выбранной специализации.
В нашей концепции любой студент должен сразу или довольно быстро найти себе индивидуального руководителя, который будет вести его во время всей магистерской программы. Мы разрабатываем список тем и предложений для студентов, где рассказываем, чем занимается каждый из профессоров и к чему можно присоединиться.
Кроме того, мы организовываем семинары по различным тематикам. Сейчас у нас четыре таких семинара, включая теорию оптимального транспорта — самый математический, или глубокое обучение нейронных сетей — самый прикладной. Цель таких занятий — вовлечь студентов в активную работу.
У студентов есть возможность пройти стажировку на Западе. У нас хорошие партнерские отношения с университетами Берлина, Парижа, Гренобля, возможны стажировки в Кембридже, Массачусетском технологическом институте, Беркли, Стэнфорде. Впрочем, к любым стажировкам мы относимся очень серьезно, и не будем отправлять студента, если сочтем, что это неэффективно.
Мы надеемся на плодотворное сотрудничество с ведущими специалистами по теории машинного обучения со всего мира. Я уже получил принципиальное согласие целого ряда ученых — они готовы приехать и читать специальные курсы в рамках нашей программы.
К каким именно работам и исследованиям могут присоединиться студенты магистерской программы?
Их много. Одна из тем, которой я сейчас занимаюсь — кластеризация. Очень интересная задача — кластеризация многомерных данных. Представьте, что у вас есть данные любого типа — медицинские записи, видео, тексты — любые. И их нужно разбить на группы однородных объектов — они называются кластерами. Эта задача встречается в колоссальном числе приложений.
Есть тысячи алгоритмов. Но теории очень мало, вплоть до того, что никто не знает, что такое кластер. Данные малой размерности можно визуализировать и разбить на кластеры вручную. Но для реальных многомерных данных очень трудно предложить состоятельный и стабильный метод. Этой тематикой мы сейчас занимаемся.
Родственная тематика — обучение по частично размеченным данным. Допустим, надо определить, есть ли на картинке изображение кошки. Есть 100 размеченных картинок — известно, на каких из них кошка есть и на каких ее нет. И еще 100 тысяч картинок, где непонятно, есть кошка или нет. Это та проблема, с которой сталкиваются все поисковики — как по ограниченному количеству размеченной информации давать точные рекомендации. «Яндекс», Google, Bing — для всех это интересно. Это суперактуальная задача, над которой мы работаем.
Это лишь несколько математических задач, но есть и вполне прикладные проекты, которые мы вели и ведем с разными компаниями.
С кем, например?
Недавно делали проект по анализу трафика для китайской телекоммуникационной компании Huawei — для того, чтобы оптимизировать телекоммуникационную архитектуру сетей.
Подготовили еще один проект по оптимизации распределения ресурсов. У нас были проекты со «Сбербанком», сейчас мы общаемся со «Сбертехом» — надеемся на сотрудничество. В Германии есть проекты с Bosch, Opel. Их интересуют глубинные нейронные сети, кластеринг и ряд других подобных задач. Но подробности не раскрываю, мы связаны соглашением.
В целом могу сказать, что большинство научных задач, которые возникают в современном мире, требуют компетенций во всех областях прикладной математики. Нужно быть специалистом и в статистике, и в теории вероятности, и в теории оптимизации, в вычислительных методах, линейной алгебре. Все это востребовано в полном объеме, и если специалист не владеет каким-то набором знаний — ему уже тяжело.
Многие российские компании занимаются схожими направлениями. «Яндекс», Mail.ru, ABBYY и другие. Нет ли у вас борьбы за кадры?
«Яндекс» давно на этом рынке труда, у компании своя наработанная система. Они привлекают молодежь через свою школу анализа данных. В ней учатся 100 студентов, а заявок каждый год поступает около двух тысяч. У них нет проблемы поиска кадров. В этом смысле мы не конкуренты и не вступаем в конфронтацию. Наоборот, я делал пробные шаги для кооперации, полагаю, что это было бы взаимовыгодно. И целый ряд людей, задействованных в нашей магистерской программе, трудятся и преподают в том же «Яндексе». Это Виктор Лемпицкий, Дмитрий Ветров и другие коллеги.
Думаю, у нас не может быть ни конфликта интересов, ни конфронтации. Я верю, что те специалисты, которых мы готовим, которые проходят жесткую школу обучения современной науке, будут очень востребованы в таких компаниях, как «Яндекс» или Mail.ru. Вопросы продвижения современных теорий и методов ИИ сейчас востребованы абсолютно везде.
Но все же, как вы воспринимаете переход молодых людей из науки в бизнес?
Я исхожу из правила 1 к 5. Если все идет нормально, примерно 20% сохраняют интерес к науке при переходе из бакалавриата в магистратуру, и аналогичное происходит после получения магистерского диплома.
Полагаю, что мы занимаем ту нишу, куда приходят студенты, желающие остаться в науке. Некоторый отсев происходит заранее — мы сразу предупреждаем студентов, что ориентируемся на подготовку ученых. Дальше — как пойдет.
Подходы и процессы обучения будущих научных специалистов как-то отличаются в Европе и России?
В России преподают как минимум не хуже чем в Европе. Разница в том, что западная система требует от студентов большей самостоятельности. Они имеют немного иной менталитет. Активность, самостоятельность и направленность другие. Впрочем, в этом плане в России сейчас ярко выражено движение в ту же сторону, к западным стандартам.
Я могу сравнить с тем, что было, когда я учился 30 лет назад. У нас не было особого выбора. Сейчас же студент должен постоянно определяться на уровне бакалавриата — куда идти, какие курсы брать. Вторая возможность всё переосмыслить возникает на пороге магистратуры.
В такой системе есть и риск — студент может потеряться. Поэтому очень важно найти студентов, которые заинтересованы в научной деятельности, и как можно скорее их в нее вовлечь.
Подходы НИУ ВШЭ и «Сколтеха», вроде бы, тоже несколько разнятся?
«Сколтех» — инновационный университет, который растит студентов, способных совершать технологические прорывы. Но моё мнение: университет — это не конструкторское бюро. У студентов всего-то два года магистратуры, чтобы научиться науке. Пройти погружение. А потом, если ты овладел знаниями — можешь развиваться как специалист дальше.
Мы хотим готовить именно ученых, которые работают на стыке современных дисциплин прикладной математики: статистика, оптимизация, искусственный интеллект, машинное обучение. И они должны многое знать. Возможность участия в проектах важна, но не за счёт качества обучения.
В рамках нашей программы мы будем сами планировать и предлагать проекты, и они обязательно будут наукоемкими. Это — главное требование. Результаты деятельности должны публиковаться в научных журналах. Магистратура в нашем исполнении — это от трети до половины диссертации. У человека, который после магистратуры пойдет в аспирантуру, будут солидные наработки на самом передовом уровне науки.
В чем «общечеловеческое» значение того, чем вы занимаетесь?
Сегодня сложно представить какую-либо область человеческой деятельности, где не задействована наука о данных. Всё, что нас окружает — смартфоны, машины, транспортные системы, сервисы, производства — меняется на глазах. То, что раньше требовало человеческого участия — сейчас делается в автоматизированном режиме, причем быстрее и лучше. Отмирают целые области человеческой деятельности.
Развитие интерфейсов «мозг — компьютер» скоро устранит «посредников» в виде устройств — все их возможности будут в голове. Страшно подумать: где же во всем этом место человека?
Мы работаем как раз в той зоне, где без человека не обойтись — в зоне понимания, почему это все работает и как это продвигать дальше. Мы обучаем не простых пользователей, мы растим созидателей. Я считаю, что математики будут все более и более востребованы, они будут востребованы всегда. Математик строит модели, он понимает, что, как и почему происходит, генерирует новые идеи, методы, подходы. Без этого прогресс невозможен.
© vc.ru