Как поступить на PhD программу по машинному обучению

1. Введение

Этот текст — небольшое обобщение моего опыта подачи заявок на Computer Science PhD с уклоном в machine learning в Северной Америке. Я постарался собрать в этом гайде свои просчеты (учиться лучше на чужих ошибках) и более-менее универсальные вещи, полезные всем. Но все равно нужно понимать, что это довольно индивидуальный опыт, поэтому ваша личная стратегия может отличаться. Например, в случае выбора вузов/научных руководителей или в написании statement of purpose. Ну или вы находитесь в других стартовых условиях по сравнению со мной (оценки, статьи, рекомендации).

Имейте в виду, что основная часть гайда писалась до получения результатов, потому что мне хотелось избежать «ошибки выживших» (survivorship bias) и проанализировать свой опыт безотносительно того, поступил я или нет. В конце руководства есть мои результаты: я поступил в 2 из 11 вузов, в которые подавался. На мой взгляд, все равно стоит избегать ошибок, которые я здесь буду описывать. Ну и нужно понимать, что в процессе подачи на ML PhD очень много шума, поэтому можно сделать все хорошо и пролететь и наверное даже наоборот.


image

Содержание

Будьте готовы, что подача заявок на PhD займет у вас от двух месяцев до полугода, в зависимости от вашего стартового уровня и способов организации работы. У меня вышло в районе двух месяцев и это было стрессово. Если у вас нет научных статей, возможно, имеет смысл накинуть год-два на их написание. По деньгам: $400 (GRE + TOEFL) + $70–150 за каждую поданную заявку + $150 (подготовка к GRE/TOEFL через Magoosh). Учтите, что эти цифры актуальны на конец 2017 года.

Процесс подачи на PhD вкратце устроен следующим образом: вы готовитесь и сдаете GRE/TOEFL, выбирайте вуз и научника, пишете statement of purpose/personal history, пишете потенциальным научным руководителям, заполняете заявки, ждете ответов, проходите собеседования (в некоторых случаях берут без них), поступаете и пилите офигенные исследования и вас берут профессором в Стэнфорд или исследователем в Google (но это неточно). Каждая из глав этого гайда описывает одну из частей процесса выше. В конце каждой главы я также собрал полезные ссылки, на которые натыкался в процессе подготовки, потому что мой опыт не первый и не последний.


2. Зачем мне PhD?

Это главный вопрос, на который себе нужно ответить, прежде чем во все это ввязываться. Подача заявок стоит времени, денег и, что самое важное, нервов. Да, в процессе вы что-то поймете про себя и станете чуть лучше представлять, как устроены исследования в этой области, но эти же знания можно получить в менее стрессовых условиях и сделать за это время гораздо больше полезного.


image

На мой взгляд, нормальный ответ на вопрос «Зачем мне PhD» только один — вы хотите заниматься исследованиями в этой области. Если вы смотрите на phd как на способ попасть в гугл/фейсбук/амазон, то есть куча других более надежных и интересных способов. Нужно понимать, что phd занимает от 4 до 6 лет и за это время вполне можно выстроить нормальную карьеру как data scientist или data engineer. При этом если ваше phd пойдет не так, то вы окажетесь в очень проигрышной позиции по сравнению с людьми, которые работали, пока вы вымучивали из себя с phd.

По сути, phd — это лицензия на то, чтобы заниматься исследованиями (но не единственный способ ими заниматься). Если вы не знаете, что с этой лицензией делать дальше, тогда в это лучше не ввязываться.


3. Выбор страны

Изначально этого пункта не было в этом руководстве, но я решил его добавить из-за ситуации с визами. Суровая правда жизни в том, что в текущей геополитической ситуации (2018 год), многим иностранцам стало сложнее получать учебные визы в США, особенно если они занимаются технологиями двойного назначения: атомная физика, computer science, химия и так далее. Почти 100%, что подаваясь на визу, вы попадете на вещь, которая называется administrative processing, которая раньше занимала в районе трех недель, а теперь может занимать три месяца и даже больше.

Вторая проблема с американской учебной визой в том, что велика вероятность, что ее дадут вам всего на год. Это значит, что вы либо застрянете в США (можно находиться там без визы, если у вас все в порядке с внутренними документами), либо вам придется каждый год обновлять визу, если вы хотите ездить на конференции за пределы США (виза дает право въезда в страну, но не на пребывание). Если для вас важно географическая мобильность или вы хотите регулярно навещать родственников, вам стоит серьезно подумать про подачу документов не в США, например, в Канаду или Европу.

Также важно понимать особенности стран в подходах к PhD. В Европе PhD обычно требует образования магистра и длится 3–4 года, в течении которых вы работаете над конкретным проектом. В Канаде и США люди обычно поступают в аспирантуру после бакалавриата, первые два года проходят обучение, выбирают научного руководителя с темой и в итоге защищаются через 5–6 лет после начала обучения. Вы можете поступить на PhD в США и со степенью магистра, но это не главное, на что смотрят в большинстве вузов в первую очередь.


Полезные ссылки

Комментарий про ситуацию с PhD заявками от иностранцев в США


4. Оценка расходов

Это в основном касается американских/канадских вузов, которые почти все требует заплатить application fee ($70–125 на вуз), а также прислать им официальные отчеты GRE ($27 GRE + $19 TOEFL). В итоге выходит, что одна заявка в вуз обходится в $100–150 долларов. Еще есть фиксированные косты сдачи GRE и TOEFL — примерно $200 за каждый. Иными словами, если вы хотите податься в 10 американских вузов, то это обойдется вам примерно в $2000. Расчет актуален на конец 2017 года.

Вторая важная составляющая расходов — это время. У меня ушло примерно два месяца: один на подготовку к GRE и другой на поиск научных руководителей, написание statement of purpose и заполнение заявок. На мой взгляд, это абсолютный минимум, ниже которого опускаться не стоит. Это не чистое время, потому что я параллельно работал в научной лаборатории, поэтому если у вас больше свободного времени, возможно вы управитесь быстрее. Если вы сторонник минимума стресса, то лучше начинать за 3–6 месяцев до дедлайна заявок.


5. Подготовка к GRE

5.1 Общее


GRE — это тест на 3 часа 45 минут, который проверяет ваше знание численных методов (quant, Q), ваше умение анализировать тексты/предложения в сочетании со словарным запасом (verbal, V), а также умение писать аналитические тексты (AWA). Про сам тест подробно написано в куче мест, поэтому здесь я поделюсь своими впечатлениями и трюками.

image

С GRE в целом дурацкая история, на мой взгляд. Если написать его очень хорошо, то это не дает особого преимущества, ведь большинство сильных кандидатов пишут его хорошо. А вот если написать его плохо, то это может сильно навредить. Это делает подготовку к нему муторным и утомительным занятием, поскольку такая постановка вопроса не мотивирует вообще (нужно изо всех сил бежать, чтобы остаться на месте). Я использовал несколько ментальных трюков, чтобы сделать этот нудный процесс более приятным/эффективным.

Установите себе цель. Моя цель была 165Q, 155V. Цель по AWA я не выставил и это была ошибка. В итоге я сдал на 169Q, 159V и 3.0 AWA, где первые две оценки — это очень хорошо для моей специальности (96 и 83%), а последняя — крайне посредственно (18%). Если бы я выставил конкретную цель по AWA, моя подготовка была бы эффективнее.

Смотрите на GRE как на возможность чему-то научиться. В случае с математикой я освежил некоторые школьные знания + научился нескольким оценочным трюкам. В случае c verbal я существенно расширил словарный запас и выучил часть слов, которые никогда иначе бы не выучил. Без этого трюка готовиться к GRE ужасно скучно.

Понимайте мету теста. Вопросы в GRE не всегда сформулированы максимально ясно и это сделано специально. Составители прекрасно понимают условия, в которых вы решаете тест и в рамках правил иногда стараются сбить вас с толку. Нужно понимать, как устроены эти ловушки, чтобы в них не попадаться. В этом очень полезен magoosh (см. ниже).

Используйте www.magoosh.com. Подписка на полгода стоит $150 и она того стоит. На Magoosh куча коротких и ясных видео, которые вам объяснят как устроен GRE, основные трюки и ловушки составителей, а также помогут освежить ту математику, которую вы забыли. Плюс там примерно по тысяче задач на quant и verbal, а также удобная и ясная статистика и способ отслеживать разделы, в которых вы больше всего ошибаетесь.

Оцените время, которое вам нужно на подготовку. Rule of thumb, которое везде пишут и с которым я согласен — в среднем нужно 40 часов, чтобы улучшить балл в категории (например, quant) на 5 единиц. Например, если вы написали в первый раз тест на 160Q/155V, то вам нужно 80 часов, чтобы поднять балл до 165Q/160V. Но тут важно понимать свои индивидуальные особенности. Например, если вы уверены, что ваши баллы занижены из-за нервов, то вам может потребоваться меньше/больше времени чтобы выработать свою стратегию написания теста.

Установите рутину подготовки с учетом своих приоритетов и доступного времени. У меня на подготовку был ровно месяц и поэтому в моем случае рутина была 40 вопросов quant и 40 вопросов verbal ежедневно. Рутины по AWA у меня не было и это было ошибкой.

5.2 Quant


Важно понимать, что GRE Quant — это тест скорее не только на знание базовой математики, но и на внимание с концентрацией. В начале подготовки я оценил себя по этим трем пунктам (отлично/норм/плохо) и строил подготовку соответственно. В моем случае математика была отлично, внимание плохо и концентрация отлично. Под концентрацией можно понимать умение работать под жестким временным давлением.

image

Каждый день я решал минимум 40 вопросов с magoosh в quiz mode — это когда вы отвечаете на вопросы и только потом видите ответы. Я бы вообще не использовал practice mode, когда вы видите правильный ответ сразу после своего ответа. Подготовка в формате quiz больше похожа по условиям на реальный тест. Плюс анализировать ошибки проще и лучше кучей.

Кроме того, в процессе написания этого текста мне посоветовали Crunchprep — утверждается, что им тоже удобно пользоваться и можно посмотреть, что подтянуть.

5.3 Verbal


GRE Verbal в первую очередь про словарный запас, и во вторую — про понимание, как устроены самые распространенные ловушки в задачах на чтение. Чтобы нормально сдать Verbal достаточно вдумчиво посмотреть все видео на magoosh про verbal (их меньше, чем по математике) + постоянно работать над словарем. С последним мне очень помог сайт quizzlet.com (есть еще memrise.com), где можно составлять списки слов, а потом запускать обучение, где сайт тебе их подсовывает хитрым образом для изучения. Я завел привычку записывать туда все незнакомые слова, которые я встречал в вопросах magoosh и текстах, которые я читал. Слова я записывал пачками по 50 штук и под конец подготовки старался прорабатывать одну пачку каждые 2–3 дня. С чтением на мой взгляд достаточно прорешать все связанные с ним вопросы на magoosh. Самый важный трюк, который я вытащил — это то, что сначала нужно читать вопрос, потом формулировать свой ответ и только в конце смотреть на варианты ответа.

5.4 AWA


С этой частью я немного облажался, поскольку получил 3.0 из 7.0, что довольно плохо. Идеальный вариант подготовки, как я понимаю постфактум — это найти людей, которые смогут давать фидбек по письму и писать по 3–4 эссе в неделю. Основная проблема с AWA для меня была в том, что сложно писать осмысленные вещи под жестким временным давлением. Magoosh предлагает хорошую схему: интро, 3–4 абзаца с тезисами, заключение. Мне она была полезна, потому что позволяет не думать о структуре, а сосредоточиться на содержании.

В процессе написания этого текста мне также посоветовали вот этот ресурс, который дает грубую оценку за эссе в полуавтоматическом режиме.

5.5 Навык сдачи самого теста


Чтобы нормально сдать GRE на мой взгляд очень важно снизить уровень стресса при его сдаче. Например, быть знакомым с интерфейсом теста. Кроме того, очень важно правильно распоряжаться временем. Например, не подвисать на сложных вопросах и возвращаться к ним в оставшееся время. Для этого я рекомендую сдать как можно больше mockup тестов (такая опция есть на magoosh, а еще список бесплатных тестов можно найти здесь). Кроме того, GRE предлагает два powerprep теста при бронировании времени сдачи. Их обязательно надо сдать, чтобы получить представление об интерфейсе.

Лично я за последние 10 дней подготовки сдал шесть тестов: два PowerPrep и четыре Magoosh. Мне это очень сильно помогло при сдаче самого теста. Например, мне в секции quant попался очень хитро сформулированный вопрос про вероятности, на котором я подвис. Но поскольку у меня был опыт сдачи, я этот вопрос пропустил, потом со спокойной душой вернулся к нему в конце и оказалось, что вопрос простой, просто сформулирован с подвохом.

5.6 Бронирование времени


Самое позднее время комфортной сдачи GRE и TOEFL — первая неделя ноября, если вы хотите делать только одну попытку. Если хотите несколько, добавляйте по месяцу на каждую дополнительную попытку для GRE. Октябрь/ноябрь — самое горячее время сдачи, поэтому время лучше бронировать минимум за месяц вперед, а то и раньше, чтобы получить тест в удобное время суток.

Например я сова и первоначально забронировал тест на 8 утра, поскольку бронировал в последний момент. Мне потом пришлось мониторить удобное время и потратить $50 на смену времени, чтобы взять тест в четыре часа дня. Постфактум я считаю, что это было очень правильно решение, поскольку более простой TOEFL я сдавал в 8 утра и чувствовал, что мозг еще не очень включился. Если вы жаворонок, то возможно для вас это верно с точностью до наоборот.

5.7 Пересдача GRE/TOEFL


Если вы не уверены в своих силах, запланируйте тесты так, чтобы у вас было время на одну-две пересдачи. GRE вы можете сдавать пять раз в год с минимальным интервалом в 21 день, TOEFL вы можете пересдавать сколько захотите с интервалом в 12 дней. На практике это означает, что лучше добавлять по месяцу на каждую попытку пересдачи GRE и по две недели — на TOEFL.

6. Подготовка к TOEFL


TOEFL состоит из четырех частей: speaking, writing, listening, reading. За каждую из них можно получить максимум 30 баллов. Как правило университеты требуют, чтобы ваш результат был не ниже определенного порога, чаще всего 80 или 100. Некоторые университеты указывают минимумы по секциям. Например, я не стал подавать в Cornell, потому что у них отсечение по speaking было 22 (у меня вышло 20). Вообще, speaking обычно самая важная часть, если у универа есть отдельная разбалловка, поэтому ей стоит уделить отдельное внимание (см. ниже).

image

Если вы нормально готовились к GRE Verbal и AWA, то вы автоматом готовы и к reading/writing, потому что они упрощенные версии GRE Verbal. Listening тоже не должна представлять проблем, если вы способны смотреть сериалы/фильмы без субтитров и понимать большую часть того, что там происходит. Если нет, то это хороший способ подготовки. Главная сложность с listening во время теста — это то, что в комнате несколько людей сдают тест, поэтому вы можете слушать, когда кто-то другой наговаривает speaking. К этому надо быть морально готовым и не тушеваться.

Самая сложная часть для меня оказалась speaking. Я считал, что по дефолту готов к ней, но в тесте оказался важный нюанс — ограничение по времени. У вас есть 45–60 секунд, а иногда еще меньше, чтобы четко ответить на поставленный вопрос. Это требует некоторой практики. У magoosh есть сервис подготовки к toefl ($50 за месяц). Я купил, но по факту почти не использовал. Если бы я готовился к тесту сейчас, то обязательно проработал бы несколько десятков вопросов speaking.

7. Оценки в вузе (-ах)


Тут есть две важные составляющие: undergrad (бакалавриат/специалитет) и graduate (магистратура). Требования по оценкам варьируются от вузу к вузу. Кому-то интересны ваши оценки только в undergrad целиком, кому-то интересны за последние два года, включая магистратуру (если вы были в ней). В моем случае я был скорее в плохом положении — у меня были очень плохие оценки, несмотря на то, что я окончил очень хороший вуз на очень хорошей программе.

В зависимости от вуза и программы, высокие оценки повысят ваш шанс пройти первоначальный отбор, но на окончательное решение они скорее всего не повлияют. Плохие оценки снижают вероятность того, что вы пройдете предварительные фильтры и делают ваш профиль чуть менее конкурентоспособным: у вас будет очень много конкурентов с GPA близким к идеальному. При этом судя по тому что я читал, разницы между GPA 3.8 и 4.0 особо нет. По моим ощущениям, если у вас сильны другие части заявки, то GPA > 3.5 вполне норм.

image

Здесь я шел по пути минимизации повреждений — если у вас есть хорошая причина, почему оценки были плохие, то стоит ее упомянуть в statement of purpose, но без фанатизма и в позитивном ключе. Кроме того, если у вас есть академические рекомендатели, которые у вас преподавали, можно их попросить написать нечто вроде «его оценки в бакалавриате отстой, но это полная чушь». Сработает это или нет — зависит от вуза и программы, но это не то, на что вы можете сильно повлиять, поэтому не стоит сильно напрягаться на эту тему (хотя я все равно напрягался).

Если у вас плохие оценки, то вам вдвойне важно хорошо втащить GRE и очень осмысленно подходить в выбору вузов, куда вы подаете заявления. Например, я не стал подаваться в MIT, потому что они известны тем, что для них очень важен GPA. А еще тот же MIT прямо пишет, что для них ничего не значит GRE. Наверное, в MIT можно попасть с плохими оценками, просто вероятность не очень высокая, а моя задача была максимизировать вероятность попадания на пхд при условии, что мне нравится потенциальный вуз и научные руководители. Чуть больше про это в пункте про выбор вуза и потенциального научного руководителя.

8. Рекомендации


Для большинства вузов вам потребуются 2–3 рекомендации преподавателей/научных руководителей/людей, которые вас знают с научной или трудовой точки зрения. И тут возникают две проблемы — как таких людей найти и что они там должны писать.

8.1 Как выбрать рекомендателя


Поскольку вы подаете документы на исследовательскую позицию, то в идеале рекомендации должны быть от исследователей в интересующей вас области, которые говорят о вашей способности заниматься самостоятельными исследователями. Я бы нацеливался на минимум две рекомендации из академической среды. Статус рекомендателя тоже важен — если он известен, то выше шанс, что к его рекомендации прислушаются.

image

Поскольку у большинства из нас нет возможности получать рекомендацию условных Бенжио, Хинтона или Лекуна, то есть несколько возможных источников рекомендаций. Во-первых, научный руководитель диплома — это практически обязательный вариант, особенно если вы учились в магистратуре. Во-вторых, кто-то из деканата, кто вас хорошо знает и хорошо к вам относится. В-третьих, если вы делали интересные исследовательские проекты или летнюю практику, то подойдет руководитель проекта/практики. В-четвертых, ваш непосредственный руководитель на работе, если вы достаточно долго проработали где-то и гордитесь тем, что там сделали.

Общий принцип при выборе рекомендателя — пусть лучше вам напишет хорошую рекомендацию менее статусный человек, которые хорошо к вам относится, чем безликую — статусный. Идеальный вариант — и то, и то, но в этом случае вам, скорее всего, не нужно это руководство.

8.2 Как писать рекомендации


Есть шанс, что рекомендатель попросит вас написать рекомендацию за него, чтобы он потом отредактировал. Это странный опыт, поскольку с одной стороны хочется написать о себе хорошо, с другой стороны — объективно. Поскольку я не писал рекомендаций за себя, то могу дать несколько общих советов.

Избегайте рекомендаций типа did well in class. Университеты получают такие рекомендации тысячами и они бесполезны. Если рекомендацию пишет человек, который читал у вас курс, пусть напишет подробнее, чем вы так хороши, какой интересный проект сделали и насколько вы круты среди тех, кого он обучал в своей жизни.

Рекомендация должна демонстрировать, насколько вы самостоятельны и способны к исследовательской работе. Профессора как правило жутко занятые люди, поэтому ценят тех, кто требует меньше их драгоценного времени. Если рекомендация показывает, что вы способны заниматься исследованиями самостоятельно (но не пропадаете!) — это хороший знак. В идеале должны быть конкретные примеры проектов и что вы сделали в них.

Из рекомендации должно быть хотя бы приблизительно понятно, насколько вы приятный человек. Если вы гений и уникум, то наверное это часть не очень важна, но если нет, то при прочих равных отдадут предпочтение тому, с кем приятно работать. Про это не надо писать много, но если из рекомендации будет понятно, что вы приятный и порядочный человек, это точно не будет лишним.

8.3 Как облегчить жизнь рекомендателям


Чем круче у вас рекомендатели, тем хуже у них со свободным временем. Ваша задача — сделать процесс написания и подачи рекомендаций максимально безболезненным для них. Лично я сделал для них таблицу в Google Sheets, где указал все вузы, куда подавался, их дедлайны и статус рекомендации (отправлен/не отправлен запрос, получена/не получена рекомендация, и нужна ли вообще рекомендация от этого человека). Не лишним будет при приближении самого раннего дедлайна прислать напоминание рекомендателям, что через X недель/дней наступает первый дедлайн.

9. Статьи


Это очень важная часть заявки, ведь основная часть научной работы — это написание статей. Даже если вы не планируете после PhD заниматься наукой, вам придется во время обучения писать статьи и также защищать диссертацию. Чтобы понимать, на что вы идете, хорошо бы попробовать это сделать заранее, чтобы понять, насколько это вам интересно.

image

Если вы студент бакалавриата или магистратуры, то все относительно просто — вы ищете людей и лаборатории в университете, которые занимаются тем, что вам интересно и пробуете делать с ними исследовательские проекты. Не стесняйтесь обращаться к профессорам — всем нужны работящие студенты и лишние руки (особенно бесплатные). При этом не стоит завышать планку слишком высоко и метить сразу на NIPS или ICLR, но хорошо бы конечно подаваться на англоязычные конференции или workshops. Даже если вашу статью не приняли, но вам она нравится, выложите ее на arXiv — это лучше, чем ничего. Никто не ждет от вас статьи на NIPS — это очень сложно и одна из целей вашего обучения в аспирантуре как раз научиться писать такие статьи.

Если вы работали в индустрии и не хотите идти в магистратуру, а сразу хотите сразу поступать на PhD, то тут сложнее. Тут я могу предложить только один рецепт — устроиться research assistant в лабораторию и принять участие в нескольких проектах.

Мне повезло и я устроился в лабораторию в США, которая занимается neuroscience и несколько своих статей я написал там. Если вы думаете, что моя история уникальна, то вот пример человека, который в США работал очень высокооплачиваемым юристом, а потом поступил в NYU, проработав до этого год в научной лаборатории. Мораль этой истории: даже если вы много достигли в старой профессии/индустрии, вам скорее всего придется пожертвовать временем/деньгами для поступления PhD.

Правда, есть еще одна проблема в том, что в России не так много групп и университетов, которые делают ML-research мирового уровня. На мой взгляд их четыре: ВШЭ, МФТИ, МГУ и Сколтех. Я не хочу советовать конкретные имена, но довольно легко найти людей в этих вузах, которые имеют публикации в международных конференциях. Как попасть в такую группу — отдельный вопрос и тут я к сожалению не могу ничего посоветовать.

Наконец, еще один способ получить исследовательский опыт — это воспроизвести какую-нибудь известную статью с нуля. Это позволит вам понять, насколько вы способны делать то, что сделали авторы статьи. Более того, на ICLR есть Reproducibility Challenge, в котором организаторы призывают воспроизводить статьи из предыдущего года. Это тоже хороший способ показать, что вы способны заниматься исследованиями в этой области, а также получить квазипубликацию для заявки на PhD.

10. Выбор университета и научного руководителя

10.1 Общее


По идее, этот раздел должен идти сразу после «зачем мне PhD», но он стоит в конце по одной простой причине. В США и Канаде огромное количество хороших вузов и еще больше хороших профессоров. Для того, чтобы вдумчиво их просмотреть, нужно очень много времени. Пункты выше (GRE, статьи, TOEFL, GPA) накладывают ограничения на ваш выбор вузов. Например, если ваши оценки так себе, то для вас скорее всего закрыты вузы типа MIT. Или например ваш GRE не дотягивает до официально указанного порога (некоторые вузы указывают и такое). Это значит, что если вы отложите выбор вузов под конец, вы можете сэкономить время, используя ваши результаты в качестве дополнительных фильтров.

На мой взгляд перед началом подготовки к PhD стоит выбрать несколько dream school — места, куда вы хотите подаваться невзирая на шансы, просто чтобы попытаться. После того, как вы сдадите тесты, вы можете добавить к этому списку несколько более реалистичных кандидатур с учетом ваших результатов.

Еще важно понимать, что в США и Канаде очень много хороших вузов, из которых вы скорее всего знаете только 5–10 самых известных (скажем Stanford, Berkeley, Harvard, Yale, Carnegie Mellon, MIT и Caltech). В эти вузы очень сложно попасть, потому что их знают все и каждый год туда подается огромное количество народу. Лично я ориентировался на попадание в вуз из топ-50.

10.2 Поиск научного руководителя


Для себя я решил, что мне не очень важен рейтинг школы — рангов много (QS, TIMES, US NEWS и так далее), они могут разниться и часто не очень понятно, как они составлены. Поэтому в первую очередь я искал профессоров, которые занимаются интересными мне исследованиями и выглядят приятными людьми. Последнюю часть не стоит недооценивать — вы проведете с научным руководителем несколько лет и если он вам неприятен с самого начала, то вряд ли это будут приятное время.

image

Для поиска научников я использовал CSrankings.org — удобный и минималистичный сайт, в котором можно выбирать различные направления CS/AI/ML и смотреть универы, отсортированные по количеству публикаций в ведущих конференциях по этим направлениям. Что еще более ценно, для каждого университета приводится разбивка по цитированиям профессоров. Собственно, я просто выбрал интересующие меня направления, взял период за последние пять лет и шел по списку людей из каждого универа. Как правило, я фильтровал профессоров, у которых меньше 10 публикаций, потому что искал людей, которые активно работают.

Для каждого профессора я оценивал три вещи. Первое — профиль в google scholar. Там я смотрел не только самые цитируемые статьи, но и широту интересов профессора, а также его последние статьи. Я старался избегать слишком узких или слишких широких специалистов, а также чистых теоретиков (таких довольно много) и чистых прикладников (таких мало, потому что прикладные статьи сложнее публиковать). Я искал людей, которые сильны фундаментально и используют это знание для решения прикладных задач. Это отсеивало примерно половину профессоров (очень субъективно).

Второе — личный сайт. Это лучшее (хоть и весьма несовершенное) из возможных приближений личностей профессора, если вы с ним незнакомы. По моим наблюдениям, у хороших профессоров сайт не перегружен регалиями или понтами, там ясно прописано, чем человек занимается вообще и сейчас, из публикаций выделены ключевые и в идеале есть пометки для потенциальных студентов. Кроме того, на сайте частенько пишут, берут студентов или нет. Из вещей, которые меня настораживали: обилие понтов и/или регалий (ты профессор, понятно, что ты крутой/крутая), отсутствие обновлений, отсутствие студентов или малое их количество.

Третье — социальные сети. Это опциональная вещь, но живой твиттер/фейсбук — это большой плюс для профессора. По нему можно понять, как он мыслит, какие вещи его интересуют и что он за человек. Таких профессоров не очень много, но я думаю, что с годами их будет все больше, поэтому этот совет будет все актуальнее.

Важно понимать, что мой способ выбора научника сильно смещен в сторону крутых ребят. Если профессор активно публикуется в лучших конференциях, велики шансы, что он работает в хорошем вузе, в который сложнее поступить. С другой стороны, если вам не нравится потенциальный научный руководитель даже на бумаге, то есть шанс, что вам с ним будет тяжеловато.

10.3 Выбор вуза


image
Поскольку мы живем в неидеальном мире, то может получиться так, что идеальный научник находит в неидеальном вузе. Это либо расположение, либо критерии поступления, либо научник просто не берет студентов в этом году. Поэтому после фильтрации научников, я фильтровал вузы. Критерии были следующие.

Количество потенциальных научников. Я не подавался в вузы, где не мог найти как минимум трех потенциальных руководителей, которые мне нравились. Это вопрос максимизации отдачи на вложенные ресурсы — вы платите за каждую заявку деньги, поэтому делать ставку на одного научного руководителя рискованно. Плюс многие вузы просят вас указать трех потенциальных руководителей.

Соответствие критериев отбора моим параметрам. Например, у меня был не очень высокий speaking в TOEFL — 20 и по этому критерию для меня был закрыт Cornell. Другие универы, типа MIT, очень придирчиво смотрят на GPA. Третьи универы дают cutoff по GRE, явный или неявный. С явным все понятно, а неявный обычно проявляется в том, что универ дает баллы поступивших туда по разным годам (вот например для Duke University). Если ваши баллы существенно ниже, то стоит задуматься.

Возможности финансирования. Большинство вузов пишут, как финансируют своих PhD студентов. Обычно это работа teaching/research assistant. Если на сайте вуза этого ясно не указано, то это может быть тревожный знак, потому что есть шанс, что у вас будут проблемы с финансированием. Ну то есть вас могут взять, но без финансирования, что лично для меня было равносильно отказу, потому что аспирантура в США, как и вообще все образование, очень дорогая.

Во сколько вузов подаваться, зависит от наличия у вас времени и денег, а также от относительной силы вашей заявки. Если вы считаете, что у вас сильная заявка для тех вузов, куда вы собираетесь подавать, то можно податься в небольшое число вузов (<7), если заявка относительно слабая, то возможно стоит раскинуть сети шире. Важно понимать, что ваша оценка относительной силы резюме может быть завышена, поэтому стоит подстраховаться.

Я знаю несколько людей, которые подавались либо одновременно со мной, либо на год раньше. Первый из США, с очень сильным резюме, подался в ~10 крутых вузов, из которых его взяли больше чем в половину и он сейчас в Стэнфорде. Второй из России, с не очень хорошими оценками в undergrad, подался в пять университетов на шесть программ, из которых его взяли в два вуза, один из которых в топ-10 US News. Третья из Китая, которая подалась в ~20 мест, из которых ее взяли в один или два университета, и она в итоге пошла в университет из топ-25. Все они подавались на biomedical engineering.

Лично я подался в 11 (8 в США, 2 в Канаде, 1 в Европе) вузом на Computer Science, девять из которых требовали плату за заявку. На мой взгляд, больше — это уже перебор. Каждый вуз требует заполнения заявки (и обычно форматы заполнения заявок отличаются), поэтому рассчитывайте, что только на одно ее заполнение у вас уйдет около двух часов (это регистрация на сайте, заполнение многочисленных полей, проверка информации), поэтому умножение числа вузов линейно умножает это время.

11. Написание statement of purpose/personal history


Statement of Purpose (SoP) — это текст на две страницы о том, кто вы такой, зачем вам PhD, чем вы хотите заниматься и какой у вас релевантный опыт. Уже из этого описания понятно, что основная проблема SoP — это засунуть огромное количество информации в очень сжатый объем текста. В зависимости от вашего профиля, устремлений и характера, вам придется пожертвовать одними частями и написать больше про другие.

Оценки роли statement of purpose (SoP) сильно разнятся. Некоторые гайды говорят, что это самая важная часть заявки для PhD, другие — что это более-менее формальная часть (в конце концов, его ведь кто-то может написать за кандидата). На мой взгляд, роль SoP вырастает, если у вас не самый идеальный профиль и вы не являетесь студентом бакалавриата/специалитета на момент подачи. Лично я провел очень много времени за его написанием и сформулировал для себя несколько важных принципов, которые перечислен

© Habrahabr.ru