Машинное обучение в геологии
Лейла окончила геологический факультет МГУ им. М.В. Ломоносова. Поступила в аспирантуру Баварского Геологического Института в Германии. Во время обучения в аспирантуре опубликовала статьи в престижных научных журналах (Nature и Science Publishing group) и работала в разных лабораториях в Германии, Франции и США. С подробным списком публикаций можно ознакомиться по ссылке.
После защиты аспирантуры вернулась в Россию и пошла работать постдоком в Сколтех. В Сколтехе начала заниматься машинным обучением для геологии, даже поучаствовала в основании стартапа Digital Petroleum. Сейчас работает в научном центре нефтяной компании.
Делимся с вами расшифровкой эфира и записью.
❒ Всем привет, меня зовут Лейла Исмаилова. Я — ученый, который перешел заниматься наукой в индустрию, и сегодня я расскажу вам свое видение на науку в геологии, на то, как стать ученым в России, на науку в России и за рубежом, и о машинном обучении в нефтянке и в геологии.
Дисклеймер — это все будет исключительно мое мнение. Если у вас будут какие-то вопросы — пишите.
❒ Чтобы быть в контексте — то есть, почему я тут рассказываю про науку — я расскажу о своем пути в науке, в геологии. Я поступила на геологический факультет МГУ в далеком году; когда поступаешь на геологический факультет, у тебя есть выбор: то есть, ты выбираешь направление. Конкретно, на геологическом факультете МГУ есть общая геология, геохимия, геофизика. Я тогда выбрала геохимию, которая, как я потом поняла — и, в принципе, как понимаю сейчас — является тем местом, где непосредственно готовят ученых. Уже этим решением было предопределено то, чем я буду заниматься.
Первые два курса я проходила обычный базовый набор. Где-то после третьего курса ты выбираешь себе научного руководителя; я тогда выбрала руководителя, который занимался синтезом алмазов. Я могу сказать, что на третьем курсе я практически вообще ничего не понимала в этом, просто само словосочетание «синтез алмазов» звучало классно.
❒ Синтез алмазов — это не с точки зрения того, что мы потом их продаем ювелирной индустрии, например; алмазы используются учеными в такой форме, что они образуются очень глубоко в недрах земли, и в процессе образования захватывают множество включений. Это — самые глубинные породы, которые нам доступны, и после того, как алмазы транспортируются наверх, с помощью включений, которые есть в алмазах, можно воссоздать, что именно происходит в глубине земли, куда мы не можем попасть. То есть, именно те алмазы, которые непригодны для ювелирной индустрии из-за включений, очень интересны ученым.
Я пришла к своему научному руководителю и сказала: эта тема мне интересна, хочу этим заниматься. Он сказал: здорово, я люблю науку и занимаюсь синтезом — воссоздаю, в каких условиях образуются алмазы. У нас в университете на тот момент не было пресса, чтобы создавать высокое давление и температуру для условий, при которых создаются алмазы; он сказал — есть лаборатория в Черноголовке. Это где-то час езды от Москвы по Щелковскому шоссе.
❒ Так начался мой научный путь. Хочу сказать, что я была абсолютно несознательным студентом/ученым тогда; я совсем не понимала, что мне нужно делать. Научный руководитель мне говорил — нужно смешать это и это, положить в пресс, довести до такого-то давления и температуры, и я все это делала. Сейчас я понимаю, что тогда я абсолютно не понимала, что нужно было делать и как.
Первый этап — нам нужно что-то синтезировать. Следующий этап — нам нужно это изучить, и существуют различные аналитические методы для этого. Один из них — сканирующая электронная микроскопия, этот метод очень часто используется в науке вообще. Я думаю, большинство ребят, которые не связаны с геологией, но как-то связаны с наукой, с индустриальной наукой, в курсе этого метода. Получается, что те образцы, которые выходят после высокого давления, сами по себе очень маленькие, и ничего ты там не увидишь —, но в электронном микроскопе огромное увеличение. Я помню, как садилась у микроскопа уставшая — тогда нам давали смены буквально в 7 часов, после всех занятий — и микроскоп включался, и я видела настоящие алмазы, которые я синтезировала. Сейчас я понимаю, что, наверно, это и был тот момент, когда у меня произошел сдвиг, и я поняла, что наука — это классно. Я была в полном восторге; приехала на ужин к родителям, рассказывала, что такое синтез алмазов.
❒ Та оно и завертелось. Я защитила бакалаврскую работу и продолжила ее же в магистратуре. Мой научный руководитель занимался (и занимается сейчас) наукой, и у него в то время были хорошие связи с университетом в Германии. Он рассказал мне о возможности съездить на стажировку, я сказала — ОК. Но перед этим я подалась в школу в Германии, в тот университет, в котором я впоследствии окончила аспирантуру. Так что, для тех ребят, которые ищут свой вариант получить образование и заняться наукой за границей: очень классный способ получить контакты, познакомиться, узнать, хочешь ты в этой лаборатории дальше работать, или нет — это попробовать посмотреть, какие у них есть курсы. Я съездила на этот курс, и тогда меня поразило то, как все, чему нас учили в университете — огромное количество аналитических способов — было в этом университете представлено вживую. Я увидела очень много оборудования, о котором раньше только читала в лекционных материалах или слышала. Дальше я стала больше углубляться в науку; мне научный руководитель рекомендовал разные статьи, я читала их — для меня это было действительно «вау». Помню, как я смотрел на тех людей, которые публиковали эти статьи, и думала — ничего себе, они пишут целые научные статьи!
Небольшой дисклеймер: примерно через 4–5 лет я познакомилась со всеми этими авторами статей, сидела за одним столом с этими большими людьми — то есть, они все доступны. Думаю, на различные вопросы они спокойно могут ответить, никакого барьера между учеными не существует.
Параллельно с научной работой я водила экскурсии в минералогическом музее имени Ферсмана. Я знаю, что некоторые пришли сюда, заинтересовавшись геологией. Часть геологии — это минералогия, и минералы — это яркая и очень красивая часть геологии. В Нескучном саду на метро Октябрьская, где парк Горького, есть этот потрясающий минералогический музей, уникальный по количеству минералов, которые в нем представлены. Так что, если вам интересна геология — максимально советую там все посмотреть. Там есть большие метеориты, огромное количество всего. Причем этот музей хорош еще и тем, что он максимально старается собирать все возможные минералы, а не делать подборки отдельных избранных минералов.
То есть, я водила экскурсии и параллельно делала науку. Уже после первой моей поездки я начала что-то понимать, начала видеть ребят, которые увлечены наукой. Тогда я стала думать о том, чтобы поехать в аспирантуру. Мой научный руководитель сказал: слушай, я был в Германии, спрашивал у профессора — там нет мест, но ты съезди на месяц на стажировку для своей магистерской работы; там посмотришь, как что, и поймешь сама — нужно тебе это или нет.
❒ Я съездила на эту месячную стажировку, уже не в качестве ученика курсов, а в качестве полноценного ученого, который приехал на месяц. То есть, делала все эксперименты, смотрела на ребят с горящими глазами, как они делают науку — ужасно этим всем вдохновилась. Небольшая история: когда я жила в Германии, я жила в гестхаусе, в котором не было интернета. То есть, в нем было нечем заняться — и я сидела в лаборатории, измеряла на разных спектрометрах свои породы. Я точно помню, что это был вечер пятницы: в это время уже никто не задерживается в лаборатории, особенно в Германии — у них же своя насыщенная жизнь, а мне дома нечего делать. Интернета нет, какие-то сериалы я закачала –, но не вечно же их смотреть. И мобильный интернет был не очень, у меня был один гигабайт трафика на месяц, который я тут же потратила. И в тот момент, когда я сидела в лаборатории, в нее зашел мой будущий профессор и сказал: о, интересно, а что у тебя получается. Я показала результаты — такой спектр, такой минерал, такое соединение. И он вдруг начал меня чуть ли не экзаменовать:, а почему это получилось, а как это получилось. Знания вроде бы есть, но все равно стрессовая ситуация — я что-то отвечаю ему, отвечаю, отвечаю; он такой — отлично, наверно, у вас получилось это. И на следующий день я прихожу в лабораторию, а он говорит: знаете, у нас есть грант, приезжайте к нам по этому гранту. Он тогда попросил податься параллельно на программу стажировки, о которой я позже расскажу. Я тогда вообще совершенно этого не ожидала.
Так что для ребят, которые рассматривают карьеры за границей, повторюсь: самый лучший вариант — это искать стажировки, пока вы учитесь в университете, и непосредственно знакомиться с профессором. Дальше, при отборе, профессору будет легче с вами общаться.
❒ То есть, я вернулась уже защищать магистерскую диссертацию. И про программу стажировок: между Германией и Россией существует программа DAAD. Они тебе выдают стипендию, профессор получает финансирование на твое обучение, на твою зарплату, покрывает какие-то твои расходы. Я была знакома со многими ребятами, которые прошли эту программу. Что мне показалось здорово в ней — это то, что перед тем, как ты начинаешь работать, они дают тебе 2 месяца. Ты живешь в Германии и учишь язык: они хотят, чтобы ты максимально приспособился к этой программе. Я надеюсь, эта программа есть до сих пор; не думаю, что она должна почему-то отмениться — но, возможно, есть какие-то сложности из-за ситуации в мире. Очень многие ребята прошли через эту программу, потом они разъезжаются по разным городкам Германии.
Я эту стипендию не получила, о чем я написала профессору. Он сказал — окей, жалко, что ее нет, но у нас есть грант, приезжайте по гранту. Я приехала по гранту — эту уже, наверно, следующая часть, про науку в России и за рубежом. Когда ты приезжаешь, университет оказывает тебе полную поддержку. Он говорит — конечно, без проблем, можно учить немецкий. Я могу сказать даже больше: у нас в аспирантуре нужно было получить определенное количество кредитов, и можно было выбрать soft course — и взять какой-то язык. Я, конечно, взяла немецкий. Собственно, поэтому я так хорошо знаю про программу стажировки: немецкий я учила вместе с девочкой, которая была после этой программы. Мы с ней потом изъездили всю Германию, и получилось так, что практически в каждом городе Германии у нее были друзья после этой программы. Так что, если есть возможность — обязательно участвуйте максимально.
❒ Получилось так, что практически сразу после окончания магистратуры я переехала в Германию. Там, конечно, все завертелось и закрутилось. Что я вижу в моем случае, из того, чем я занималась: отличия в науке в России и за рубежом в основном складываются из того, что цикл от синтеза до аналитического исследования в университете, где я училась (понятно, что, когда ты учишься, это явно стоит не на первом месте) намного более длинный по сравнению с тем, что было у нас в университете в Германии. То есть, так можно было синтезировать на первом этаже, потом на второй этаж подняться — изучить что-то, посмотреть, что ты насинтезировал, дальше принимать решения: что ты хочешь дальше синтезировать, больше, меньше, добавлять какой-то реагент, не добавлять. Это, конечно, ведет к тому, что ты буквально варишься в этой науке.
❒ Также, важной часть наших исследований была дифракция, мы этим очень много занимались. Мы определяли, какие структуры у нас получились. И из-за того, что работали с мантийными образцами, мы были ограничены в размерах — нам всегда нужно было получать большие размеры. Метод, который работает на маленьких размерах — это синхротронное излучение: рентген, но гораздо более мощное точечное излучение, то есть, с тем, что нам нужно было изучать несколько часов, за 10 минут получалось на синхротроне.
Синхротронов существует несколько, один из самых популярных — это лаборатория в Гренобле, также еще есть в Германии и в США. Так как там есть хорошая поддержка государства, они говорят: окей, если вы — компания и хотите за деньги, то вы делаете за деньги, и ваши данные будут закрыты, мы их никому не дадим. Но если вы — научный университет и хотите изучить свои научные образцы, то — пишите заявку, обосновывайте, почему мы должны дать вам время на синхротроне. Работа там стоит сумасшедших денег. И наша лаборатория писала заявки; сначала все заявки, конечно, правились профессором, а потом мы постепенно доходили до того, чтобы писать хорошие заявки.
❒ Мы очень много времени там провели. Конечно же, когда ты делаешь исследование на таком топовом оборудовании, то результаты получаются быстрее и, конечно, результаты максимально подходящие. Могу сказать, что тот университет, в котором я находилась — мне кажется, там были либо ребята, у которых уже вышли статьи в топовых журналах, либо те, у которых они скоро должны выйти. Находясь в такой атмосфере, ты, конечно же, заряжаешься всем этим и думаешь — надо делать науку. Атмосфера в таких зарубежных вузах очень вдохновляющая. Так что, наверно, мой совет для тех ребят, которые хотят учиться в аспирантуре за рубежом (можно и в магистратуре; как мне говорили, учиться в магистратуре, а потом поступать в аспирантуру — это более простой путь) — максимально смотреть лабораторию, в которой вы хотите находиться. Готова ли лаборатория, какие у профессора есть публикации. В идеале, конечно, пообщаться с ребятами, которые у него учатся. Обычно, приезжая на стажировку, ты можешь пообщаться с ребятами.
Аспирантура в Германии — это полноценная работа. То есть, ты по 8 часов (в науке — даже больше) полноценно проводишь времени там. Это хорошо оплачивается, спокойно хватает на жизнь. Но, конечно, от тебя и требуют классных результатов — к этому нужно быть готовым.
❒ Три года мы провели, занимаясь наукой. Атмосфера была потрясающая, я до сих пор скучаю по этой атмосфере. Дальше у ученого стоит выбор, чем ты хочешь заниматься после окончания аспирантуры: либо ты бросаешь науку и уходишь в индустрию, либо ты остаешься в науке. С уходом в индустрию есть много разных вопросов: один профессор, например, говорил мне, что там не будет свободы. Конечно, уходя в индустрию, ты будешь заниматься именно тем, что делает индустрия. И там есть порог входа: ты, получается, только выпустился, окончив свое образование, а там ребята твоего возраста уже имеют по 3 года работы, как минимум. Нужно учитывать этот момент. И, насколько мне говорили коллеги, если ты будешь уходить в индустрию, то это нужно делать сразу же. То есть — не уходить на постдок. Был случай у моего коллеги, с которым мы вместе учились в аспирантуре: он подался в крупную компанию, но он уже начал делать свой постдок, и ему отказали, аргументируя это тем, что нужно было приходить к ним сразу из аспирантуры. Решения нужно принимать взвешенно.
❒ Следующий путь для ученого — это пойти дальше по научной академической карьере. То есть, ты становишься постдоком. Здесь уже больше стресса: ты уже должен сам делать свою научную работу, должен сам выбирать направление. Твой научный руководитель уже не руководитель, а скорее консультант — ты можешь к нему обратиться, понятное дело, у него опыта и знаний намного больше. Интересно, что, когда ты оканчиваешь аспирантуру и постдок, как мне говорил научный руководитель, считается, что, если ты получил постоянную позицию (все стремятся после постдока получить постоянную позицию, это как бы следующий шаг) после первого постдока, то ты — крутой ученый. Если ты получил после второго — тоже нормально. Если больше — уже начинаются вопросы. Доля аспирантов, которые доходят до профессорства — по-моему, Nature публиковал эту статистику — около 1%, то есть, воронка сужается. И получить постоянную позицию действительно очень сложно.
То есть, передо мной стоял выбор — уходить в индустрию или оставаться в науке. То, чем я занималась — это были действительно фундаментальные исследования. И мне, на самом деле, всегда хотелось попробовать себя в индустрии. Конечно, профессор говорил мне, что в индустрии у меня будет меньше свободы, и я не смогу делать то, что сама хочу. Собственно, это действительно так: ты меняешь свою деятельность, и ты уже не сам все делаешь. Я приняла решение, что хочу перейти в индустрию, и вернулась в Россию. По своим причинам я не стала подаваться на работу в зарубежные компании.
❒ Тут есть важный момент, который нужно предусмотреть, когда вы ищете свою аспирантуру: вам нужно быть уверенными в том, что вашу степень будут признавать. Обязательно проверьте вуз, в который вы собираетесь — будет ли автоматическое признание. У аттестационной комиссии есть список вузов — и эти вузы строго регламентированы (около 200, по-моему) — которые признаются в России. То есть, та степень, которую вы получили в России, будет признаваться за границей везде, а то, что вы получили за границей, может признаваться, а может и не признаваться. И, на самом деле, не факт, что в топовом вузе за границей будет офигенная лаборатория, в которой вы напишете хорошие статьи: ведь ученый измеряется статьями, и, по сути дела, ваша основная задача — именно написание хороший статей, потому что по статьям вы получаете грантовое финансирование и признание вас как ученого. Действительно, когда ты опубликовал статью и приезжаешь на конференцию, ты — как рок-звезда. Тебя узнают в мировом научном сообществе.
❒ Вернувшись в Россию, я попала в Сколковский институт науки и технологий, к профессору, который изначально предполагал, что я буду заниматься экспериментальным изучением в лаборатории. По прошествии нескольких месяцев, пока я устраивалась здесь, я пришла к нему, и он сказал: слушай, у нас появились классные новые проекты с разными компаниями, и им очень интересно машинное обучение — и ты, как эксперт в геологии, можешь в этом помочь. Например, если говорить про нефтяные компании, то они, конечно, подхватили флаг цифровизации и перехода на машинное обучение — я думаю, это связано с тем, что в процессе работы с месторождениями генерируется огромное количество данных. То, чем я занимаюсь, связано с разведкой, и в процессе разведки генерируется огромное количество данных. А основное, что нужно для машинного обучения — это данные. Нефтяные компании это поняли, и пытались по-разному использовать эти данные.
❒ Из примеров, которые есть: когда мы работали, одна нефтяная компания заявила: сейчас эра легкоизвлекаемой нефти закончилась. В России в основном добывают нефть из трудных коллекторов, и основная проблема с ними — в том, что они очень тонкие, и в них происходит переслаивание. Идет песчаник, в котором легкая нефть, и порода, в которой нет нефти. Бурение — это самый дорогой процесс в нефтянке, и любая оптимизация сохраняет для компании огромное количество средств. И они говорят: у нас есть проблема, что мы не можем попасть именно в тот пласт, в котором находится нефть. И, так как пласты очень тонкие, устройство, которое определяет, какая именно порода, находится за 15–30 метров. И они говорят: мы за 15–30 метров, через столько-то времени, уходим из пласта, и бывает, что мы теряем время — можно ли с помощью последних наработок в машинном обучении и ИИ как-то оптимизировать процесс? И мы сделали, совместно с ребятами, такую модель — я помогала в геологической части — которая предсказывает, какая будет порода (коллектор, не коллектор), непосредственно находясь рядом с ней, то есть, не дожидаясь отрезка в 15–30 метров. По этим результатам опубликовали статью, и, если интересно, у меня в описании должна быть ссылка.
❒ Другая тематика, которая довольно популярна, когда мы хотим узнать потенциал нашего месторождения — это исследование колонки керна. Это когда выпиливается такой столбик на несколько метров, который, по сути дела, является репрезентаций той скважины, которая бурится. И, имея датасет с открытыми данными, мы разработали модель, которая позволяет типизировать породу. То есть, у нас есть размеченный датасет по фотографиям, и, когда поступают какие-то новые фотографии, нужно пробовать это доразметить. Это имело довольно большой успех — была в классном журнале опубликована статья. Дошло даже до того, что я поучаствовала в создании стартапа по применению машинного обучения в нефтянке.
Еще расскажу о том, что произошло недавно. Когда был большой хайп соцсети голосовых сообщений, мы поучаствовали с ребятами — популяризаторами науки, геологии, Палеонтологии, разных тематик геологии — и я присоединилась к подкасту «Про вулканы и людей» как соведущий. Можно сказать, что так, через участие в подкастах, общаясь с людьми, можно очень много всего узнавать о геологии. Огромное количество очень классных, талантливых ученых из России — ну, аудитория, в основном, русскоязычная. Так что, на правах рекламы — если вам интересно, обязательно послушайте подкаст. И вот недавно у нас была дискуссия с одним из участников подкаста: стоит ли применять data science непосредственно в фундаментальной науке? На самом деле, после долгой дискуссии мы с ним единогласно дошли до того, что сложно переменить взгляды. То есть, никогда в жизни не объяснишь ученому, который все делает руками и смотрит на образец сам, что мы с помощью data science смогли сделать регрессию, например, и сказать, что у него при таком составе будут такие условия термобарические. И это, опять же, ведет к тому, что наука еще остается — не data science (или машинным обучением) единым. И, если вам интересно заниматься наукой, то это не обязательно должна быть нефтянка, и не обязательно в геологии должен быть data science.
Q: То есть, вы занимаетесь геонавигацией во время буренияДа, это так называется.
Q: А можно в двух словах, какие методы используются? Я читал статью про геонавигацию во время бурения, где использовали фильтр Калмана и результаты были получены на основании данных, полученных с помощью картографа границ по сопротивлениям. Вы используете только знания геологии и машинного обучения?Нет, когда занимаются геонавигацией, задача ставится так. Нужно использовать данные ГТИ — то есть, данные, полученные от сенсоров наверху. Это довольно сильно осложняло задачу. Они говорили: человек на месторождении смотрит, какие у него есть измерения — нагрузка на ротор, число оборотов — и по ним, с помощью модели машинного обучения (какие конкретные модели были использованы, описано в статье) нужно определить литологию. То есть, здесь использовались MWD-данные мадлогинга. Получается, это не только знания геологии — конечно же, она помогает, потому что с помощью нее мы создаем обучающую выборку –, но и еще данные, которые получаются непосредственно во время бурения.
Q: Использовались каротажные диаграммы?Нет, каротажные диаграммы не использовались. Сейчас, на самом деле, много ребят, которые используют каротажные диаграммы для автоматической интерпретации, например. Сейчас очень много статей, сейчас прямо бум в нефтяной индустрии, если почитать статьи на эту тему. Есть и очень хорошие статьи.
Большое спасибо всем, кто присутствовал. Надеюсь, что смогла немного затронуть большие и интересные темы. Если интересно, можете и дальше оставлять свои вопросы в комментариях — постараюсь на них ответить. Спасибо за внимание.
Предыдущую расшифровку нашего эфира можно посмотреть тут, ещё больше наших спикеров по хэштегу #ruvds_расшифровка