Машинное обучение в геологии

На прошлой неделе в наших соцсетях выступила ейла Исмаилова, специалист машинного обучения в геологии и со-ведущая подкаста о геологах «Про вулканы и людей».

Лейла окончила геологический факультет МГУ им. М.В. Ломоносова. Поступила в аспирантуру Баварского Геологического Института в Германии. Во время обучения в аспирантуре опубликовала статьи в престижных научных журналах (Nature и Science Publishing group) и работала в разных лабораториях в Германии, Франции и США. С подробным списком публикаций можно ознакомиться по ссылке.

После защиты аспирантуры вернулась в Россию и пошла работать постдоком в Сколтех. В Сколтехе начала заниматься машинным обучением для геологии, даже поучаствовала в основании стартапа Digital Petroleum. Сейчас работает в научном центре нефтяной компании.

Делимся с вами расшифровкой эфира и записью.


Всем привет, меня зовут Лейла Исмаилова. Я — ученый, который перешел заниматься наукой в индустрию, и сегодня я расскажу вам свое видение на науку в геологии, на то, как стать ученым в России, на науку в России и за рубежом, и о машинном обучении в нефтянке и в геологии.

Дисклеймер — это все будет исключительно мое мнение. Если у вас будут какие-то вопросы — пишите.

Чтобы быть в контексте — то есть, почему я тут рассказываю про науку — я расскажу о своем пути в науке, в геологии. Я поступила на геологический факультет МГУ в далеком году; когда поступаешь на геологический факультет, у тебя есть выбор: то есть, ты выбираешь направление. Конкретно, на геологическом факультете МГУ есть общая геология, геохимия, геофизика. Я тогда выбрала геохимию, которая, как я потом поняла — и, в принципе, как понимаю сейчас — является тем местом, где непосредственно готовят ученых. Уже этим решением было предопределено то, чем я буду заниматься.

Первые два курса я проходила обычный базовый набор. Где-то после третьего курса ты выбираешь себе научного руководителя; я тогда выбрала руководителя, который занимался синтезом алмазов. Я могу сказать, что на третьем курсе я практически вообще ничего не понимала в этом, просто само словосочетание «синтез алмазов» звучало классно.

image

Синтез алмазов  — это не с точки зрения того, что мы потом их продаем ювелирной индустрии, например; алмазы используются учеными в такой форме, что они образуются очень глубоко в недрах земли, и в процессе образования захватывают множество включений. Это — самые глубинные породы, которые нам доступны, и после того, как алмазы транспортируются наверх, с помощью включений, которые есть в алмазах, можно воссоздать, что именно происходит в глубине земли, куда мы не можем попасть. То есть, именно те алмазы, которые непригодны для ювелирной индустрии из-за включений, очень интересны ученым.

Я пришла к своему научному руководителю и сказала: эта тема мне интересна, хочу этим заниматься. Он сказал: здорово, я люблю науку и занимаюсь синтезом — воссоздаю, в каких условиях образуются алмазы. У нас в университете на тот момент не было пресса, чтобы создавать высокое давление и температуру для условий, при которых создаются алмазы; он сказал — есть лаборатория в Черноголовке. Это где-то час езды от Москвы по Щелковскому шоссе.

Так начался мой научный путь. Хочу сказать, что я была абсолютно несознательным студентом/ученым тогда; я совсем не понимала, что мне нужно делать. Научный руководитель мне говорил — нужно смешать это и это, положить в пресс, довести до такого-то давления и температуры, и я все это делала. Сейчас я понимаю, что тогда я абсолютно не понимала, что нужно было делать и как.

Первый этап — нам нужно что-то синтезировать. Следующий этап — нам нужно это изучить, и существуют различные аналитические методы для этого. Один из них — сканирующая электронная микроскопия, этот метод очень часто используется в науке вообще. Я думаю, большинство ребят, которые не связаны с геологией, но как-то связаны с наукой, с индустриальной наукой, в курсе этого метода. Получается, что те образцы, которые выходят после высокого давления, сами по себе очень маленькие, и ничего ты там не увидишь —, но в электронном микроскопе огромное увеличение. Я помню, как садилась у микроскопа уставшая — тогда нам давали смены буквально в 7 часов, после всех занятий — и микроскоп включался, и я видела настоящие алмазы, которые я синтезировала. Сейчас я понимаю, что, наверно, это и был тот момент, когда у меня произошел сдвиг, и я поняла, что наука — это классно. Я была в полном восторге; приехала на ужин к родителям, рассказывала, что такое синтез алмазов.

Та оно и завертелось. Я защитила бакалаврскую работу и продолжила ее же в магистратуре. Мой научный руководитель занимался (и занимается сейчас) наукой, и у него в то время были хорошие связи с университетом в Германии. Он рассказал мне о возможности съездить на стажировку, я сказала — ОК. Но перед этим я подалась в школу в Германии, в тот университет, в котором я впоследствии окончила аспирантуру. Так что, для тех ребят, которые ищут свой вариант получить образование и заняться наукой за границей: очень классный способ получить контакты, познакомиться, узнать, хочешь ты в этой лаборатории дальше работать, или нет — это попробовать посмотреть, какие у них есть курсы. Я съездила на этот курс, и тогда меня поразило то, как все, чему нас учили в университете — огромное количество аналитических способов — было в этом университете представлено вживую. Я увидела очень много оборудования, о котором раньше только читала в лекционных материалах или слышала. Дальше я стала больше углубляться в науку; мне научный руководитель рекомендовал разные статьи, я читала их — для меня это было действительно «вау». Помню, как я смотрел на тех людей, которые публиковали эти статьи, и думала — ничего себе, они пишут целые научные статьи!

Небольшой дисклеймер: примерно через 4–5 лет я познакомилась со всеми этими авторами статей, сидела за одним столом с этими большими людьми — то есть, они все доступны. Думаю, на различные вопросы они спокойно могут ответить, никакого барьера между учеными не существует.

image

Параллельно с научной работой я водила экскурсии в минералогическом музее имени Ферсмана. Я знаю, что некоторые пришли сюда, заинтересовавшись геологией. Часть геологии — это минералогия, и минералы — это яркая и очень красивая часть геологии. В Нескучном саду на метро Октябрьская, где парк Горького, есть этот потрясающий минералогический музей, уникальный по количеству минералов, которые в нем представлены. Так что, если вам интересна геология — максимально советую там все посмотреть. Там есть большие метеориты, огромное количество всего. Причем этот музей хорош еще и тем, что он максимально старается собирать все возможные минералы, а не делать подборки отдельных избранных минералов.
То есть, я водила экскурсии и параллельно делала науку. Уже после первой моей поездки я начала что-то понимать, начала видеть ребят, которые увлечены наукой. Тогда я стала думать о том, чтобы поехать в аспирантуру. Мой научный руководитель сказал: слушай, я был в Германии, спрашивал у профессора — там нет мест, но ты съезди на месяц на стажировку для своей магистерской работы; там посмотришь, как что, и поймешь сама — нужно тебе это или нет.

image

Я съездила на эту месячную стажировку, уже не в качестве ученика курсов, а в качестве полноценного ученого, который приехал на месяц. То есть, делала все эксперименты, смотрела на ребят с горящими глазами, как они делают науку — ужасно этим всем вдохновилась. Небольшая история: когда я жила в Германии, я жила в гестхаусе, в котором не было интернета. То есть, в нем было нечем заняться — и я сидела в лаборатории, измеряла на разных спектрометрах свои породы. Я точно помню, что это был вечер пятницы: в это время уже никто не задерживается в лаборатории, особенно в Германии — у них же своя насыщенная жизнь, а мне дома нечего делать. Интернета нет, какие-то сериалы я закачала –, но не вечно же их смотреть. И мобильный интернет был не очень, у меня был один гигабайт трафика на месяц, который я тут же потратила. И в тот момент, когда я сидела в лаборатории, в нее зашел мой будущий профессор и сказал: о, интересно, а что у тебя получается. Я показала результаты — такой спектр, такой минерал, такое соединение. И он вдруг начал меня чуть ли не экзаменовать:, а почему это получилось, а как это получилось. Знания вроде бы есть, но все равно стрессовая ситуация — я что-то отвечаю ему, отвечаю, отвечаю; он такой — отлично, наверно, у вас получилось это. И на следующий день я прихожу в лабораторию, а он говорит: знаете, у нас есть грант, приезжайте к нам по этому гранту. Он тогда попросил податься параллельно на программу стажировки, о которой я позже расскажу. Я тогда вообще совершенно этого не ожидала.

Так что для ребят, которые рассматривают карьеры за границей, повторюсь: самый лучший вариант — это искать стажировки, пока вы учитесь в университете, и непосредственно знакомиться с профессором. Дальше, при отборе, профессору будет легче с вами общаться.

То есть, я вернулась уже защищать магистерскую диссертацию. И про программу стажировок: между Германией и Россией существует программа DAAD. Они тебе выдают стипендию, профессор получает финансирование на твое обучение, на твою зарплату, покрывает какие-то твои расходы. Я была знакома со многими ребятами, которые прошли эту программу. Что мне показалось здорово в ней — это то, что перед тем, как ты начинаешь работать, они дают тебе 2 месяца. Ты живешь в Германии и учишь язык: они хотят, чтобы ты максимально приспособился к этой программе. Я надеюсь, эта программа есть до сих пор; не думаю, что она должна почему-то отмениться — но, возможно, есть какие-то сложности из-за ситуации в мире. Очень многие ребята прошли через эту программу, потом они разъезжаются по разным городкам Германии.

Я эту стипендию не получила, о чем я написала профессору. Он сказал — окей, жалко, что ее нет, но у нас есть грант, приезжайте по гранту. Я приехала по гранту — эту уже, наверно, следующая часть, про науку в России и за рубежом. Когда ты приезжаешь, университет оказывает тебе полную поддержку. Он говорит — конечно, без проблем, можно учить немецкий. Я могу сказать даже больше: у нас в аспирантуре нужно было получить определенное количество кредитов, и можно было выбрать soft course — и взять какой-то язык. Я, конечно, взяла немецкий. Собственно, поэтому я так хорошо знаю про программу стажировки: немецкий я учила вместе с девочкой, которая была после этой программы. Мы с ней потом изъездили всю Германию, и получилось так, что практически в каждом городе Германии у нее были друзья после этой программы. Так что, если есть возможность — обязательно участвуйте максимально.

Получилось так, что практически сразу после окончания магистратуры я переехала в Германию. Там, конечно, все завертелось и закрутилось. Что я вижу в моем случае, из того, чем я занималась: отличия в науке в России и за рубежом в основном складываются из того, что цикл от синтеза до аналитического исследования в университете, где я училась (понятно, что, когда ты учишься, это явно стоит не на первом месте) намного более длинный по сравнению с тем, что было у нас в университете в Германии. То есть, так можно было синтезировать на первом этаже, потом на второй этаж подняться — изучить что-то, посмотреть, что ты насинтезировал, дальше принимать решения: что ты хочешь дальше синтезировать, больше, меньше, добавлять какой-то реагент, не добавлять. Это, конечно, ведет к тому, что ты буквально варишься в этой науке.

Также, важной часть наших исследований была дифракция, мы этим очень много занимались. Мы определяли, какие структуры у нас получились. И из-за того, что работали с мантийными образцами, мы были ограничены в размерах — нам всегда нужно было получать большие размеры. Метод, который работает на маленьких размерах — это синхротронное излучение: рентген, но гораздо более мощное точечное излучение, то есть, с тем, что нам нужно было изучать несколько часов, за 10 минут получалось на синхротроне.

Синхротронов существует несколько, один из самых популярных — это лаборатория в Гренобле, также еще есть в Германии и в США. Так как там есть хорошая поддержка государства, они говорят: окей, если вы — компания и хотите за деньги, то вы делаете за деньги, и ваши данные будут закрыты, мы их никому не дадим. Но если вы — научный университет и хотите изучить свои научные образцы, то — пишите заявку, обосновывайте, почему мы должны дать вам время на синхротроне. Работа там стоит сумасшедших денег. И наша лаборатория писала заявки; сначала все заявки, конечно, правились профессором, а потом мы постепенно доходили до того, чтобы писать хорошие заявки.

Мы очень много времени там провели. Конечно же, когда ты делаешь исследование на таком топовом оборудовании, то результаты получаются быстрее и, конечно, результаты максимально подходящие. Могу сказать, что тот университет, в котором я находилась — мне кажется, там были либо ребята, у которых уже вышли статьи в топовых журналах, либо те, у которых они скоро должны выйти. Находясь в такой атмосфере, ты, конечно же, заряжаешься всем этим и думаешь — надо делать науку. Атмосфера в таких зарубежных вузах очень вдохновляющая. Так что, наверно, мой совет для тех ребят, которые хотят учиться в аспирантуре за рубежом (можно и в магистратуре; как мне говорили, учиться в магистратуре, а потом поступать в аспирантуру — это более простой путь) — максимально смотреть лабораторию, в которой вы хотите находиться. Готова ли лаборатория, какие у профессора есть публикации. В идеале, конечно, пообщаться с ребятами, которые у него учатся. Обычно, приезжая на стажировку, ты можешь пообщаться с ребятами.

Аспирантура в Германии — это полноценная работа. То есть, ты по 8 часов (в науке — даже больше) полноценно проводишь времени там. Это хорошо оплачивается, спокойно хватает на жизнь. Но, конечно, от тебя и требуют классных результатов — к этому нужно быть готовым.

Три года мы провели, занимаясь наукой. Атмосфера была потрясающая, я до сих пор скучаю по этой атмосфере. Дальше у ученого стоит выбор, чем ты хочешь заниматься после окончания аспирантуры: либо ты бросаешь науку и уходишь в индустрию, либо ты остаешься в науке. С уходом в индустрию есть много разных вопросов: один профессор, например, говорил мне, что там не будет свободы. Конечно, уходя в индустрию, ты будешь заниматься именно тем, что делает индустрия. И там есть порог входа: ты, получается, только выпустился, окончив свое образование, а там ребята твоего возраста уже имеют по 3 года работы, как минимум. Нужно учитывать этот момент. И, насколько мне говорили коллеги, если ты будешь уходить в индустрию, то это нужно делать сразу же. То есть — не уходить на постдок. Был случай у моего коллеги, с которым мы вместе учились в аспирантуре: он подался в крупную компанию, но он уже начал делать свой постдок, и ему отказали, аргументируя это тем, что нужно было приходить к ним сразу из аспирантуры. Решения нужно принимать взвешенно.

Следующий путь для ученого — это пойти дальше по научной академической карьере. То есть, ты становишься постдоком. Здесь уже больше стресса: ты уже должен сам делать свою научную работу, должен сам выбирать направление. Твой научный руководитель уже не руководитель, а скорее консультант — ты можешь к нему обратиться, понятное дело, у него опыта и знаний намного больше. Интересно, что, когда ты оканчиваешь аспирантуру и постдок, как мне говорил научный руководитель, считается, что, если ты получил постоянную позицию (все стремятся после постдока получить постоянную позицию, это как бы следующий шаг) после первого постдока, то ты — крутой ученый. Если ты получил после второго — тоже нормально. Если больше — уже начинаются вопросы. Доля аспирантов, которые доходят до профессорства — по-моему, Nature публиковал эту статистику — около 1%, то есть, воронка сужается. И получить постоянную позицию действительно очень сложно.

То есть, передо мной стоял выбор — уходить в индустрию или оставаться в науке. То, чем я занималась — это были действительно фундаментальные исследования. И мне, на самом деле, всегда хотелось попробовать себя в индустрии. Конечно, профессор говорил мне, что в индустрии у меня будет меньше свободы, и я не смогу делать то, что сама хочу. Собственно, это действительно так: ты меняешь свою деятельность, и ты уже не сам все делаешь. Я приняла решение, что хочу перейти в индустрию, и вернулась в Россию. По своим причинам я не стала подаваться на работу в зарубежные компании.

Тут есть важный момент, который нужно предусмотреть, когда вы ищете свою аспирантуру: вам нужно быть уверенными в том, что вашу степень будут признавать. Обязательно проверьте вуз, в который вы собираетесь — будет ли автоматическое признание. У аттестационной комиссии есть список вузов — и эти вузы строго регламентированы (около 200, по-моему) — которые признаются в России. То есть, та степень, которую вы получили в России, будет признаваться за границей везде, а то, что вы получили за границей, может признаваться, а может и не признаваться. И, на самом деле, не факт, что в топовом вузе за границей будет офигенная лаборатория, в которой вы напишете хорошие статьи: ведь ученый измеряется статьями, и, по сути дела, ваша основная задача — именно написание хороший статей, потому что по статьям вы получаете грантовое финансирование и признание вас как ученого. Действительно, когда ты опубликовал статью и приезжаешь на конференцию, ты — как рок-звезда. Тебя узнают в мировом научном сообществе.

Вернувшись в Россию, я попала в Сколковский институт науки и технологий, к профессору, который изначально предполагал, что я буду заниматься экспериментальным изучением в лаборатории. По прошествии нескольких месяцев, пока я устраивалась здесь, я пришла к нему, и он сказал: слушай, у нас появились классные новые проекты с разными компаниями, и им очень интересно машинное обучение — и ты, как эксперт в геологии, можешь в этом помочь. Например, если говорить про нефтяные компании, то они, конечно, подхватили флаг цифровизации и перехода на машинное обучение — я думаю, это связано с тем, что в процессе работы с месторождениями генерируется огромное количество данных. То, чем я занимаюсь, связано с разведкой, и в процессе разведки генерируется огромное количество данных. А основное, что нужно для машинного обучения — это данные. Нефтяные компании это поняли, и пытались по-разному использовать эти данные.

image

Из примеров, которые есть: когда мы работали, одна нефтяная компания заявила: сейчас эра легкоизвлекаемой нефти закончилась. В России в основном добывают нефть из трудных коллекторов, и основная проблема с ними — в том, что они очень тонкие, и в них происходит переслаивание. Идет песчаник, в котором легкая нефть, и порода, в которой нет нефти. Бурение — это самый дорогой процесс в нефтянке, и любая оптимизация сохраняет для компании огромное количество средств. И они говорят: у нас есть проблема, что мы не можем попасть именно в тот пласт, в котором находится нефть. И, так как пласты очень тонкие, устройство, которое определяет, какая именно порода, находится за 15–30 метров. И они говорят: мы за 15–30 метров, через столько-то времени, уходим из пласта, и бывает, что мы теряем время — можно ли с помощью последних наработок в машинном обучении и ИИ как-то оптимизировать процесс? И мы сделали, совместно с ребятами, такую модель — я помогала в геологической части — которая предсказывает, какая будет порода (коллектор, не коллектор), непосредственно находясь рядом с ней, то есть, не дожидаясь отрезка в 15–30 метров. По этим результатам опубликовали статью, и, если интересно, у меня в описании должна быть ссылка.

image

Другая тематика, которая довольно популярна, когда мы хотим узнать потенциал нашего месторождения — это исследование колонки керна. Это когда выпиливается такой столбик на несколько метров, который, по сути дела, является репрезентаций той скважины, которая бурится. И, имея датасет с открытыми данными, мы разработали модель, которая позволяет типизировать породу. То есть, у нас есть размеченный датасет по фотографиям, и, когда поступают какие-то новые фотографии, нужно пробовать это доразметить. Это имело довольно большой успех — была в классном журнале опубликована статья. Дошло даже до того, что я поучаствовала в создании стартапа по применению машинного обучения в нефтянке.

Еще расскажу о том, что произошло недавно. Когда был большой хайп соцсети голосовых сообщений, мы поучаствовали с ребятами — популяризаторами науки, геологии, Палеонтологии, разных тематик геологии — и я присоединилась к подкасту «Про вулканы и людей» как соведущий. Можно сказать, что так, через участие в подкастах, общаясь с людьми, можно очень много всего узнавать о геологии. Огромное количество очень классных, талантливых ученых из России — ну, аудитория, в основном, русскоязычная. Так что, на правах рекламы — если вам интересно, обязательно послушайте подкаст. И вот недавно у нас была дискуссия с одним из участников подкаста: стоит ли применять data science непосредственно в фундаментальной науке? На самом деле, после долгой дискуссии мы с ним единогласно дошли до того, что сложно переменить взгляды. То есть, никогда в жизни не объяснишь ученому, который все делает руками и смотрит на образец сам, что мы с помощью data science смогли сделать регрессию, например, и сказать, что у него при таком составе будут такие условия термобарические. И это, опять же, ведет к тому, что наука еще остается — не data science (или машинным обучением) единым. И, если вам интересно заниматься наукой, то это не обязательно должна быть нефтянка, и не обязательно в геологии должен быть data science.

image
Q: То есть, вы занимаетесь геонавигацией во время бурения
Да, это так называется.
Q: А можно в двух словах, какие методы используются? Я читал статью про геонавигацию во время бурения, где использовали фильтр Калмана и результаты были получены на основании данных, полученных с помощью картографа границ по сопротивлениям. Вы используете только знания геологии и машинного обучения?
Нет, когда занимаются геонавигацией, задача ставится так. Нужно использовать данные ГТИ — то есть, данные, полученные от сенсоров наверху. Это довольно сильно осложняло задачу. Они говорили: человек на месторождении смотрит, какие у него есть измерения — нагрузка на ротор, число оборотов — и по ним, с помощью модели машинного обучения (какие конкретные модели были использованы, описано в статье) нужно определить литологию. То есть, здесь использовались MWD-данные мадлогинга. Получается, это не только знания геологии — конечно же, она помогает, потому что с помощью нее мы создаем обучающую выборку –, но и еще данные, которые получаются непосредственно во время бурения.
Q: Использовались каротажные диаграммы?
Нет, каротажные диаграммы не использовались. Сейчас, на самом деле, много ребят, которые используют каротажные диаграммы для автоматической интерпретации, например. Сейчас очень много статей, сейчас прямо бум в нефтяной индустрии, если почитать статьи на эту тему. Есть и очень хорошие статьи.

Большое спасибо всем, кто присутствовал. Надеюсь, что смогла немного затронуть большие и интересные темы. Если интересно, можете и дальше оставлять свои вопросы в комментариях — постараюсь на них ответить. Спасибо за внимание.

Предыдущую расшифровку нашего эфира можно посмотреть тут, ещё больше наших спикеров по хэштегу #ruvds_расшифровка

fd2b54bc3722efda2cfd8dc052376907.jpg

oug5kh6sjydt9llengsiebnp40w.png

© Habrahabr.ru