Нейросеть помогла ученым найти геоглиф перуанских индейцев
Иллюстрация: Yamagata University
Японские ученые из Университета Ямагато нашли новый геоглиф на плато Наска в Перу, использовав нейросеть на платформе IBM Watson Machine Learning. Университет Ямагато сообщил об открытии в пресс-релизе 15 ноября.
Геоглифы плато Наска — гигантские изображения людей, птиц, животных растений и геометрических фигур на юге Перу. Считается, что геоглифы Наски были созданы коренными жителями Южной Америки с V века до н.э. по V век н.э. Мнения об их назначении расходятся: некоторые предполагают что геоглифы играют роль указателей, другие — что у них есть обрядовая роль. При создании геоглифов местные жители стирали верхние темные слои камня, под которым был белый песок.
Ученые Университета Ямагато под началом профессора Макато Сакая ищут геоглифы Наски с 2018 года. За год с лишним они обнаружили 142 геоглифа, среди которых были фигуры людей, рыбы, треугольники, линии и т.д. В своих поисках они сочетали наблюдения с воздуха с работой «в полях». Для расширения своего инструментария ученые прибегли к помощи IBM.
Для поиска новых геоглифов Наски исследователи использовали нейросеть, которой «скормили» предыдущие находки и некоторые геоглифы, найденные другими учеными. Сложности возникли из-за того что геоглифы сильно отличаются по форме и размерам, а также походят на линии природного происхождения. Нейросеть ошибалась в том числе из-за относительной бедности материала для обучения.
Исследователи вместе с нейросетью на платформе IBM нашли новый геоглиф — человеческую фигуру с дубиной. Хотя изображение было два метра в ширину и пять метров в длину, до этого ученые его обнаружить не могли.
В процессе поиска предыдущих 142 геоглифов и для формирования датасета нейросети японские ученые пользовались облачным сервисом IBM PAIRS (Physical Analytics Integrated Data Repository & Services) Geoscope. Этот сервис основан на технологии гиперспектральной визуализации и призван помогать бизнесу и науке. К примеру, с помощью Geoscope IBM помогла энергетическим компаниям исследовать почву и проложить линии электропередач в обход тех мест, где могут вырасти деревья. Агрохолдинг Bungee начал сотрудничать с IBM и использовать Geoscope после того как компания сделала свой облачный сервис доступным для пользования в феврале 2019 года. С помощью данных Geoscope о погоде в конкретных зонах Bungee решает, что стоить высадить.
IBM PAIRS Geoscope помог исследователям из Японии найти 142 геоглифа Наски. Вместе с нейросетью на базе IBM Watson Machine Learning ученые обнаружили ранее незаметный 143 геоглиф. Макато Сакай в интервью The Verge уточнил, что у алгоритма есть свои серьезные несовершенства. Алгоритм нашел несколько сотен вероятных геоглифов, а ученые уже вручную отобрали из них один настоящий.
В пресс-релизе университета Ямагато сообщалось, что использование нейросети для поиска геоглифов было экспериментом, но теперь университет и IBM подписали соглашение о дальнейшем сотрудничестве в этой сфере. Следующий шаг — собрать аэрофотоснимки плато Наска за последние десять лет в рамках уже более масштабного совместного исследования.
IBM Watson Machine Learning, также как и PAIRS Geoscope — облачный сервис. В отличие от платформы для обработки и анализа геоданных он предназначен для машинного обучения. С помощью Watson Machine Learning исследователи могут тренировать свои нейросети удаленно на мощностях IBM, ускорять и оптимизировать обучение и т.д.
Нейросети могут распознавать не только гигантские фигуры людей в перуанской пустыне. Ученые Университета Калифорнии Сан-Франциско (UCSF) обучили нейросеть типа FCN (fully convolutional network) на 4 396 томограммах на поиск микроскопических кровоизлияний в мозг и прочих повреждений. В результате нейросеть искала потенциально опасные участки лучше специалистов-радиологов.
Значительная часть завоеваний нейросетей в науке так или иначе завязаны на технологиях машинного зрения. Однако этот факт не ограничивает нейросети только визуалом: исследователи из Google Brain научили научили алгоритм распознавать запах по форме молекул. Они собрали датасет из 5000 молекул, каждую из которых пометили маркером «древесный», «жирный» или «цветочный». Затем датасет предоставили нейросети, чтобы она научилась связывать форму молекулы с заданным названием. Нейросеть действительно научилась определять запах по молекулярной структуре. Впрочем, были и свои проблемы. Как пояснили авторы исследования: «Замените или удалите один атом или связь, и вы можете перейти от роз к тухлым яйцам». Кроме того, при обучении нейросети передалась некоторая субъективность — два человека могут совершенно по-разному описывать один и тот же запах.