Исследователи из Google AI при помощи машинного обучения нанесли на карту Африки 516 млн зданий

Специалисты по искусственному интеллекту (ИИ) из Google AI с использованием машинного обучения разметили почти весь африканский континент, выделив на нём местоположение, размеры и другую информацию о 516 млн жилых домов и других строений. База создавалась с использованием спутниковых фотографий, и уже выложена в открытый доступ под названием Open Buildings. Детали распознавания подробно описаны в работе, выложенной на сайте arXiv.

Целей подобной разметки домов на карте может быть много — оценка количества жителей, планирование развития городов, развитие наук об окружающей среде, гуманитарные миссии. После какого-нибудь стихийного бедствия властям нужно прикинуть, сколько домов пострадало. В идеале для таких вещей требуется база данных с актуальными сведениями, полученными во время переписи. В реальности подобные данные быстро устаревают, а то и вовсе не собираются. Тогда альтернативным источником информации может послужить база с данными о местоположении зданий и плотности застройки.
Спутниковые фотографии — идеальный материал для сбора подобных данных, однако автоматический сбор информации при помощи систем компьютерного зрения сопряжён с определёнными трудностями. Компьютер не всегда может правильно распознать здания на снимках, сделанных из космоса, даже при высоком (30–50 см на пиксель) разрешении. Проблем распознаванию также доставляют неформальные поселения, дома, сливающиеся с окружением из-за использования природных материалов, а также природные образования, похожие на дома.

image-loader.svg
Слева сверху по часовой стрелке: пруды, камни, заборы, транспортные контейнеры.

Применив машинное обучение, исследователи собрали базу из 516 млн зданий почти по всему африканскому континенту. База устроена так, что подойдёт для нескольких видов использования в практических, научных и гуманитарных целях — от реакции на катастрофы до демографической разметки и планирования.

Для построения обучающего набора данных исследователи вручную разметили порядка 1,75 млн зданий на более чем 100 000 изображениях. Пример разметки приведён на фото ниже.

image-loader.svg

Учитывались особенности африканского континента, которые могут запутать компьютер. К примеру, в сельской местности нужно было описывать различные типы жилья и отличать их от природных объектов. В городах нужно было разработать свои правила разметки для очень плотной застройки или длинных структур.

На примере 1) показана группа строений, сочетающая в себе как жилые дома, так и пристройки типа магазинов. Пример 2) — фото круглого дома с соломенной крышей, который машине трудно отличить от дерева. Тут нужно учитывать наличие тропинок, очищенных от растительности участков и теней. 3) — пример нескольких стоящих вместе зданий, которые трудно разграничить.

Обучение модели шло «снизу вверх», когда каждый пиксель относят либо к зданию, либо не к зданию, а потом пиксели группируются. Распознавание работало при помощи популярной для разбора спутниковых снимков модели U-Net.

© Habrahabr.ru