Waymo открыла доступ к большому датасету для обучения беспилотных автомобилей

d745d0muwic3xu0-jzwm-lgspy4.jpeg

Компания Waymo открыла в общий доступ и только для некоммерческого использования большой датасет, предназначенный для обучения алгоритмов беспилотных автомобилей.

Датасет «Waymo Open Dataset» содержит в себе тысячу двадцатисекундных записей, собранных с пяти лидаров и пяти камер во время реальных поездок по четырем американским городам с разными дорожными и погодными условиями, как пояснено в блоге компании.

Большая часть данных в датасете маркирована и содержит в себе суммарно о 12 млн. 3D меток и 1,2 млн. 2D меток различных объектов вокруг автомобиля.
Компания Waymo считается одним из лидеров в отрасли беспилотных автомобилей. Данные являются важным компонентом для машинного обучения в работе Waymo.

Беспилотные автомобили Waymo уже проехали более 10 млн. миль в двадцати пяти городах США. Этот богатый и разнообразный опыт, накопленный в реальном мире, помог инженерам и исследователям компании разработать и модернизировать беспилотные инновационные модели и алгоритмы.

Теперь Waymo открывает для исследователей специально подготовленный датасет на основе данных датчиков высокого разрешения, собранных беспилотными автомобилями Waymo во время тестовых поездок по американским городам, расположенным в штатах Калифорния, Аризона и Вашингтон.

qkryhy4q8otqol841hk6br7j5sy.gif

Датасет собран на основе тысячи поездок, различающихся между собой погодой, временем суток, количеством пешеходов и автомобилей вокруг, а также многими другими факторами.

Из каждой поездки разработчики Waymo выбрали наиболее репрезентативный фрагмент длиной 20 секунд.

locwqivu4tt2wg2c7ivpin96tyy.gif

Данные, собранные из каждой поездки состоят из видеороликов с пяти камер и облаков точек с пяти лидаров (одного лидара дальнего действия и четырех лидаров ближнего действия). Для удобства дальнейшей обработки алгоритмами все данные датасета синхронизированы и сформированы в виде единых пакетов данных за каждые 0,1 секунды поездки.

1bzpvqunhwg1khridlfem2vaccu.png

Данные датасета размечены и на них нанесены границы вокруг объектов четырех главных типов: автомобили, пешеходы, велосипедисты и дорожные знаки. При этом пока размечены только все данные с лидаров, а с камер размечено только сто роликов.

В будущем Waymo планирует доразметить все данные с камер, а также опубликовать данные с новых поездок.

Этот открытый датасет только первый шаг для Waymo, где ожидают обратной связи от его исследователей о том, как сделать эти данных еще более эффективными в новых следующих открытых датасетах.

© Habrahabr.ru