Facebook открыл код платформы Detectron для распознавания объектов на фотографиях23.01.2018 11:15

Группа исследователей искусственного интеллекта из компании Facebook открыла исходные тексты платформы Detectron с реализацией набора алгоритмов для распознавания и классификации объектов на фотографиях. Проект реализован на языке Python с использованием фреймворка глубинного машинного обучения Caffe2 и распространяется под лицензией Apache 2.0. Для загрузки подготовлена большая коллекция наборов данных и более 70 натренированных готовых моделей для решения различных типов задач компьютерного зрения. Модели поставляются под свободной лицензией CC BY-SA 3.0.

В рамках платформы Detectron предложены реализации наиболее перспективных подходов по построению нейронных сетей и систем машинного обучения, нацеленных на выделение объектов на изображениях. Например, авторы алгоритма Mask R-CNN в прошлом году стали обладателями премии Марра, вручаемой комитетом IEEE за выдающиеся достижения в области компьютерного зрения. В итоге удалось подготовить высокопроизводительную и гибкую систему для высококачественного определения объектов, для разработчиков ПО предоставляющую средства для быстрой интеграции данной функциональности в свои проекты, а для исследователей машинного обучения — для проведения экспериментов и создания реализаций новых алгоритмов.

В текущем виде Detectron предлагает шесть алгоритмов распознавания изображений (Mask R-CNN, RetinaNet, Faster R-CNN, RPN, Fast R-CNN и R-FCN), разработанных различными академическими коллективами исследователей. Для организации машинного обучения поддерживается развёртывание четырёх типов нейронных сетей: ResNeXt{50,101,152}, ResNet{50,101,152}, Feature Pyramid Networks (на базе ResNet/ResNeXt) и VGG16, но дополнительные типы могут быть легко добавлены, благодаря модульной архитектуре платформы. Решения на базе Detectron уже используются Facebook в некоторых проектах по сегментации изображений и построению систем дополненной реальности.