В России создан новый алгоритм для обработки биологических изображений
В биологии большое количество информации ученые получают в виде изображений. Автоматический анализ биологических изображений — сложная задача. Часто приходится ориентироваться во множестве слоев и разнообразных объектов одновременно, особенно если речь идет о данных микроскопии, где объекты накладываются друг на друга, а качество и четкость изображений могут быть очень низкими. Машинное обучение помогает обучить компьютер обрабатывать биологические изображения, чем значительно ускоряет анализ данных и добавляет точности и объективности.
В лаборатории компьютерного зрения Центра Сколтеха по научным и инженерным вычислительным технологиям для задач с большими массивами CDISE был предложен метод для вычленения биологических объектов (отдельных клеток, организмов, частей растений) из сложных изображений. Первым автором исследования выступил научный сотрудник Виктор Куликов, работавший под руководством профессора Сколтеха Виктора Лемпицкого. В основе нового метода лежит идея сведения сложной задачи разделения объектов к более простой задаче регрессии. Это достигается введением дополнительных «гармонических» сигналов во входные слои нейронной сети и автоматической подстройкой параметров этих сигналов под характерный размер и расположение разделяемых объектов. Результаты исследования опубликованы в открытом доступе и будут представлены в виде устного доклада на престижной конференции по компьютерному зрению СVPR 2020.
Ученые использовали четыре разных типа изображений: фотографии растений, фотографии, содержащие большое количество червей С. Elegants, микроскопические снимки бактерий E. Coli и культуры раковых клеток HeLa. Алгоритм обучения нейронных сетей, состоящий из двух этапов, отлично справился с поставленной задачей. После обучения под соответствующий тип изображений, нейронные сети успешнее, чем ранее представленные методы, выделяли листья растений, червей, раковые клетки и отдельные бактерии. Новый метод может найти свое применения в научных исследованиях и медицинской практике.
«Основным преимуществом нового метода является способность обучаться даже на маленьких выборках. Мы надеемся, что предложенный нами алгоритм найдет применение не только в биологических исследованиях, но и в других отраслях, в которых сложно получать большие выборки размеченных обучающих изображений», — рассказывает Виктор Лемпицкий.
Препринт работы доступен на сайте препринтов Arxiv.org. Авторы также выложили код работы в открытый доступ. Материал предоставлен пресс-службой Сколтеха.
Обсудить 0