Нейросеть Inception спасает женские груди по гигапиксельным фотографиям
Лечение рака груди сильно зависит от того, на какой стадии находится болезнь. Чтобы понять стадию, проводится микроскопическое исследование образцов биопсии примыкающих лимфатических узлов (увеличение 40X). На некотором количестве слайдов 100 000 × 100 000 пикселей патолог внимательно ищет области раковых клеток, то есть метастазы. Это очень трудоёмкий процесс, доступный только опытному специалисту. К счастью, в последнее время на помощь врачам приходят системы машинного зрения. Компьютер сильно уступает человеку по специфичности, то есть точности выявления отрицательных образцов, но зато обогнал его по чувствительности, то есть точности выявления положительных образцов.
Новая нейросеть Inception (она же GoogLeNet: вероятно, в ней используются элементы старой нейросети LeNet, отсюда и название) заметно превосходит человека по чувствительности, не говоря уже о скорости работы. Результат других нейросетей по точности распознавания положительных образцов улучшен примерно на десять процентных пунктов или больше.
Конечно, компьютерный тест потребует дальнейшего подтверждения специалистов, чтобы сократить ложно-положительные срабатывания, но зато теперь сильно уменьшается вероятность пропустить опухоль там, где она действительно есть. Другими словами, диагностирование стадии рака груди станет более точным. А значит, на несколько процентов повысятся шансы успешного лечения. Вот так машинное зрение и искусственный интеллект спасают женские груди —, а ведь очень важные органы, терять которые не хочет никто (в отличие от аппендикса, например, — червеобразного отростка прямой кишки).
В научной работе представлен фреймворк рекуррентной нейросети Inception (GoogLeNet), которая выполняет поиск раковых метастазов в лимфоузлах. Исследователям удалось вдвое уменьшить количество ошибок при количестве ложно-положительных срабатываний 8 штук на один слайд, по сравнению с другими системами машинного зрения.
У лучшей до настоящего времени системы из конкурса на поиск метастазов рака Camelyon16 показатель чувствительности составлял 75%, если допустить 8 ложно-положительных срабатываний на слайд, а показатель AUC (то есть область под ROC-кривой) на слайд составлял 92,5%. Обученная нейросеть Inception значительно улучшила эти показатели. На восьми ложных срабатываниях нейросеть Google показывает чувствительность около 92%.
*Примечание: указанный результат патологи демонстрируют, если их практически не ограничивать во времени изучения слайдов, то есть предоставить для этой задачи 30 часов на 130 слайдов
В то же время патологи с результатом 73% практически не допускают ложно-положительных срабатываний вообще. Если они говорят, что опухоль есть — то она точно есть.
Нужно понимать также, что нейросеть нуждается в предварительном обучении с учителем. Таким образом, её точность сильно зависит от того, на каких конкретно образцах аномалий её обучали. В то же время она не обладает широтой знаний опытного врача — и неспособна увидеть на слайдах никаких других аномалий типа воспалительных процессов, следов аутоиммунных заболеваний или других видов рака. Она «заточена» конкретно под определённый внешний вид клеток рака молочной железы в лимфоузлах. Поэтому она ещё и бесполезна в диагностике других видов рака. Хотя авторы работы говорят, что в некоторых других видах рака Inception всё-таки может улучшить точность распознавания. Например, в распознавании рака лёгких.
В целом такие нейросети способны значительно облегчить работу патологов и уменьшить у них количество ложно-отрицательных срабатываний. У нейросети в четыре раза (!) меньше ложно-отрицательных срабатываний, чем у человека-патолога. Количество ложно-отрицательных срабатываний у Inception более чем в два раза меньше, чем у лучшей системы машинного зрения, разработанной к настоящему времени.
Определённо, в точности распознавания изображений нейросетями в последние годы наблюдается очень бурный прогресс. Это настолько перспективная и быстроразвивающаяся область, что здесь буквально каждый день происходят прорывные достижения. У исследователей возникает главный вопрос — какое из применений выбрать. Практически в любой области, где решат использовать нейросеть для распознавания образов — обязательно будет показан результат, значительно превосходящий предыдущие методы.
Авторы Inception намерены продолжить работу над своей нейросетью, увеличив наборы данных для обучения.