Самые интересные идеи ИИ-проектов, поданные на Архипелаг 20.35
Воскресенье — последний день подачи заявок на наш акселератор ИИ-проектов Архипелаг 20.35. Сейчас в базе больше тысячи проектов разной стадии проработки и 13 тысяч участников, которые стоят за ними или пришли в одиночку, чтобы присоединиться к одной из команд.
Не дожидаясь окончания приема заявок, мы заглянули в их описания и обнаружили массу интересного — от роботов, играющих в шашки и го, до построения цифровых моделей социума. Под катом — подборка интересных идей и продуктов, которые мы там нашли.
Кстати, еще не поздно присоединиться: на первую ступень акселератора мы планируем взять 1000 стартапов, отсеяв из поданных нерелевантные.
Общие цифры
По данным на утро четверга на Архипелаг 20.35 подали 1364 проекта.
Из них 37% — в стадии идеи, 47% имеют готовые прототипы, а 16% уже вышли на рынок со своим продуктом.
О некоторых из них мы рассказывали в небольшой подборке и еще в двух публикациях: про нейросеть Awtor и сервис подбора резюме GoRecruit.
Бегло просматривая заявки, сложно определить, какая из заявленных идей жизнеспособна и имеет за собой команду, готовую воплотить ее в жизнь. Поэтому, анализируя ситуацию, мы будем смотреть только на сами идеи, без оглядки на глубину проработки или прогноз их успеха.
Вполне ожидаемо, что в списке участников половина команд — вузовские. Среди институтов самым плодотворным оказался Национальный исследовательский университет «Высшая школа экономики». От него заявилось 23 команды (31 человек) и 9 индивидуальных участников. В пятерке лидеров также Томский государственный университет, МГУ имени Ломоносова, СПбГУ и Российская академия народного хозяйства и государственной службы при Президенте РФ.
В каких областях больше проектов?
По своему уровню проекты очень разные — от сложных промышленных систем до теоретических работ старшеклассников. И направлены они на решение проблем принципиально разного масштаба — от локальных инициатив одного поселка или рекреационной зоны до глобальных идей. Но в общей массе заявок явно выделяются несколько тем, которые привлекают больше внимания изобретателей и энтузиастов. По ним сейчас и пройдемся.
Алгоритмы распознавания
Множество идей связаны с распознаванием текстов и изображений. Благо, тут много общедоступных библиотек, которые развились достаточно хорошо, чтобы показывать интересные результаты. Дело за малым — за освоением новых сфер применения.
Для текстов будущие участники Архипелага 20.35 предложили несколько специализированных онлайн-переводчиков и инструментов, которые помогают обучающимся усвоить информацию.
В сфере распознавания изображений оказалась популярна тема медицины, а точнее анализа данных, собранных при помощи УЗИ или снимков в разных спектральных диапазонах, в том числе в видимой области с помощью камеры смартфона. Еще лет 10 назад мы смеялись над «диагностикой по фото», а сегодня такие системы, заточенные под конкретные заболевания, уже начинают приносить пользу на ранних этапах выявления проблем.
Среди прототипов, о которых пока мало информации, нашлась система анализа рентгеновских снимков, предназначенная не для помощи врачам, а для пациентов, чтобы те могли контролировать врачей. Такая фокусировка проекта немного пугает. Тем не менее все подобные системы, дошедшие до стадии продукта, все-таки ориентированы на врачей (например, Pocket medic, помогающая назначать препараты в комплексе).
Много внимания команды уделили распознаванию человеческого поведения, лиц и эмоций по видео. В этом сегменте много готовых продуктов, к примеру система ConVision, которая распознает пол, возраст и эмоции для таргетирования при демонстрации наружной рекламы. Параллельно ConVision собирает статистику по зрительному контакту с запущенными видеороликами — это помогает понять, привлекает реклама внимание или нет.
Дождемся, что скоро билборды будут лично обращаться к прохожим: «Username, ты только что спросила подругу про хороший кофе? Так вот, в 20 метрах — шикарная кофейня «Супер-арабика-капучино»
В бизнесе распознавание эмоций и поведения может иметь массу применений, так что на Архипелаг заявлено сразу несколько проектов, занимающихся анализом эмоций без конкретного практического применения. Например, Нейрокорпус.
Система выделяет фигуры и лица людей на видеоряде, характеризуя их эмоциональное состояние. Обученная модель при необходимости просто адаптируется под конкретную задачу.
Пример распознавания эмоций системой «Нейрокорпус»
Еще один проект — система идентификации на основе поведенческой биометрии, которая не требует специальных устройств или датчиков. Конечно, в этом случае анализируется не видеоряд, а динамика нажатия на клавиатуру, характер движения мыши и прикосновения к сенсорному экрану.
Честно говоря, немного пугает обилие проектов, которые предлагают анализировать видео или аудио с единственной целью — чтобы за кем-то следить. Один из заявленных проектов даже так и называется — Большой брат.
Команда разрабатывает устройство видеонаблюдения, которое будет «ловить» фигуру человека в объектив камеры и отслеживать его перемещение в секторе наблюдения. Прототип уже функционирует.
В первую очередь под прицелы объективов попадут работники производств и офисов. А вишенкой на торте стал тот факт, что сразу несколько команд заявили проекты по отслеживанию активности удаленных сотрудников во время видеосовещаний.
Например 2dlab предлагает контролировать происходящее во время zoom-конференций. Помимо протоколов собрания система будет выдавать результаты того, насколько команда была вовлечена в общение. И стоит отвлечься во время zoom-встречи, думая, что вас никто не видит, как потом придется объяснять начальству, почему вы отлыниваете.
Разработчики HumanVision пошли дальше. Судя по презентационному видео, они предлагают следить за вовлеченностью удаленных сотрудников все рабочее время. Но проект пока дошел лишь до стадии прототипа, поэтому подробностей у нас нет.
Другие участники Архипелага предлагают реализовать похожий сервис для ресторанного бизнеса. Инструмент должен анализировать видео из зала, отслеживая, сколько времени официанты тратят на обслуживание и кто из них игнорирует клиентов.
Следить за окружающей обстановкой можно не только с помощью видеокамер. Команда VoiceAnalytica предлагает записывать и анализировать звуковой фон в офисах обслуживания, чтобы повышать качество взаимодействия с клиентом. Один из вариантов внедрения уже готового продукта — аудиобейджи, подразумевающие подслушивание каждого специалиста. Оруэлл как в воду глядел…
Другими словами, тенденция такова, что системы будут следить за людьми везде где только можно.
Тем не менее раздел про технологии распознавания хочется закончить позитивной нотой. К той же категории проектов можно отнести многочисленные инструменты для людей с ограниченными возможностями. Участники предлагают свои решения для задач генерации и перевода шрифта Брайля, распознавания языка жестов и, наоборот, перевода печатного текста в жесты, развития слуха и речи у детей после слухопротезирования. Эти проекты вселяют надежду на то, что жизнь людей с ограниченными возможностями станет немного проще.
Беспилотники
Заметная доля проектов сосредоточена вокруг разноформатных беспилотников. Это и роботы-доставщики, и научно-исследовательское оборудование, и автономные системы для конкретного практического применения. Некоторые проекты сосредоточились вокруг отдельных деталей беспилотников или необходимых для них систем — автопилотов, навигации.
Наше внимание привлекли сразу два аппарата виртуального присутствия, оба, правда, пока находятся на стадии прототипа.
X-Walker предлагает вместо вас прогуляться по улочкам Парижа или набережной теплого курорта, чтобы подарить новые эмоции тому, кто хочет путешествовать, не тратясь на дорогу. Пользователь сможет переключаться между роботами, находящимися в разных частях света, и будет наблюдать за происходящим их глазами.
X-Walker
Второй проект — Robot Avatar, система виртуального присутствия, которая повторяет все движения пользователя и при необходимости управляется голосом. Робот имеет широкий спектр применения, транслируя речь оператора и даже используя переводчик для общения с окружающим миром. Правда, пока бизнес-модель его использования неясна.
Экология и сортировка мусора
Одна из самых популярных тем в этой категории — раздельный сбор и сортировка мусора, а также очистка сточных вод. Среди просмотренных проектов наиболее любопытным показался умный мусоропровод. Идея заключается в том, чтобы вместо закрытия мусоропроводов в многоквартирных домах, как тут предлагают общественники, переоборудовать их под раздельный сбор мусора с интеллектуальной сортировкой на закрытой контейнерной площадке. Команда пока не успела продумать до конца все детали (проект на стадии разработки прототипа). Открытым остался вопрос, как именно мотивировать жильцов сортировать мусор правильно. Положиться на их сознательность или автоматизировать и этот процесс тоже?
Параллельно с этим проектом несколько команд заявили роботов — сортировщиков мусора. Один из проектов добрался до стадии успешного продукта.
Это роботы, которые производит компания «Интеллектуальные системы».
Роботы-сортировщики
Сортировка мусора роботами на конвейере
Другие заявленные проекты пока не ушли дальше прототипа. Среди них можно отметить робота-мусорщика для уборки парков. Он перемещается по прогулочным дорожкам, распознает окурки, бумажки, бутылки и прочий типичный мусор, который подбирает или пылесосит. Если робот сталкивается со слишком крупным мусором, то отправляет сообщение оператору.
Принципиальная схема прототипа робота-мусорщика из блога разработчика. По всей видимости, обработка видео будет осуществляться в облаке
Персональные сервисы
Довольно много среди представленных проектов инструментов, облегчающих жизнь конкретному человеку. Часть проектов посвящена личной эффективности и развитию, в том числе профессиональному. Сразу несколько команд готовят решения для профориентации, проектирования индивидуальных карьерных треков и оценки знаний в разных предметных областях.
Популярна тема интерактивных помощников и разноформатных систем рекомендаций. Несмотря на сложившуюся обстановку, выделяется на этом фоне сфера туризма и развлечений: участники подали очень много проектов, связанных с поиском попутчиков, подбором отелей, направлений и мест проведения досуга.
Отдельной строкой стоит упомянуть ботов для психологической помощи в разных форматах. Например, чат-бот для Telegram, который выступит посредником в семейных конфликтах. Задача бота — выявить конфликты в переписке между супругами, порекомендовать, как убрать из текста напряжение, и впоследствии, вероятно, доложить обо всем практикующему семейному психологу. Проект находится на стадии прототипа.
Генерация контента
Из нескольких поданных заявок наше внимание привлекла нейронная сеть, которая генерирует образ и голос диктора. Проект дошел до стадии прототипа, а на официальном сайте есть многообещающий ролик, сгенерированный системой.
Другой пример — нейросеть, которая создает описание товара по фотографии. Разработчики видят ее применение в интернет-витринах, где нужно быстро создать сотни или тысячи описаний.
Еще один любопытный проект — ИИ-режиссер. Команда собирается обучать нейронную сеть на известных фильмах и литературных произведениях, чтобы та генерировала сценарии. Правда, подробностей о проекте пока никаких нет — он еще на стадии идеи.
Удивительно, но сразу несколько команд развивают идею бесед с историческими персонажами, оставившими большое эпистолярное или научное наследие, на котором можно было бы обучить модель.
Лаборатория цифровых дневников известных личностей собирается начать с цифровой копии А.С. Пушкина. А со Стивеном Хокингом уже можно поговорить в Telegram благодаря одноименному боту.
Еще одна команда ставит своей целью интерактивные тренировки критического мышления, для чего предполагает конструировать собеседников, способных аргументированно спорить. На деле предполагается тренировать модель все на том же наследии реальных исторических личностей. Так что и тут появляется шанс поспорить с Аристотелем или Гитлером.
Отличие этой модели в том, что точно так же (при правильном обучении модели) можно поспорить с самим собой.
Проект пока на стадии прототипа.
Когда ошиблись дверью, но вышло забавно
Ну и под конец добавим немного бэкстейджа. Изучая заявки по их названиям и кратким описаниям, иногда воскликнешь: «А это что такое? Что у них там делает ИИ? Где они берут данные?» Например, попалось «производство тортов на заказ в небольшом поселке». Открываешь детали проекта: там презентация в PowerPoint, вроде все как положено, но внутри полно фраз типа «магазинные сладости брать не надо, все равно непонятно, из чего их делают, а тут все свое, домашнее!» Ну и далее про то, как человек собирается сам печь и что-то продавать соседям, рекламируясь во «ВКонтактике». Где тут ИИ? Да и зачем он, когда своя голова на плечах (тут должен быть большой смайл, но в правилах Хабра просят смайлы не лепить).
Ну, а далее по списку: проект производства иммобилизационных шин для людей и животных, идеи экологических парков и кинологических площадок, средства индивидуальной защиты со встроенными подушками безопасности, вендинговый автомат, который выдает пельмени, биоурна для праха, которая после смерти помогает человеку превратиться в дерево, и даже специальные замки на дорожные люки. Из всех поданных проектов таких примерно 1,5%. Думаю, что к некоторым из них вполне можно прикрутить «машин лернинг» — было бы как минимум прикольно.