СМИ: Роскомнадзор запустил интеллектуальную систему отслеживания незаконного контента в интернете «Окулус»

Источники СМИ сообщили, что подведомственный Роскомнадзору Главный радиочастотный центр (ГРЧЦ) запустил в эксплуатацию интеллектуальную систему отслеживания незаконного контента в интернете «Окулус».
«Информационная система «Окулус» уже запущена и выполняет возложенные на неё задачи в полном объёме: выявляет нарушения законодательства в изображениях и видеоматериалах. В декабре 2022 года система была протестирована, а в январе 2023 г. началась интеграция системы с другими инструментами мониторинга Роскомнадзора», — заявил СМИ представитель ГРЧЦ.

Главная задача системы — это выявление нарушений российского законодательства в изображениях и видеороликах, уточнили в надзорном ведомстве.

«Система распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах. «Окулус» автоматически обнаруживает такие правонарушения, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суициду, пронаркотический контент, пропаганда ЛГБТ и другие запрещённые действия», — пояснил СМИ представитель ГРЧЦ.

Представители отрасли рассказали СМИ, что «Окулус» — это система, которая предполагает выполнение задач по классификации изображений и видеороликов по заданным требованиям, включающим основные типы запрещённого контента. По их словам, «Окулус» работает как классификатор с уже заданным набором источников информации, в которых анализируется контент на предмет соблюдения или несоблюдения требований закона. Эта система может анализировать конкретные страницы сайтов или же паблики и профили в соцсетях, но не занимается сбором данных, она их классифицирует.

«До внедрения системы «Окулус» специалисты ГРЧЦ анализировали запрещённый контент преимущественно вручную. В среднем каждый оператор обрабатывал несколько сотен изображений и видеороликов в сутки. «Окулус» же будет анализировать более 200 000 изображений в сутки (около трёх секунд на одно изображение). Система позволит автоматизировать и значительно ускорить мониторинг визуального контента», — раскрыл данные о системе СМИ представитель ГРЧЦ.

В надзорном ведомстве планируется доработка и модернизация системы «Окулус» до 2025 года. «Прорабатывается возможность добавления новых классов и типов нарушений, а также функции определения поз людей и их действий. Система будет выявлять запрещённые материалы «на нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте», — подытожили в надзорном ведомстве


В августе 2022 года ГРЧЦ со второго раза нашёл разработчика интеллектуальной системы отслеживания незаконного контента в интернете с помощью технологий искусственного интеллекта с названием «Окулус».

Начальная цена контракта составляла 79 млн рублей. Компания «Эксикьюшн Эр Ди Си» (Execution RDS) согласилась выполнить проект за 57,7 млн рублей.

Месяцем ранее данный тендер был отменён комиссией ГРЧЦ из-за отсутствия претендентов.

В 2021 году Московский физико-технический институт (МФТИ) выполнил за 14 млн рублей для ГРЧЦ предварительные работы по этому проекту в рамках исследования о возможности применения нейросетей для выявления противоправного контента.

Согласно ТЗ проекта «Окулус», исполнитель был должен концу 2022 г года создать и запустить систему на основе нейросетей, которая будет анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещённой информации.

Рабочая система «Окулус» должна с помощью ИИ уметь находить запрещённый контент как в текстовом виде, так и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений». Также «Окулус» должна уметь распознавать текстовую информацию на изображениях и кадрах видеоматериалов (включая, но не ограничиваясь: расшифровку QR-кодов, переписки в чатах и каналах мессенджеров, надписей, URL-адресов, субтитров и др.).

По условиям тендера подрядчик обязуется создать систему и предоставить ГРЧЦ дата-сеты, которые позволят определять запрещённую информацию (не менее 1 тыс. изображений по каждому типу нарушений).

Проект предусматривает создание отказоустойчивого, работающего круглосуточно, кроме перерывов на режим обслуживания и обновления, а также масштабируемого и обучаемого информационного решения. Система должна поддерживать технологии виртуализации и контейнеризации в инфраструктуре Заказчика на ПО Kubernetes. Весь разработанный исходный код «Окулус» должен храниться в единой системе управления репозиториями GitLab, организованной на ресурсах Заказчика.

Основные цели создания такой системы — автоматизация и повышение эффективности процессов выявления признаков нарушений законодательства РФ в изображениях и видеоматериалах, размещённых в сети Интернет и оптимизация расходов на выявление признаков нарушений законодательства РФ в изображениях и видеоматериалах в интернете.

6xunaqijnswusr5wemkj24ilazs.jpegФункциональная архитектура системы «Окулус».

Согласно ТЗ, «Окулус» должна анализировать не менее 200 тыс. изображений в сутки с ложноположительными и ложноотрицательными результатами не более 20%.

Представитель ГРЧЦ пояснил СМИ, что для стабильной работы системы понадобится не менее 48 серверов, оснащённых графическими ускорителями, а поиск запрещённого контента система должна осуществлять благодаря нейронным сетям, работающим на основе глубокого машинного обучения.

Профильные эксперты считают, что исполнителю будет сложно реализовать такую систему за три месяца, так как это полностью новое решение, а не доработка существующих аналогов. По их мнению, только сбор репрезентативных обучающих дата-сетов может занять более полугода, а ввод в эксплуатацию системы может занять несколько месяцев.

© Habrahabr.ru