VK внедрила технологии рекомендаций на базе ИИ с глубоким пониманием контента
Компания VK (бывшая Mail.ru Group) внедрила в продукты холдинга технологии глубокого понимания контента Discovery. Как рассказали в пресс-службе, кросс-форматная контентная модель анализирует название, обложку, аудио и видеоряд ролика по отдельности. Нейросеть объединяет все данные в едином пространстве, что позволяет рекомендательной системе «понимать смысл» контента и объединять разные форматы. Например, такая модель может предложить похожий по смыслу ролик в «VK Видео» на основе понравившегося текстового поста ВКонтакте или короткого видео в «VK Клипах», что делает рекомендации кросс-платформенными.
Распознавание персон на видео. Иллюстрация: VKМультимодальная языковая модель (MMLM) сравнивает контент по смыслу и тематике, объясняет комментарии, описывает интересы пользователя к конкретным сценам и учитывает эмоциональный тон материалов. Нейросеть обучена более чем на трех миллионах русскоязычных материалов и может анализировать видео, изображения, тексты и аудио. С ней рекомендательные алгоритмы быстрее показывают новый контент в продуктах VK без необходимости получения первых пользовательских реакций.
Кросс-форматная контентная модель. Иллюстрация: VKРекомендательная система автоматически распознает известных персон на видео, что позволяет алгоритмам учитывать как тематики контента, так и присутствие в роликах конкретных популярных личностей. Технология построена на двух моделях машинного обучения: одна анализирует видеоряд с частотой один кадр в секунду, а вторая определяет на кадрах лица и формирует единый «образ» героя.
Мультимодальная языковая модель. Иллюстрация: VKПомимо «VK Видео» и внутренних задач поиска и аналитики, технологии будут использоваться в других продуктах VK с пользовательским контентом — от коротких видео до музыки.
© iXBT
