Сбер обновил нейросеть Kandinsky для создания видео: еще больше реалистичности12.12.2024 14:15

AQAKkrdlrm1qZZtzglFH6xoErpGdDr9ddPNeMa_W

На международной конференции AI Journey компания показала множество новых разработок, среди которых обновленная версия Kandinsky Video и ее ускоренный вариант Kandinsky 4.0 Video Flash. Сбер обещает, что новая нейросеть для генерации видео позволит достичь еще больше реалистичности, давая возможность создавать ролики на основе текстовых описаний / стартовых кадров.

В пресс-службе компании рассказали, что Kandinsky 4.0 Video доступна как для обычных пользователей, так и для профессионалов: дизайнеров, маркетологов, мультипликаторов и т. д. Новая нейросеть способна генерировать видеоролики в разрешении 1280×720 точек продолжительностью до 12 секунд. При этом она «переваривает» любые текстовые описания или произвольные стартовые кадры. Также доступен выбор формата соотношения сторон видео.

В Сбере акцентируют, что обновленная нейросеть обладает улучшенным визуальным качеством, обеспечивая высокий контраст и четкость кадров, грамотное выстраивание общей композиции сцены. Также отметили в компании и возросшую реалистичность — прогресс стал возможен благодаря уникальному сотрудничеству научных и инженерных команд.

Помимо основной нейросети компания также выпустила быструю версию Kandinsky 4.0 Video Flash. Она отличается тем, что генерирует 12-секундные видео всего за 15 секунд, но в разрешении 720×480 точек.

Доступ к Kandinsky 4.0 Video

Сообщается, что нейросеть сначала будет доступна для художников, дизайнеров и кинематографистов на базе инструмента Fusion Brain. После опробовать генерацию видео смогут все желающие — уже в первом квартале 2025 года.

Ранее мы рассказывали о новом инструменте от Сбера для программистов — ИИ-помощнике GigaView.