Google представила новые нейросети для работы с изображениями: на что они способны

логотип Google на здании
Источник: Unsplash

Технологии искусственного интеллекта от Google продолжают расширять свои возможности. На этот раз компания анонсировала сразу две новые модели: Veo, которая предназначена для генерации видео, и Imagen 3 — для создания изображений высочайшего качества. Эти модели уже доступны на платформе Vertex AI, которая позволяет бизнесу использовать ИИ для ускорения рабочих процессов и повышения качества контента.

Модель Veo разработана для создания видеороликов на основе текстовых или визуальных запросов. Это первая такая технология среди облачных провайдеров, которая способна преобразовывать статические изображения в динамические видеосцены. Модель не только генерирует качественные видеоклипы, но и поддерживает разнообразие визуальных стилей — от кинематографических до документальных.

Скриншот нейросети Veo
Возможности VeoИсточник: Google

Одной из ключевых особенностей Veo является реализм. Люди, животные и предметы в созданных видеороликах выглядят естественно, а их движения согласованы. Например, компания Agoda уже тестирует Veo для создания уникального видео-контента о путешествиях, генерируя изображения популярных туристических мест, а затем преобразовывая их в видеоролики.

Кроме того, Veo позволяет значительно снизить затраты на видеопроизводство. Там, где раньше были нужны команды специалистов и недели работы, теперь достаточно текстового описания. Эта технология открывает новые горизонты для маркетинга, социальных сетей и даже киноиндустрии.

Еще одна новинка — третья версия популярной текст-изображение модели от Google. Она создает изображения с высочайшей детализацией, приближенной к фотореалистичной, и минимизирует визуальные дефекты, такие как артефакты и шумы.

Скриншот примера работ нейросети Imagen 3
Возможности Imagen 3Источник: Google

Модель не ограничивается генерацией контента: она предлагает функции редактирования, включая изменение фона, доработку деталей и масштабирование изображений. С ее помощью бренды могут адаптировать изображения под свои потребности, например, добавляя логотипы или подчеркивая фирменный стиль.

Крупнейший производитель товаров массового потребления Mondelez International уже использует Imagen 3 для массового производства рекламных материалов. Сотни тысяч уникальных визуалов создаются для таких брендов, как Oreo, Milka и Cadbury. Благодаря ИИ время подготовки кампаний сократилось с недель до дней, а качество материалов значительно улучшилось.

Различные виды продукции Mondelez International
Продукция Mondelez InternationalИсточник: Avant Food Media

Безопасность и прозрачность

Google уделяет особое внимание безопасности использования ИИ. В обе модели встроены фильтры, предотвращающие создание вредного контента, а также система цифровых водяных знаков. Это позволяет защищать права на контент и минимизировать риски дезинформации.

Компания также гарантирует соблюдение конфиденциальности данных: информация клиентов не используется для обучения моделей, что делает решения Google надежными для бизнеса.

Что это значит для отрасли

Появление Veo и Imagen 3 знаменует важный этап в развитии генеративных технологий. Они позволяют компаниям работать быстрее, дешевле и эффективнее, раскрывая новые возможности для творчества и автоматизации.

Vertex AI делает эти технологии доступными для бизнеса любого уровня. Простота использования платформы, включая настройку и интеграцию, дает возможность сразу включить ИИ в рабочие процессы.

Если вам интересно, как можно использовать ИИ для целого города, то прочитайте об этом в нашем материале.

©  HI-TECH@Mail.Ru