ChatGPT научился слушать, видеть и говорить
OpenAI обновила нейросеть ChatGPT. Теперь нейросеть умеет слушать людей и отвечать им голосом. Об этом разработчики рассказали в своем блоге. Всего чатбот получил три крупных нововведения:
ChatGPT научился отвечать на вопросы, которые пользователь не написал, а произнес с включенным микрофоном. Функция диктовки запросов доступна в мобильном приложении ChatGPT. Вот как выглядит диалог с нейросетью:
Голос
Теперь ChatGPT может вам отвечать не только в текстовом, но и в голосовом формате. Чтобы активировать функцию, нужно в мобильном приложении ChatGPT перейти в Настройки > Новые функции приложения > Ответы голосом.
Всего доступно 5 голосов на выбор: 2 женских, 2 мужских и 1 небинарный. Послушать каждый из них можно по ссылке. Озвучкой ChatGPT занимались профессиональные актеры дубляжа. Помогала преобразовывать речь в текст собственная технология OpenAI Whisper.
«Глаза»
ChatGPT получил еще одно человеческое чувство — способность видеть. Человек может отправить нейросети фотографию, чтобы чатбот проанализировал ее. Примеры сценариев использования этой функции:
- У вас сломался велосипед — сфотографируйте его и отправьте ChatGPT. Нейросеть расскажет, как его починить;
- Вы не знаете, что приготовить — отправьте ChatGPT фото с продуктами в холодильнике. Нейросеть расскажет, что можно сделать из имеющихся ингредиентов;
- Вы не можете решить задачу — сфотографируйте условия задачи или пример и отправьте ChatGPT. Нейросеть озвучит или напишет ответ с объяснением.
Новые функции уже доступны некоторым пользователям. Вскоре они будут открыты всем. Чтобы пользоваться опциями, нужно быть подписчиком ChatGPT Plus (19,99 доллара в месяц). Голосовой чат работает только в программе ChatGPT для Android и iOS.