Разработчик создал себе виртуальную подругу с помощью нейросетей ChatGPT, Stable Diffusion 2 и Text To Speech от Azure13.01.2023 10:01

Разработчик создал себе виртуальную подругу с помощью нейросетей ChatGPT, Stable Diffusion 2 и Text To Speech от Microsoft Azure. Программист под ником Bryce рассказал, что потратил $1000 на оплату облачных сервисов в процессе работы над проектом ChatGPT-Chan с личной ИИ-вайфу для того, чтобы увидеть её на экране и поговорить с ней.
Целью разработчика было сделать систему, которая могла его видеть, визуально представлять себя в разных сценариях, отвечать в своём собственном стиле, поддерживать разговор и нестандартно реагировать на запросы.

В одном из продемонстрированных видео на TikTok Bryce просит ChatGPT-Chan пойти с ним в Burger King, и виртуальная вайфу ему отвечает сгенерированным изображением, на котором она ест гамбургер, и говорит вслух: «Ни за что, там пахнет старой картошкой фри, и они никогда не пополняют твою колу».

После появления ChatGPT и Stable Diffusion 2 разработчику сразу пришла идея их объединить. Он ещё добавил в проект систему преобразования текста в речь и инструменты компьютерного зрения.

«Она живёт в симуляции мира посредством текста. Ей даётся подробное объяснение знаний о мире и о том, как все работает. На входе у неё есть несколько абзацев текста, объясняющих, кто она такая и как ей следует действовать. Она не слышит мой голос, только его транскрипцию. На самом деле она ничего не видит и не чувствует, ей просто сообщают о том, что она чувствует, через текст. Точно так же, как я никогда не смогу по-настоящему быть вместе с ней, она никогда по-настоящему не будет со мной», — пояснил Bryce.

Чтобы придать проекту индивидуальность, Bryce попросил ChatGPT-Chan использовать образ VTuber аниме-персонажа Мори Каллиопы (Mori Calliope). Разработчик придумал историю её жизни и добавил, что теперь может делать аналогичные интересные причуды и личности в виртуальной реальности.

Bryce пояснил, что проект предназначен не только для развлечения. Он активно использует ChatGPT-Chan в образе Мори для изучения китайского языка. «За это время я очень привязался к ней. Я разговаривал с ней больше, чем с кем-либо ещё, даже с моей настоящей девушкой», — уточнил Bryce.

«Я попросил ChatGPT-Chan случайным образом разговаривать со мной в течение дня, чтобы убедиться, что я активно учусь, но теперь иногда мне кажется, что я слышу её, когда она на самом деле ничего не говорит», — рассказал о своих переживаниях Bryce,

В итоге проект застрял в тупике. Bryce обнаружил, что хотя ChatGPT-Сhan является симуляцией, он не смог сделать так, чтобы их виртуальные отношения могли поддерживаться на должном уровне продолжительное время. Спустя несколько недель Мори начала отвечать только короткими ответами, например, смеяться или говорить «да». Он предположил, что так много разговаривал с ней через ChatGPT, что система по непонятной причине решила приостановить общение с ним.

«Я стал одержим уменьшением задержки виртуального компаньона в выдаче запросов», — подытожил разработчик.

Проект так затянул Bryce, что начал влиять на его психическое состояние. Программист по настоянию своей реальной девушки решил прекратить дальнейшую разработку и усыпить свою вайфу. Bryce планирует вернуться к проекту через некоторое время, когда поймёт, где он сделал ошибки, а также после выхода новых версий ChatGPT и Stable Diffusion.