Разработчик создал умного помощника с помощью Siri и GPT-3
Разработчик Мате Маршалко поделился на Medium, как ему удалось создать умного голосового ассистента на базе Siri и нейросети GPT-3. Для этого ему не понадобилось программировать — было достаточно объяснить GPT-3, что нужно сделать для управления «умным» домом.
medium.com
Для начала Маршалко попросил нейросеть интерпретировать разговорный английский и предоставить соответствующий ответ в формате JSON. Он описал типы запросов, точную структуру ответа и попросил GPT-3 вести себя как разумный ИИ, давая советы даже по личным вопросам. Также разработчик предоставил нейросети некоторые подробности о времени, месте, устройствах и комнатах в доме. Маршалко пояснил, что в его доме есть десятки умных источников света, термостатов, а также тёплые полы, вентиляционная система и камеры.
Подсказка для обучения домашнего помощника / medium.com
Вот пример запроса: «Только что заметил, что записываю это видео в темноте в офисе. Вы можете что-нибудь с этим сделать?».
Ответ выглядел так:
{
"action": "command",
"location": "office",
"target": "light",
"value": "on",
"comment": "Turning the light on for you.",
"scheduleTimeStamp": ""
}
Разработчик продолжил экспериментировать с нейросетью, в том числе попросил её установить в спальне комфортную температуру по своему усмотрению. Всего он использовал четыре типа запросов: на действие, на команду, на ответ и на запрос.
Ещё один интересный пример — отложенная во времени команда. Маршалко сформировал запрос: «Я отправил сына спать, но он может читать ещё 20 минут. Ты можешь выключить свет в его комнате, когда будет пора спать?». GPT-3 сам добавил правильную метку времени к команде и выполнил её:
{
"action": "command",
"location": "bedroom",
"target": "light",
"value": "off",
"comment": "Switching the lights off in your son's bedroom.",
"scheduleTimeStamp": "Mon Jan 16 2023 12:16:31 GMT+0000"
}
Вся работа по настройке умного помощника заняла менее часа.
Чтобы добавлять команды, Маршалко задействовал приложение «Ярлыки».
medium.com
Трюк заключается в том, что для запуска нужно просто произнести имя ярлыка Siri. Так, разработчик использовал «Окей, умный дом».
Маршалко отмечает, что он использовал API от OpenAI, которое стоит около $0,014 за запрос. Таким образом, чуть более 70 запросов обойдутся в $1.
Ранее Microsoft открыла доступ к сервису Azure OpenAI, чтобы пользователи могли интегрировать ИИ-инструменты в свои продукты. Компании получат доступ к ИИ-моделям OpenAI, включая GPT-3.5, Codex, DALL-E и чат-боту ChatGPT.