Разработчик создал умного помощника с помощью Siri и GPT-3

Разработчик Мате Маршалко поделился на Medium, как ему удалось создать умного голосового ассистента на базе Siri и нейросети GPT-3. Для этого ему не понадобилось программировать — было достаточно объяснить GPT-3, что нужно сделать для управления «умным» домом. 

medium.commedium.com

Для начала Маршалко попросил нейросеть интерпретировать разговорный английский и предоставить соответствующий ответ в формате JSON. Он описал типы запросов, точную структуру ответа и попросил GPT-3 вести себя как разумный ИИ, давая советы даже по личным вопросам. Также разработчик предоставил нейросети некоторые подробности о времени, месте, устройствах и комнатах в доме. Маршалко пояснил, что в его доме есть десятки умных источников света, термостатов, а также тёплые полы, вентиляционная система и камеры.

Подсказка для обучения домашнего помощника / medium.comПодсказка для обучения домашнего помощника / medium.com

Вот пример запроса: «Только что заметил, что записываю это видео в темноте в офисе. Вы можете что-нибудь с этим сделать?».

Ответ выглядел так:

{
  "action": "command",
  "location": "office",
  "target": "light",
  "value": "on",
  "comment": "Turning the light on for you.",
  "scheduleTimeStamp": ""
}

Разработчик продолжил экспериментировать с нейросетью, в том числе попросил её установить в спальне комфортную температуру по своему усмотрению. Всего он использовал четыре типа запросов: на действие, на команду, на ответ и на запрос.

Ещё один интересный пример — отложенная во времени команда. Маршалко сформировал запрос: «Я отправил сына спать, но он может читать ещё 20 минут. Ты можешь выключить свет в его комнате, когда будет пора спать?». GPT-3 сам добавил правильную метку времени к команде и выполнил её:

{
  "action": "command",
  "location": "bedroom",
  "target": "light",
  "value": "off",
  "comment": "Switching the lights off in your son's bedroom.",
  "scheduleTimeStamp": "Mon Jan 16 2023 12:16:31 GMT+0000"
}

Вся работа по настройке умного помощника заняла менее часа.

Чтобы добавлять команды, Маршалко задействовал приложение «Ярлыки».

medium.commedium.com

Трюк заключается в том, что для запуска нужно просто произнести имя ярлыка Siri. Так, разработчик использовал «Окей, умный дом».

Маршалко отмечает, что он использовал API от OpenAI, которое стоит около $0,014 за запрос. Таким образом, чуть более 70 запросов обойдутся в $1.

Ранее Microsoft открыла доступ к сервису Azure OpenAI, чтобы пользователи могли интегрировать ИИ-инструменты в свои продукты. Компании получат доступ к ИИ-моделям OpenAI, включая GPT-3.5, Codex, DALL-E и чат-боту ChatGPT.

© Habrahabr.ru