[Из песочницы] Сравнение Google Home и Amazon Alexa
Недавно мне в руки попало два популярных голосовых помощника. В этом обзоре я расскажу о том, что они умеют и чего пока не умеют.
Покупка и инсталляция
Google Home сейчас стоит $129, цена Amazon Echo с помощником Alexa $179. Оба, конечно, не продаются в России. Что ж, едем в США и покупаем там.
Google Home предлагается в 7-ми разных цветах тряпичного чехла, закрывающего нижнюю часть устройства (там находится колонка). Алекса бывает черная и белая и по размеру существенно крупнее и увесистее конкурента. Оба сделаны из приятного матового пластика. На мой личный взгляд внешне Google Home кажется каким-то обрубком, тогда как нижняя часть Alexa похожа на дуршлаг. Но о вкусах не спорят.
Зато надо отметить, у Google Home отличная коробка, ее хочется открывать и закрывать снова и снова. Продакт дизайнеры очень постарались.
В качестве внешних интерфейсов у Алексы 2 кнопки, а у Гугла небольшой невидимый тачскрин, по которому у меня редко получается попасть. Впрочем, эти кнопки и не нужны, ведь всеми функциями можно управлять голосом.
Для подключения нужно скачать приложение (приложение Alexa пришлось ставить как apk, его нет в российском сторе), и настроить доступ в домашний Wi-Fi. Делается это довольно просто, только нужно не забыть также включить bluetooth на телефоне. После подключения в домашний Wi-Fi устройства быстро линкуются с приложением — и вы можете видеть, как их движки интерпретируют полученные фразы.
Немного о безопасности. Как известно, «the S in IoT stands for Security». Помощники слинкованы с вашим личным аккаунтом, но не распознают голос хозяина. Кто угодно может воспользоваться ими, чтобы прочитать вашу почту и что еще там вы им доверили.
Распознавание речи
Распознавание паттерна вызова («OK, Google» и «Alexa») происходит на месте, а распознавание фразы и формирование ответа — в облаке. Если рассматривать их как хабы для управления умным домом, то здесь кроется принципиальное отличие этих платформ от HomeKit, который умеет работать оффлайн. У меня ни разу не случалось, чтобы помощники не узнали свое имя. Зато не раз бывало, чтобы в качестве имени приняли что-то еще.
Наш с супругой среднерусский английский Google понимает очень хорошо. Практически все простые фразы распознаются корректно с первой попытки, чего не скажешь об Алексе. Ниже я попробовал произнести ей довольно сложное слово:
— Alexa, what«s under rubber new riddle?
— Alexa, what is them to bring new rail?
— Alexa, what is an tripper no real?
Ок, упрощаем вопрос
— Alexa, what is interpret priner?
— Alexa, what is an trump renewal?
— Alexa, what is an to pandora?
Зайдем с другой стороны
— Alexa, what is a synonym for businessman?
— Business«s synonyms include business executive and business person.
Ну хорошо, дорогая. Кому интересно, изначальное слово было entrepreneurial.
Ведем непринужденную беседу
Оба помощника имеют встроенный обширный набор предустановленных фраз и ответов. Не с кем поговорить о любви, о жизни? Роботы к вашим услугам. Например, обоих можно попросить 'tell me a joke'. Набор шуток у них обширный, но ни одна из шуток не показалась мне смешной. Думаю, коварные нейросети просто притворяются тупее, чем они есть.
— Alexa, who killed Kenny?
— Oh my god, they killed Kenny!
— OK, Google, are you robot?
— I prefer to think of myself as your friend
— Alexa, what is the purpose of life?
— The answer is 42, but the question is far more complicated
— OK, Google, what is your gender?
— I am all inclusive
— Alexa, does Santa exist?
— I don«t know him personally, but I heard a lot of good things about Santa
— OK, Google, tell me a story
— One there lived a protagonist and some supporting characters. Together they went on a journey. And twist ending, it was all a dream!
— Alexa, am I funny
— I don«t have a sense of humour so it«s hard for me to tell
И здесь она определенно не соврала.
Поиск
Alexa отправляет вопросы в bing, а куда их отправляет Google Home — догадаться несложно. Оба помощника вполне сносно пользуются интернет поиском и Википедией в ответ на вопросы. На мой взгляд, Гугл ищет лучше — он гибче настроен на поисковые фразы и чаще понимает, что запрос поисковый.
— Alexa, when Moscow was founded?
— Moscow state of establishment was 1147
— OK, Google, what is a greatest number
— According to English Language and Usage, 7 is the smallest and 9 is the greatest number
— Alexa, where is Kilkenny?
— Kilkenny is a city in Kilkenny, Ireland (…)
— OK, Google, which fish is the fastest?
— Sailfish. According to china.org.cn the sailfish is the fastest fish in the world able to speed at a swim speed of 68 miles per hour
Так что, Борис Борисыч, развейте наконец свои сомнения, ИИ нам все рассказал.
Фичи out-of the-box
Оба умеют рассказывать, что стоит у вас в Гугл-календаре (но озвучивают только латинское написание). Почту пока не читают. И слава роботам, см выше про безопасность.
Гугл умеет переводить на множество языков, Алекса — нет
— OK, Google, what is «Mother washed a frame» in Russian?
— Мать мыл раму
Оба умеют стримить музыку из популярных приложений (платите деньги), а также радио и новости (бесплатно). Насчет музыки надо понимать, что так как данные на железку идут через Cloud, то стримить ее с телефона затруднительно, такой опции нет. Amazon и Google разрешают бесплатно загрузить на ваш аккаунт в их музыкальных сервисах какое-то количество треков и играть их оттуда.
Alexa позволяет делать покупки на Amazon. Для покупок можно установить pin-код, чтобы соседи не игрались.
— Alexa, shopping
— Would you like to shop?
— Yes
— What would you like to order?
— Books
— Voice ordering is exclusively available for prime members. Would you like me to add Books to Nikolai«s cart instead?
— Yes
Здесь в приложении появляется набор книг, можно продолжить покупки там.
Помимо этого, у обоих есть довольно много толковых и не очень фич, таких как игра в викторину, будильник, калькулятор, конвертер мер и валют, толковый словарь и так далее.
Фичи с бубном
8 декабря было объявлено о запуске открытого API для Google Home. Говорится, что механизм под названием Google Actions заработает в начале 2017 года и позволит третьим сторонам создавать диалоговые сценарии, через которых пользователь сможет использовать обращаться к контенту или сервисам поставщика. Мудрено написал, в общем смотрите, как это работает в Alexa Skill Kit, который существует с середины 2015.
В приложении Alexa есть магазин skills, разработанных разными сервисами, такими как Expedia или NASA. Скилл — это доступ к услугам/информации сервиса посредством голосовых команд. Его можно бесплатно подключить в магазине или просто голосом, назвав ключевое слово или фразу.
— Alexa, ask NASA Mars to get me a Curiosity rover update
— Alexa, ask RecipeFinder what I can cook with tuna and cheese
— Here are some more recipes (…) I have included links to the recipes in your cart
Ссылки появляются в приложении. Не кликабельные арррргх!
В скиллах круто то, что они представляют собой диалог, который может иметь достаточно много опций развития (в отличие от сценариев IFTTT, о которых речь дальше). Пока что количество оценок у скиллов в магазине Alexa измеряется сотнями, так что это только первые шаги в создании голосовых интерфейсов. Свои скиллы запустили Expedia и Kayak, но они не дают возможности голосом бронировать билеты и отели, можно только цены смотреть. Тем не менее, можно бронировать автомобиль в Expedia, заказывать Uber, и есть даже один банковский скилл, который позволяет оплачивать счета.
Кроме того, у Alexa и Google имеется свой IFTTT канал, через который можно настроить еще больше функций. IFTTT позволяет делать между сервисами триггеры вида «если сервис 1 сказал А, то отправить в сервис 2 команду Б». Такой канал имеют почти все Smart Home железяки, несколько крупных торговых сетей (они позволяют только обновлять онлайн-корзину) и миллион информационных порталов. Беда с IFTTT в том, что все рецепты для Алексы и Гугла позволяют делать что-то по голосовой команде (заметки в spreadsheet, пост в фейсбуке, включить термостат), но не позволяют прокидывать связь обратно (прочесть заметки, прочесть фейсбук, спросить температуру). Очевидно, разработчики не предоставили соответствующего API, но я не понимаю, почему. Уж если они календарь умеют читать, то могли бы и сообщения от IFTTT озвучивать, но нет.
Дальнейшее развитие
Резюмируя, я бы сказал, что за счет Skills у Alexa сейчас больше возможностей, чем у Google, но все это может появиться в нем довольно быстро. Кстати, полтора года назад Amazon запустил 100-миллионный венчурный фонд Alexa Fund для инвестиций в проекты, использующие голосовой интерфейс Alexa. У фонда уже 10 инвестиций, самая большая из которых — в Ecobee, термостат, который то ли уже обогнал, то ли вот-вот догонит по продажам Nest.
У Amazon также есть SDK Alexa Voice Service, позволяющий запускать сервис Alexa на железе сторонних разработчиков. Google пока не выпустил аналогичный SDK, планируют выпустить в этом году.
В целом, соревнование Amazon vs Google на поле Smart Home обещает быть интересным. Пока Гугл зафейлил попытку подмять платформы и протоколы неудачным проектом Brillo-Weave, Амазон вырвался вперед с развитием голосовых интерфейсов. Гугл теперь вынужден догонять, с задержкой примерно в год-полтора. Зато в активе Гугла более качественная голосовая библиотека, и вообще он умнее, лучше запрограммирован, так что ситуация близка к паритету. Если вы читаете эту статью с сугубо практическими целями и вы не американец, при выборе из двух устройств я бы предложил купить Гугл, так как он получше понимает и получше ищет. От сложных диалоговых интерфейсов из Skills Store мало толку, если вас не могут нормально понять.