Как работают голосовые ассистенты и кто их озвучивает
Голосовые ассистенты все более основательно входят в нашу жизнь. Многие до сих пор не начали ими активно пользоваться, но отрицать их в некотором роде победное шествие, как минимум, нелогично. Массовое появление голосовых ассистентов началось еще во времена iPhone 4S и появившейся в нем Siri. С тех пор, надо сказать честно, она поумнела не очень сильно, что странно. Кроме неё, есть также Alexa, Google Assistant, Кортана, Алиса, Portal и даже недавно появившаяся Маруся от Mail.ru Group. Всех их объединяет одна цель — дать возможность пользователям ощутить присутствие виртуального помощника, который выполнит любую (почти) просьбу. Вопрос в том, почему они говорят женскими голосами и кто их озвучивает?
Голосовых ассистентов становится все больше, но как они работают?
Содержание
Как работает голосовой ассистент
В первую очередь, стоит разобраться в том, как голосовые ассистенты вообще начинают говорить. Несмотря на всю кажущуюся реалистичность их голоса, а иногда даже интонаций, за каждой фразой стоит компьютер, а не реальный человек. Именно он синтезирует буквы и слова, собирая их в единое предложение. Хотя люди тоже прикладывают к этому свой речевой аппарат.
Естественно, передать всю базу и все наработки по распознаванию текста и синтезу речи на смартфон не представляется возможным. Именно по этой причине ассистенты работают только при наличии подключения к Сети. В остальных случаях они просто говорят о том, что у них проблемы с соединением. Это чуть ли не единственная фраза, которая у них есть оффлайн.
Работа кипит: Google превратила Google Assistant в вашего персонального секретаря
В итоге, ваш запрос отправляется на сервер для определения того, что вы сказали, данные обрабатываются и ответ прилетает обратно. Ассистент как бы переспрашивает у сервера: «Что он сказал?». Все это происходит за секунды или даже доли секунд, но за редким исключением работает именно так.
После обработки команды на сервере команда или отправляется обратно в виде обратной команды, или формируется поисковой запрос, по результатам которого генерируется голосовой ответ (в случае со смартфоном еще и визуальный). В первом случае включается свет, открывается дверь и тому подобное, а во втором — озвучивается погода или, например, свежие новости.
Стоит себе и команды выполняет.
Кроме этого, работа через сервер позволяет сделать гаджеты умного дома более универсальными. Именно так можно обеспечить их работу на удалении. Например, включить чайник, подходя к дому, заранее зажечь свет в гараже или включить робот-пылесос, находясь на работе.
Почему голосовые ассистенты говорят женским голосом?
Чтобы ответить на этот вопрос, стоит обратиться к психологии или просто задать вопрос, чей голос будет приятно слышать человеку — мужской или женский? Мужчины ответят, что женский, а мнение женщин разделится. Женский никого из них не будет отталкивать, даже если мужской будет приятнее.
В этом и кроется ответ. Просто к женскому голосу все люди относятся более лояльно, чем к мужскому. Тем не менее, если вы захотите, некоторые ассистенты предлагают и мужскую версию голоса. Но производители неохотно вводят функцию выбора голоса. В этом случае теряется самое важное — отношение пользователя к ассистенту, как к живому помощнику, а не как к машине.
Кроме этого, считается, что женский голос успокаивает и позволяет более спокойно относиться к происходящему. Именно поэтому почти во всех военных самолетах именно женским голосом озвучиваются команды о приближении к критическому углу атаки, возможном сваливании и других неприятных моментах.
Как вы думаете, каким голосом должен говорить голосовой ассистент, если его нельзя изменить? Ответить ниже и давайте развернуто обсудим это в нашем Telegram-чате.
Как озвучивают голосовые ассистенты?
Как я уже говорил выше, многие голосовые ассистенты работают на полностью синтетическом голосе. То есть, все сказанное ими является просто озвучкой с определенными настройками тембра, тональности и прочих параметров. Никакого живого человека за этим не стоит. Примером таких ассистентов является помощник от Google.
Некоторые голосовые ассистенты наоборот озвучивают реальные люди, которые в обычной жизни являются актерами, дикторами или занимаются озвучкой (реклама, мультфильмы, гаджеты). Так голос получается более человечным и пользователь воспринимает его не как компьютер, а как настоящего помощника. Так уж устроена психика, что ощущать присутствие человека проще и приятнее, чем присутствие «бездушной» железяки.
Вот так в студии записывают данные голоса.
Для конструирования модели голоса, его владелец должен зачитать множество типовых фраз и звуков, которые потом обрабатываются и генерируются в голос самого ассистента. Чем больше фраз будет записано, тем более живым будет голос и тем меньше будет ошибок.
С одним из примеров недостаточной проработанности голоса я столкнулся, когда ездил по США на машине. В навигаторе, который я взял там же, где и машину, был русский язык. Вместо «Хай Вэй» навигатор говорил «Хвай». Локализованные голоса навигатора не так важны, как голосовой ассистент, который должен быть почти везде. Поэтому там я отнесся к этому с юмором и лишний раз убедился, что создатели голосов для ассистентов делают свою работу более ответственно. Ни разу не сталкивался с такими косяками, например, у Алисы.
Кто озвучивает голосовые ассистенты?
Наверное, самым известным голосом, который озвучивает голосовые ассистент, является Сьюзан Беннетт. Именно она подарила свой голос оригинальной Siri на английском языке.
Она родилась в 1949 году в Клинтоне, штат Нью-Йорк, США. Всю жизнь Сьюзан посвятила искусству, занимаясь актерской деятельностью, и даже попробовала себя в роли продюсера. Хотя, ролей в кино у нее не так много, зато очень много озвучки.
Например, она озвучивала рекламные ролики для Ford, Coca-Cola, Fisher-Price, McDonald«s, Goodyear, VISA, Hot Pockets, Cartoon Network и других. Кроме этого, ее голосом говорит система оповещения в терминалах Delta Air Lines во всем мире, различные системы навигации и телефонные системы. С 4 октября 2011 года она увековечила свой голос в лице Siri.
Сьюзан Беннет (английская Siri).
В русской версии ассистент от Apple говорит голосом Коноплянской Марии. Найти много информации о ней не получается, но точно можно сказать, что ее опыт в сфере озвучки не такой большой, как у Сьюзан Беннетт. Кроме этого, стоит отметить, что ее голос очень сильно обработан, но в нем все равно можно узнать его хозяйку.
Коноплянская Мария (русская Siri)
Еще одним вариантом ассистента является Alexa от Amazon. В основе оригинального голоса тоже лежит компьютер, правда, позже было принято решение добавить мужской голос и в качестве его основы был выбран Сэмюэль Л. Джексон. Напомню, среди его основных работ в последнее время можно отметить роль Фьюри в фильмах Marvel.
Сэмюэль Л. Джексон (коллега Alexa).
Многие знают такого голосового ассистента, как Кортана от Microsoft. Свое имя ассистент получил в честь героини серии компьютерных игр Halo, которые выходят на XBox и PC, обходя стороной PlayStation. В оригинале голосом ассистента является тот же человек, который озвучивает героиню игры — Джен Тейлор.
Джен Тейлор (Кортана).
Тут мы добрались до нашей соотечественницы, которая должна была изначально называться Майя, но от этого имени отказались, так как это очень похоже на название месяца и может случайно вызывать срабатывания при произнесении обычных фраз. В итоге она получила имя Алиса. В числе прочего к требованиям по имени было отсутствие звука «эр», который плохо выговорят маленькие дети, и оно не должно быть распространенным, опять же для ликвидации случайных срабатываний. Впрочем, в этом отношении авторы все равно перестраховались и дали возможность вызывать ассистента словом «Яндекс». Если в семье живет Алиса, это нормально, но если есть кто-то по имени Яндекс, тут уже стоит задуматься. Если двух детей назвали Алиса и Яндекс, тут уже должны напрячься уполномоченные органы.
В качестве голоса Алисы выступает Татьяна Шитова, которая озвучивает в фильмах на русском языке Скарлетт Йоханссон, Шарлиз Терон и некоторых других актрис.
Татьяна Шитова (Алиса).
Я не смог нигде найти подтверждение этой версии и даже упоминания о ней, но мне кажется очень странным одно совпадение. В 2014 году вышел фантастический фильм Люси, в котором главную роль играла Скарлетт Йоханссон. В конце фильма главная героиня смогла поместить свой, прокачавшийся в результате воздействия сильного гормона, разум внутрь компьютера. В итоге, она исключительно с благой целью оказалась в каждом компьютере мира.
Так вот, через несколько лет Яндекс выпускает ассистента и он говорит голосом той самой Люси. Возможно, это совпадение, возможно, нет, но факт мне показался очень интересным.
Как видим, все ассистенты разные, но использование в них живого голоса очень помогает пользоваться всеми функциями, делать это с удовольствием и легко воспринимать сказанное. Конечно, они будут и дальше развиваться. В конце концов, у каждого из нас дома будет жить свой Джарвис, который будет делать буквально все. Пока ассистенты могут только помочь, но их наличие в колонках уже облегчает жизнь. Самое главное, что к ним привыкаешь и начинаешь ценить. Поэтому ждем развития этого технологического направления.