Создан генератор вежливости
Разработанный метод перерабатывает не очень вежливые указания или запросы, придавая им более мягкую стилистику путем изменения структуры или замены отдельных слов. В результате, например, вместо «пришлите мне эти данные» получается «не могли бы Вы, пожалуйста, прислать мне эти данные».
По словам разработчиков, метод может быть очень востребован в целом ряде случаев, в частности, при электронной переписке, создании чат-ботов или ведении блога. И это, конечно, не первая попытка создать подобную систему, однако то, чего не хватало до сих пор — это достаточного количества «вежливых» данных.
Авторы метода смогли решить эту проблему, взяв данные из электронной переписки сотрудников техасской компании Enron. Она обанкротилась в 2001 году в результате крупного скандала, связанного с фальсификацией отчетности, тогда же были публикованы и полмиллиона внутрикорпоративных писем, которые затем не раз использовались в различных исследовательских проектах.
Но даже с такой базой данной создать генератор вежливости оказалось не самой простой задачей. Поскольку вежливость, как говорит руководившая научной группой Шримаи Прабхумойе, это не просто слова «спасибо» и «пожалуйста», это особая стилистика языка — менее прямая и директивная. К тому же представления о вежливости сильно варьируются от культуры к культуре, и поэтому исследователям пришлось ограничиться пока только северо-американским английским.
Из переписки Enron разработчикам удалось извлечь 1,39 миллиона предложений с признаками вежливости, которые затем были отдельно проанализированы, чтобы выявить частоту упоминания и распределение отдельных слов в вежливых и невежливых фразах. После чего был создан механизм «вежливой» трансформации — сначала он помечает невежливые слова и предложения, а затем генератор текстов заменяет их. При этом смысл самой фразы не меняется.
Правда, сначала система пыталась просто вставлять слова «пожалуйста» и «спасибо», полагая при этом, что многократное их повторение приведет к увеличению степени вежливости фразы. Но по мере ее обучения результат стал вполне реалистичным — система научилась использовать достаточно сложные вежливые обороты.