Meta хочет создать универсальный переводчик в реальном времени
Исследовательское подразделение Meta работает над универсальным переводчиком, который упростит взаимодействие пользователей в цифровой вселенной компании.
«Это будет особенно важно, когда люди начнут путешествовать по виртуальным мирам и общаться с людьми из разных мест», — указывает глава компании Марк Цукерберг.
План Meta состоит из двух частей. Во-первых, компания разрабатывает No Language Left Behind, систему перевода, способную изучить «любой язык, даже если материала для изучения не так много», по словам Цукерберга. Система будет знать сотни языков — от австрийского до угандийского и урду. Второй проект называется Universal Speech Translator; в его рамках компания разрабатывает новые подходы к переводу речи с одного языка на другой в режиме реального времени. Модель мгновенного перевода «даст возможность общаться с кем угодно на любом языке».
«Это сверхспособность, о которой люди всегда мечтали, и ИИ обеспечит ее еще при нашей жизни» , — пообещал Цукерберг.
Основное препятствие в разработке системы — нехватка данных.
«Системы машинного перевода обычно полагаются на миллионы аннотированных данных, — пишет Facebook AI Research в своем блоге. — По этой причине системы, способные выполнять высококачественные переводы, разработаны только для нескольких языков, доминирующих в интернете».
По словам команды Facebook AI Research, для прямого преобразования речи в речь дополнительные данные еще важнее. Большинство систем речевого машинного перевода используют текст в качестве промежуточного шага, то есть речь на одном языке сначала преобразуется в текст, затем переводится в текст на целевом языке, а затем, наконец, вводится в систему преобразования текста в речь. Из-за этого системы перевода речи в речь очень зависимы от текста, что ограничивает их эффективность и затрудняет их масштабирование на устные языки.
Переводчик в реальном времени, над которым работает Meta, сможет переводить даже те языки, в которых нет стандартизированных систем письма. Этот речевой подход также сделает перевод быстрее и эффективнее, так как он не потребует дополнительных шагов по преобразованию речи в текст.