Как перевести речевой аудио-файл в текст с помощью Google translate

tbijjgqk2vxzf6nvde-n1xmvkme.jpegc5ijt6txngcxctxrtx7lg8bmc9c.jpeg

Обычно Google translate используют для перевода речи транслируемой микрофоном.

Но в один момент, автору потребовалось перевести подкаст Медузы в текст.

Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.

Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google.

Первый нашелся русскоязычный сайт https://speechpad.ru/blog/windows-integration/

304q45fdiw0rlvloe7whczmkyzy.jpeg

Но, как бы не было обидно, магия не сработала…

Был найден англоязычный сайт: https://speechlogger.appspot.com/ru/

Результат — тот же. Но, было в отличие от предыдущего — объяснение.

Там было показано, как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл.

Для этого необходим драйвер VB-CABLE Virtual Audio Device Он OpenSourse.

Искренняя благодарность «прогнившим западным» альтруистам!

Устанавливаем (проверено под Win 10) и настраиваем микрофонный вход в системе, на этот драйвер.

Открываем Gogle translate, нажимаем кнопочку с изображением микрофона и запускаем любой плейер с аудио — файлом.

И — Вааля! Магия работает, на ваших глазах появляются строки текста.

hu2fnrq45zlbym6oljza0fvrhe0.gif

Точность распознавания, на глаз 85–97%. Но, есть ограничение — 5 тыс. символов, что немало. Поэтому приходиться останавливать запись, копировать текст и продолжать далее.

Заодно происходит перевод на второй выбранный язык. О боже, сколько странных переводов появится!

Дополнение: есть способ без ограничений на количество символов. — это Google Docs, он так-же работает но, только без перевода на второй язык. Спасибо dioneo

Как мне кажется, Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен. Тут уже слово разработчикам и большим «гуру», чем автор.

Всем добра и удобства.

© Geektimes