yandex-speech — wrapper к речевым технологиям Яндекса11.08.2014 19:33

Ознакомившись с обзором движков для распознавания речи, заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика на Хабре.Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.

npm install yandex-speech Исходники и примеры использования: github: www.github.com/antirek/yandex-speech

Немного деталей: Ключ API активировали в течение трех часов. В запросе так и написал: «нужен тестовый ключ, запросов будет 10–20 штук в день». Ключ, указанный в примерах, блокирован. Запросите, пожалуйста, свой: developer.tech.yandex.ru/

В документации написан пример, подобный запросу curl типаcurl -v -4 -H «Content-Type: audio/x-mpeg-3» -d »@examples/data/1.mp3» «asr.yandex.net/asr_xml? key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU»

Оказалось, что можно и так отправить: curl -v -4 -F «Content-Type=audio/x-mpeg-3» -F «audio=@examples/data/1.mp3» «asr.yandex.net/asr_xml? key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU»

Добавил проверку размера отправляемого аудиофайла, не более 1Мб, т.к. сервис ругается на файлы большего размера.

Также добавил враппер для генерации аудиофайла по тексту. Неофициальное API по мотивам комментария на Хабре. Чтобы и text2speech, и speech2text в одном флаконе.

Надеюсь, что кому-то еще пригодится в хозяйстве. Вопросы, пожелания, критика по коду?