Как стать автором
Обновить

yandex-speech — wrapper к речевым технологиям Яндекса

Время на прочтение1 мин
Количество просмотров15K
Ознакомившись с обзором движков для распознавания речи, заметил там API от Яндекса. И на выходных написал небольшую обертку для Node.js для распознавания речи с целью поиска мата в своих телефонных разговорах. По мотивам топика на Хабре.

Список нецензурных слов выкладывать не буду, а сам npm устанавливается командой.
npm install yandex-speech


Исходники и примеры использования:
github: www.github.com/antirek/yandex-speech

Немного деталей:

Ключ API активировали в течение трех часов. В запросе так и написал: «нужен тестовый ключ, запросов будет 10-20 штук в день». Ключ, указанный в примерах, блокирован. Запросите, пожалуйста, свой: developer.tech.yandex.ru

В документации написан пример, подобный запросу curl типа
curl -v -4 -H "Content-Type: audio/x-mpeg-3" -d "@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Оказалось, что можно и так отправить:
curl -v -4 -F "Content-Type=audio/x-mpeg-3" -F "audio=@examples/data/1.mp3" "asr.yandex.net/asr_xml?key=yandex_developer_key&uuid=12345678123456781234567812345678&topic=general&lang=ru-RU"

Добавил проверку размера отправляемого аудиофайла, не более 1Мб, т.к. сервис ругается на файлы большего размера.

Также добавил враппер для генерации аудиофайла по тексту. Неофициальное API по мотивам комментария на Хабре. Чтобы и text2speech, и speech2text в одном флаконе.

Надеюсь, что кому-то еще пригодится в хозяйстве. Вопросы, пожелания, критика по коду?
Теги:
Хабы:
+21
Комментарии6

Публикации

Истории

Работа

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн