Comments 26
Хотелось бы больше подробностей. Примеров кода по конвертации через ffmpeg, работу с Google Cloud Storage. Сейчас больше похоже на главу из очередной нон-фикшн книги с названием: «Бери от жизни все! Да, ты сможешь».

И где можно бота в действии посмотреть-то?
Добрый день! Постараюсь учесть ваш комментарий и дополнить статью примерами кода.

К сожалению, боюсь, меня с Хабрахабра выпилят за прямую ссылку на бота.
Без кода или ссылки на исходники не вижу смысла в упоминании JavaScrtipt и Node.js.
То же самое могу сказать про слово «успех». Вы что то заработали на боте или пока только «успех»?
Большое спасибо за комментарий! Бот написан на Node.js — в статье попутно указываю фреймворки, которые использовал, в частности, от Google. Обязательно учту ваш комментарий — добавляю примеры кода в статью прямо сейчас.

Поискал слово «Успех» в своем тексте — нашел:

Оказалось, Google принимает .flac — конвертируем, пробуем, все принимается, Google отвечает текстом, успех.

Да, Google ответил текстом — вот он, мой «успех».
Делал что то подобное но только для яндекс speech kit лимиты запросов огорчают, если кому интересно отпишитесь в личку отправлю бота и расскажу подробности дабы за рекламу не сочли
Аналогичные ограничения на родной iOS speechKit. В сравнении с Apple, Яндекс лучше распознает русские фамилии, но у меня не работал со служебным интернетом (прокси?), приходилось уходить на 3G или домой, что иногда приятно.
Можете посмотреть wit.ai — полностью бесплатный сервис, там ограничение только на кол-во запросов в секунду.
Думаю, если выложите код на GitHub и приложите ссылочку — никто из администрации Хабрахабра против не будет :)
Делал такого бота в качестве пробного, когда разбирался с Elixir'ом и Phoenix'ом
Кому интересно: https://github.com/sck-v/s2t_bot. Можно поднять своего на heroku

Сейчас всё в процессе рефакторинга, в пользу отказа от Phoenixframework в виду множества лишних функций
А откуда у вас эти ограничения?

Google API only accepts up to ~10-15 seconds of audio.
You can only make 50 requests per day to the Google speech API.

Боюсь сам на эти грабли наступить. Я тестил в боте 3х минутный войс, он перевелся. За последние 2 часа из-за Хабраэффекта было больше 50 реквестов в секунду — Google ни один не отклонил.
Я пользовался этим описанием API:
https://github.com/gillesdemey/google-speech-v2#caveats. Оттуда и взял

Но за всё время пользования бот обрабатывал и длинные голосовые сообщения. Насчёт частоты не могу сказать, пользуюсь сам и не в таких объёмах
Можно чуть подробней про
запускаем в командной строке «express payments»
?
expressjs.com — удобный инструмент генерирования шаблонов Node.js приложений на основе, собственно говоря, Express :)

«express payments» генерирует проект на основе Express с названием «payments».
я в своем боте с котиками тоже использую нейросети от гугла, для распознавания изображений. а вы не получали письмо про изменения в подписке Гугла, типа такого https://geektimes.ru/post/161717/?
Интересно! Я зарегистрировал аккаунт разработчика с Developers Console только четыре дня назад для этого бота, так что, думаю, я проспал вспышку этих email'ов :)

Можете поделиться ссылочкой на своего бота, пожалуйста? Сколько примерно времени ушло на разработку?
Пытался гуглом распознавать общение двух людей в телефоне — аццкое кургуду получается… :(((
Мне, если честно, иногда и самому «распознать» речь из некоторых войсов друзей в Телеграме довольно сложно :)
Only those users with full accounts are able to leave comments. Log in, please.