Как стать автором
Обновить

Комментарии 13

Интересно.
Для клиентов это как будет выглядеть?
Будет API какое-то чтобы запись сразу куда-то к себе слать?
Стоить сколько будет?
Готов поучаствовать в качестве тестера.

Давайте с другого конца зайдем. А вы какую задачу хотите решить? Обещаю в ответ на вопрос показать скриншот и честно изложить все, что мне самому известно на этот момент. :)

Мне кажется, что распознавание поможет руководителям следить за четким исполнением скрипта. С этой точки зрения можно протестировать.

Да, интересная задача. Такой вариант использования мы ещё тестировали. Попробуем в ближайшее время на себе, спасибо. :)

Вот ещё вариант исполнения​: рассылка участникам конференции текста этой конференции. Найти нужную информацию будет на порядок легче, чем прокручивать файл в 30-60 минут.

Это хорошая мысль, но пока качество распознавания не позволяет давать достоверные расшифровки участникам. Работаем над этим пока.

Для начала я пытаюсь автоматизировать выдачу заданий в текстовом виде по телефону.
Т.е. как только в разговоре прозвучало ключевое слово, например, "Задача", сразу создаем задачу и в неё всё до слова "Конец". Ну а там уже на нашей стороне даты распознаем, исполнителя или ещё что-то.

Именно такую задачу мы в текущей реализации не решаем. Более того, постановка задач же где-то должна делаться? В CRM, например? То есть требуется ещё и интеграция с внешней системой. Мы сами именно эту задачу решать не планируем, однако в следующей версии будет возможность «подписаться» на определенные слова и расшифровку разговора использовать для генерации задачи во внешней системе.

Вот в следующей версии вроде всё как раз как нам и надо.

скрытая реклама црт
Мне в первую очередь важно было показать, как мы выбирали. А выбирали мы по назначению движков распознавания и особенностям эксплуатации: мы хотели иметь решение in-house, а не отдавать в другое облако. И потребительские свойства «SDK» я выписал честно: SDK по факту не является и платой за «правильное» для нас предназначение является просто ужасающая негибкость и стоимость внедрения.
Ах-ах-ах, тотальный контрол, гугл вроде тоже логи должен откладывать что в мобильник говорят, а вот, почему-то в поисковике на pc версии гугла такого нет :-/

Рассматривали ли такие решения, как CMU Sphinx, Kaldi, HTK?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий