Comments 7
Ждем когда появятся приложения преобразующие голос в текст, а потом текст в голос робота или какого-то другого человека, и привет товарищу майору и его системе распознавания голоса и поиска по голосовому отпечатку :)
0
Если сносного качества можно достичь на слабой видеокарте и небольшом датасете, то боюсь представить возможности тех, у кого есть время и деньги. Причем если учить сеть только на русской речи, качество получается существенно выше.
Особенно забавляют новости про индетификацию пользователей в банках по голосу
Особенно забавляют новости про индетификацию пользователей в банках по голосу
0
Подскажите на какое решение смотреть если нужно голос в текст?
Если конкретнее то надо вычленять, по словарю, слова паразиты и мат.
Yandex.Kit и гугл не надо предлагать.
Если конкретнее то надо вычленять, по словарю, слова паразиты и мат.
Yandex.Kit и гугл не надо предлагать.
0
Я бы смотрел в сторону DeepSpeech 2, wav2letter++.
И может помочь iPavlov.
Но, возможно, есть что-то и лучше.
И может помочь iPavlov.
Но, возможно, есть что-то и лучше.
0
Можете попробовать ESPnet. Я недавно добавил модель для русского:
github.com/espnet/espnet/blob/master/egs/ru_open_stt/asr1/RESULTS.md
github.com/espnet/espnet/blob/master/egs/ru_open_stt/asr1/RESULTS.md
0
посмотрите Kaldi Speech Recognition Toolkit
0
всем кому интересна идея синтеза — вероятно вас заинтересует эта публикация — https://habr.com/ru/post/549480/
+1
Sign up to leave a comment.
Многоязычный синтез речи с клонированием