Pull to refresh

Mozilla опубликовала крупнейший датасет разговорной речи с транскрипцией: 7226 часов, 54 языка

Reading time2 min
Views3.7K
Полтора года назад Mozilla порадовала сообщество по распознаванию речи и машинному обучению, выложив в открытый доступ крупнейший в мире набор данных Common Voice. Он включал в себя почти 1400 часов разговорной речи в маленьких фрагментах, на 18-ти языках, от более 42 тыс. пользователей. Каждый фрагмент речи сопровождался текстовой транскрипцией, то есть это готовый набор размеченных данных для машинного обучения.

Сейчас Mozilla обновила наборы данных, доведя количество языков до 54-х. Среди 14-ти новых — украинский, грузинский, чешский, польский и греческий языки.
Читать дальше →
Total votes 15: ↑15 and ↓0+15
Comments2

Checking the Code of DeepSpeech, or Why You Shouldn't Write in namespace std

Reading time13 min
Views552
DeepSpeech is an open-source speech recognition engine developed by Mozilla. It's pretty fast and ranks high, which makes its source code an interesting target for static analysis. In this article, I'll show you some of the bugs found in DeepSpeech's C++ code.

image1.png

Introduction


We have already scanned a few projects based on machine learning before, so there was nothing new about DeepSpeech to us in this respect. No wonder since the project is quite popular: as of this writing, it has 15k stars on GitHub.
Read more →
Total votes 2: ↑1 and ↓10
Comments0

Анализ кода проекта DeepSpeech или почему не стоит писать в namespace std

Reading time14 min
Views3.3K
DeepSpeech – это открытый и свободно распространяемый движок распознавания речи, разрабатываемый компанией Mozilla. Движок имеет довольно высокую производительность и хорошие отзывы пользователей, и это делает код проекта интересной мишенью для проверки. Данная статья посвящена разбору ошибок, найденных в C++-коде проекта DeepSpeech.

image1.png

Читать дальше →
Total votes 14: ↑11 and ↓3+8
Comments5