Search results for «[Deep Speech]» / Habr

Publications Hubs Companies Users Comments

alizar Jul 3 2020 at 09:47

Mozilla опубликовала крупнейший датасет разговорной речи с транскрипцией: 7226 часов, 54 языка

2 min

3.7K

Machine learning*SoundVoice user interfaces*

Полтора года назад Mozilla порадовала сообщество по распознаванию речи и машинному обучению, выложив в открытый доступ крупнейший в мире набор данных Common Voice. Он включал в себя почти 1400 часов разговорной речи в маленьких фрагментах, на 18-ти языках, от более 42 тыс. пользователей. Каждый фрагмент речи сопровождался текстовой транскрипцией, то есть это готовый набор размеченных данных для машинного обучения.

Сейчас Mozilla обновила наборы данных, доведя количество языков до 54-х. Среди 14-ти новых — украинский, грузинский, чешский, польский и греческий языки.

Читать дальше →

+15

GGribkov Oct 19 2020 at 10:43

Checking the Code of DeepSpeech, or Why You Shouldn't Write in namespace std

13 min

552

PVS-Studio corporate blogProgramming*C++*

DeepSpeech is an open-source speech recognition engine developed by Mozilla. It's pretty fast and ranks high, which makes its source code an interesting target for static analysis. In this article, I'll show you some of the bugs found in DeepSpeech's C++ code.

Introduction

We have already scanned a few projects based on machine learning before, so there was nothing new about DeepSpeech to us in this respect. No wonder since the project is quite popular: as of this writing, it has 15k stars on GitHub.

GGribkov Oct 19 2020 at 10:54

Анализ кода проекта DeepSpeech или почему не стоит писать в namespace std

14 min

3.3K

PVS-Studio corporate blogProgramming*C++*

DeepSpeech – это открытый и свободно распространяемый движок распознавания речи, разрабатываемый компанией Mozilla. Движок имеет довольно высокую производительность и хорошие отзывы пользователей, и это делает код проекта интересной мишенью для проверки. Данная статья посвящена разбору ошибок, найденных в C++-коде проекта DeepSpeech.

Читать дальше →