Comments
Если кто-то, как я, не понял что значат проценты в таблицах: это частота ошибок в распознанных словах на обучающей и тестовой выборках. (WER on the development/evaluation data). Получается, алгоритм ЦРТ разобрал 60% слов.
Записи для конкурса были сделаны на 20 ужинах в реальных домах на вечеринках, где люди готовили, ели, мыли посуду, свободно и эмоционально общались, шутили и смеялись. Распознавание речи здесь осложняет одновременная речь 2–4 человек, реверберация и интенсивный шум: звон приборов, льющаяся из крана вода, гул кондиционера, шаги, смех. Цель участников — создать систему распознавания, которая «прослушает» записи и выдаст полную расшифровку с наименьшим количеством ошибок.

Не знаю даже кому бы такое понадобилось. (Сарказм)

Only those users with full accounts are able to leave comments. Log in, please.