Как стать автором
Обновить

Комментарии 4

НЛО прилетело и опубликовало эту надпись здесь
Да, я написал, что он это умеет. Спасибо за кнопочку — она действительно хитро спрятана, не знал, что есть возможность поиска по титрам.

Несколько НО:
— у нас не весь контент публичный, есть то, что заливать на youtube нельзя, можно хранить только на внутренних ресурсах.
— для автоматического создания титров youtube, скорее всего, использует тот же движок Google, что логично, но без какого-либо тюнинга словаря. Нашел один из своих давних вебинаров, для которого автоматически создались субтитры, качество недостаточное, чтобы что-то найти.
— ну и эти субтитры работают только если автор их разрешит, т.е. искать в залитых кем-то вебинарах не получится. Это не имеет отношения к моему кейсу, но есть другие кейсы, где это будет ограничением.
Сейчас уже есть датасеты перевода речи в текст в связи с этим вопрос: самостоятельное обучение нейросети не рассматривалось?
Признаюсь, я поначалу не думал «лезть в облако», хотел собрать все локально, но, после прочтения этой статьи на Хабре, решил, что распознавание речи действительно лучше делать в облаке.

Я попробовал покопать в эту сторону, но после изучения материалов, в частности статьи выше, пока отказался.
Посоветуйте, пож-та, в сторону каких датасетов рекомендуете посмотреть?
Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Публикации

Истории