Открыть список
Как стать автором
Обновить

Комментарии 4

Заливаешь всё на ютуб (всё равно архиву вебинаров нужен хостинг, чтобы с людьми делиться, да?), он распознает весь голос, да и текст в видео и поиск встроен.

Найти видеоуроки по многим вопросам не Youtube не сложно, но часто приходится прослушивать 15-20 мин видео, чтобы узнать, что лектор ничего не сказал по конкретному интересующему вопросу

Там есть хитроспрятанная кнопочка «Open transcript», нажимаешь и можно искать в комфорте своего браузера Ctrl-F :)
Да, я написал, что он это умеет. Спасибо за кнопочку — она действительно хитро спрятана, не знал, что есть возможность поиска по титрам.

Несколько НО:
— у нас не весь контент публичный, есть то, что заливать на youtube нельзя, можно хранить только на внутренних ресурсах.
— для автоматического создания титров youtube, скорее всего, использует тот же движок Google, что логично, но без какого-либо тюнинга словаря. Нашел один из своих давних вебинаров, для которого автоматически создались субтитры, качество недостаточное, чтобы что-то найти.
— ну и эти субтитры работают только если автор их разрешит, т.е. искать в залитых кем-то вебинарах не получится. Это не имеет отношения к моему кейсу, но есть другие кейсы, где это будет ограничением.
Сейчас уже есть датасеты перевода речи в текст в связи с этим вопрос: самостоятельное обучение нейросети не рассматривалось?
Признаюсь, я поначалу не думал «лезть в облако», хотел собрать все локально, но, после прочтения этой статьи на Хабре, решил, что распознавание речи действительно лучше делать в облаке.

Я попробовал покопать в эту сторону, но после изучения материалов, в частности статьи выше, пока отказался.
Посоветуйте, пож-та, в сторону каких датасетов рекомендуете посмотреть?
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.