Pull to refresh
5
0
Send message
«Попробуйте сказать вслух — «museum». Слово выходит моментально, на одном выдохе, и RNN могут это распознать. »

— и какой объём словаря (сколько слов использовалось для обучения и тестирования) такие модели способны таким способом распознать?
«В процессе обучения RNN мы подмешивали искусственные шумы, ревербацию, эхо и прочие типичные в повседневной эксплуатации «загрязнения» на обучающих сэмплах, что помогло сделать систему распознавания более устойчивым к фоновым шумам. „

И каким же образом это “что» «помогло сделать систему » обученную на шумах, которая в свою очередь будет нормально работать на чистом сигнале без шума без переобучения моделей на чистой речи?

Ведь (пере)обучение НС моделей занимает приличное время в распознавании речи. Не ясно, что именно при использовании RNN послужило благоприятно при распознавании зашумленной речи?

даже так — процент правильных ответов! Думаю в конце, если дашь согласие — опубликуешься или не опубликуешься — галку поставишь на разрешение или нет и все. Хотя хочется сейчас америкосов сделать! :)
скорее всего автоматизированно. Там сейчас на теорию вероятности вопросы пошли — посчитать вероятность совместных событий и.т.п. — готовят к Скрытому Марковскому Моделированию ;) и там творчество так и прёт! :) Если правильно задавать вопрос и вводить параллельно ответами в заблуждение, то как ни как берешь карандаш и занимаешься творчеством :)
со сроками, то такое дело… они даже на 1н день продлили, т.к. в последний вечер все сели смотреть видео :) и всё «потухло» не надолго правда. А то что у них clarification появились позже к заданиям, а вроде бы сохраняется первый введенный тобою результат в не зависимости от дальнейших исправлений! Вот как — вот тут то тоже ляпа дала — теперь осторожнее надо отвечать! Вот робот -если не сказать, что у него ограниченное число поворотов в лабиринте, то он двигается непрерывно, а не дискретно и.т.п. — мелочь, а не приятно! Будем внимательнее!
Вопрос, а где можно увидеть рейтинг, кто сколько набрал и из какой страны — ну хочется увидеть!
Это возможно или закрытая пока информация? :)
все дело в ограничениях, которые накладывают на распознавание — т.е. что именно подают на распознавание?
Произвольную речь, т.е. человек наговорил что-то и все распознают или что-то отбрасывают, а что-то оставляют — в деталях суть, а не в общем результате WER.
Какими средствами этот WER достигался — это важно.
Implementing a Speech Recognition System on a GPU using CUDA — это уже не новость… А про результаты IS — чуть позже почитаем и напишем, что же там за такой прорыв :)
это до сих пор пробелма, открою вам секрет. И точность распознавания фонем (звуков) Нейросетью по мировым достижениям и достижениям исследователей старн Украины и др. составляет 64,28% на слитной речи, но не свободной, т.е. спонтанной — и это самый лучший на данный момент результат… вот и подумайте, что должна сделать языковая модель, что бы распознавание было ну хотя бы 85%.
А на других фотках своих же друзей вы где-то отмечены?

Или более того на фотках, которые вы/друзья когда-то удалили… Либо же ваш друг вас отметил, но вы не подтвержили — тоже очень в этом деле может «помочь»…

Если «да», то вероятность того, что вы будите найдены на других подобных фотках тех же друзей — увеличивается…
«Бесполезно вымучивать нейронные сети» — ну зачем же так недооценивать НН. В прикладных областях они составляют довольно неплохую конкуренцию классическим методам и на данный момент являются перспективой для дальнейших исследований, например, в распознавании человеческой речи:
Нейромережевий розпізнавач фонем uasoiro.kibermova.com/zhukyn/bondarenko_fedyaev_Zhukyn2010.pdf
Спасибо за ответ! Приблизительно такие цифры я и ожидала увидеть.
Спасибо! Интересно услышать как вы повышали точность
«Подняв его сейчас и «обучив» доступными данными точность предсказания можно было бы поднять до приемлемой» — за счет учёта большего числа предшествующих слов, т.е. пошли в триграммы и.т.д.?

«до приемлемой» — можно в личку, какая приемлемая вышла?
Интересна, стоит открывать. Мои наблюдения, что по этой тематике много пишут Китайцы с их мандаринским акцентом, Французы, Испанцы даже, а у нас даже блога нет обработке естественных языков!

Хотела бы узнать, использовали ли вы на практике HMM для борьбы с омонимией?

А кроме омонимии и синонимии эти ми же методами можно решать другие задачи по выявлению особенностей текстовых корпусов?

И если можете привести какие-то доводы, какой из Вами перечисленных методов борьбы с омонимией даёт лучший результат и несколько соображений почему?
Т.е. от чего зависит выбор того или иного метода?

«Я не первый год работаю в этой области» — хотелось спросить, не встречались ли Вы с альтернативой идентификации по по голосу человека?
«думаю, потребуется около двух недель для освоения интуитивно понятного интерфейса»
Хотелось бы отметить, каким образом решают такую проблему освоения сложных интерфейсов. Как раз для такой цели ведутся активные разработки речевых интерфейсов, которые заменяют запоминание множества действий, интуитивно понятными словами-командами («перейти», «закрыть», «писать» и.т.п.). Особо увлекательно общаться с ASRкой, когда не понимая чего-либо она задаёт уточняющие вопросы и таки добивается от Вас нужного ей ответа :)

Но следует отметить, что голосовой интерфейс не может взять на себя все задачи управления, а зачастую это просто не нужно, поэтому для большей эффективности применяют голосовое управление в комбинации с привычными нам интерфейсами, такими как клавиатура, сенсорные экраны и.т.п.

Интересно, будет ли применены технологии голосовых интерфейсов в такой заманчивой «игрушке» от Microsoft.
Не могу не согласиться, что у них наука развивается не только для «утилизации», но и для развития самой науки, как в направлении положительных результатов, так и получения опыта отрицательных результатов. В не зависимости от того будет ли результат исследований выгоден или нет — любой результат- это результат и Наука штука требующая долгосрочных вложений, зачастую не всегда прибыльных… У них исследования проводят, даже, для получения подтверждений, что в данном направлении не стоит двигаться, у нас же — главное, что бы продать можно было… от так и живём.
Успешно намучалась, но это работает и работает уже давно ;)!!! Спасибо :)
Есть такие люди! Вот так «поле и пашем» Собственно Я и приперлась на работу на 8 утра, по старому на 7мь утра, а если быть точной опоздала на 20ть минут, вот скажите пожалуйста как не опоздать?
1

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Registered
Activity