Как стать автором
Обновить

Комментарии 10

Ваша супруга, которая прожила с вами 20 лет, только сейчас начинает отдаленно представлять себе, что вы подразумеваете на самом деле, когда что-то говорите. Ваш компьютер, скорее всего, никогда не начнет вас понимать по той простой причине, что вещи, которые вы говорите, в принципе не понимаемы.


В общем, это как гармоники в антенне…
Смыслов много. «Помой посуду» (в контексте времени, интонации, состоянии, места и прошлых диалогов) в устах подруги, может значить и, а вот почему шубку мне до сих пор не купил.

Или некоторые (если не все) герои Достоевского, выдают слова положительные-правильные по социальным, политическим и прочим меркам эпохи, но от их правильности блевать хочется.

Провёл жестокий эксперимент, и видно, что человеки не способны (из за давления общества и так далее...) мыслить рационально.

Компьютер «поймёт» с. контекст, если будет располагать нужной (глобальной) информацией. Ибо он рационален и свободен от своих «эмоций», вся информация о диалоге ему доступна. Выделит смыслы и примет решения.
Компьютер «поймёт» с. контекст, если будет располагать нужной (глобальной) информацией. Ибо он рационален и свободен от своих «эмоций», вся информация о диалоге ему доступна. Выделит смыслы и примет решения.


Интересные мысли, спасибо! Но если противопоставлять именно нерациональность человеков и рациональность компьютера, то получается, что все тем более обречено. Человек будет ожидать от компьютера действий именно соответствующих своей иррациональной парадигме, вне зависимости от глобального контекста. А машина этого просто не сможет.
Человек будет ожидать от компьютера действий именно соответствующих своей иррациональной парадигме

Монолог Робота.
— Чувак, да помой ей посуду, а то эта дура набитая тебя ещё сильней достанет, а так успокоится на время.
Не дрейфь, я придумаю как твоей бабе понизить самооценку, чтобы про шубу не думала.
Мне кажется, идея об удобстве голосовых интерфейсов идёт от каких-то топ-менеджеров, которые привыкли устно давать общие указания. Как только пытаешься изложить хоть сколько-то сложную задачу более точно и подробно, в виде, пригодном для выполнения, понимаешь, что аудиоформат тут совершенно не подходит. Да и для простых задач ткнуть пальцем кнопку — как правило, быстрее, определённее и легче, чем приговаривать несколько слов голосом.
Про кнопку трудно не согласиться. Но все же например в машине, как и в приведенном в статье примере, действительно трудно отвлекаться на кнопки или «лазанье» в смартфоне, если нужно выполнить не одно действие, а цепочку хотя бы из 3-4 шагов. Так что грамотное голосовое управление упростило бы здесь жизнь. Другое дело, что да, и в таком раскладе, если не руки и глаза, то мозг все равно подсознательно отвлекается на эти «разговоры», а значит, и внимание от дороги отвлекается.

Ну и если применительно к нашей теме, телефонии (вы уж простите :)), говорить, то тут тоже распознавание – палочка-выручалочка. С точки зрения автоматизации — машина способна обработать и прослушать колоссальные объемы разговоров в разы быстрее человека. Так что как только мы приблизимся к хорошему проценту распознавания смыслов и значений, ее помощь в контроле коммуникаций, их фильтрации, будет бесценна с точки зрения практической пользы. Хотя и вычленение просто слов из записей уже выручает и помогает расставлять смарт-теги хотя бы для грубой первичной обработки массивов данных. Чем больше объемы голосового трафика, тем полезнее технология. И, конечно, да, экономия ресурсов при этом более чем имеет место.

Приходим к тому, что задача проектировщиков — просто не пытаться везде пихать этот инструмент, а использовать его адекватно, там, где он уместен. Как всегда, решает «золотая середина».
Идеальный для таких случаев интерфейс — когда нажал кнопочку, и он сам знает, кого набрать, сделать тише музыку или почесать спину. А то и вовсе без кнопочки. Кажется, что такое научатся делать раньше, чем полноценно распознавать речь.
«С точки зрения автоматизации — машина способна обработать и прослушать колоссальные объемы разговоров в разы быстрее человека.»
Самое главное — ей за это не нужно платить зарплату!
НЛО прилетело и опубликовало эту надпись здесь
По английскому языку современные технологии ИИ распознают лучше, чем среднестатистический человек (в среднее попадают, конечно, призжие мексиканцы с индусами, но тем не менее). Про русский не знаю, может, какие-то особенности языка мешают. Но вряд ли.
Возможно, используются устаревшие технологии распознавания. Или у вас плохое качество связи — какой-нибудь VOIP с безумным сжатием.
НЛО прилетело и опубликовало эту надпись здесь
Зарегистрируйтесь на Хабре, чтобы оставить комментарий