Pull to refresh

Comments 20

UFO just landed and posted this here
UFO just landed and posted this here
Ну шум сейчас — это не вот прям какая серьезная проблема. А вот приватность и удобство (в том числе и скорость решения своих проблем через автоматизированную голосовую систему) — да, существенные сдерживающие факторы.
UFO just landed and posted this here
Ну это экстремальный случай. :) Голос из метро и люди-то очень плохо понимают.
У меня все эти автоинформаторы и голосовые меню не вызывают ничего кроме отторжения. Максимум что готов послушать — это одно меню с 3-5 вариантами и возможностью вызвать оператора. Если что-то более сложное, то и мне и компании будет проще воспользоваться веб-сайтом…
UFO just landed and posted this here
Расскажите подробнее? Я бы сам позвонил и пообщался с роботом.
UFO just landed and posted this here
Лингвисты говорят, что языковые модели романских языков проще, чем модели языков славянских. А не знаете ли чего-то на русском?
А вот на что стоит обратить внимание при использовании обратной технологии, Speech-to-text:

Я как-то думал, что статья о речевом управлении, а не наборе текста. Если о первом, то ИМХО очень важно иметь не краткую, а полную инструкцию для человека о всевозможных командах для распознавалки. Так как это не GUI — там нет видимых кнопок, которые можно понажимать и посмотреть что произойдет. Речь гораздо многограннее — одну и ту же команду можно произнести 10-ком различных способов и нормальный человек ее поймет, а вот роботу будет намного труднее. Поэтому обязательно надо предоставлять пользователю список всех возможных команд, воспринимаемых роботом.

Справедливо. Но вопрос в том, как это делать? Можно (и нужно, навреное) встраивать инструкцию в само голосовое меню, но надо с одной стороны клиенту дать возможность его как-то прослушать, а с другой — не грузить человека тем, что он уже знает, и не тратить его время на ненужные подсказки. В этом и есть большая сложность с голосовыми интерфейсами. Из-за необходимости обучения они становятся малоюзабельными, и из-за обучения они тоже малоюзабельны. Отсюда есть выход в виде ассистента, понимающего естественную речь, но тут мы упираемся в технологические ограничения. Собственно, об этом и статья: несколько попыток уже видели создания замены IVR «барышней», но пока из 100% наблюдаемых все 100% провалились и тихонько вернулись к обычному меню с DTMF.

Как пример Siri и управление Homekit. На сайте имеется несколько примеров, но многие пользователи проваливались на том, что на жалюзи надо было говорить не "открыть", а "поднять". Или что люстры надо называть лампами и прочие приколы, которые возможно появились из-за локализации, но в итоге для нужной команды приходится долго подбирать слова, пока система, наконец, не поймет.

Лично у меня был с такой штукой только один, увы, негативный опыт. Сайт РЖД. Пытался забронировать билет на поезд.


  • Назовите пункт назначения
  • Адлер
  • Вы указали пункт назначения… Краснодар

    и так несколько раз, пока мне не надоело...
Ага, вот об этом и пишу. Звонящие от непонятливых роботов быстро устают.
Странно, но создается впечатление, что авто сознательно подменяет понятие «смена интерфейса» на «автоматизация». Все, о чем пишется в статье — к автоматизации имеет лишь опосредованное отношение. Поскоьку задача стоит не столько облегчить жизнь оператору/сотруднику выписки (автоматизация), сколько — убрать оператора (сменить интерфейс/способ общения с заказчиком). С этой очевидной ошибки и растут проблемы. Не проанализировав, что именно нужно, народ расчехлил шашки и помчался на нечто грохочущенее в клубах пыли и дыма :)

Это еще не учитывая, что даже нормальный, напечатанный текст, ПО не способно обработать даже с 80% точностью (кто сомневается, переводческое ПО в помощь). Поэтому, автору могу лишь порекомендовать разобраться, что именно нужно заказчику, а уже только потом думать о том, что и как лучше делать.

Что касается голосовых интерфейсов, то они убоги, что называется, по определению — поскольку с одной стороны (человек) имеется источник неформализованных/неформатированных данных, а с другой (система распознования) система, которая может работь только с данными в рамках известных ей форматов и форм.

Если брать примеры, то самым простым вариантом «телефонного меню», будет система. где от человека требуется лишь отвечать «да» или «нет». Применительно к продаже билетов, я бы рекомендовал следующие вариант " «автозаказов»
1. выбрать с 5к самых популярных направлений. и просто спрашивать заказчика, в какой из пунктов он хочет.
что-то типа «Пожалуйста, ответьте да или нет на следующий несколько вопросов»
— Нужен билет в Сочи?
— Нужен билет в Санкт-Питербург?
— Нужен билет в Минск
и так далее, не более 5 вариантов в сумме.
2. Если человеку нужны другие направления, то переключаться на оператора — и далее как всегда (можно, конечно, паралельно включить автораспознование, чтобы оператор меньше вводил, а заодно и проверял).
3. Если какой-то их преложенных вариантов, то включить запись, и попросить человека четко произнести количество билетов, дату и ФИО пассажиров.
4. Сообщить, что на СМС ему придет подтверждение заказа.
5. автоматически распознать произнесенное и передать информацию оператору для проверки.
6 Оператор внесет необходимые изменения и дальше система работает как обычно

Это самый простой и достаточно удобный вариант работы с системами распознования речи на неком сферическом примере.
Подразумеваю, что «замена живого человека роботом» — это «вид автоматизации». Можно ли назвать это подменой понятий? Наверное, можно. Имеет ли это для сути статьи принципиальное значение? Не уверен. В статье делюсь, как телефонист, своими наблюдениями за результатами своих действий и действий партнеров и конкурентов. Если кратко, то вы правы: пока не взлетает по причине технологических ограничений, которые делают получающееся предложение малоюзабельным, а значит и малополезным.
как я и боялся, все сильно хуже. Замена ручного (человеческого) труда на некий «нечеловеческий» не является «автоматизацией», это обычная, допотопная уже механизация. Но Вы не поняли основной проблемы. Вы не «механизировали» труд, незаметным для пользователя образом. И даже не упростили ему жизнь. В итоге Вы (или не Вы лично, а Ваши коллеги) кардинально сменили интерфейс и назвали это — автоматизацией. Видать видео про лифт и ирландцев, желающих попасть на 11й этаж, надо обязательно показывать всем, кто хочет что-то «автоматизировать» :)

А результат вполне ожидаем — «механизированный бардак». И дело тут не только в технологиях.
От того, что я начну «правильные» слова использовать для названия тех же самых сущностей, суть проблемы и сложности с её решением никак не меняются. А за нас не бойтесь, у нас все хорошо. ;)
Sign up to leave a comment.