Интернет-маркетинг
Искусственный интеллект
Интернет вещей
Будущее здесь
Голосовые интерфейсы
Комментарии 55
+6

Пытался составить список покупок через Google Assistent несколько раз. Работает ужасно — не поддерживает разговор (нужно каждый раз говорить "окей гугл"), не поддерживает контекст, не понимает что в предложении покупка, а что — просто разговорная обвязка. И даже удалить пункт из него нельзя.


Теперь выдержка из отчета, на который приведена ссылка:


41% of all device owners had conducted a product search on their smart speakers and 28% say they do so monthly

Формулировка тут "had conducted a product search", что означает — попытались найти товар для покупки. Не известно получилось ли у них это в итоге и совершили ли они ее. Допускаю что в США может сработать запрос в духе "купи мне батарейки на амазоне с доставкой", когда и выбора никакого не надо. Покупать таким образом, например, телевизор — идея как по мне странная

0
Во первых вся эта история про аппаратные устройства и пока что не совсем для Русского языка. Дома стоит колонка Гугл которая прикручена к Русскому языку и очень удобна схема, где жена наговаривает список покупок, а я в магазине с телефоном по нему иду и по мере покупок выкидываю купленное.
Про то что каждый отдельный пункт — нужно окей гугл говорить, согласен, неудобно. Но время на месте не стоит.
0
> купить батарейки
Это как? Может в штатах они не заморачиваются первый попавшийся по списку в амазоне нонэйм. То мне нужно будет уточнить: типоразмер, фирма, количество сравнить по цена/качество. Тут нужно до этого дойти, чтоб брать первое попавшееся. Также в штатах заказать с амазона (он один и где всё есть) и могут проследить за качеством и развивать это направление, в России это всё разрознено, нужно собирать в одно и также развивать клиентскую базу.

Кстати кто-то покупал голосовым помощником? Как это вообще происходит? Хотелось бы реальный кейс и диалог.
+3
Год пользовался кнопкой «вызова голосового ассистента» Google на своём Galaxy S8+.
Затем понял бесполезность данной функции и даже вредность из-за того что кнопка могла нажаться случайно и запускался голосовой помощник, громогласно объявляющий о себе.
Выключил. Сейчас кнопка вообще не выполняет никакую функцию.
О каком росте заявляют в статье? Может этот рост произошёл из-за спам звонков? И теперь спамеров стало гораздо больше. Надеюсь спам фильтр вырежет это развитие по экспоненте)))
0

Поставил как-то голосовой помощник от Яндекса, т.к. хотел видеть, кто звонил — реклама услуц, опросы, банки и т.п. И по новым требованиям гугла такие программы обязаны идти почему-то только в комплекте с голосовым помощником. Ну поставил себе шпиёна, звонки показывает хорошо.
А с помощником поигрался немного, таки те функции, которые показывают в рекламе более-менее работают нормально, хотя как только начинаешь требовать что-то более сложное — сразу уже начинаются проблемы. В общем, баловство всё это, забросил и не пользуюсь.
Возможно, когда-нибудь технология дойдёт до нормальной зрелости — а пока я быстрее сам справлюсь.

0
Согласен, это неправильная политика выпуска на рынок незрелого продукта компанией Яндекс.
0

Есть приложение "Не бери трубку", блокирует мусорные звонки и без всяких голосовых помощников

+5
Сколько не пробовал пользоваться голосовым управлением, ни разу ни возникло кейса с положительным опытом. А соотношение устройств и приложений мне кажется говорит только о том что производители форсят пока что никому не нужную технологию.
0
не впервый раз на этапе развития рынок наполнен никчёмным софтом, далее качество начинает расти и переходить в нечто новое.
+3
Однако, бывает, что технологии умирают, так и не завоевав рынок.
Например, 3D телевизоры и Blueray диски — одно время активно продвигались, но так и застряли, кажется не пошло…

PS: Я бы честно не хотел иметь дома еще и такого явного шпиона.
Этож ничего сказать дома нельзя будет. И так тотальная слежка и тут еще это. Доверять никому нельзя. Я думаю в России недоверие и неверие в безопасность — возможно главный тормоз таких штук.
0
Судя по сериалам и новостям мне кажется на западе ещё больше заморачиваются приватностью.
0
есть знакомые в штатах которые именно по этому не заводят такую штуку. То что они следят — это 100%. реклама накрывает сразу после высказывания желания купить вещь, причём не этой говорящей голове, а так, вслух.
0
Рынок распознавания письма/речи за те 15 лет, что я его помню никогда не имел нормальных решений. Особенно в области русского языка. Стоит только выйти за рамки условного Simple English и распознавание превращается в какую-то белиберду.

А разгадка проста — так называемое распознавание это решение-нейронка, решение зависящее от датасета обучения, решение заточенное под общие случаи. А упирается все в фундаментальные алгоритмы распознавания, которые в принципе не могут в контекст, которые будут работать только если ваш письменный и голосовой ввод будет условно близок к тому на чем обучался алгоритм распознавания. И не дай бог вам использовать редкие термины, сленг, сложную структуру предложений.

Без фундаментально новых методов обучения так и будем иметь распознавание на которое положиться нельзя. Рост качества сейчас достигается за счет экстенсивного роста, который имеет свой предел.
0
Насколько я понимаю, проблема в распознавании речи в том, что из-за несовершенства получаемой на вход от пользователя звуковой информации и очень ограниченного времени на её обработку, алгоритму приходится строить вероятностный прогноз о том, какое слово (или словосочетание) было сказано и отдавать предпочтение одному над другим не только на основе похожести звучания, но и на основе контекста. Как Вы правильно заметили, с этим у современных движков и правда были проблемы, однако всё меняется. Недавно появилась нейронка на алгоритме gpt2, которую обучили на столь большом массиве информации, что она способна производить статьи, которые выглядят осмысленными, то есть она способна видеть/понимать контекст сквозь весь текст, а не только на предложение или несколько слов назад. В связи с этим, я довольно оптимистично настроен на счёт улучшения качества распознавания речи в ближайшей перспективе. Посмотреть про упомянутую нейронку можно тут (английский).
0

Б — безопасность. Пока распознавания локального не будет — даже не дёрнусь.

0
Есть парочка опенсорсных проектов, которые можно развернуть на своем оборудовании. Но с русским там не густо, и конечно все в виде набора «сделай сам» (довольно много усилий и знаний нужно что бы все это настроить до того вида как это предоставляется голосовыми ассистентами гугла/амазона).

Вот собственно и безнес-идея: на основе опенсорса сделать коробочное, локальное решение и продавать его. Думаю спрос будет.
0
есть такие штуки на рынке. Сделать конструктор не самая хорошая идея. Это как позволить автоматизировать хаос что в лучшем случае приведёт к полностью автоматизированному хаосу.
0
Тут есть некое противоречие.
Вот к примеру сделал локальное распознавание голоса.
Спрашиваешь у такого помошника — «какая будет днем погода?»
И что делать помошнику без интернета? Он же не знает погоды — то есть интернет все же нужен. А если есть интернет — то все — доверия голосовому распознаванию нет.
0
Он же не знает погоды — то есть интернет все же нужен. А если есть интернет — то все — доверия голосовому распознаванию нет.
По вашей схеме, пока нет локального сервиса расчета погоды, никакому помошнику доверия не будет. Ни голосовому, ни текстовому.
0
Как запрос погоды через интернет ломает ваше доверие локальной распознавалке голоса?

С внешними распознавалками самый неприятный момент — это подделка вашего голоса с с использованием семплов, которые уходят «неизвестно куда». А запросы в интернет ваши все равно можно отследить и не важно — их голосовой помошник делал или вы на ноуте/планшете/телефоне вбили руками запрос погоды.
0
Мне кажется Вы сами ответили на свой вопрос.
1) Я не хочу чтобы еще и мои аудио сэмплы куда-то уходили.
2) Если распознавалка голоса подключена к интернету, то нет никакой гарантии, что она работает локально.
0
Так это просто вопрос вашего понимания технологий, которые вы используете.

Если вы в состоянии просмотреть и понять как работает код OpenSource-ного решения и что в этом коде нет отправки ничего ненужного на какие-то внешние ресурсы — то вы можете быть уверены, что никаких голосовых семплов наружу и не уйдет.

Но если вы OpenSource-ное решение рассматриваете как черный ящик, то единственное, что вам остается это доверять или не доверять разработчику и сообществу которое это проект поддерживает.
0
Кроме того распознавалку можно засунуть в докер (например) без доступа в интернет.
Вся внешняя связь из докера — только с интерпретатором команд (в текстовом виде).

В таком случае вы четко контролируете:
— голос — только в распознавалку
— из распознавалки только текст.
И утечка семплов голоса невозможна технически.
0
Теоретически вы правы. Это если вы сами себе разрабатываете штуку, которой сами собираетесь пользоваться. А вот когда вы покупаете штуку с «функционалом», то тут и возникают вопросы.
0
Я не теоретически, а технически прав. И для реализации такого разделения не нужно разрабатывать решение. Его можно собрать из готовых компонентов.

Но даже в коробочном решении можно разделить его на 2-3 «под-коробки» с четко разделенным функционалом, что позволит на уровне настройки готового решения разделить доступы таким образом, что утечка голосовых семплов будет исключена чисто техническими средствами.
0
Мы похоже говорим о разном.
Я говорю о том, что купленное в магазине устройство неизвестно что делает. И в современном мире это уже касается почти всего — компьютеры с предустановленной ОС, смартфоны, умные телевизоры, фитнес браслеты, электромобили. Даже технически грамотный человек не в состоянии контролировать все это, даже если захочет.
0
Для России или вернее для русского языка в этом рынке — пока что мираж.
0
все чем я в итоге пользуюсь это «Привет Сири, спокойной ночи» что бы не выключать свет дома самому.
0
на вкус и цвет товарищей нет. Дома стоит Гугл колонка говорящая по русски. Все таймеры при готовке и охлаждении на ней. Включать радио и песни. Ответы в стиле википедии. Список покупок домой. Сколько времени жарить мясо на сковороде. в общем жена подсела на эту штуку.
0
Покупать что либо чисто по голосовому интерфейсу — так себе идея. Особенно с учетом того, что большинство людей — визуалы и плохо воспринимают информацию на слух.
И во-вторых с учетом того, что большинство товаров требуют какого-никакого, а изучения характеристик/состава/соотношения цен.
0
есть рекламная компания от Nike которая в феврале 2019 распродала серию лимитированных кросовок, которые можно было купить только через Гугл ассистент за время перерыва в матче NBA
0
Вы путаете рекламную кАмпанию, импульсивную покупку сувениров, и реальный мир. Попробуйте купить голосом хотя бы телевизор например, и не облажаться с его параметрами.
Большая часть этих гаджетов используется как музыкальный проигрыватель. И большая часть этих гаджетов куплена как игрушка-безделушка, что и подтверждается многочисленными комментариями здесь.
0
Ну чтобы купить кросовки одного типа — нужно сказать размер ноги и выбрать цвет.
0
Размер ноги у разных фирм отличается. Без таблицы подобрать не выйдет. Цвет он тоже знаете ли на слух не определяется, при том, что кроссовки обычно не однотонные.
0
если покупать один и тот же бренд, то с размером проблем не будет.
0
Вот уже и появилось волшебное слово «если». А если я хочу купить не один и тот же бренд и вообще не кроссовки, что тогда? Кроссовки я покупаю к примеру раз в год. Ради этого раза в год на кой ляд покупать гаджет, со стоимостью выше стоимости кроссовок. А как быть со всем остальным?
0
это не решение всех проблем, и не везде применимо, например покупать тепловой насос голосом в метро в переполненном вагоне навряд ли получится, но есть вещи, для которых вполне сгодится.
0
Оно и годится для прослушки радио и для поиграть в вопрос-ответ.
Реального полноценного применения для совершения покупок у этих игрушек нету.
0
Есть ложь, есть большая ложь, и есть статистика.
Особенно в ней радует 45 миллионов пользователей Алисы.
Причем по этой же статистике, покупки при помощи этих помошников совершали только 15% пользователей помошников. Что и говорит о их непригодности для этих целей.
0
Нашёл только одно прменение помощника: «Set alarm in n minutes», когда готовлю.
0
По моему опыту голосовой помощник способен стабильно выполнять 3 команды: музыка, будильник и погода. Все остальное — в лучшем случае через раз.
0
Постоянно пользуюсь Сири для отправки смс особенно когда за рулем или на пешей прогулке. Работает очень хорошо. Часто прошу позвонить кому-либо из списка контактов. Включает/выключает vpn. Конвертит все что нужно, только спроси. Погоду и время говорит. Находит и ставит музыку. Добавляет покупки в список.
0

"смс", а что насчет телеграмм или whatsup, работает уже?

0

Круто, а как это голосом сказать? "Отправь Васе в телегам сообщение "Привет, как дела?"" — типа того? Я попробовал сказать так мне сири говорит "простите в этой программе возникла проблема".

0

Беда с отсутствием реальных… даже не приложений, а применений. Стоит у меня дома в Калифорнии колонка Google Home, раз в неделю спрашиваем ее что-то из Википедии, и всё. Ну музыку послушать — но подписка на Play Music нужна для какого-то разумного выбора, только ради этого вряд ли есть смысл — но даже если бы и была — тоже очень редко надо. Погода есть на телефоне… И так у всех почти. И это на английском и в США — и всё равно игрушка — а по-русски еще хуже всё. Вроде бы нужная вещь и должно работать — так все думают — а вот нет.

0
А разбивка по типам покупок есть?
Допустим покупать какую-нибудь пиццу из ближайшего Papa Jones — да запросто…
Билеты на футбольный матч — почему нет…

Понятно что холодильник так не будешь покупать.
0
Взял Amazon Echo за $30, поигрался две недели, поучил язык, поспрашивал погоду, понаставил будильники, потом тот потерял вайфай, а для меня полезность этого устройства было настолько «высокой», что до сих пор руки не доходят восстановить и он валяется мёртвым грузом не холодильнике. Да, я учитываюсь в статистике, в тех 45%, которые взяли колонку поиграться. Но есть что-то реальное за этими цифрами? Сильно сомневаюсь.
Только полноправные пользователи могут оставлять комментарии., пожалуйста.