Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Google опубликовал пособие по Voice Playbook для разработчиков conversational AI

Блог компании Neuro.netИскусственный интеллектГолосовые интерфейсы

Корпорация Google недавно выпустила интерактивную публикацию, которая демонстрирует процесс работы обычных пользователей с голосовыми технологиями. Это своеобразное пособие по голосовому UI еще и подсказывает различные идеи представителям отрасли. В основе материала от Google - идея разработки оптимальной голосовой технологии, которая позволит привлечь гораздо больше людей в онлайн в рамках стратегии Google Next Billion Users. Подробности о пособии по голосовым технологиям от Google — под катом.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Просмотры613
Комментарии 0

Epic выпустила голосовой чат Voice и сделала бесплатным античит Easy

СофтИгры и игровые приставки

Компания Epic Games выпустила два бесплатных инструмента для разработчиков видеоигр — античит Easy и голосовой чат Voice. Они стали частью набора Epic Online Services — инструменты из этого набора можно использовать со всеми игровыми движками на всех актуальных платформах — Windows, Mac, Linux, PlayStation, Xbox, Nintendo Switch, iOS и Android.

Читать далее
Всего голосов 11: ↑11 и ↓0 +11
Просмотры680
Комментарии 0

Всё ли сделал? А молоко — купил?

Я пиарюсь
Почему такой странный заголовок? При чём тут молоко? Дело в том, что в сервисе голосового доступа Вселисделал появилась поддержка веб-приложения Remember the Milk. Фанатов сервиса я прошу подождать следующего поста, там мы расскажем подробно обо всех возможностях добавления записей голосом в РТМ. Этот пост посвящается тем, кто ещё не очень хорошо знает, что такое Remember the Milk.


Читать дальше →
Всего голосов 34: ↑26 и ↓8 +18
Просмотры712
Комментарии 16

Pliq.me крошка…поговори со мной!

Я пиарюсь
image

Лучший способ набрать текст на телефоне – это сказать его.


С прошлой недели доступен в закрытом тестировании новый проект Pliq.me, позволяющий с помощью небольшого приложения и большой серверной части создавать голосом короткие текстовые сообщения на вашем телефоне для SMS, E-mail, напоминаний, записей в Twitter, Evernote или просто быстрых заметок.
Читать дальше →
Всего голосов 41: ↑37 и ↓4 +33
Просмотры516
Комментарии 93

Инвайты на Google Voice уже доступны студентам

IT-компании
Перевод
Вы учитесь в одном из американских учебных заведений? Или имеете друзей «там»?
Google раздаёт приглашения в Google Voice всем студентам, кто имеет почту в домене .edu
Подробности
под катом
Всего голосов 72: ↑52 и ↓20 +32
Просмотры413
Комментарии 48

Телефония на Cisco (Call Manager Express) — Часть 1

Cisco
Начав изучать CVoice (642-436) я решил выкладывать некоторые лабы в виде статей. Первая часть — такой себе «Hello World», звонок с одного телефона на другой.

читать дальше
Всего голосов 31: ↑29 и ↓2 +27
Просмотры53.1K
Комментарии 9

Используем голос в Chromium 7

Google Chrome
Другой интересной новинкой в проекте Chromium собираются порадовать нас ребята из Google — функция распознавания речи. Это будет полезным при использовании технологии Google’s Voice Search, что прижилась на современных смартфонах и не только. На данный момент имеется лишь небольшая демонстрация работы будущей функции — голосовой переводчик с английского на французский, построенный с использованием Google Translate API.

Чтобы протестировать работу функции не надо вводить даже никаких специальных команд. Достаточно иметь последнюю dev-сборку Chromium, микрофон, систему Windows или Mac и, собственно, открытую страничку демки.
Читать дальше →
Всего голосов 27: ↑23 и ↓4 +19
Просмотры4.5K
Комментарии 8

Google Voice в Gmail

IT-компании
Google добавил службу звонков на стационарные и мобильные телефоны в Gmail

image

Цены на звонки по России сравнимы со Skype

image

Ищите в своем Gmail.

Остальные цены

UPD: как сообщают ниже, сервис может не работать в Русской версии Gmail.
Всего голосов 72: ↑39 и ↓33 +6
Просмотры1.9K
Комментарии 56

Ближайшее будущее Wi-Fi: сертификация Voice Enterprise

Сетевые технологииБеспроводные технологии
В прошлой статье мини-цикла мы говорили о 802.11ac, в этой — поговорим о сертификации Voice Enterprise: что это такое, и зачем она нужна.

Голос в беспроводных сетях прошел примерно через тот же тернистый путь, что и в сетях проводных: изначально никто и не собиралсяпередавать по этому что-то вроде голоса и видео; потом была поставлена задача, пришлось изобретать новые протоколы и прикручивать дополнительные расширения к существующим; в итоге всё заработало.
Технологии более-менее качественной передачи голоса по Wi-Fi существуют достаточно давно, но построение качественной сети для VoWLAN до сих пор является весьма тяжелой задачей. И даже не из-за тонкостей радиопланирования и тюнинга QoS – банально, проблемой является подбор железа!
Читать дальше →
Всего голосов 6: ↑6 и ↓0 +6
Просмотры10.7K
Комментарии 2

Клиническая обработка сигналов речи и машинное обучение. Часть 1

Алгоритмы
Из песочницы

Из выступления Max Little (основателя PVI) на конференции TED в 2012 году.

Здравствуй, Хабрахабр. Данный цикл статей будет посвящен рассмотрению возможности и построению Open Source универсального анализатора нарушений речи.

В данной статье будет рассказано о проекте Parkinson Voice Initiative, посвященному ранней диагностике Болезни Паркинсона по голосу (успешность распознавания составляет 98,6± 2.1% за 30 секунд по телефонному разговору).

Будет произведено сравнение точности используемых в нем алгоритмов выбора особенностей (ВО) – Feature Selection Algorithm – LASSO, mRMR, RELIEF, LLBFS.

Битва между Random Forest (RF) и Supported Vector Machine (SVM) за звание лучшего анализатора в данного рода приложениях.

Начало


Читая статьи по синтезу и распознаванию речи, нашел упоминание о том, что при болезни изменяется голос. Проверив очевидность факта, что я не первый догадался использовать распознавание речи для диагностики болезней (первые клиницисты определили некоторые features — особенности еще в 40-х годах прошлого века, записывая на магнитофонную ленту, а потом вручную анализируя), пошел по ссылкам Гугла. Одна из первых указывала на проект PVI.


Читать дальше →
Всего голосов 25: ↑22 и ↓3 +19
Просмотры7K
Комментарии 2

Аутентификация и идентификация по голосу с помощью когнитивных сервисов Microsoft

Разработка мобильных приложенийРазработка под Windows PhoneMicrosoft AzureРазработка под Windows
Tutorial

Когнитивные сервисы представляют доступ к различным облачным сервисам, которые позволяют работать с визуальной, голосовой и текстовой информацией. Кроме того, доступны различные поисковые функции Bing.

Для того, чтобы попробовать когнитивные сервисы в действии даже не обязательно иметь аккаунт Microsoft. Получить пробный ключ можно и с помощью аккаунта GitHub или LinkedIn. Пробная подписка не ограничена по времени, но ограничена по количеству используемых ресурсов за период. Ознакомиться с онлайн демонстрацией можно по адресу: Speaker Recognition API

Далее идет описание того как опробовать в действии аутентификацию пользователя с помощью голоса. Хоть сервис еще и в состоянии preview, но, несмотря на это, уже довольно интересен.
Сервис может быть использован из различных платформ, но я буду рассматривать создание C#/XAML приложения UWP.
Читать дальше →
Всего голосов 17: ↑17 и ↓0 +17
Просмотры7.4K
Комментарии 3

Краудфандинг технологии звукового зрения vOICe — для слепых и не только

КраудсорсингНосимая электроникаDIY или Сделай самМедгаджетыБудущее здесь
Ушами можно любить, на них можно вешать лапшу. А ещё ушами можно… видеть.

Много лет назад голландец Питер Мейер, сотрудник научно-исследовательского отдела компании Philips, начал работу над проектом Seeing With Sound, призванным заменить зрение незрячим людям. Идея была весьма необычной и на первый взгляд довольно спорной. Человеческий мозг довольно пластичен. И если превратить изображение с камеры в звуковую последовательность — возможно, после тренировок мозг пользователя сможет научиться воспринимать скрежещаще-свистящую трель не как звук, а как монохромную картинку и различать тёмные и светлые участки этого «аудио-изображения». На первый взгляд, идея неочевидная. Но её авторы сумели найти единомышленников и рискнули собственным временем и потраченными на оборудование деньгами. Так родилась система «звукового» зрения vOICe – (аббревиатура из трех заглавных букв звучит как «Oh I See»).

image

По отзывам экспериментаторов, после долгих и регулярных тренировок незрячие люди, пользующиеся vOICe'ом, могли передвигаться в помещениях, не натыкаясь на предметы, и даже читать крупный текст, например надписи на вывесках.

Такой проект не мог не привлечь внимание трансгуманистического сообщества РТД еще в 00-х, но только к середине 10-х прогресс железа и интернет-ресурсов позволил дать разработке vOICe новый импульс и организовать кампанию на Boomstarter, которая сегодня успешно завершается более чем на 100%. Базовый проект предусматривает создание 5 пилотных экземпляров системы для слепых пользователей плюс их обучение, но если кто-нибудь желает помочь еще одному человеку с ограниченными возможностями стать немножко Бэтменом, а заодно получить софт и обучающие материалы для экспериментов и сувенир на память, то это можно успеть сделать до 20:34 MSK 4 августа. Более подробно о проекте можно почитать на странице кампании, а сейчас несколько слов об истории его разработки от Яны Артищевой ака telegamochka:
Читать дальше →
Всего голосов 10: ↑8 и ↓2 +6
Просмотры3.9K
Комментарии 14

Звуковое зрение vOICe – в шаге от прорыва

Блог компании iCover.ruГаджетыБиотехнологииAR и VRМедгаджеты
"Все предметы обладают своим уникальным звуком, и как только вы поймете принцип действия системы, вы сможете "видеть", что вас окружает". До относительно недавнего времени это удивительное свойство окружающего нас мира существовало в отрыве от практического применения. Благодаря Питеру Мейеру, работающему в отделе исследований и разработок голландской компании Philips был составлен уникальный алгоритм, позволяющий буквально превратить звук в картинку. После нескольких десятков лет поиска возможности воплотить идею Мейера “на аппаратном” уровне было создано устройство, позволяющее наделить слепого человека т. н. ”суррогатным” зрением. Об успехах, проблемах и перспективах проекта, реализуемого сегодня командой российских ученых – энтузиастов, мы остановимся в нашей статье.

vOICe
Читать дальше →
Всего голосов 22: ↑20 и ↓2 +18
Просмотры10.3K
Комментарии 31

Что нужно незрячему? Обзор слепоглухого эксперта Сергея Флейтина

Блог компании Реабилитационная индустрия РоссииГаджетыБиотехнологииНосимая электроникаМедгаджеты
Качество продукции в конечном итоге определяет пользователь. Реабилитационная индустрия при всех её особенностях – не исключение. Об этом свидетельствует опыт множества проектов, как успешных, так и оставшихся в истории.



Наш сегодняшний гость уже много лет изучает отрасль и её продукцию. Интерес Сергея Флейтина к техническим средствам реабилитации незрячих людей носит не только личный характер, но и профессиональный. В прошлом тотально слепой Сергей работал экспертом по ТСР Европейского союза слепоглухих и был генеральным секретарём этой организации, а сегодня занимает должность вице-председателя благотворительного фонда «Творческое Объединение «Круг».

Сергей Флейтин один из немногих незрячих россиян, который на себе опробовал большинство существующих средств реабилитации и ассистивных устройств. Некоторые разработки стали верными спутниками Сергея, каждый день помогая ему в быту, а другие пылятся в дальнем углу после первого же использования.
Читать дальше →
Всего голосов 23: ↑20 и ↓3 +17
Просмотры5.4K
Комментарии 11

VoiceOver на iOS: каждый контрол ведёт себя по-разному

Блог компании Dodo EngineeringРазработка под iOSРазработка мобильных приложенийAccessibility
Привет, Хабр! Недавно я говорил про адаптацию приложений для незрячих и неподвижных людей. И не договорил!

Сегодня расскажу, как изменить поведение контролов с помощью accessibilityTraits и сделать жизнь незрячих чуть удобней. Знать работу этих трейтов (traits) важно, чтобы не писать свои костыли.


Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Просмотры2.4K
Комментарии 7

VoiceOver на iOS: решение типовых проблем

Блог компании Dodo EngineeringРазработка под iOSРазработка мобильных приложенийAccessibilityДизайн мобильных приложений
Когда берёшься адаптировать приложение для незрячих, часто что-то идёт не так: то порядок собьётся, то фокус не туда встанет. С другой стороны, есть UX, который легко пропустить, потому что не знаешь про возможные проблемы. В этой статье будем разбираться с типовыми проблемами и их решением.


Читать дальше →
Всего голосов 10: ↑10 и ↓0 +10
Просмотры1.7K
Комментарии 0

Как встроить голосового помощника в любое мобильное приложение. Разбираем на примере Habitica

Блог компании Just AIРазработка мобильных приложенийРазработка под AndroidKotlinГолосовые интерфейсы
Tutorial
Вам не кажется, что многие мобильные приложения стали бы куда удобнее, будь в них голосовое управление? Нет, речь не о том, чтобы вести беседы с банковским ассистентом в чате техподдержки. В основном было бы достаточно голосовой навигации по приложению или form-filling в режиме диалога.

На примере Habitica (опенсорсный app для закрепления привычек и достижения целей, написан на Kotlin) Виталя Горбачёв, архитектор решений в Just AI, показывает, как быстро и бесшовно встроить голосовой интерфейс в функционал любого приложения.


Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Просмотры3K
Комментарии 7

NetBox как Voice и UC Source of Truth

Ненормальное программированиеСистемное администрированиеСетевые технологии

Привет Хабр! Доводилось ли вам испытывать трудности с документацией на корпоративные Voice и Unified Communications инфраструктуры?


  • Что это за номер? Откуда он приходит?
  • Этот SIP-транк еще актуален?
  • В каком из этих Excel-файлов нужная мне информация?
  • Есть у нас свободный городской номер для новой услуги?
  • Телефонные_номера_новый_072019(3).xlsx?!

Звучит до боли знакомо? Есть вариант, который может с этим помочь.
Всем заинтересовавшимся добро пожаловать под кат!

Читать дальше →
Всего голосов 5: ↑5 и ↓0 +5
Просмотры942
Комментарии 6

Разрабатываем своего первого голосового ассистента на iOS

Блог компании VS RoboticsРазработка под iOSГолосовые интерфейсы
Tutorial

За последнее время значимость голосовых функций и звука значительно выросла. Примером тому может служить уже громкая история запуска приложения Clubhouse, голосовых ассистентов Сбера и общего оживления интереса со стороны пользователей, компаний и инвесторов к звуку на мобильных устройствах.

На мой взгляд, звук как интерфейс между пользователем и приложениями, изначально был недооценен, однако с появлением технологий искусственного интеллекта, высокой информационной нагрузки и нехватки времени, польза аудио становится очевиднее.

В этой статье я бы хотел рассмотреть пример разработки голосового помощника на платформе iOS, используя язык Swift.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры1.1K
Комментарии 2

И чат, и бот, и логопед. Как разработать сервис на основе ML для диагностики дефектов речи у детей

Машинное обучениеИскусственный интеллект

«Шла Саша по шоссе», «Скажи: рррррыба», «Кукушка кукушонку...» – знаете, да, эти фразы, травмировавшие нас всех в детстве? Это был какой-то бесконечный эксперимент родителей с неоформленным желаемым результатом и главное – страхами, что их ребенок растет с дефектом речи. 

Привет! Меня зовут Дима Пухов, я технический директор в Cleverbots. Хочу рассказать, как мы учили чат-бот распознавать дефекты речи и добились 80% точности в диагнозах ИИ-логопеда.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры1.3K
Комментарии 7