Это одна из наших практических рубрик, в рамках которой мы делимся примерами многолетнего сотрудничества с российскими и зарубежными компаниями. Например, ранее мы рассказывали о кейсах Hotels.ru и PickPoint.
Сегодня мы хотели бы познакомить вас с Центром речевых технологий (ЦРТ), который вы уже должны были встречать на Хабре — они ведут отличный блог.
/ фото Per-Olof Forsberg CC
ЦРТ был основан специалистами по акустике, которые вложили в компанию свой научный потенциал и разработки. Труд команды ЦРТ оказался востребован на международном уровне — характеристики продуктов не уступали, а даже превосходили возможности зарубежных аналогов.
Сегодняшний ЦРТ — это компания с более чем 20-летней историей и ведущий разработчик систем высококачественной записи, обработки и анализа аудио-видео информации, синтеза и распознавания речи. Продукты компании работают на основе ИТ-инфраструктуры «ИТ-ГРАДа», что дает возможность быстро развивать новые продукты и задействовать пул вычислительных ресурсов с высокой доступностью.
Теперь посмотрим на сами проекты.
Это сервис, позволяющий озвучивать синтезированным голосом любую текстовую информацию. Он работает на основе возможностей облака и даже обладает собственным API.
Сейчас данный интернет-сервис умеет работать с такими сложными конструкциями как омографы. Он понимает тембр и тон с помощью SSML-тегов и распознавать эмоциональные реакции.
Голоса, озвучивающие текст понимают даже обозначения ":)" и ":(" — они смеются и вздыхают. Реализована поддержка нескольких языков. В их число входит, например казахский.
Проект VoiceNavigator — ПО для IVR-систем контактных центров. Умеет распознавать и синтезировать русскую речь (переводит речь в текст и обратно).
Если говорить простыми словами, то вместо набора нужной цифры на клавиатуре («чтобы узнать о наших услугах, нажмите 1») можно управлять контекстным меню голосовыми командами. Алгоритм распознавания считывает тематику запроса и синтезирует ответ. Технология хорошо подходит и для систем массового обслуживания.
В рамках сотрудничества с Мегафоном компания ЦРТ предложила решение для службы клиентского сервиса — виртуального консультанта. «Елена» (так решили назвать сервис) может обработать более миллиона запросов в год и экономить клиентам компании тысячи часов, которые те могли бы провести в ожидании ответа живого человека.
В данный момент «Елена» — пробный проект, в основе которого лежат технологии ЦРТ.
Сегодня мы хотели бы познакомить вас с Центром речевых технологий (ЦРТ), который вы уже должны были встречать на Хабре — они ведут отличный блог.
/ фото Per-Olof Forsberg CC
О чем «речь»
ЦРТ был основан специалистами по акустике, которые вложили в компанию свой научный потенциал и разработки. Труд команды ЦРТ оказался востребован на международном уровне — характеристики продуктов не уступали, а даже превосходили возможности зарубежных аналогов.
Сегодняшний ЦРТ — это компания с более чем 20-летней историей и ведущий разработчик систем высококачественной записи, обработки и анализа аудио-видео информации, синтеза и распознавания речи. Продукты компании работают на основе ИТ-инфраструктуры «ИТ-ГРАДа», что дает возможность быстро развивать новые продукты и задействовать пул вычислительных ресурсов с высокой доступностью.
Поскольку ЦРТ регулярно проводит высоконагрузочное тестирование продуктов, а также реализует внешние проекты, выбор в пользу облака является совершенно оправданным.
— команда ЦРТ
Теперь посмотрим на сами проекты.
VoiceFabric
Это сервис, позволяющий озвучивать синтезированным голосом любую текстовую информацию. Он работает на основе возможностей облака и даже обладает собственным API.
Сейчас данный интернет-сервис умеет работать с такими сложными конструкциями как омографы. Он понимает тембр и тон с помощью SSML-тегов и распознавать эмоциональные реакции.
Голоса, озвучивающие текст понимают даже обозначения ":)" и ":(" — они смеются и вздыхают. Реализована поддержка нескольких языков. В их число входит, например казахский.
VoiceNavigator
Проект VoiceNavigator — ПО для IVR-систем контактных центров. Умеет распознавать и синтезировать русскую речь (переводит речь в текст и обратно).
Если говорить простыми словами, то вместо набора нужной цифры на клавиатуре («чтобы узнать о наших услугах, нажмите 1») можно управлять контекстным меню голосовыми командами. Алгоритм распознавания считывает тематику запроса и синтезирует ответ. Технология хорошо подходит и для систем массового обслуживания.
Виртуальный консультант «Мегафона»
В рамках сотрудничества с Мегафоном компания ЦРТ предложила решение для службы клиентского сервиса — виртуального консультанта. «Елена» (так решили назвать сервис) может обработать более миллиона запросов в год и экономить клиентам компании тысячи часов, которые те могли бы провести в ожидании ответа живого человека.
В данный момент «Елена» — пробный проект, в основе которого лежат технологии ЦРТ.
Существенная часть обращений в контакт-центр носит типовой характер и может быть автоматизирована с помощью современных речевых технологий.
Работая в тесном сотрудничестве с «МегаФоном», ЦРТ создал не просто справочник с голосовым управлением, а настоящую «персону», общение с которой максимально приближено к естественному.
— команда ЦРТ