Pull to refresh
0
Content AI
Решения для интеллектуальной обработки информации

Олимпиада-2014: как помочь иностранцу справиться с русским языком

Reading time6 min
Views8.4K

17 сентября в Сочи мы совместно с компанией «МегаФон» представили программу лингвистического обеспечения будущей Олимпиады. Конечная цель этой программы – сделать так, чтобы иностранным гостям Олимпиады-2014 было комфортно в городе и чтобы они свободно могли объясняться в любых ситуациях, вне зависимости от того, какой язык для них родной. До недавнего времени такой проект мог показаться абсолютно невыполнимым – ведь к каждому из сотен тысяч иностранцев не приставишь персонального переводчика. Но сегодня эта задача, которая раньше не могла быть решена даже при огромных материальных вложениях, может быть успешно решена с помощью современных технологий. Под катом мы расскажем о том, что мы придумали для Олимпиады, с техническими подробностями для любителей.

Итак, основная задача – обеспечить комфортные коммуникации иностранных гостей на Олимпиаде. Традиционные способы:

— перевести в городе все вывески, указатели и меню,
— выпустить локализованные карты и путеводители,
— собрать всю потенциально полезную справочную информацию (расписания, транспортные маршруты, адреса и телефоны заведений, учреждений и служб) в единую базу данных и перевести ее на основные языки,
— организовать работу переводчиков в сервис-центрах и на основных мероприятиях.

Всё это будет и в Сочи.



Однако, очевидно, что полностью ликвидировать языковые барьеры эти меры не позволяют. Иностранцу на Олимпиаде придется общаться с людьми, например, с таксистом, врачом, полицейским, просто с человеком на улице. Наконец, во многих ситуациях, когда нужно оперативно получить информацию, удобнее позвонить в справочную и спросить, чем искать ее в картах или путеводителях.

Чтобы помочь гостям Олимпиады в таких ситуациях, мы совместно с «МегаФон» запускаем многоязычный информационно-справочный call-центр, который будет поддерживать 8-10 языков (английский, немецкий, французский, итальянский, испанский, китайский, корейский, японский, арабский, русский). С его помощью иностранные гости смогут на родном или понятном языке:

— получить любую справочную информацию о городских учреждениях, туристических и прочих объектах;
— заказать товары или услуги, например: забронировать номер в гостинице или билеты на самолет, вызвать такси, заказать доставку ужина или лекарства и т.д.;
— оперативно связаться со службой скорой помощи, полицией, МЧС и другими экстренными службами;
— легко сориентироваться в городе, получив нужную информацию о расписании или маршрутах общественного транспорта;
— и, конечно, позвонив в call-центр, иностранный турист сможет воспользоваться услугами переводчика в режиме онлайн в любых ситуациях, когда это нужно.

Для работы удаленных операторов-переводчиков при построении call-центра использована платформа IP телефонии ASTJ, это специализированная платформа компании ABBYY Language Services, созданная для предоставления услуги «переводчик по телефону» в режиме on-demand (об этом мы писали здесь). Платформа позволяет реализовать динамические IVR-приложения и гибкую маршрутизацию вызовов. Приложение для сервиса переводов идентифицирует абонента и на основании данных из его профиля и введенных им параметров конструирует сценарий обработки вызова и распределения на переводчика.

Платформа ASTJ обеспечивает возможность быстрого развертывания и масштабирования, в ней реализована возможность работы в режиме «мультисайт» – когда несколько телефонных серверов работают в интегрированной группе, разделяя общий пул агентов и очередей. Каждый из серверов, входящих в кластер, может быть виртуальным, и по факту мы используем именно такую конфигурацию, поскольку она более надежна и удобна в сопровождении. Сервера работают под управлением CentOS.

Точная нагрузка, которая придется на call-центр во время Олимпиады, неизвестна, а значит, надо будет обеспечить технологически и организационно возможность сильно нарастить число операторов и обрабатываемых вызовов. Архитектура call-центра позволяет варьировать ресурсы переводчиков несколько раз в течение двух недель. По различным оценкам, необходимое количество операторов со знанием иностранных языков (без разделения по языкам) варьируется от 30-50 (в ночное и обычное дневное время) до 1500-2000 (во время открытия и закрытия Игр).

Еще одна составляющая программы – мобильное приложение ABBYY iSochi для платформ iOS и Android, которое поможет гостям Сочи самостоятельно ориентироваться в городе. Приложение обеспечивает удобный доступ к call-центру и позволяет быстро подключить профессионального переводчика к любому разговору. Также ABBYY iSochi содержит полезную справочную информацию для успешного ориентирования в городе.

Одна из интересных функций приложения — автоматическое определение языка пользователя по языковым настройкам телефона (с возможностью изменить язык вручную). Во время каждого звонка программа автоматически отправляет эту информацию в call-центр, и пользователю отвечают на понятном для него языке. Приложение позволяет выбрать тип звонка (звонок в call-центр для получения справочной информации, экстренный вызов, вызов такси или перевод по телефону) и определяет координаты звонящего (если в смартфоне, на котором запущено приложение, есть GPS-приемник). В результате, пользователю из Японии достаточно просто нажать на кнопку «Taxi», и он сразу попадет на оператора call-центра, который говорит на японском, знает, что звонок совершен именно с целью заказать такси, и, кроме того, видит на карте местоположение звонящего.

Прямо из оболочки iSochi можно будет установить другие мобильные программы ABBYY, которые облегчают жизнь в чужой стране, – ABBYY Lingvo, ABBYY TextGrabber, ABBYY Business Card Reader.

Технические подробности для любителей


Приложение передает данные (язык, тип звонки, координаты и параметры авторизации) отправляя POST-запрос по протоколу HTTP на веб-сервер. Веб-сервер (Nginx + Perl (Mojolicious + Starman) + MySQL) обрабатывает полученные параметры, идентифицирует пользователя в системе, сохраняет данные в базе данных и отдает приложению ответ, после чего приложение инициирует звонок в call-центр. В проведенных испытаниях обработка запроса на стороне сервера занимала не более 30-40 мс. Помимо этого, есть еще несколько сценариев, в которых приложение обращается к веб-серверу (например, запрос баланса для обращения к платным услугам или изменение личных данных), ответы возвращаются в виде JSON-структур.

Веб-составляющая решения масштабируема за счет того, что Nginx-фронтэнд может быть сконфигурирован на распределение входящих запросов по произвольному количеству бэкэндов, каждый бэкэнд – это реальная или виртуальная машина под FreeBSD, на которой запущены prefork демоны (в качестве загрузчика используется Starman, фрэймворк – Mojolicious) с постоянно открытыми соединениями с базой данных (используется DBIx::Connector). Можно запускать до (N — 1) демона на сервер, где N – количество доступных физических и логических ядер. Количество виртуалок может наращиваться достаточно быстро.

Call-центр, получив входящий звонок, запрашивает наличие в базе данных информации по данному абоненту. Если он находит информацию, полученную из приложения, то дальше звонок обрабатывается исходя из этих параметров, – система подбирает наиболее подходящего оператора/переводчика и устанавливает соединение. Звонки с типом «экстренный вызов» при этом получают приоритет.

В перспективе планируется использовать бинарную репликацию для поддержания нужного количества реплик БД, содержащих относительно медленно изменяющуюся информацию, с тем, чтобы кластера серверов call-центра обращались к «своим» репликам, снимая подавляющую часть нагрузки с мастер-базы.

В схеме с несколькими кластерами входящий вызов по SIP-протоколу распределяется на один из кластеров (пока что просто равномерно), количество кластеров может быть достаточно произвольным при условии обеспечения их достаточным количеством реплик БД.

На обработку информации затрачивается 30-40 миллисекунд на стороне веб-сервера плюс до 100 миллисекунд на прохождение пакетов и единицы миллисекунд на стороне call-центра. Это позволяет использовать такую схему в телефонии, работающей в режиме реального времени.
Все основные составляющие программы лингвистического обеспечения Олимпиады в Сочи – многоязычная справочная база данных, call-центр и приложение iSochi – тесно интегрированы. В итоге, к Олимпиаде мы запустим уникальный сервис, не имевший пока аналогов в мире. Мы надеемся, что этот сервис сделает Сочи по-настоящему комфортным для пребывания иностранных гостей.

Ну и в заключение скажем, что весь этот проект не требует дополнительного финансирования со стороны государства, поскольку все инновационные решения реализуются за счет партнеров (ABBYY и «МегаФон»).


Мэр Сочи Анатолий Пахомов и заместитель председателя Правительства РФ Дмитрий Козак на презентации, посвященной программе лингвистического обеспечения Олимпиады

Егор Заикин,

ABBYY Language Services
Tags:
Hubs:
+25
Comments6

Articles

Change theme settings

Information

Website
www.contentai.ru
Registered
Founded
Employees
101–200 employees
Location
Россия