107,23
Рейтинг
ABBYY
Решения для интеллектуальной обработки информации

Ответы генерального директора ABBYY Сергея Андреева на вопросы читателей Хабра. Часть 1

Блог компании ABBYY
image
Уважаемые читатели и писатели Хабра!

Хочу сказать спасибо всем участникам этого обсуждения за их искреннее желание сделать нашу страну лучше. Это видно во всех вопросах, заданных здесь, даже если они порой звучат жёстко и предубеждённо. Я посчитал важным ответить на вопросы, потому что ABBYY слишком давно не рассказывала о том, чем мы занимаемся, и как мы это делаем. А отсутствие информации порождает много нелепых догадок. Итак, время отвечать на вопросы.

В этих ответах я буду иногда отвлекаться к общим суждениям и общей информации, но не для того, чтобы что-то рекламировать, а чтобы лучше объяснить причины, лежащие в основе наших действий.

Начну с того, что компании ABBYY уже 21 год. Все это время мы делаем интересные продукты и технологии, известные во всём мире. Сейчас это продукты распознавания печатного и рукописного текста и словари. В будущем – это продукты, основанные на компьютерной лингвистике. Наши интересы не лежат в области потребления. Наши руководители и акционеры не ездят на роскошных автомобилях, не покупают яхт, вертолетов и дворцов, у нас нет дач на Рублевке. Нам интересно делать новые удивительные продукты, а не ходить по магазинам.

Более 70% наших доходов зарабатывается не в России. По разным оценкам, от 30% до 50% сканеров и МФУ всего мира комплектуется российским программным продуктом ABBYY FineReader. Мы довольно хорошо диверсифицированы по источникам доходов. У нас нет зависимости от российского рынка и, тем более, от его госсектора.

Мы занимаемся только тем, что нам интересно. Только тем, на что мы готовы тратить время своей жизни. Нам не интересны распилы, политика, коррупционные схемы и прочая мутная деятельность.

Мы живем в России, работаем в России, платим все налоги. Как-то даже получили грамоту от налоговой инспекции, как лучший налогоплательщик района :) (не знаю радоваться этому или тревожиться). Наши дети здесь учатся, и никто не собирается никуда уезжать. Всё, что у нас есть, находится здесь! Нам не всё равно, что будет с Россией. И мы готовы участвовать в полезных для страны делах. Мы тратим свое время и средства на развитие образования и на другие полезные инициативы, которые развивают отрасль ИТ в России.

Может все это и покажется кому-то слишком возвышенным, но у нас тут и правда заповедник хороших людей с хорошими и общими интересами.

Теперь давайте переключимся на вопросы по существу. Вопросов было много, много и ответов, поэтому сегодня здесь появятся пока только первый блок. В нём я отвечу на вопросы о технологии ABBYY Compreno, под которую ABBYY получила грант. Следующие блоки будут опубликованы в начале следующей недели.

"… Деньги выделяются для создания технологии автоматической обработки текстов Compreno… Технология Compreno предназначена для создания систем анализа, перевода и поиска текстов на различных языках. С помощью данной технологии можно будет, например, осуществлять автоматическое составление базы данных контекста для улучшенного анализа текстов, автореферирование текстов и др..."

Хотелось бы услышать больше конретики, с объяснениями на примерах. Я догадываюсь, что технология Compreno может использоваться при компьютерном переводе текстов, например для правильного определения структуры предложения на исходном языке – то есть для определения связей и отношений между словами в предложении на исходном языке. Таким образом, генерация предложения на конечный язык будет проводиться с учетом всей структуры исходного предложения. Насколько я вижу, в современных автопереводчиках такой анализ находится в зачаточном состоянии, примерно на уровне определения существительного (местоимения) и глагола к нему. Поэтому предложения современных переводчиков достаточно корявые.

Насколько повысится качество перевода? Не получится ли так, что предложения будут генерироваться лингвистически связанными, со словами с правильными окончаниями, то есть на уровне структуры – никаких претензий не будет. Но на уровне смысла автопереводчик как генерировал белиберду, так и будет продолжать генерировать псевдоосмысленный текст?


Отвечая на первые два вопроса, я хотел бы рассказать поподробнее про технологию ABBYY Compreno.

Хотя мы очень внимательно следим за разработками в этой области в мире, нам не известны аналоги созданной нами лингвистической технологии нового поколения ABBYY Compreno.

Центральным ядром создаваемой технологии служит универсальная иерархия понятий и модель отношений между этими понятиями (для специалистов: иерархия универсальных семантических значений и отношений между ними). Хотя все люди на земле говорят разными словами, но используют они очень похожую систему понятий. Люди в разных странах ходят на работу, сидят дома, работают на компьютерах, составляют договоры, летают на самолётах, ведут переговоры. Для них строятся похожие бизнес-центры. Они находятся в похожих помещениях и пользуются похожей мебелью. Все эти понятия и их взаимоотношения в разных развитых цивилизациях имеют гораздо больше общего, чем различного. В дальнейшем это семантическое дерево понятий я буду назвать английской аббревиатурой USH (Universal Sematic Hierarchy).

USH – это дерево понятий, универсальное для всех языков, толстые ветви которого являются более общими и универсальными понятиями (например, «путешествие»), а тонкие – более специфическими, но тоже универсальными понятиями (например, «командировка»). Древесная структура позволяет обеспечить наследование свойств от предков к потомкам, благодаря которому описание новых понятий происходит быстрее, так как, чтобы описать понятие «приказ», уже не надо перечислять все характеристики понятия «документ». Слова конкретного языка являются листочками на дереве USH. Мы получаем возможность снимать неоднозначности. Например, в русском языке разные значения слова «управление» соответствуют понятиям на разных ветвях этого дерева, поскольку есть значение «управление» как департамент, а есть значение «управление» как действие.

Семантическое описание какого-либо конкретного языка превращается в прикрепление «листочков» – слов этого языка – к веткам USH.

Второй, но не менее важной частью технологии является полный синтаксический разбор текста. Синтаксис – это способ «кодирования» смысла (для специалистов: семантических отношений) в конкретном языке. Сами семантические отношения универсальны, а способы их реализации в каждом языке – свои. В каких-то языках установлен линейный порядок, в других используются падежи, предлоги, специальные служебные слова, где-то используется всё сразу. Для каждого языка синтаксическое описание делается заново, но сами средства, которые разные языки используют для кодирования смысла, перечислимы. При описывании нового языка используется разные элементы конструктора (тот же линейный порядок, различные типы синтаксических преобразований, грамматические значения, предлоги, специальные конструкции).

Технология Compreno также успешно определяет и более сложные синтаксические связи, такие как замена слова «мальчик» на слово «он» в предложении (для специалистов: анафора): «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени». Или целые пропуски в сложносочиненных предложениях (для специалистов: эллипсис), например «он любит красное вино, а она – белое». Выделяемые системой связи между понятиями также выражаются в древесной структуре, фактически передают смысл написанного, и несут важную информацию для поиска или перевода. Таким образом, система стремится к определению смысла текста, написанного на обычном языке, позволяя машине «понять» этот текст и трансформировать его в универсальное представление, не зависящее от языка.

Используя USH, синтаксическое описание языка, а также статистику взаимоотношений между словами, технология Compreno производит полный анализ текста и при переводе его на другой язык использует слова, соответствующие правильным ветвям дерева USH и отношениям, выявленным при разборе исходного предложения.

Как вы понимаете, если для перевода нам удалось приблизить компьютер к пониманию смысла текста, то это понимание можно использовать не только для задач перевода, но и для многих других чрезвычайно востребованных приложений. Получение универсального представления (смысла) дает возможность подойти вплотную к более качественному распознаванию речи, умному поиску информации, когда в качестве запроса используется естественный язык, а в качестве ответа можно получить документ, совсем не обязательно содержащий слова запроса, но зато содержащий их аналоги и правильные отношения между понятиями. Можно определять авторство документа, можно сделать реферат (выжимку из большого документа). Можно ещё много чего сделать, когда у тебя есть универсальная базовая лингвистическая технология ABBYY Compreno.

Какие проблемы решает продукт, на который выделены деньги в Сколково? Каковы области его применения? Какие новые возможности он предоставит обычным людям?

Перечислите конкретно, в каких типах программ вы сейчас видите необходимым использовать Compreno, если бы вдруг сейчас она уже была бы полностью готова?


Опять отвечу разом на два вопроса.

Технология Compreno – это универсальная лингвистическая платформа для приложений, решающих множество прикладных задач по обработке текстов на естественном языке, таких как:
  1. Письменный и устный перевод с одного языка на другой;
  2. Интеллектуальный поиск, в частности:
    • Поиск по смыслу, а не по ключевым словам;
    • Извлечение фактов и связей между объектами поиска (в т.ч. для конкурентной разведки);
    • Мониторинг компаний и персоналий и построение аналитических отчетов на основе параметров разного типа. Например, при подготовке отчета на тему «Какой тариф сотовых операторов является самым популярным?» важно не только верно идентифицировать все тарифы, обсуждаемые в СМИ, но и сравнить частотность.
    • Возможность получить ответы на запросы, заданные обычным языком (например, «Чем владеет Иван Иванович Бобров?»).
  3. Многоязычный поиск, т.е. когда на вопрос на одном языке находятся ответы на всех языках, поддерживаемых системой;
  4. Классификация и фильтрация документов;
  5. Защита от несанкционированного использования информации;
  6. Автоматическое реферирование и аннотирование документов;
  7. Распознавание речи;

В мире сейчас не существует настолько универсальной технологии, позволяющей решить так много прикладных задач, требующих качественного лингвистического анализа текстов. И речь идет не только о традиционных задачах, таких как перевод, но и задачах, решение которых на качественно новом уровне было невозможно в прошлом (например, автоматический поиск фактов и связей в массивах информации).

Революционность ABBYY Compreno состоит в фундаментальности подхода. Над универсальной системой понятий и технологиями полного синтаксического и семантического анализа задумывались многие. В своей работе мы опираемся на труды ведущих российских учёных в этой области и классическое лингвистическое образование. Однако многие специалисты отступали перед колоссальной инженерной и лингвистической сложностью реализации этой идеи для реальных практических задач. Передовое российское лингвистическое образование и наука дали нам очень хороший фундамент для начала и развития этой большой работы.

На что пойдут деньги? Какие ожидаются результаты? Будет ли результат новым продуктом, или он разойдется по старым?

Проект разрабатывается уже около 10 лет. О каких-либо публичных результатах я не знаю. Не превратился ли он в долгострой с неясными перспективами? Каковы гарантии, что этот грант будет последним необходимым для выхода продукта?

На какое время рассчитан проект, который будет реализовываться в Сколково?


Отвечаю на три вопроса.

В психологии известно, что ребёнка от взрослого отличает неспособность контролировать свои импульсы – и это одна из причин, почему он никогда не сможет заменить взрослого во многих видах взрослой деятельности. Так же и зрелую компанию, построенную надолго, от фирмы-однодневки отличает способность вкладываться в проекты, которые принесут плоды через годы. Читайте подробнее здесь.

Добавлю, что мы уже давно решили, что заниматься нужно только тем, в чём ты уверен, что можешь добиться самых лучших результатов в мире. Если же у тебя нет разумных оснований полагать, что ты станешь в своем деле самым лучшим в мире, то это плохой бизнес, потому что он будет сведен в итоге к ценовой конкуренции. Уникальные вещи быстро не делаются, иначе их было бы легко повторить.

Ну а теперь по сути того, чем мы занимаемся.

Работа над созданием технологии Compreno ведется уже 15 лет (на людей, которые занимаются этим и другими нашими проектами вы можете посмотреть здесь). Дело в том, что этот проект требует серьезного научного фундамента, без которого невозможно создать работающую технологию действительно высокого качества. Фундаментальная наука, как известно, требует денег и времени. 15 лет назад началось продумывание основных концепций новой технологии. Примерно 10 лет назад – работы по построению архитектуры, около 6 лет назад – серьезные работы по программированию базовых модулей, а около 2 лет назад были пройдены самые серьезные технологические риски. Проект вошел в ту фазу, которая позволяет нам с высокой степенью уверенности говорить о достижимости поставленных целей.

Результат, к которому мы стремимся, я описал в одном из предыдущих ответов.

Мы ожидаем, что коммерческие продукты для широкого применения на базе платформы Compreno появятся в течение 2-3-х лет. Но уже сегодня мы демонстрируем технологию Compreno крупным заказчикам, Специалисты, которые видят, как работает технология уже сегодня, обсуждают с нами пилотные проекты. Кроме того, мы готовим еще один наш продукт – библиотеку функций, доступную для других разработчиков приложений. То есть любой разработчик сможет лицензировать ядро системы и встроить эти функции в свои программные продукты.

В конце, чтобы снять сомнения в перспективности «долгостроя», хочу добавить, что все эти годы акционеры компании (примерно совпадающие с ее менеджментом) вместо обогащения и покупок яхт, вилл и прочего хлама вкладывают прибыль компании в совершенно новое прорывное направление. Мы смогли построить качественный наукоемкий международный бизнес, и считаем себя компетентными в том, чем мы занимаемся. Кому как не нам лучше знать, куда вкладывать свои деньги? Разве кто-то кроме нас может более надежно оценить правильность этого вложения? Если кто-то считает, что мы ошибаемся, и знает, как можно применить наши деньги лучше, – то могу поздравить нас всех с появлением новых бизнесменов, которые прославят нашу родину своими делами. Дорогу молодым! Ждем постов о ваших успехах!

Хотелось бы больше узнать о системе распознавания, а именно. Будет ли она «языконезависимой» или будет в том числе опираться на морфологию каждого языка, как и нынешняя система в FineReader'е? Во втором случае, планируется ли использовать открытый формат или технологию позволяющую добавлять правила морфологии для новых языков самим пользователям? Скажем по примеру hunspell/aspell словарей в браузерах.

Я надеюсь, что предыдущие ответы прояснили эту тему. Если нет, уточните, пожалуйста.

Какой профит государству и гражданам от этой технологии? Мне интересно ее применение в чем-то кроме ваших продуктов.

Немногие знают, что продажа библиотек функций ABBYY FineReader для разработчиков приносит нам больше доходов, чем продажа коробок ABBYY FineReader. Мы также планируем сделать технологию ABBYY Compreno доступной для других разработчиков, чтоб ее можно было включать в другие продукты, требующие качественной обработки текста на естественном языке. Это подстегнёт развитие самых разных российских бизнесов, использующих Compreno для создания программ или оказания услуг. Мы полагаем, что часть этих высокотехнологичных продуктов или услуг будет продаваться за рубеж, что в текущей ситуации преимущественно нефтегазового российского экспорта не может не радовать.

Кроме того, не надо забывать, что создание такой технологии здесь, в России, повышает общий уровень квалификации в данной области в стране. Потому что люди, которые так хорошо понимают в прикладной лингвистике, живут, работают, платят налоги и тратят свои деньги в России, а не в Калифорнии, Мюнхене, Калькутте или Гуаньджоу. Конференции, лекции и семинары, которые проводит ABBYY на тему искусственного интеллекта и прикладной лингвистики, проводятся в России. ABBYY поддерживает образование в этой области в наших вузах, а не в MIT или Пекинском университете. И вообще, шанс получить мировое лидерство в этой локальной области знаний есть именно у России, а не у Америки, Израиля или Индии.

Немедленный ПРОФИТ со всего этого государству и гражданам посчитать сложновато, но вот ПОЛЬЗА очень большая, особенно если смотреть на долгий временной горизонт.

Какие технологии искусственного интеллекта используются в работе?

Для построения языконезависимой семантической структуры используются технологии синтаксического и семантического анализа. Для разрешения омонимии используются технологии классификации и машинного обучения.

Сколько будут стоить ваши новые технологии?

Постараемся сделать так, чтобы от их применения выиграли все. Чтобы переводчики могли больше зарабатывать, повысив производительность труда, чтобы заказчик мог перевести больше, а заплатить меньше. Иначе не получается делать бизнес в современном мире. Ты будешь успешен, только если все твои партнеры и клиенты будут успешны. Наверняка что-то будет доступно бесплатно в интернете.

Можно ли (и будете ли?) использовать технологию Compreno для улучшения качества распознавания текстов? Имеется в виду, поможет ли Compreno принимать решение в спорных случаях при дефектах на распознаваемой картинке? Может ли Compreno работать с неполным набором данных и помогать делать предположения о том, что должно находиться на плохо читаемом месте?

Видимо какие-то элементы технологии Compreno будут использованы в системе распознавания FineReader в будущем.

Как может ваша система помочь мне, простому строителю?

Отличный вопрос! Вы сможете сфотографировать на свой мобильный телефон мешок с сухим китайским клеем или банку с немецкой краской, нажать на кнопку «Перевод», программа распознает и переведёт китайскую и немецкую инструкции на русский язык, что поможет Вам правильно развести клей или смешать краски. Вы сделаете Вашу работу качественно, и она принесет радость тем людям, которые будeт жить в построенном Вами доме. Это мы и называем «помогать людям лучше понимать друг друга». Мы создаем технологии искусственного интеллекта, которые повышают качество жизни. В этом смысле мы с Вами коллеги. Вы также создаете то, что повышает качество жизни.

Продолжение — на следующей неделе.
Часть 2. Грант
Часть 3. Сколково, Linux и остальные вопросы
Теги:ABBYYcomprenoтехнологииискусственный интеллекткомпьютерная лингвистика
Хабы: Блог компании ABBYY
+91
36,4k 37
Комментарии 171

Похожие публикации

Лучшие публикации за сутки