Открыть список
Как стать автором
Обновить

Давид Ян (ABBYY) о том, как был создан FineReader

Чулан
Был недавно на встрече некого клуба, где выступал Давид Ян (основатель компании ABBYY). Часть выступления записал на телефон. Расшифровку записи представляю Вашему вниманию.

--------------------------------
Если компания выходит на рынок и на этом рынке уже есть что-то похожее, то, об этом можно прочитать во многих книжках, в частности по ведению военных стратегий. Идея основная заключается в следующем: Чтобы не сталкиваться с сильным конкурентом что называется «на его поле». То есть необходимо находить своё поле боя, там где конкурент абсолютно беззащитен и никогда не собирался даже выставлять силы.

Приведу пример: в своё время мы выходили с продуктом под названием Fine Reader. В 92 году ко мне подошел Костя Анисимович, наш technology officer, и сказал «давай сделаем нашу собственную систему распознавания». Это выглядело абсолютно как безумие, потому что мы сами продавали другую систему распознавания под названием «Authors», были её дилерами.
Продавая эту систему, мы сталкивались с жесточайшей конкуренцией на российском рынке, там были программы под названием Тайгер, Униформ, Интуиция, ещё какие-то программы российского производства. Были программы западного производства (перечисляет), могу назвать десяток сильных систем западных, которые тогда существовали и были лидерами на международном рынке. И слова «давай сделаем свою» выглядели как безумие, потому что это означало: давай проинвестируем супер большие деньги, много ресурсов, талантливых лучших наших голов с абсолютно неизвестным результатом.

Вопрос, а чем мы будем лучше?, что мы можем сделать того, чего они не сделали до сих пор? Потому что мы уступаем, у них есть фора несколько лет разработок, помноженная на десятки людей в команде разработчиков, то есть несколько десятков человеколет форы у них есть. И конечно же очень страшно вступать в такую борьбу.

Но так как мы вышли родом из физтеха и нам всегда казалось море по колено, мы как-то так почесали голову и сказали «А, сделаем».

Мы на самом деле начали действовать следующим образом. Мы параллельно посадили две команды. Одна команда разрабатывала Finereader 1.0, другая команда разрабатывала Finereader 2.0. Абсолютно две разные команды. Первой команде была задача сделать быстро систему распознавания, и выйти, это был очень важный момент, то что называется time to market, то есть надо было выйти на данные позиции быстро. Какие позиции?
Мы обнаружили, что, тут далеко не надо было ходить, основным параметром, по которому оценивались системы распознания, это была точность распознавания. То есть сколько программа допускает ошибок при вводе текста. И на этом самом главном параметре мы должны был проиграть, потому что это действительно требует человеколет на технологии искусственного интеллекта связанные с распознаванием различных форм букв, дефектами печати, замятия бумаги, плохая ксерокопия и всё такое. Мы скорее всего должны были проиграть на самом главном параметре, как же нам воевать?

Мы выяснили, что на самом деле люди в России сканируют тексты технического плана, экономического плана, двуязычные тексты. То есть на ряду с русским основным текстом обязательно встречаются латинские термины, бренды и тд. И существующие системы, да они тогда были лидерами по точности распознавания одноязычного текста, в результате все слова иностранного языка они заменяли, грубо говоря, звездочками, их надо было перебивать заново. Мы решили сделать интеллектуальную двуязычную систему, которая будет автоматически отличать русскую букву у от латинской буквы u по контексту, или русскую букву р от латинской буквы p которую визуально отличить невозможно, только можно отличить по контексту.

Мы сделаем интеллектуальную систему, которая будет распознавать двуязычные тексты. Да, она будет допускать больше ошибок, и она допускала в начале больше ошибок, но интегрально, когда вводился двуязычный текст, он на самом деле содержал меньше ошибок в этом понимании, меньше звездочек и это очень сильно оказалось востребованным на рынке. Вторая вещь, которую мы сразу же заложили в систему это так называемая унишрифтовость, то есть её не надо было обучать. Тогда старые системы распознавания надо было обучать шрифту, прежде чем приступать к распознаванию. Там ещё некоторые элементы, она была первая на Виндовс.

Выходить с этим предложением ни через год, а через два года было абсолютно рискованным, потому что наши конкуренты дышали в затылок, и они должны были выпустить такую же двуязычную, такую же под Виндовс, такую же унифонтовую систему там через два года. Мы могли только выйти на через год. Мы нашли методы, вместе скооперировались с группой разработчиков. И сделали буквально через 10 месяцев. Это было трудно в это поверить, но через десять месяцев, в августе 1993 мы продали первые 40 экземпляров Finereader 1.0 который обладал этими функциями.

Таким образом, заняв позицию на рынке как первую на рынке под Виндовс, интеллектуальную, без настройки на шрифт и двуязычную.
И началась ожесточенная борьба, тесты в прессе. Конкуренты были абсолютно ошеломлены тем, что мы вышли из-за угла. Казалось бы у нас меньше опыт разработки и так далее, но мы нашли ту поляну, ту нишу рыночную, где они оказались совершенно не подготовленными. Они совершенствовали все эти годы свою точность распознавания на одном языке. И пока мы боролись с ними в прессе, пока пресса то сравнивала одноязычные тексты мы проигрывали, то она сравнивала реальные двуязычные тексты мы выигрывали, пока всё там баталии происходили, другая группа занималась Finereader 2.0

И через три года мы наконец то выпустили абсолютно на новых технологиях Finereader 3.0 которая обладала всеми преимуществами Finereader 1.0, но при этом она уже была очень сильно конкурентоспособна по своему главному параметру, точность распознавания одноязычного текста. И в этот момент мы вдруг обнаружили, что она лучше не только на русских текстах, но она лучше американских систем на английских текстах. Мы ещё через год начали её продавать за рубежом под другим названием. …

В какой-то момент мы начали побеждать по всем параметрам. Последний параметр, скорость распознавания, мы хромали по этому параметру ещё некоторое время. Потому что да, у нас было выше качество, но мы проигрывали по скорости. Но скорость пол минуты или одна минута распознавания, когда машинистка при этом тратит 15 минут на туже страницу, это было уже на самом деле не так значительно для пользователя. В результате мы вот так совершенно на краю пропасти, с большой группой разработчиков проехали эти несколько лет, пока не закрепились основательно и по всем параметрам. По точности распознавания, по количеству языков, по удобству интерфейса, по всем практически параметрам мы начали опережать. Ну, Российских наших коллег мы обогнали в конце 90-х, а в начале 2000-х мы занял прочную позицию на европейских рынках, американских. И результативно, сейчас по количеству лицензий, которые поставляются в мире, системы распознавания мы лидируем…

Вот такая история, как в тот момент удалось нам эту поляну найти.
--------------------------------

П.С. Продолжение последует, если это кому окажется интересным. Просто так расшифровывать не хочется, процесс достаточно трудоёмкий.
Теги:ABBYYстартапFineReaderДэвид ЯнДавид Ян
Хабы: Чулан
Всего голосов 27: ↑25 и ↓2 +23
Просмотры277

Похожие публикации

Backend Developer JS + Python (Django).
от 200 000 ₽Top-executiveМожно удаленно
C# Senior Developer
от 100 000 до 400 000 ₽Calibrate Trading TechnologiesМожно удаленно
React разработчик (fullstack) в EdTech
от 180 000 до 300 000 ₽GurucanМожно удаленно
Frontend developer React + Typescript (Remote)
от 130 000 ₽FlowquizМожно удаленно

Лучшие публикации за сутки