luciana 5 июл 2016 в 23:42

Как мы помогли крупному бразильскому банку справиться с последствиями деноминации

5 мин

16K

Блог компании Content AIОбработка изображений*

+53

Комментарии 19

EndUser 6 июл 2016 в 00:22

Рассказ впечатляет.
Поздравляю с подвигом! Желаю и дальше уверенным шагом доказывать конкурентам, что вы круче. :-)

luciana 6 июл 2016 в 09:22

Спасибо на добром слове ) Ну, мы больше для пользователей стараемся, чем для конкурентов, если честно :)

Alexsandr_SE 6 июл 2016 в 11:54

Неплохие, но конкуренты тоже не дремлют. Акробат иной раз куда лучше распознает и точнее форматирование сохраняет, а еще он умеет добывать буквы из самого пдф (если они там есть), а файнридер только распознавать насколько я в курсе. Ну и по мелочам с опциями сканирования. нельзя сохранит в пдф не распознав текст… Еще есть куда расти ABBYY.

-3

aram_pakhchanian 18 июл 2016 в 23:38

а файнридер только распознавать насколько я в курсе

Вы неправильно в курсе. FineReader проверяет текст внутри PDF на разумность (часто там путанница с кодировкой или текст подложен под изображение каким-то левым OCR), и если все хорошо, то используется готовый текст.

нельзя сохранит в пдф не распознав текст

См. тут

Alexsandr_SE 20 июл 2016 в 21:32

Не знаю насчет того как будет работать, но думаю модуль обычного сохранения пдф один и тот же. Без распознавания к примеру режет текст, если страница была перевернута в ручную, еще там есть проблема. В общем лучше распознавать.

aram_pakhchanian 21 июл 2016 в 04:19

Наверное, вам нужен ABBYY Pdf Transformer +

AVX 6 июл 2016 в 07:49

А вот этот текст напечатан на старом принтере – в буквах видны отдельные точки и расстояния между ними

— и что ни говори, такой текст читается (человеком) значительно легче всех других. При этом и печатать можно на любой бумаге (или даже не бумаге) и расход ленты небольшой.

LoadRunner 6 июл 2016 в 09:38

У Человека алгоритмы распознавания символов намного лучше.

AVX 6 июл 2016 в 11:29

Я видимо не совсем правильно выразился. Имелась ввиду читабельность текста на «старом» матричнике и «новом» в приведённых примерах, а не в сравнении человек-машина. Это и так понятно, что человек может много чего распознать лучше. Или я где-то не прав?

ExplodeMan 6 июл 2016 в 11:44

Человек может распознать даже рецепт, выписанный от руки врачом! Если, конечно, распознавать будет другой врач.

LoadRunner 6 июл 2016 в 11:53

А тут в дело и вступают алгоритмы Человека. Они реально очень продвинутые, поэтому точки заливаются до целого символа быстро и без ошибок. Тем более, что мы смотрим на текст удалённо, а на таком расстоянии точки и сами сливаться могут. Ну и не стоит забывать, что техника была сделана человеком для человека. Никто не стал бы делать принтеры, которые печатают текст для человека, человеку непонятный.
Про удобство можно поспорить — люди разные и у каждого свои предпочтения. Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта.

AVX 6 июл 2016 в 13:02

Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта

Эта версия мне нравится. Хотя это всё наверное и правда субъективно, и кому-то удобнее читать какой-нибудь condensed шрифт (сжатый), а иные и вовсе капсом пишут и думают, что так и надо.

cb_ein 6 июл 2016 в 11:54

Деньги-то всем вернули?

luciana 6 июл 2016 в 14:12

Я думаю, да — раз уж озаботились, чтобы информация о счетах была доступна

Kate_Hamster 6 июл 2016 в 11:54

Спасибо за такое подробное объяснения методов распознования. Жаль только, что они настолько эффективно работаю только в больших и серьезных проектах. В переводческом софте распознавание текста с изображения все еще остается большой проблемой

luciana 6 июл 2016 в 14:14

Распознавание должно хорошо работать не только в больших проектах. У вас в каком продукте плохо работает?

zemavo 6 июл 2016 в 12:10

У меня возник вопрос другого плана — много ли предприимчивый бразильский гражданин на своем обращении?

neko 6 июл 2016 в 13:45

С уважением к бразильцу: скорее всего его зовут João Rotta, что на русский обычно транслитеруется как Жоао (с вариациями вроде Жоау… но никак не Джао).

ContentAI_Team 6 июл 2016 в 14:08

Давайте я русский вариант, действительно, уберу

Зарегистрируйтесь на Хабре, чтобы оставить комментарий