Как стать автором
Обновить

Комментарии 19

Рассказ впечатляет.
Поздравляю с подвигом! Желаю и дальше уверенным шагом доказывать конкурентам, что вы круче. :-)
Спасибо на добром слове ) Ну, мы больше для пользователей стараемся, чем для конкурентов, если честно :)
Неплохие, но конкуренты тоже не дремлют. Акробат иной раз куда лучше распознает и точнее форматирование сохраняет, а еще он умеет добывать буквы из самого пдф (если они там есть), а файнридер только распознавать насколько я в курсе. Ну и по мелочам с опциями сканирования. нельзя сохранит в пдф не распознав текст… Еще есть куда расти ABBYY.
а файнридер только распознавать насколько я в курсе


Вы неправильно в курсе. FineReader проверяет текст внутри PDF на разумность (часто там путанница с кодировкой или текст подложен под изображение каким-то левым OCR), и если все хорошо, то используется готовый текст.

нельзя сохранит в пдф не распознав текст


См. тут
Не знаю насчет того как будет работать, но думаю модуль обычного сохранения пдф один и тот же. Без распознавания к примеру режет текст, если страница была перевернута в ручную, еще там есть проблема. В общем лучше распознавать.
А вот этот текст напечатан на старом принтере – в буквах видны отдельные точки и расстояния между ними

— и что ни говори, такой текст читается (человеком) значительно легче всех других. При этом и печатать можно на любой бумаге (или даже не бумаге) и расход ленты небольшой.
У Человека алгоритмы распознавания символов намного лучше.
Я видимо не совсем правильно выразился. Имелась ввиду читабельность текста на «старом» матричнике и «новом» в приведённых примерах, а не в сравнении человек-машина. Это и так понятно, что человек может много чего распознать лучше. Или я где-то не прав?
Человек может распознать даже рецепт, выписанный от руки врачом! Если, конечно, распознавать будет другой врач.
А тут в дело и вступают алгоритмы Человека. Они реально очень продвинутые, поэтому точки заливаются до целого символа быстро и без ошибок. Тем более, что мы смотрим на текст удалённо, а на таком расстоянии точки и сами сливаться могут. Ну и не стоит забывать, что техника была сделана человеком для человека. Никто не стал бы делать принтеры, которые печатают текст для человека, человеку непонятный.
Про удобство можно поспорить — люди разные и у каждого свои предпочтения. Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта.
Выскажу предположение, что между символами и фоном меньше контрастности и это меньше «бьёт» по глазам, из-за чего и возникает чувство комфорта

Эта версия мне нравится. Хотя это всё наверное и правда субъективно, и кому-то удобнее читать какой-нибудь condensed шрифт (сжатый), а иные и вовсе капсом пишут и думают, что так и надо.
Деньги-то всем вернули?
Я думаю, да — раз уж озаботились, чтобы информация о счетах была доступна
Спасибо за такое подробное объяснения методов распознования. Жаль только, что они настолько эффективно работаю только в больших и серьезных проектах. В переводческом софте распознавание текста с изображения все еще остается большой проблемой
Распознавание должно хорошо работать не только в больших проектах. У вас в каком продукте плохо работает?
У меня возник вопрос другого плана — много ли предприимчивый бразильский гражданин на своем обращении?
С уважением к бразильцу: скорее всего его зовут João Rotta, что на русский обычно транслитеруется как Жоао (с вариациями вроде Жоау… но никак не Джао).
Давайте я русский вариант, действительно, уберу
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.