Как стать автором
Обновить
16
0
Василий Панфёров @vpanferov

Пользователь

Отправить сообщение
Спасибо. Это тот же cuni. Тестировать нечего.
На базе одной из самых развитых открытых технологий OCR создали целый дистрибутив по развертыванию сервера для OCR с веб-интерфейсом для общения с этим самым сервером.


Не подскажете ссылку? Интересно потестить. Может быть, развёрнутая онлайн-версия есть.
Тогда уж лучше вот эту штуку. Подешевле будет.
Он сам по себе умеет распознавать только строчки текста и не делает анализ структуры документа.
В cuni DA лажает не по-детски.
Я вот жду когда кто-нибудь соберёт и запустит ocropus+tesseract 3. На такую штуку было бы интересно посмотреть. А то самому собирать и продвигать конкурентов не хочется :-)
Да, google продолжает воевать за мировое господство. Создают свой вариант facebook, за это fb не пускают их себя индексировать, теперь google закрывает импорт контактов. Что дальше?
Да, именно так.
Ещё хороший тред на эту же тему на форуме файна:
finereader.abbyy.ru/forum/actualthread.aspx?bid=7&tid=206&pg=1
Да в общем вариант «отпроситься» никто не отменял. И трудовой кодекс у нас в стане неплохой. Если человек болеет, никто не может заставить его отработать это время.
Полная ерунда. Для сравнения можно хотя бы взять количество вопросов с тегами [c] [c++] [c#] [java] [javascript] на stackoverflow.com

Язык go в списке появился только потому, что google его запустила. На stackoverflow по [go] всего 200 вопросов против 116K у C#.
Вы не пробовали набирать пароль на машине, на которой кто-то поставил дворака? Не пробовали? Очень рекомендую. Вдохновляет.

Был у нас один товарищ, фанат ускорения скорости печати на 20%, везде менял раскладку. В какой-то момент без него пришлось попользоваться билдовой машиной, где под линуксом тоже оказался дворак. Удовольствие ещё то — когда тебе надо быстро достичь результата, а ты должен сражаться с клавиатурой.

Так что qwerty, и только она.
Интересно, куда ставят такие штуки? Собирают из них ещё больший датацентр? Посмотреть бы на картинки…
У нас стандартное ограничение на продукт — это количество обрабатываемых страниц/символов за период. Все счётчики хранятся на жёстком диске и как-то защищены. Если же процесс запускается на виртуальной машине, то мы не можем контролировать, сколько экземпляров виртуалок запущено.

Для выделенных серверов эта проблема решается так, что должен быть физический сервер с установленным процессом лицензирования, который занимается хранением и обработкой счётчиков. С облаком такое решение не работает — там все машины виртуальные, и для хранения счётчиков нужно писать особое решение.

Если сумма заказа крупная, то мы рассматриваем варианты без счётчиков — в этом случае объём обрабатываемых документов определяется в договорах, а клиент в облаке может запускать столько копий процесса, сколько ему надо.
В данный момент мы умеем работать в Azure, но только без защиты. Так что для больших проектов проблем нет.
Над полноценной поддержкой думаем, но пока это только планы. Следующая, 11я версия, точно будет работать под клаудом, про 10ю пока сказать трудно.
Пока что только через экспорт в Word или пробегая руками через API. В xml, надеюсь, появится довольно скоро.
Ответил личным сообщением.
Интересно, спасибо! Можно попробовать поставить такую штуку работать на неделю, вдруг найдёт оптимум.
Речь идёт о примерно 2 миллионах строк кода. Работает?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность