Как стать автором
Обновить
16
0
Василий Панфёров @vpanferov

Пользователь

Отправить сообщение
Зачем обязательно нейросети? Есть много других хороших классификаторов.
У Мегафона в Европе можно подключить бесплатно опцию «Отпуск Онлайн» и получить инет по 7 руб./Мб.:
moscow.megafon.ru/roaming/world/special_offers_internet/20110617-1716.html
Да, и выдирать поля, содержащиеся в машиночитаемой зоне, с загранпаспорта можно уже сейчас: processMRZ.

Умеет доставать имя, фамилию, номер документа, пол, дату рождения и срок действия.
Вывести в облако на базе ocrsdk.com проблема не большая. Непонятно насколько большой будет спрос — всё-таки не все готовы доверить такие данные веб-сервису.

Попробуйте пообщаться с нашими продавцами. Может, получится сделать.
Не будет. Если заведомо 10 баллов, то люди просто не будут ездить на машинах на работу => меньше машин => меньше 10 баллов.

Тут имеет место равновесие с метро, когда в среднем на машине чуть дольше, но чуть удобнее, чем на метро. Конечно, для отдельных районов всё может отличаться, но в среднем 10 баллов не будет. Люди просто пересядут на электрички/метро, если они есть.
Да, да, девушки действительно так старались только для того, чтобы написать этот текст :)

Вообще было очень приятно получить от них такое поздравление.
Не можем :) Это пользовательские данные, и передавать их кому-либо нехорошо.
Избавимся, конечно. Спасибо!
Спасибо! Поправим и положим что-нибудь на китайском :-)
:) Поправлено.
Сорри, промазал ссылкой и ответил ниже.

Зависит от реализации. У нас «средняя».
Зависит от реализации. У нас «средняя».
Да.

может, вы научились сжимать и текст внутри PDF.

Давно уже. Текст внутри и команды его вывода сжимаются zip'ом.
Текст распознаётся и помещается отдельным слоем под картинку.

Весь механизм работает и в FR Engine, и в обычном FR одинаковым образом — у них общий код. В Engine чуть побольше ручек.

Про сжатие я не уверен, что понял вопрос. Pdf представляет из себя текст, картинки и управляющие команды. Обычно картинки имеют самый большой размер.
Технология MRC направлена на то, чтобы уменьшить размер картинок. Размер текстового слоя не меняется, управляющих команд становится немножко больше.
Поправил, спасибо.
Кстати, у нас есть вакансия для человека, который хочет заниматься тем, чтобы технологии FineReader были доступны и на линуксе, и на куче других систем. Так что всем желающим welcome! :-)
www.abbyy.ru/vacancy/
Продукты портированы. В частности, выше написано про FineReader Engine, если вас интересуют продукты для разработчиков.
Про будет не могу сказать — не знаю.

Но в принципе такую штуку можно сделать. Вопрос в том, какая нужна функциональность? Из чеков можно достаточно надёжно выдирать итоговую сумму и дату. Название организации уже гораздо труднее, и для надёжности тут хорошо бы иметь базу инн.

Если надо вбивать чеки из ашана, возникает ещё две проблемы. Первое, чеки довольно длинные, айфоном их сфотографировать так, чтобы распознался текст, не получится. Нужны ли данные о каждом товаре? Если на чеке есть цифры со штрихкода, можно сделать запрос к базе штрихкодов и получить ответ.

И последний вопрос: в каком виде представлять результаты? Интегрироваться с какой-то программой трудно, можно в виде таблички Excel, где каждая строчка соответствует одному чеку.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность