Открыть список
Как стать автором
Обновить

Комментарии 50

Еще один online сервис — еще один удар по винде как по платформе
это отлично, т.к. OCR для русского в Linux по сути нет. теперь будет :)
Мы запустили сервис примерно полгода назад и даже писали об этом на хабре.
Но, судя по тому, что для многих он еще новость, у нас пока не особо получилось пропиарить его в Linux-сообществе. Может быть подскажете — как это лучше сделать?
На linux.org.ru новости еще по-моему не было
Факт, не было!
Спасибо за «площадку», исправим в ближайшее время. А чего-нибудь международного не подскажете?..
из международного, надо признаться, читаю только «бумажный» linuxjournal.com. онлайн как-то времени нет, только на rss хватает. пусть шаттлворт у себя в блоге напишет :)
Самое крутое протолкнуть ссылку в FF или Opera, чтобы в какой-нибудь сборке браузера она была.
Да на самом деле нужно следующее:
— Возможность бесплатно распознать небольшой обьем текста в некоторый интервал времени (Просто я не куплю файнридер, а пойду к тому у кого он есть).
— Возможность при увеличении объемов докупить еще 200 страниц за 100 рублей
— Возможность покупки аккаунта на время и навсегда (блокируйте одновременные входы).

И вы убьете пиратство Файнридера в России.

PS: Обязательно все виды оплат, от WM и обязательно Яндекс денег, до SMS
+ оплата с кредиток и Paypal!
Кажется, моим единственным отправленным пожеланием было сохранение возможности бесплатного распознавания хотя-бы 5 страниц в сутки.
опять-таки очень рад. спасибо большое. на работе распознаю иногда по мелочи.
останется ли возможность триального распознавания после выхода из беты?
НЛО прилетело и опубликовало эту надпись здесь
> При всех этих новых возможностях FineReader Online продолжает работать в тестовом > режиме, а значит вы всё так же можете бесплатно распознавать по 10 страниц в день.

Вы главное не забудьте оставить бесплатный тариф после выхода из беты, это уже стандарт де-факто для веб-сервисов. Т.к. те, кто активно пользуется сервисом, в любом случае будут платить за расширенные тарифы, а те, кто пользуется от случая к случаю будут его бесплатно пиарить, если у них будет возможность бесплатно им пользоваться, и косвенно увеличивать кол-во активных пользователей.
Это сильно зависит от того, что за сервис.

Лично я не против платного сервиса.

Но хочется:

1. Гибкости в оплате. Например я привык к PayPal либо кредиткам. Многим очень понравится оплата посредством SMS, хотя там и процент оператора драконовский.

2. Гибкости в тарифах. На примере Йоты: здорово, что у нее есть «Йота-день» за 50 рэ: мне мобильный интернет нужен три раза в месяц — не платить же из-за этого 900 рэ за месячный доступ.
Так а кто против платного сервиса? Главное чтобы у этого платного сервиса был полнофункциональный бесплатный тариф с ограничением по кол-ву распознаваемых страниц, например 100 стр. в месяц бесплатно, а сверх этого уже платные тарифы.
Так а кто против бесплатного сервиса? ;-)

Только это маловероятно. Сервис очень специфический и не особо масштабный. Наверное только 1% пользователей стали бы его пользовать систематически (из тех, кто туда вообще зашел). Остальные — пару раз в год. С бесплатным пакетом сервис себя окупать не будет, не то что прибыль приносить.

Мой прогноз — любое распознавание за деньги.
Но с тарифами вроде 10 рэ за одну страницу, 50 рэ за 20, 100 рэ за 100 и т.п.
С другой стороны, подобная система «скидок» при наличии API может спровоцировать перепродажу услуг.
Посмотрим, что сделают.
В том то и дело, что не систематически никто за деньги пользоваться не будет (особенно в России, 80% потенциальных пользователей даже 10 коп. за страницу платить не будут), так что без бесплатного тарифа и 1% не будет… Т.к. 99.99% зайдут и больше не вернутся…

> С бесплатным пакетом сервис себя окупать не будет, не то что прибыль приносить.

Тут сложно сказать, но без бесплатного пакета он точно себя окупать не будет. На первый взгляд парадокс, а на второй — аксиома. :-)
Где-то на хабре разработчик писал, что они прекрасно понимают, что за сервис, который используется раз в месяц или еще реже платить никто не будет.

Из этого следует, что некоторое бесплатное количество страниц все же останется. Весь навар в том, что пользуясь бесплатной распознавалкой изредка, после появления необходимости в действительно большом количестве страниц юзер купит именно FR, т.к. сервис испытанный и хороший.
Кто зарегистрирован, посмотрите, пожалуйста, появился ли китайский язык среди поддерживаемых? Спасибо.
К сожалению, Китайского языка до сих пор нет в поддерживаемых
Сервер ляжет, когда китайцы узнают о нем :))
Решение легко масштабируемо. К тому же, сейчас нагрузка в десятки раз меньше той, к которой он один готов.
Актуальная задача для разработки мобильных приложений — распознавание текста с мобильных фоток. Как я понимаю, abbyy это умеет.
Если заточить api под это — было бы здорово.
И еще — очень хочется ODT в формате документов. А то у меня в системе почему, то Word не запускается :-)
ODT нет пока даже в десктопном файне, так что в ближайшем будущем он вряд ли появится в нашем онлайн-сервисе. Поэтому могу порекомендовать Вам пока использовать RTF
Поскольку Ваш клиент под Mac OS X, вышел абсолютно деревянным [мягко говоря], надеюсь онлайн-версия будет правильной и спасёт не только маководов, но и линуксоидов. :)
«Ваш» стоило бы написать с маленькой буквы. Он, конечно, наш, но все-таки не мой точно :)
В данном случае я к ABBYY обращаюсь.
А можно поподробнее о «деревянности»? Я принимал некоторое участие в выпуске программы под мак, хочется понять, что именно создаёт такое мнение.
Попробуйте отсканировать в ней 3-4 страницы. Поймёте. Объяснять не буду. Придирок к механизму распознавания нет абсолютно, он лучше чем у ReadIris, но интерфейс, инструментарий, да и вообще весь процесс построен крайне отвратительно.
Что касается именно сканирования — оно идёт через UI вашего сканера. Да, мы такие бяки, что начинаем распознавание сразу после сканирования и да, поэтому пятую страницу вы будете сканировать на более тормозящей машине, чем 1ую. А по-вашему, было бы лучше, если бы приходилось сначала сканировать какое-то количество страниц (что занимает немало времени, и мы тут, заметьте, не при чём), а потом, после завершения сканирования, ждать, пока всё распознается (тут бы уже файн некоторое время потупил)?
Согласитесь, что удобнее получить распознанный документ через несколько секунд после завершения сканирования, а не через несколько минут.
Вон оно как. Сразу в бой бросаетесь? Я Вам говорю — ВЕСЬ процесс распознавания — ГОВНО!
Это я вам, как пользователь говорю. И под «сканированием» в предыдущем комменте, я имел ввиду не именно процесс разметки и распознавания.
По сути, программа всасывает 1 файл и сама решает что сканировать, а что нет. Потом вы схраняете результат, открываете и, как правило, видите что отсканировалось не то, что надо. Вы начинаете размечать по-новой. А текущую (автоматически проставленную) разметку удалить нельзя! Выделить 1 блок и удалить нельзя! Выбрать несколько углов — нельзя!.. И тд и тп. А продается программа по баснословной цене!
Купите ReadIris (которому уже лет 5 наверное) и посмотрите как всё реализовано у них. Учитесь.
Пардон опечатка:
***под «сканированием» в предыдущем комменте, я имел ввиду именно процесс разметки и распознавания.
Про удаление блоков поподробнее пожалуйста. И полную версию продукта скиньте в личку, возможно, доступны обновления.
Я в бета-тестеры не записывался :) Об ошибках и неправильностях в файнридере для Mac OS X можете прошерстить маковские форумы/блоги/сообщества. Какашек множество прочитаете.

Последний раз пробовал недели 3 назад. Больше не хочу. Теперь у меня есть лицензионный ReadIris.
Читал я ру_мак. Цирк с конями развели там, вот что могу сказать.
Мдэ… Если Вы действительно разработчик/участник проекта, то из Вашего поведения видно, откуда у программы растут проблемы.
Я позволю поставить точку в этом бессмысленном обсуждении.
1. Движок распознавания ABBYY — прекрасен.
2. Обертка этого движка на Mac OS X — говно.
Удачи!
А по каким причинам Онлайн версия распознаёт заметно хуже оффлайн версии?
Я сравниваю с FineReader proffesional, одной из последних версий
Понятие «заметно хуже» раскройте пожалуйста. Вас сохранение форматирования не устраивает или именно качество распознавания символов?
Да, именно качество распознавания. Сравнивал на одинаковых исходных файлах.
Особенно плохо удавались надстрочные и подстрочные знаки.
Сделан сервис на ABBYY Recognition Server предпоследней версии. На момент выхода первой беты FR Online просто не было последней версии этого продукта, и мы при всём желании не могли её использовать.

«Переезд» сервиса на новый движок — не такое простое дело, но в ближайшем светлом будущем может состояться :)
НЛО прилетело и опубликовало эту надпись здесь
ну там хоть фон мешает, а вы попробуйте сделать скриншот этих комментов, к примеру, и распознать
не надо этого делать. Программа не предназначена для распознавания скриншотов, я об этом уже писал в топике про beta2 на хабре.
Планируется ли поддерзжка иврита? Если да, то когда?
Поддержка openID пока не предусмотрена?
Сейчас не предусмотрена
ой, а чего это он PDF-ки не распознает, оффлайн версия то может…
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.