Pull to refresh
  • by relevance
  • by date
  • by rating

Ученые компании Smart Engines окончательно решили задачу распознавания паспорта РФ

Smart Engines corporate blogDevelopment of mobile applicationsImage processingMachine learningArtificial Intelligence

Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта (ИИ). В программном продукте Smart ID Engine продемонстрирован режим распознавания «книжки» паспорта под разными углами и различном освещении в реальном времени в видеопотоке и на фотографиях. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровне ИИ можно считать решенной.

Читать далее
Total votes 17: ↑8 and ↓9 -1
Views2.3K
Comments 15

reCAPTCHA: дополнительная польза от борьбы со спамом.

Website development
Сотрудники Carnegie Mellon University подсчитали, что ежедневно по всему миру люди заполняют 60 миллионов каптч. Приняв время заполнения каптчи за 10 секунд, получаем более 160 000 человекочасов (или около 19-ти ЛЕТ!) за день.
И они решили попытаться хотя бы малую часть пропадающих зазря усилий направить на полезное дело, а именно — на распознавание книг.
Суть их идеи такова: на реКАПТЧЕ даются ДВА идущих подряд слова из книги, одно из которых система распознания текста не осилила. реКАПТЧА проверяет известное слово, а вариант распознания неизвестного добавляет в свою базу. Оба этих слова задисторчены обыкновенными и специальными каптча-фильтрами, чтобы пользователь не схалявил, предложив вариант «упячка», к примеру.
Демо и подробности тут:


Университет предлагает готовые решения для форумов/блогов/почты. ИМХО если технология найдет свое применение, вебдваноль наконец сотворит что-то действительно полезное.
Total votes 54: ↑51 and ↓3 +48
Views2.2K
Comments 58

OCR из Google

Lumber room
Google ведёт разработку собственной OCR-системы под названием OCRopus.
В данный момент разработка ведётся для Linux x86 и x86/64 под дистрибутивом Ubuntu 6.10. Как сообщают разработчики, код легко портируется для поддержки других дистрибутивов и платформ.
План разработки:
  • Альфа релиз (3 четверть 2007)
  • Бета релиз (1 четверть 2008)
  • Версия 1.0 (3 четверть 2008)


Исходный код: ocropus.googlecode.com (Subversion)
Источник: googleblog.blogspot.com
Total votes 8: ↑7 and ↓1 +6
Views466
Comments 4

FineReader 9.0: новый революционный размягчитель твердых копий

Software
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Rating 0
Views257
Comments 0

FineReader 9.0: новый революционный размягчитель твердых копий

Lumber room
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Total votes 43: ↑37 and ↓6 +31
Views381
Comments 167

Scribd бесплатно отсканирует ваши документы

Lumber room
Стартап Scribd, который специализируется на публикации документов через флэш-виджеты, вчера объявил о старте беспрецедентной программы Scribd iPaper. Чтобы привлечь на свой хостинг побольше файлов, они решили делать бесплатное сканирование и OCR всех документов и книг, которые пришлют им по почте. Это действительно уникальное предложение, потому что у нас цены на сканирование и распознавание текстов начинаются примерно от $0,17 за страницу, а здесь всё бесплатно.


Читать дальше →
Total votes 24: ↑23 and ↓1 +22
Views347
Comments 26

Google подключил OCR-движок для индексации PDF

Search engines
Google сделал значительный шаг на пути к индексированию так называемой Невидимой сети, то есть той львиной части сетевого контента, которая до сих пор не поддаётся роботам поисковых систем. Это, в основном, запароленые сайты и различные базы данных, а также огромные массивы отсканированных документов в формате PDF.

И Google, и многие другие поисковики без проблем индексируют PDF, если в нём есть текстовый слой (он хранится в стандартном текстовом формате в контейнере файла). Но подобных «правильных» PDF на самом деле довольно мало. Гораздо больше документов представляют собой обычные отсканированные копии в графическом формате, просто сохранённые в PDF. Поэтому для их индексации Google сейчас подключил OCR-движок. Теперь в индекс попадут миллионы недоступных ранее государственных отчётов, судебных решений и академических исследований. Вот некоторые примеры работы нового движка.

Нужно напомнить, что в апреле Google научился обрабатывать выпадающие меню и другие HTML-формы в различных интерфейсах баз данных, это тоже важная технология по индексации Невидимой сети.
Total votes 53: ↑51 and ↓2 +49
Views1K
Comments 32

OCR и нейронная сеть на Javascript

JavaScript
Некий Shaun Friedle написал любопытный javascript который автоматизирует распознавание captcha на megaupload.

Пара любопытных особенностей скрипта:
  1. используется HTML 5 функция javascript getImageData для работы с пикселями;
  2. используется искусственная нейронная сеть для распознавания и работает довольно точно.

Пример работы: herecomethelizards.co.uk/mu_captcha
Исходник: userscripts.org/scripts/review/38736
Total votes 74: ↑74 and ↓0 +74
Views7K
Comments 50

Каптчи. Способы взлома и защиты

Information Security
Кросс-пост из нашего блога, посвященному компьютерной безопасности

Ранее мы писали о уязвимостях каптч на сайтах компании Киевстар и Билайн. Теперь мы хотим, вашему вниманию предоставить наше исследование в области взломов и защиты каптч.
Читать дальше
Total votes 28: ↑16 and ↓12 +4
Views3.3K
Comments 12

Инфракрасная подсветка для OCR

IT-companies
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Total votes 36: ↑34 and ↓2 +32
Views763
Comments 34

Демо-версия Google Docs OCR

IT-companies
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Total votes 35: ↑29 and ↓6 +23
Views1.6K
Comments 22

OCR online

Self Promo
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Total votes 48: ↑45 and ↓3 +42
Views4.4K
Comments 31

Фотокамеры телефонов Nokia будут переводить слова

Computer hardware
Translation
image

По фотографии, думаю, и так все понятно. Nokia занимается над созданием OCR для камер в своих телефонах. Понятно, что технология будет актуальна в камерах с большим количеством пикселей — примерно 8-12 Мп. Думаю, что технология будет востребована, например, туристами.
Скажите, Вы удивлены новой технологией или это раньше где-то уже обсуждалось?
Total votes 56: ↑54 and ↓2 +52
Views304
Comments 48

Google Docs индексирует PDF

IT-companies
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Total votes 14: ↑9 and ↓5 +4
Views894
Comments 7

pytesser — OCR-библитека для языка Python (оптическое распознавание символов)

Lumber room
Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.
Читать дальше →
Total votes 13: ↑11 and ↓2 +9
Views8.6K
Comments 6

Вышел FineReader 10!

ABBYY corporate blog
Уже несколько месяцев как вышел, успел получить немало лестных отзывов и даже одну (надеемся, не последнюю) весьма важную награду. 4.5 звёзд из 5 от PCMagа, сами понимаете, за «Hello, world» не дают. Более того, ходят слухи, что столько не ставили ещё ни одному OCR! Так вот, мы, значит, стараемся-стараемся, а на Хабре ни слуху, ни духу: всё FineReader Online, да FineReader Online. Нехорошо. Давайте разберёмся,

Чего же ждать от FineReader 10?


Читать дальше →
Total votes 69: ↑53 and ↓16 +37
Views1.7K
Comments 72

В Google Docs появилось OCR

IT-companies
На странице загрузки файлов в Google Docs теперь доступен параметр «Преобразовывать текст из PDF-файлов или изображений в формат Документов Google»:



Можно загрузить отскарированное изображение (JPEG, GIF, PNG) или PDF-файл, и Google Docs извлечёт текст и форматирование для редактирования.

В Google Docs Blog пишут, что система OCR разработана в сотрудничестве с командой Google Books. Распознавание лучше всего работает с изображениями в высоком разрешении, и не всё форматирование может быть сохранено. Для того, чтобы можно было проверить ошибки распознавания, в новый документ включается оригинал изображения. Пока что поддерживаются тексты только на английском, французском, итальянском, немецком и испанском языках.
Total votes 104: ↑99 and ↓5 +94
Views7.7K
Comments 35

Как научить Windows Search искать информацию в картинках

ABBYY corporate blog

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.

Читать дальше →
Total votes 37: ↑25 and ↓12 +13
Views6.9K
Comments 28

Первая стабильная версия OCR-системы Cuneiform Linux

Open source
Юсси Пакканен сообщил о выходе версии 1.0 системы оптического распознавания текстов Cuneiform Linux. В новой версии удалён некоторый код сомнительного лицензионного происхождения и исправлено множество ошибок.

Код Cuneiform Linux распространяется под упрощённой лицензией BSD и основан на коде системы CuneiForm, который был открыт компанией Cognitive Technologies в 2008 году.

Скачать можно здесь: launchpad.net/cuneiform-linux/+download (инструкции по установке и использованию можно прочитать в топике «Распознаем текст с помощью cuneiform»).
Total votes 53: ↑47 and ↓6 +41
Views2.8K
Comments 14

Наведи – переведи!

ABBYY corporate blog
Настало время отвлечься от разговоров о внутренней жизни ABBYY и поговорить о тех наших продуктах, которые по случайному стечению обстоятельств могут быть не знакомы Хабрапользователям. Сегодня речь пойдет об одной довольно необычной программе нашего самого (ну или одного из самых) перспективных продуктовых направлений. Итак, представляем вашему вниманию FotoTranslate (пока только для смартфонов Nokia) от нашего «мобильного» департамента.
 
В этой программе мы объединили технологию оптического распознавания (известную во всём мире по FineReader'у) и современные словари Lingvo, многие из которых лицензированы у известных авторов и издательств, например, Oxford и Compact Verlag. FotoTranslate позволяет фотографировать текст на иностранном языке и сразу же получать его перевод на экране телефона.
 
Как это работает?
Читать дальше →
Total votes 34: ↑26 and ↓8 +18
Views5.9K
Comments 15