Как стать автором
Обновить
  • по релевантности
  • по времени
  • по рейтингу

Ученые компании Smart Engines окончательно решили задачу распознавания паспорта РФ

Smart EnginesРазработка мобильных приложенийОбработка изображенийМашинное обучениеИскусственный интеллект

Научная компания Smart Engines решила последнюю фундаментальную проблему при распознавании паспорта РФ с помощью технологий искусственного интеллекта (ИИ). В программном продукте Smart ID Engine продемонстрирован режим распознавания «книжки» паспорта под разными углами и различном освещении в реальном времени в видеопотоке и на фотографиях. Именно «книжка» была тем научно-технологическим рубежом, преодолев который, задачу распознавания паспорта РФ на уровне ИИ можно считать решенной.

Читать далее
Всего голосов 17: ↑8 и ↓9 -1
Просмотры2.3K
Комментарии 15

reCAPTCHA: дополнительная польза от борьбы со спамом.

Разработка веб-сайтов
Сотрудники Carnegie Mellon University подсчитали, что ежедневно по всему миру люди заполняют 60 миллионов каптч. Приняв время заполнения каптчи за 10 секунд, получаем более 160 000 человекочасов (или около 19-ти ЛЕТ!) за день.
И они решили попытаться хотя бы малую часть пропадающих зазря усилий направить на полезное дело, а именно — на распознавание книг.
Суть их идеи такова: на реКАПТЧЕ даются ДВА идущих подряд слова из книги, одно из которых система распознания текста не осилила. реКАПТЧА проверяет известное слово, а вариант распознания неизвестного добавляет в свою базу. Оба этих слова задисторчены обыкновенными и специальными каптча-фильтрами, чтобы пользователь не схалявил, предложив вариант «упячка», к примеру.
Демо и подробности тут:


Университет предлагает готовые решения для форумов/блогов/почты. ИМХО если технология найдет свое применение, вебдваноль наконец сотворит что-то действительно полезное.
Всего голосов 54: ↑51 и ↓3 +48
Просмотры2.2K
Комментарии 58

OCR из Google

Чулан
Google ведёт разработку собственной OCR-системы под названием OCRopus.
В данный момент разработка ведётся для Linux x86 и x86/64 под дистрибутивом Ubuntu 6.10. Как сообщают разработчики, код легко портируется для поддержки других дистрибутивов и платформ.
План разработки:
  • Альфа релиз (3 четверть 2007)
  • Бета релиз (1 четверть 2008)
  • Версия 1.0 (3 четверть 2008)


Исходный код: ocropus.googlecode.com (Subversion)
Источник: googleblog.blogspot.com
Всего голосов 8: ↑7 и ↓1 +6
Просмотры466
Комментарии 4

FineReader 9.0: новый революционный размягчитель твердых копий

Софт
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Рейтинг 0
Просмотры257
Комментарии 0

FineReader 9.0: новый революционный размягчитель твердых копий

Чулан
Вступительный слайд презентации FineReader 9.0В понедельник в клубе АртеFAQ в Москве компания ABBYY, которую по праву можно назвать одной из легенд отечественного софтостроения, представила новую, девятую по счету, версию своего не менее легендарного продукта — системы оптического распознавания текста FineReader. О том, во что же вылились два года упорного труда разработчиков, об истории и перспективах развития линейки FineReader и всей отрасли,
читайте дальше
Всего голосов 43: ↑37 и ↓6 +31
Просмотры380
Комментарии 167

Scribd бесплатно отсканирует ваши документы

Чулан
Стартап Scribd, который специализируется на публикации документов через флэш-виджеты, вчера объявил о старте беспрецедентной программы Scribd iPaper. Чтобы привлечь на свой хостинг побольше файлов, они решили делать бесплатное сканирование и OCR всех документов и книг, которые пришлют им по почте. Это действительно уникальное предложение, потому что у нас цены на сканирование и распознавание текстов начинаются примерно от $0,17 за страницу, а здесь всё бесплатно.


Читать дальше →
Всего голосов 24: ↑23 и ↓1 +22
Просмотры347
Комментарии 26

Google подключил OCR-движок для индексации PDF

Поисковые технологии
Google сделал значительный шаг на пути к индексированию так называемой Невидимой сети, то есть той львиной части сетевого контента, которая до сих пор не поддаётся роботам поисковых систем. Это, в основном, запароленые сайты и различные базы данных, а также огромные массивы отсканированных документов в формате PDF.

И Google, и многие другие поисковики без проблем индексируют PDF, если в нём есть текстовый слой (он хранится в стандартном текстовом формате в контейнере файла). Но подобных «правильных» PDF на самом деле довольно мало. Гораздо больше документов представляют собой обычные отсканированные копии в графическом формате, просто сохранённые в PDF. Поэтому для их индексации Google сейчас подключил OCR-движок. Теперь в индекс попадут миллионы недоступных ранее государственных отчётов, судебных решений и академических исследований. Вот некоторые примеры работы нового движка.

Нужно напомнить, что в апреле Google научился обрабатывать выпадающие меню и другие HTML-формы в различных интерфейсах баз данных, это тоже важная технология по индексации Невидимой сети.
Всего голосов 53: ↑51 и ↓2 +49
Просмотры1K
Комментарии 32

OCR и нейронная сеть на Javascript

JavaScript
Некий Shaun Friedle написал любопытный javascript который автоматизирует распознавание captcha на megaupload.

Пара любопытных особенностей скрипта:
  1. используется HTML 5 функция javascript getImageData для работы с пикселями;
  2. используется искусственная нейронная сеть для распознавания и работает довольно точно.

Пример работы: herecomethelizards.co.uk/mu_captcha
Исходник: userscripts.org/scripts/review/38736
Всего голосов 74: ↑74 и ↓0 +74
Просмотры7K
Комментарии 50

Каптчи. Способы взлома и защиты

Информационная безопасность
Кросс-пост из нашего блога, посвященному компьютерной безопасности

Ранее мы писали о уязвимостях каптч на сайтах компании Киевстар и Билайн. Теперь мы хотим, вашему вниманию предоставить наше исследование в области взломов и защиты каптч.
Читать дальше
Всего голосов 28: ↑16 и ↓12 +4
Просмотры3.3K
Комментарии 12

Инфракрасная подсветка для OCR

IT-компании
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Всего голосов 36: ↑34 и ↓2 +32
Просмотры763
Комментарии 34

Демо-версия Google Docs OCR

IT-компании
Как сообщалось вчера, для Google Docs API начали тестировать новую фичу распознавания текстов, как в Evernote. То есть станет возможным просто сфотографировать или отсканировать документ, загрузить картинку в Google Docs — и документ появится там в виде нормального текста

Для активации OCR при загрузке документов через API нужно добавить параметр ocr=true.

В онлайне появилась работающая демо-версия (исходники будут позже). Поддерживаются файлы JPG, GIF и PNG размером до 10 МБ. Распознавание одной страницы текста занимает до 40 секунд (сегодня, очевидно, будет и дольше). Сервис работает с глюками, возможны ошибки.
Читать дальше →
Всего голосов 35: ↑29 и ↓6 +23
Просмотры1.6K
Комментарии 22

OCR online

Я пиарюсь
С технологией оптического распознавания текста я познакомился где-то в 1997 года, когда купил свой первый, тогде ещё ручной, чёрно-белый сканер Genius ScanMate 256 (кстати, всё ещё рабочий). К сканеру прилагалась программа Direct OCR на 3х дюймовой дискете (блин, откуда-то из подсознания все эти названия всплывают), которая всеми своими силами пыталась доказать, что можно быстро и почти без ошибок текст из книги ввести в компьютер. Ну, доказательства были не очень. FineReader, с которым я познакомился позже, делал это качественнее. Тема распознавания меня заинтересовала, я потратил довольно много времени на научно-популярные статьи о технологиях OCR.

В 2001 году я готовил дипломную работу по web-технологиям. Долго думал о том, куда приложить знания. Поскольку меня интересовала технология OCR, я задумал совместить WEB и распознавание текстов. За само распознавание у меня должен был отвечать FineReader. С друзьями мы «разобрали» FineReader на отдельные DLL и выяснили, как вызывать отдельные функции этих библиотек, передавая двоичные данные изображений, и как получать обратно распознанный вариант текста. Над этим всем был построен простейший веб-интерфейс, чтобы загружать картинки, запускать распознавание и получать результат.
Читать дальше →
Всего голосов 48: ↑45 и ↓3 +42
Просмотры4.4K
Комментарии 31

Фотокамеры телефонов Nokia будут переводить слова

Компьютерное железо
Перевод
image

По фотографии, думаю, и так все понятно. Nokia занимается над созданием OCR для камер в своих телефонах. Понятно, что технология будет актуальна в камерах с большим количеством пикселей — примерно 8-12 Мп. Думаю, что технология будет востребована, например, туристами.
Скажите, Вы удивлены новой технологией или это раньше где-то уже обсуждалось?
Всего голосов 56: ↑54 и ↓2 +52
Просмотры304
Комментарии 48

Google Docs индексирует PDF

IT-компании
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Всего голосов 14: ↑9 и ↓5 +4
Просмотры894
Комментарии 7

pytesser — OCR-библитека для языка Python (оптическое распознавание символов)

Чулан
Сегодня бродил по проектам на Google и наткнулся на довольно интересную разработку — pytesser. По утверждению разработчика распознать текст на изображении. Библиотека использует tesseract-ocr и PIL.
Читать дальше →
Всего голосов 13: ↑11 и ↓2 +9
Просмотры8.6K
Комментарии 6

Вышел FineReader 10!

ABBYY
Уже несколько месяцев как вышел, успел получить немало лестных отзывов и даже одну (надеемся, не последнюю) весьма важную награду. 4.5 звёзд из 5 от PCMagа, сами понимаете, за «Hello, world» не дают. Более того, ходят слухи, что столько не ставили ещё ни одному OCR! Так вот, мы, значит, стараемся-стараемся, а на Хабре ни слуху, ни духу: всё FineReader Online, да FineReader Online. Нехорошо. Давайте разберёмся,

Чего же ждать от FineReader 10?


Читать дальше →
Всего голосов 69: ↑53 и ↓16 +37
Просмотры1.7K
Комментарии 72

В Google Docs появилось OCR

IT-компании
На странице загрузки файлов в Google Docs теперь доступен параметр «Преобразовывать текст из PDF-файлов или изображений в формат Документов Google»:



Можно загрузить отскарированное изображение (JPEG, GIF, PNG) или PDF-файл, и Google Docs извлечёт текст и форматирование для редактирования.

В Google Docs Blog пишут, что система OCR разработана в сотрудничестве с командой Google Books. Распознавание лучше всего работает с изображениями в высоком разрешении, и не всё форматирование может быть сохранено. Для того, чтобы можно было проверить ошибки распознавания, в новый документ включается оригинал изображения. Пока что поддерживаются тексты только на английском, французском, итальянском, немецком и испанском языках.
Всего голосов 104: ↑99 и ↓5 +94
Просмотры7.7K
Комментарии 35

Как научить Windows Search искать информацию в картинках

ABBYY

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.

Читать дальше →
Всего голосов 37: ↑25 и ↓12 +13
Просмотры6.9K
Комментарии 28

Первая стабильная версия OCR-системы Cuneiform Linux

Open source
Юсси Пакканен сообщил о выходе версии 1.0 системы оптического распознавания текстов Cuneiform Linux. В новой версии удалён некоторый код сомнительного лицензионного происхождения и исправлено множество ошибок.

Код Cuneiform Linux распространяется под упрощённой лицензией BSD и основан на коде системы CuneiForm, который был открыт компанией Cognitive Technologies в 2008 году.

Скачать можно здесь: launchpad.net/cuneiform-linux/+download (инструкции по установке и использованию можно прочитать в топике «Распознаем текст с помощью cuneiform»).
Всего голосов 53: ↑47 и ↓6 +41
Просмотры2.8K
Комментарии 14

Наведи – переведи!

ABBYY
Настало время отвлечься от разговоров о внутренней жизни ABBYY и поговорить о тех наших продуктах, которые по случайному стечению обстоятельств могут быть не знакомы Хабрапользователям. Сегодня речь пойдет об одной довольно необычной программе нашего самого (ну или одного из самых) перспективных продуктовых направлений. Итак, представляем вашему вниманию FotoTranslate (пока только для смартфонов Nokia) от нашего «мобильного» департамента.
 
В этой программе мы объединили технологию оптического распознавания (известную во всём мире по FineReader'у) и современные словари Lingvo, многие из которых лицензированы у известных авторов и издательств, например, Oxford и Compact Verlag. FotoTranslate позволяет фотографировать текст на иностранном языке и сразу же получать его перевод на экране телефона.
 
Как это работает?
Читать дальше →
Всего голосов 34: ↑26 и ↓8 +18
Просмотры5.9K
Комментарии 15