Открыть список
Как стать автором
Обновить
77.24
Рейтинг
ABBYY
Решения для интеллектуальной обработки информации

Как научить Windows Search искать информацию в картинках

ABBYY

Некоторое время назад мы уже писали об одном из вариантов использования ABBYY Recognition Server, сегодня расскажем вам ещё об одном. Все знают виляющую хвостом собаку, которая появляется в Windows XP при нажатии F3. За ней скрывается удобная поисковая служба Windows Search, позволяющая находить затерявшиеся на компьютере файлы по названиям, а иногда и по содержимому. Поиск по содержимому в Windows по умолчанию поддержан только для файлов текстовых форматов.

Недавно мы выпустили новый продукт ABBYY Recognition Server IFilter – специальное дополнение к Windows Search, которое помогает этому поисковому сервису индексировать файлы графических форматов – TIFF, JPEG, PDF и др., хранящиеся на компьютере, чтобы потом можно было легко находить их с помощью полнотекстового поиска. Для извлечения текста из документов-изображений задействуется ABBYY Recognition Server, установленный в корпоративной сети.



Работает эта система так:

На рабочие компьютеры сотрудников устанавливается IFilter – маленькое лёгкое приложение, которое умеет передавать изображения на удаленный ABBYY Recognition Server и получать оттуда в ответ распознанный текст. Windows Search можно настроить на индексирование определенных папок и почтовых ящиков на компьютере. Все текстовые документы и письма из выбранных папок Windows Search индексирует сам, а все изображения, найденные в этих папках и вложениях в письма, передает через IFilter в Recognition Server для распознавания. Распознанный текст возвращается обратно на компьютер и добавляется в индекс – изображение становится доступно для полнотекстового поиска.

image

Сам IFilter потребляет минимум системных ресурсов – все ресурсоемкие процессы происходят на сервере в корпоративной сети. Копии изображений хранятся на сервере только во время распознавания, после распознавания они с сервера удаляются.

Ну и приятный бонус – IFilter умеет автоматически отсеивать фотографии (чтобы не мучить сервер распознаванием красот Египта и Турции).

Update по просьбам читателей: приложение работает под Windows 7, Vista, XP :)

Вера Серова
Аналитик по технологическим продуктам
Теги:ABBYYrecognition serverifilterOCR
Хабы: ABBYY
Всего голосов 37: ↑25 и ↓12 +13
Просмотры6.9K

Похожие публикации

Лучшие публикации за сутки