Как стать автором
Обновить

Google Docs индексирует PDF

Время на прочтение1 мин
Количество просмотров1.7K
В Google Docs добавлена фича индексирования текста в PDF-документах, так что они теперь тоже доступны для полнотекстового поиска из интерфейса Docs. Текст индексируется по текстовому полю, в том числе на русском языке.



В будущем Google должен подключить также систему распознавания текста из графических изображений (OCR), которая уже используется базовым индексатором поисковой системы Google, а также доступна через Google Docs API в качестве эксперимента. Тогда станет возможным индексировать любые типы PDF, в том числе отсканированные документы. Правда, русский язык движком Google OCR пока не поддерживается.

via Google Operating System
Теги:
Хабы:
+4
Комментарии7

Публикации

Изменить настройки темы

Истории

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн