Pull to refresh

Яндекс.Диск научился читать текст с картинок

Reading time1 min
Views8.8K
image

Яндекс в своём блоге объявил о новой возможности файлохранилища Яндекс.Диск. Теперь файловый поиск может находить картинки JPEG, GIF и PNG, содержащие текст поискового запроса, Система научилась распознавать текст на изображениях.

Яндекс утверждает, что они сумели создать универсальную OCR, которая может распознавать текст на совершенно разных картинках. Для этого классификатор картинок, работающий на принципе нейронной сети, отбирает из всех файлов изображения, содержащие текст. Текст разбивается на линии, линии – на отдельные буквы, и затем система распознаёт их, учитывая особенности языка.

Для разных типов картинок ЯД обещает разную точность распознавания. Для отсканированных документов на русском языке — 80%, для фотографий с надписями — 63,2%, а для скриншотов — почти100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Средняя точность распознавания текстов находится в районе 70%.
Tags:
Hubs:
If this publication inspired you and you want to support the author, do not hesitate to click on the button
Total votes 18: ↑17 and ↓1+16
Comments10

Articles