dairok Dec 26 2023 at 10:01

Как систематизировать работу с входящими документами в компании с помощью OCR-инструментов. Часть 1

Medium

10 min

3.5K

ГК ЛАНИТ corporate blogOpen source*Machine learning*

+22

Comments 5

Tatooine Dec 26 2023 at 10:26

Совсем недавно на работе как раз размышлял над тем, что в сейчас с развитием QR кодов, то на всех печатных формах документов можно делать QR код содержащий всю информацию из документа.
Это позволит там, куда этот документ понесут наладит ввод информации не вручную, а сканированием.

Lord_Alzov Dec 26 2023 at 23:53

Я сделал свой аналогичный проект на связке CV+ NLP, тоже автоматизация документооборота. Все эти этапы куда и что отнести это легко, самая большая сложность именно качественно распознать и спарсить нужные поля в базу данных, а уже с имеющимися в базе данными работать легко. Верно сказано, что готовых решений нет.

применением набора правил, построенных на регулярных выражениях;

На одних регулярных выражениях ничего не сделать, скан может быть кривой, с помарками, либо формат документа может внезапно чуть измениться и тогда все придется делать заного руками, а в это время работу придется делать руками.

с помощью библиотек обработки естественного языка и предварительно обученных моделей;

А вот это в связке с регулярными выражениями дает хороший эффект.

dairok Dec 27 2023 at 10:00

Да, так и есть. Еще сейчас экспериментируем с fine-tuning Open Source LLM моделей, и, в целом, получилось добиться хорошего качества в задачах парсинга бизнес-полей, которые не получалось качественно находить регулярными и традиционными ML алгоритмами.

kzone Jan 3 at 09:41

А никто не пробовал решение для распознавания текста от Microsoft Power Automate? Можно было бы попробовать настроить сканирование с отправкой на почту и дальнейшее распознавание и отправка сканов адресатам.

Lord_Alzov Jan 12 at 00:05

Легче свое решение написать, чем ковырять что-то от майкрософт, а как же санкции?