Pull to refresh

Comments 5

Совсем недавно на работе как раз размышлял над тем, что в сейчас с развитием QR кодов, то на всех печатных формах документов можно делать QR код содержащий всю информацию из документа.
Это позволит там, куда этот документ понесут наладит ввод информации не вручную, а сканированием.

Я сделал свой аналогичный проект на связке CV+ NLP, тоже автоматизация документооборота. Все эти этапы куда и что отнести это легко, самая большая сложность именно качественно распознать и спарсить нужные поля в базу данных, а уже с имеющимися в базе данными работать легко. Верно сказано, что готовых решений нет.

  • применением набора правил, построенных на регулярных выражениях;

На одних регулярных выражениях ничего не сделать, скан может быть кривой, с помарками, либо формат документа может внезапно чуть измениться и тогда все придется делать заного руками, а в это время работу придется делать руками.

  • с помощью библиотек обработки естественного языка и предварительно обученных моделей;

А вот это в связке с регулярными выражениями дает хороший эффект.

Да, так и есть. Еще сейчас экспериментируем с fine-tuning Open Source LLM моделей, и, в целом, получилось добиться хорошего качества в задачах парсинга бизнес-полей, которые не получалось качественно находить регулярными и традиционными ML алгоритмами.

А никто не пробовал решение для распознавания текста от Microsoft Power Automate? Можно было бы попробовать настроить сканирование с отправкой на почту и дальнейшее распознавание и отправка сканов адресатам.

Легче свое решение написать, чем ковырять что-то от майкрософт, а как же санкции?

Sign up to leave a comment.