Pull to refresh

Comments 5

То есть вы сделали генерацию датасетов для дообучения обучения OCR, базовый пайплайн для обработки документов (включающий выравнивание, компенсацию искажений) распознавание текста, чекбоксов, извлечение Key-Value пар, сопоставление полученной информации с данными в базе данных банка (интеграционный кусок проекта). Отлично.
А где тут "AI"? в OCR и распознавании чекбоксов?

Уважаемый mst_72, спасибо, что заинтересовались статьей.
Возможно, вопрос логичен, если считать ИИ маленькой черной коробочкой, которую можно обнаружить, разломав интеллектуальную систему на детальки. Однако ИИ — это не деталь, а свойство системы в целом, а описывать систему как множество ее частей — довольно сомнительный метод анализа, это редко приносит плоды.
Кстати, у Артура Порджесса на эту тему есть великолепный фантастический рассказ «1,98»).
Возможно, на самом деле Вы перечисляете не части системы, а части статьи?
Но буквально во второй фразе статьи сказано, что речь пойдет об «искусственном интеллекте в части распознавания образов и текста».
Можно посчитать, что OCR (что бы это ни значило) — не ИИ (что бы это ни значило), но в любом случае авторская позиция была декларирована с самого начала.
Попробуем все же ответить на него по существу.
ИИ — это свойство системы заменять человека в интеллектуальной деятельности, считающейся его прерогативой, проблематика ИИ слабо поменялась за последние 65 лет, поэтому обратимся к повестке Дартмутского семинара.
6-я проблема, обсуждаемая на нем, касалась абстрагирования информации при обработке данных (в том числе — сенсорных).
Проблема распознавания документа (как, впрочем, и отдельных его букв) относится к области ИИ потому, что это — проблема абстрагирования.
А не потому, что для ее решения используются нейросети (третья тема Дартмутского семинара).
Возможно, для кого-то главное в ИИ — это «произвол и творчество» (7-ой вопрос). Но на сегодняшний день эти свойства остаются исключительно человеческими.
И в области автоматического распознавания документов это очень хорошо.
О, в Росбанке уже .Net используется? Десять лет назад была только жаба (не считая лотуса, конечно).
Каким образом генерировали рукописный текст на тестовых документах?
Sign up to leave a comment.