Комментарии 3
НЛО прилетело и опубликовало эту надпись здесь
Нейронная сеть выдает целые строки.
Полученная на основе MSER картинка-строка подается на вход сети целиком. В сверточных блоках вычисляются признаки, которые в виде последовательности подаются на вход LSTM. На выходе LSTM + CTC после декодирования получаем последовательность символов, которые объединяются в выходную строку.
Полученная на основе MSER картинка-строка подается на вход сети целиком. В сверточных блоках вычисляются признаки, которые в виде последовательности подаются на вход LSTM. На выходе LSTM + CTC после декодирования получаем последовательность символов, которые объединяются в выходную строку.
0
Интересно было б с AWS Textract сравнить
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
OCR-конвейер для обработки документов