Pull to refresh

Comments 8

Стоило упомянуть TET и PdfBox.

Но я так скажу — каждая из них это «небольшой кошмар в отдельно взятой области памяти».

В PdfBox большая проблема контролировать память если вы обрабатываете по 3000 файлов в час с размерами от 100 до 2000 мегабайт.
А достать координаты изображений вы можете только в качестве логов в консоль.

А в тете просто ужасно сырые данные. Вы познакомитесь со всей внутренней кухней пдф, структурами хранения и трансформациями над изображениями и он заставит вас все это делать ручками ибо изображение он достанет из ресурсов и отдельно матрицу трансформации. А если вдруг вы встретили тифф изображение, то он вам и его разберет на куски.

Посмотрим как будет развиваться опенПдф.

Почти 4 года назад написал библиотеку на JS для разбора, создания любых pdf, а также для создания и проверки подписей. Однако пока код закрыт заказчиком. Написан большой сервис типа DocuSign. Кому-нибудь такая библиотека пригодилась бы?

А в тете просто ужасно сырые данные. Вы познакомитесь со всей внутренней кухней пдф, структурами хранения и трансформациями над изображениями и он заставит вас все это делать ручками ибо изображение он достанет из ресурсов и отдельно матрицу трансформации. А если вдруг вы встретили тифф изображение, то он вам и его разберет на куски.

Вот у меня примерно такая же библиотека — максимально низкоуровневые данные. Можно сделать «helpers» для всяких там добавлений текста и прочая, но эта библиотека создавалась для задачи минимального апдейта существующего документа, создания подписей (вплоть до PAdES LTV), шифрования/расшифрования документов. Красивости и «плюшки» не предусматривались. Вам нужна такая библиотека? И, кстати говоря, под какие именно задачи?
Примерно такие же, электрическая подпись

И у меня в настоящий момент только RSA, ГОСТа пока нет. Но в целом я понял, что есть потребность в библиотеке подписи PDF в браузере. И даже в таком сыром виде как она есть сейчас. Поговорю с заказчиком — может откроем существующий код и продолжим дорабатывать его уже в открытом виде.

Как то пришлось столкнутся с автоматической генерацией PDF документов в веб приложении на Java. Энтузиазм заставил реализовать велосипед новую библиотеку для верстки документов со стилями и экспортом в PDF на базе Apache PDFBox. Более менее рабочий прототип конечно получился, но как оказалось все это было зря. В итоге мы остановились на технологиях XSL-FO и процессоре Apache FOP.

К Qt pdfium прикрутили вроде. Пользуюсь pdfium-ом — и разбирает и собирает
Sign up to leave a comment.