Comments 8
Стоило упомянуть TET и PdfBox.
Но я так скажу — каждая из них это «небольшой кошмар в отдельно взятой области памяти».
В PdfBox большая проблема контролировать память если вы обрабатываете по 3000 файлов в час с размерами от 100 до 2000 мегабайт.
А достать координаты изображений вы можете только в качестве логов в консоль.
А в тете просто ужасно сырые данные. Вы познакомитесь со всей внутренней кухней пдф, структурами хранения и трансформациями над изображениями и он заставит вас все это делать ручками ибо изображение он достанет из ресурсов и отдельно матрицу трансформации. А если вдруг вы встретили тифф изображение, то он вам и его разберет на куски.
Посмотрим как будет развиваться опенПдф.
Но я так скажу — каждая из них это «небольшой кошмар в отдельно взятой области памяти».
В PdfBox большая проблема контролировать память если вы обрабатываете по 3000 файлов в час с размерами от 100 до 2000 мегабайт.
А достать координаты изображений вы можете только в качестве логов в консоль.
А в тете просто ужасно сырые данные. Вы познакомитесь со всей внутренней кухней пдф, структурами хранения и трансформациями над изображениями и он заставит вас все это делать ручками ибо изображение он достанет из ресурсов и отдельно матрицу трансформации. А если вдруг вы встретили тифф изображение, то он вам и его разберет на куски.
Посмотрим как будет развиваться опенПдф.
+1
Почти 4 года назад написал библиотеку на JS для разбора, создания любых pdf, а также для создания и проверки подписей. Однако пока код закрыт заказчиком. Написан большой сервис типа DocuSign. Кому-нибудь такая библиотека пригодилась бы?
+3
Да, пригодилась бы очень
0
А в тете просто ужасно сырые данные. Вы познакомитесь со всей внутренней кухней пдф, структурами хранения и трансформациями над изображениями и он заставит вас все это делать ручками ибо изображение он достанет из ресурсов и отдельно матрицу трансформации. А если вдруг вы встретили тифф изображение, то он вам и его разберет на куски.
Вот у меня примерно такая же библиотека — максимально низкоуровневые данные. Можно сделать «helpers» для всяких там добавлений текста и прочая, но эта библиотека создавалась для задачи минимального апдейта существующего документа, создания подписей (вплоть до PAdES LTV), шифрования/расшифрования документов. Красивости и «плюшки» не предусматривались. Вам нужна такая библиотека? И, кстати говоря, под какие именно задачи?
0
Примерно такие же, электрическая подпись
0
Как то пришлось столкнутся с автоматической генерацией PDF документов в веб приложении на Java. Энтузиазм заставил реализовать велосипед новую библиотеку для верстки документов со стилями и экспортом в PDF на базе Apache PDFBox. Более менее рабочий прототип конечно получился, но как оказалось все это было зря. В итоге мы остановились на технологиях XSL-FO и процессоре Apache FOP.
0
К Qt pdfium прикрутили вроде. Пользуюсь pdfium-ом — и разбирает и собирает
0
Sign up to leave a comment.
Свободные библиотеки для создания и редактирования файлов PDF