Комментарии 24
Хороший обзор, благодарю!

Часом, в процессе работы вам не приходилось конвертировать в PDF страницы с SVG-графикой? Интересно, как справляется с ней wkhtmltopdf.
Справляется ок. единственный недочет — если в графике на странице есть прозачности (как я понял, этот баг не только к svg относится), на этой странице портятся шрифты в акробат ридере. В остальном же, график, нарисованный с помощью Raphaël никаких сюрпризов не подсунул.
а вот устроить конвертацию из pdf в html, если там есть таблицы ух как не просто
Пользовался на нескольких проектах DomPDF, очень удобная штука, странно, что автор не включил ее в обзор
Перезагрузите картинки на habrastorage.org/, будут отображаться у всех, заодно от удаления на внешнем сайте защитите.
Хм… странно почему одни сайты wkhtmltopdf корректно генерит, а другие криво? с учетом того что верстка выглядит везде одинаково в браузерах… в некоторых случаях просто некоторые дивы не воспринимает
Некоторые сайты проверяют, кто запрашивает страницу и изменяют ее под клиента. То есть, смотрять User Agent, параметры броузера (размер экрана и тд).

Есть сайты, которые пытаются сохранить куку, и если она не принимается — выводят какой-нить рекламный блок (например, fishki.net)

Бывают проблемы, если на сайте используется java приложение, или еще какая сложная штука. Flash вообще больное место.

Но в целом, лично я wkhtmltopdf очень доволен, 95% страниц обрабатываются без проблем.
Если есть большой интерес, могу вывести где то около 500-600 скриншотов сайтов, со ссылками.

Посравниваете сами =)
Использую php-класс mPDF как раз для подобной задачи. Не без напильника, но позволяет создать html-разметку для различного рода отчётов, бланков и т.д.

Поддерживает и html, и css. Ограниченно, но поддерживает.
Его единственный минус — это требовательность к ресурсам, как следствие — время генерации. Мне приходится генерировать документы по 100+ страниц с различными таблицами и время генерации составляет около 1 минуты на документ.
Я бы добавил ещё критериев:
— хедеры/футеры и номера страниц
— разделы с разными полями (не так, чтобы поля указаны в настройках на весь документ и всё тут)
— нестандартные шрифты с Unicode (часто бывает нужен фирменный шрифт)
— нормальная разбивка таблицы на несколько страниц, форматирование таблиц (рамки, цвета)
— нормальное позиционирование картинок (по скринам в статье видно, что тут не у всех гладко, а это может быть важно)

И может какой-то умеет экспортировать в RTF заодно?
Тоже мучался с такой же проблемой, каждый с разнообразными косяками, поэтому приходилось выбирать из наименьшего зла ;) для себя остановился на mPDF — он по-моему единственный умеет нормально делить таблицы на несколько страниц, чтобы заголовок таблицы дублировался на каждой и ячейку посередине не разрывало.
Ещё можно просмотреть TCPDF, dompdf — тоже довольно неплохие, но под мои задачи меньше подошли.

А вот поддержку widows и orphans (висящие строки в начале и в конце абзаца) вообще ни нашёл кто умеет, поэтому получается очень часто что в начале страницы остаётся одна строка с парой слов из предыдущего абзаца ;( Как это побороть не знаю, если у кого есть идеи — сообщайте, буду премного благодарен!
При отдаче генерируемого контента в PDF в рельсах использую prawn. Рекомендую, отличный инструмент!
Мы использовали pdf4b.ru, в массе получили оптимальный результат, но это сервис с API, а не либа
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.