Pull to refresh

Comments 22

Спасибо за пост, еще было бы интересно почитать про форматы epub и «уникальный» киндловский MOBI
UFO just landed and posted this here
Есть TIFF к примеру. Очень удобно сканировать многостраничный документ.

Только вот создать многостраничный tiff это ещё постараться надо. А пдфку можно получить из любой программы, отправив содержимое на печать встроенного в винду виртуального принтера.

irfanview к примеру без заморочек позволяет создать. Выбрал многостраничное сканирование и он сам создаёт файл.
Только для этого нужно ставить irfanview, он может перегонять только растр (читай — скан). А пдфка создается штатными средствами из любого софта и это очень удобно.

image


При этом PDF-файл можно сделать доступным только для чтения, что помогает защитить содержимое документа от копирования и внесения изменений. Для дополнительной защиты есть возможность поставить пароль или электронную подпись.

С задачей подписания и проверки подписи в PDF-файлах прекрасно справляется LibreOffice, в том числе и с электронной подписью на ГОСТ-ах.

Самое главное достоинство PDF — документы на любой платформе (Виндовс, Линукс и пр.), выведенные на любой монитор или распечатанные на любом принтере, будут выглядеть всегда одинаково. В отличие от формата PDF документы офисных программ (DOC, DOCX, ODT и др.) на разных устройствах могут выглядеть по-разному (шрифты, переносы, отступы, стилевое оформление, положение объектов и т.д.)
К сожалению это не так, в векторных pdf при последующей печати на линуксе вполне можно получить квадратики вместо букв)
На старых версиях офиса помню такое было, ставишь на печать одно, вылезает жопа.
На более новых(2013/365) всё почти всегда прилично. Но иногда всё же программа умничает, так к примеру программисты мелкомягких до сих пор не осилили корректную работу с принтерами печатающими без полей.
Это если страница там отсканированная, или правильные шрифты интегрированные.
Хотя, с шрифтами там может быть всё грустно и весело одновременно. Надуть отдельными описаниями каждого символа — сплошь и рядом.
А можно вообще шрифты не вкладывать. Место съэкономить. А как чего будет отображаться — пусть пользователь сам догадывается, каких «стандартных» шрифтов ему не хватает в системе.
Права доступа. Вот ещё зоопарк. На экране — зашибись, при печати 80-90 дпи. Сам в ответку делал максимально разрешённое рпзрешение в 1 (одина) точка на дюйм.
Внутри контейнера «pdf» вообще как левая пятка разработчика зачесалась. Захотел, положил картинки отдельным потоком «как есть». Захотел — переложил всё в жипег с качеством 50%. И вдогонку раскидал по частям.
Обычно второе. 40 кб. Пнг разложить в несколько мегабайт пдф — легко!
Текст можно разобрать по символу. А можно по составляющим символа. И завернуть каждый хвостик в индивидуальный блок. Графический. С расширенными атрибутами, байт по 500 каждый «хвостик». Потом радостно ловить тормоза на мегабайтном пдф, с одной А4 страницей текста.
Субформаты. Отдельная песня. Их там три штуки вроде. Которые обычный, архивный и ещё что-то. Если у клиента не самый свежий читатель, а вдобавок если ещё и альтернативный, могут быть разные вариации результатов попыток чтения файла.
PDF очень тормознут. Я даже не представляю, какое должно быть железо, чтобы на тяжёлых документах не приходилось втыкать по 5 секунд в пустой экран, ожидая, пока страница отрендерится. Ну и если надо быстро проскроллить с полсотни страниц, визуально выискивая нужное, PDF тоже раздражает неимоверно своими задержками.
PDF очень сложен. Простенькую программку для рендеринга fb2 средний программист напишет за выходные, и она покажет вполне приличные результаты. В случае PDF за выходные вы даже не успеете полностью прочитать спецификацию. Также если ваша программа должна выводить некоторую информацию в виде отчёта (счета за месяц, список новых поступлений с фотографиями и краткими аннотациями), то PDF — это последний формат, о котором вы задумаетесь, потому что на коленке PDF не сгенерировать, придётся как минимум искать и подключать библиотеку.
Достаточно добавить несколько слоев в разных цветах или иллюстраций в jpeg2000 и даже маленький пдф на десяток страниц начинает тормознуто отображаться. ридеры очень плохо могут в многопоточность. К большому удивлению, ридер в хроме рисует заметно шустрее.
В этом djvu сильно выигрывает, малоцветный, с полноцветными бэкграундами, даже на древнем железе удобно и комфортно просматривается.
Это Adobe Reader (DC) стал невообразимо медленным. Тот же встроенный просмотрщик в MacOS на порядок (десятичный) быстрее и к тому же редактировать PDF'ы позволяет (менять порядок страниц, объединять несколько PDF'ов в один и т.п.) Под Win — SumatraPDF, наверное, самый быстрый и удобный.
Цитата «… За Acrobat Reader просили еще 50 долларов.»
Это удивительно, наверное за использование ридера пдф всё-таки плату брали недолго, иначе этот формат никогда бы не стал популярным.

PDF хорош тем, что он является по факту стандартом, позволяющим сохранить верстку в любых условиях. Его везде понимают, если не злоупотреблять новыми возможностями и поименять адекватные инструменты для создания.
А плох тем, что тяжелый, что мало какой софт способен изменять верстку PDF под размеры экрана (да-да, достоинство порождает недостаток), что много кривого софта, который не умеет правильно генерировать PDF с национальными символами и нестандартными шрифтами.

Есть электронные книги, кот. могут переформатировать PDF на своем чернильном экране; и в их описании про данную опцию говорится как преимущество по сравнению с др. читалками на электронных чернилах (например, читалки teXet, которых у меня было 2 разные модели в разное время).
В тоже время внезапно находятся места, где pdf категорически не принимают. Например, налоговая. Все приложения к электронным заявлениям только многостраничный tiff. Делаем pdf, потом перегоняем в tiff.
Хм. Но к примеру у меня вся отчетность отправляется в pdf, уже который год.
PDF Хорош своей стабильностью и универсальностью. Любой файл на любом устройстве будет показан одинаково.
И плох ей же. К примеру, электронные книги не могут отрисовывать странички красиво под свой размер.

Количество костылей в PDF просто зашкаливает. Начиная от кучи древних форматов хранения картинок. Там есть такая экзотика… Включая забагованный JBIG2.

И заканчивая множествами вариантами для производства одной операции. Все можно сделать несколькими способами. Зачем непонятно. Результат абсолютно одинаков. Нет даже рекомендаций как рекомендуется делать.

Очень хочу новую ревизию с deprecated всей экзотики и рекомендациями по использованию методов для типовых вещей. Вот в этом замучаешься разбираться: T*, Tc, Td, TD, Tj, TJ, TL, Tm, Tr, Tw, Tz И это только базовый вывод текста. Функционал дублируется раза 3.
Да, когда PDF имеет несколько слоев в разных цветах, то открытие файла и последующая работа с ним напоминает замедленную съемку. На работе у диспетчера оперативная карта в формате DWG, размером под 100 Мб открывается намного быстрее, чем та же карта, но в PDF весом 21 Мб.

задуман и реализован формат для своего времени очень правильно.
но действительно назрела необходимость "выбрать преемника" :), чтобы сохранить плюсы и избавиться от костылей и ненужного груза времени

Sign up to leave a comment.