Как стать автором
Обновить

Комментарии 181

Все просто — всем всегда нужно влезть в файл и отредактировать его либо скопировать его содержимое куда-либо, PDF в этом плане неудобен. Плюс к этому — персонал, который хватается за голову от того, что в программе 2 кнопки поменялись местами, хотя принцип работы с программой ни чуть не изменился)
У автора есть документ в оригинальном формате, он его может отредактировать как угодно. А тем, кому приходят документы в PDF, редактировать ничего не нужно, а в ряде случаев — и запрещено. Особенно это касается всяких договоров и отчетов.
И по-хорошему, поправки к документу должны появляться не в самом документе, а идти отдельными документами — это позволит сохранить историю правок в СДО (и я сейчас не про версионность).
По-хорошему, в офисах и ПО лицензионное. Но это все где-то там, в другой стране.
В нашей стране тоже есть. OpenOffice например. К тому же у МС по крайней мере в 2007-2008 годах была льготная программа по покупке лицензионного ПО для малого бизнеса. Да наверняка и сейчас есть. Я в те времена в стартапе сидел, и наши покупали десяток вист и офисов за какие-то скромные деньги.
Ктож спорит то. Но кому это нужно? Я вообще за то, чтобы платное ПО было только у тех, кому оно необходимо.
А разве при открытии PDF оттуда нельзя скопировать текст?
В Preview.app на Mac OS такое точно есть.
Да и в Foxit вроде бы тоже.

Причем не менее удобен, чем документы MS Office. Т.к. в действительно не произойдет случайного удаления фрагмента.
Иногда таблица шрифтов не совсем адекватная — и результирующий текст тоже
Встраивание используемых шрифтов в PDF документ должно помогать.
TYPE1 адресует всего 256 глифов
Ок. Не настолько глубоко в теме, чтобы знать, спасибо за науку.
из нормального pdf (не из сканов) можно легко скопировать нужный текст
У наших риелторов постоянно с этим проблемы) Текст выделяется, копируется, но вставляется из буфера какая-то ересь)
не используйте кривые шрифты. Используете последнюю версию стандарта с современными шрифтами, а не TYPE1//TYPE3
Это вы скажите тем, кто у себя на сайте выкладывает/присылает по почте свои предложения в таком виде.
В-третьих, лично я гораздо спокойнее открываю «чужой» файл PDF, чем чужой .doc, xls. Что бы ни говорили о «дырах» Adobe-овского формата, до MS-овского им далеко.

ну не знаю, уязвимости в нём всё-таки ОЧЕНЬ нехилые, вспомнить хотя бы это. Волосы шевелятся во всех местах.
НЛО прилетело и опубликовало эту надпись здесь
Назовите мне дыру в продуктах МС, которая для своей активации не требовала открытия файла. Слабо? А вот у pdf такая дыра была — эксплойт активировался при создании превью в Проводнике, ничего не надо была даже открывать.
А что, создание превьюшек не есть открытие?
Нецеленаправленное, так сказать ;)
Технически, файл открывается, но (!) юзер то этого не просил — т.е. открытие было самовольное, даже более того — неподконтрольное.
Пример: я кидаю на сетевой диск в папку, скажем, «Share» пдф с эксплойтом. Его никто не откроет, но все заразятся.
«самовольное, неподконтрольное...» = «я скачивать не буду, я только посмотрю и всё!»
ну я думаю это не проблема adobe
а вот для m$ превьюшек нету на винде
Точнее, это не проблема PDF как такового, а уязвимость в конкретном проприетарном софте.
но тогда и сравнение с m$ неактуально. никто же не запрещает использовать опенофис.
инетересная какая позиция: если в превью-генераторе от этого самого адоба есть эксплойт, то это не проблема адоба.
а фигли они генерят preview для pdf, а свою боятся?

вроде как под mac os'ю ростаризатор pdf у них свой. Работает на ура, и вроде как без дыр
Эээ… Вообще-то винды генерят preview для pdf, потому что Adobe прописала в реестре возможность создания оного и описала способ, как это превью сделать. МС дало механизм, Адоби им воспользовались, но создали эксплойт.
ну если только так. я просто не знаю, как там это в винде работает. в любом случае если вам нужна безопасность, а значит уменшение кол-во дыр, вам придется жертвовать функциональностью
мне почему то всегда казалось, что превью генерятся в джипеги при сохранении и Проводник берет их из контейнера не обращаясь к каким-либо скриптам документа
Для эксплуатации эксплоитов совсем не обязательно выполнять скрипты напрямую, достаточно загрузить некорректные данные, вызвав, например, переполнение стэка.
это проблема адоба, но это не проблема PDF
Уязвимость не в pdf, а в Acrobat Reader. У меня, например, Foxit Reader стоит.
В Foxit Reader тоже находили критические уязвимости (хоть и реже, чем в Adobe Reader).
(пруф)
НЛО прилетело и опубликовало эту надпись здесь
Я, знаете ли, на кофейной гуще не гадаю…
Но ошибки и уязвимости бывают везде. Хотя ваш выбор скорее из разряда Неуловимого Джо, под который никто специально искать уязвимости и делать эксплоиты не будет.
Спасибо вам! До этого использовал бородатый Foxit Reader, думая что «хо-хо пусть ловят вирусы использующие Acrobat». Обновился.
Под Windows есть ещё неплохой просмотрщик — Sumatra PDF,
он бесплатный, простой, быстрый, лёгкий и опенсорсный (GPLv3).
По функционалу не такой навороченный, как Adobe Reader, но просто для просмотра большинства PDF-документов его вполне достаточно.
НЛО прилетело и опубликовало эту надпись здесь
Так не честно :)
а теперь внимательно прочитайте мой комментарий.
НЛО прилетело и опубликовало эту надпись здесь
Это внутри компании, тут все понятно. Как быть снаружи?
Зачем держать один и тот же текст в куче форматов? Ну я понимаю, когда действительно нужно переслать что-то в неизменном виде, но это требуется редко по моему опыту. Зачем заморачиваться? PDF не панацея, один из вариантов.
Думаю, одна из основных причин российской нелюбви к PDF – «здесь так не принято».

Нет — думаю вы не угадали. Основная нелюбовь к PDF в россии — платность официальных инструментов для его создания. Сейчас-то можно найти массу бесплатных аналогов Adobe Acrobat — но поезд ушел. Вообще, как мне кажется, компании, занимающиеся придумыванием своих собственных форматов с целью их коммерциализации, хуже пиратов, ворующих ПО. Потому что любое препятствование развитию стандартов, и любая их коммерциализация тормозят прогресс. И вот это вот перетягивание одеяла в форматах документов, кодеков и т.д. уже изрядно надоела всем пользователям. Поскольку это все вносит лишь путаницу и неразбериху.

Верится, что PDF постепенно завоюет широкую «бытовую» популярность. Всё-таки это формат, с которым спокойнее, «стандартнее».

Нет — не завоюет, пока будет оставаться закрытым стандартом. Будущее — за открытыми (бесплатными) стандартами.
PDF открытый (и бесплатный) стандарт.
Да… Это я пропустил. Действительно в 2008 стал открытым стандартом.
ru.wikipedia.org/wiki/PDF — «с 1 июля 2008 года». Как в анекдоте «ложечки-то нашлись, но осадок… осадок остался».
Ну да. Я именно в таком ключе и хотел написать. Стать-то он стал, но вот wow-эффекта уже не получилось — точка входа на рынок была утеряна. И все кто не любил его раньше за платность, продолжили его «не любить» по инерции.
я вот не понимаю, зачем нужно было в профиль заходить. не уж-то я не пойму, кто это сделал, если:
1. комменты пишу раз в неделю и понятно «за что»;
2. минус пришел меньше чем через минуту после публикации поста, что намекает на человека которому пришло оповещение об ответе.
трусливое быдло не нашло что ответить и расчехлило анус
Я вот тоже замечал, что минусуют в карму гораздо охотнее, чем плюсуют…
Негатив всегда выражают охотней. Такова психология человека.
Я вам плюсанул карму для восстановления душевного равновесия. Так что не ищите того, кто минусанул — я его нейтрализовал :)
Открытость в данном случае не единственное условие популярности. Ради сохранения обратной совместимости формат просто немыслимо усложнён. С doc/xls/ppt такая же проблема — именно из-за этого MSOffice 2007/2010 далеко не всегда корректно справляется с «родными» документами (речь именно о doc/xls/ppt, а не docx/xlsx/pptx).
так и docx = ooxml открытый и бесплатный, разве нет?
PS открытее и стандартнее
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Регулярно открываю doc в OOo, и заметил, что разъезжаются в основном криво отформатированные документы — такие, которые при малейшей правке и в самом ворде разъедутся.
НЛО прилетело и опубликовало эту надпись здесь
> (Есть люди, которые даже скриншоты в файле .doc шлют)

таких надо убивать, а то начнут размножаться
НЛО прилетело и опубликовало эту надпись здесь
платность официальных инструментов для его создания.

MS Office уже полтора года умеет сохранять в PDF, OpenOffice и того дольше.
сейчас-то можно найти массу бесплатных аналогов Adobe Acrobat — но поезд ушел.

Когда поезд ещё только приходил, была эра лотков с ператками в каждом метро. И в эти времена, громоздкий Acrobat Pro был большинству мне известных даром не нужен (PDF-анкет никто не видел, электронного документооборота с коллективными правками примечаний тоже), вместо него использовали быстрый/удобный/гибкий Fine Print PDF Factory (при этом 4 года назад я видел где-то практически полный бесплатный аналог, да и аналог на открытом ghostscript под виннду давно есть).
Но раньше, как только формат появился — ничего подобного не было. Был только «громоздкий Acrobat Pro», который к тому же и стоил изрядно (по российским меркам). Именно тогда, думаю, и были заложены основы расовой ненависти к PDF :)
Когда формат только появился, он был нужен только для чтения манов к матплатам. Думаю о том, чтобы в него сохранять, тогда никто даже не задумывался.

PS: минусанул не я.
У нас как раз любили платный софт, когда его можно было получить бесплатно ;) Вспомнить хотя бы Opera. Хотя у нее действительно были достоинства, но как-то нелюбви и осадка от того, что она была платной не осталось.
Скорее, наоборот — всеобщая любовь к ворду вызвана его пиратской бесплатностью.

Западная же любовь к PDF порой напрягает — многие фирмы любят выкладывать любые данные в pdf, хотя можно обойтись простой html-табличкой.

С чего вдруг платность кого-то останавливала? Или Windows получила широкое распространение из-за бесплатности?!
> хуже пиратов, ворующих ПО.

ПО воруют не пираты, а воры. Но если это с компанией случилось, то это почти полностью её проблемы. VCS и бекапы никто не отменял.
>Основная нелюбовь к PDF в россии — платность официальных инструментов для его создания.

В России платность софта проблемой стала совсем недавно, буквально год-полтора назад, так что тут явно что-то другое.

Проблема на мой взгляд в том, что Ворд у офисо-домохозяек — универсальная программа для всего. Нужно переслать картинку? Вставляем в Ворд. Нужно написать е-мейл? Пишем письмо в Ворде и аттачим к пустому е-мейлу. Кого-то после этого удивляет, что даже [i]книги[/i] в России распространяются в doc-е?
Тьфу блин, когда уже введут редактирование комментариев? Мозг не всегда успевает переключаться между разными разметками для разных форумов :)
Увы. Когда я прийдя на новую работу (не IT) и получив новый комп с виндой, но без офиса, молча поставил OpenOffice и стал работать, это всех устроило. Но когда я стал сохранять сделанные в нём прайсы в PDF (ибо надеяться что наши партнёры откроют ODT/ODS было бы вообще нелепо) и рассылать партнёрам, получилось что 90% из них тут же пишут в ICQ (ещё один СНГ-шный атавизм) директору «а можно в ворде?», в результате чего мне запретили слать PDF и купили MS Office.

Позже, помогая по скайпу одному из парнёров открыть PDF-файл, я узнал что по де фолту он у них открывается… в фотошопе! (где с русскими кодировками у них большие проблемы).

Недавно мне мама (живущая в россии) сказала что даже DOCX в большинстве контор (отнюдь не в деревне, а в «культурной столице») открыть не могут и требуют просто DOC.

Сколько ж можно…
> по де фолту он у них открывается… в фотошопе!

ещё один СНГ-шный атавизм — фотошоп на каждом офисном компе.
Ну и что, что он там не нужен и на 5% своего функционала, но на халяву же, не жалко.
Фотошоп — самая дорогая программа для захвата скриншотов :)
Одна из бесплатных программ ;)
А что мешало экспортировать «прайсы» в вордовском формате прямо из ООо?

За прайсы в PDF, посылаемые неоднократно и с особым цинизмом, я бы просто уволил. Сабж значит, что человек просто никогда не работал с прайсами сам. Минимум — втык, неделя за спиной менеджеров по закупкам (за свой счет) и предупреждение, максимум — увольнение за тупизну несоответствие должности.

P.S.
Ничего личного, просто недавно нам прислали прайс на 3000 позиций — в PDF, а другого у них, цитирую, «нет» :)
Все тётеньки в бухгалтерии знают что такое ворд и эксель, но про акробат ридер и пдф слышать не слышали. Соотв. что бы им его отправить надо сначала объяснить что это такое.

P.S. Тетенька в бухгалтерии = абстрактная единица отечественного производства. В роли этой единицы могут выступать так же и другие сотрудники
А потом выслушать кучу вопросов — ой, а почему я не могу скопировать текст? ой, а почему я вот здесь не могу дописать ещё 2 слова и т.п.
А с этим-то какие напряги??? Тётеньки из бухгалтерии могут «скопировать текст» или «дописать ещё 2 слова» во всяких приходящих к ним счетах и прочих бумажных документах? Прямая аналогия, понимается с полунамёка. Или вы как-то не так объясняете? Так дело не в тётечках тогда.
Знаете, а я спокойно открываю любой xls или doc, совсем не парясь о проблемах с безопасностью. Казалось бы, при чём тут линукс?

PS Кто сказал, что PDF нередактируемый формат?
А причём тут линукс?
Наверное (это гипотеза) при том, что там doc открывает пачка софта кучи версий, и писать эксплоит под конкретную версию слишком скучно.

Не говоря уже про PDF.
При желании и ELF редактируемый формат. А PDF не предназначен для редактирования в стиле офисного документа. Нет там абзацев, заголовков, счётчиков разделов. Вставить или удалить страницу, вставить watermark — практически предел возможностей, доступных обычному пользователю. Конечно можно найти конвертер и перегнать PDF в .odt или .doc, но это равносильно декомпиляции бинарника (в обоих случаях результат далёк от того, что хотелось бы видеть).
PS Кто сказал, что PDF нередактируемый формат?

PDF — формат, не предназначенный для редактирования.
Плюс еще и читалка PDF сразу есть. И установкой софта для «тетенек из бухгалтерии» можно не заниматься.
Формат российского документооборота — это вообще больная тема.

Десятки тысяч российских компаний/организаций (в том числе государственных) ещё с 90-х годов привыкли использовать на халяву нелицензионный MS Office (как и MS Windows), поэтому до сих пор считают в порядке вещей выкладывать на сайте и высылать партнёрам/клиентам документы в проприетарных форматах MSO. Хотя это совсем ненормально.

Считаю, что давно пора на государственном уровне (в рамках того же федерального проекта «Электронное правительство») жёстко регламентировать формат электронных документов, которыми обмениваются гос.органы, и которые предоставляются от гос.структур гражданам.

Например:
1) Информация на сайтах должна быть в текстовом формате (HTML) — чтобы всё индексировалось поисковиками.
2) Все документы, предназначенные для ознакомления, (правила, положения, инструкции, регламенты, приказы, распоряжения и т.п.) кроме HTML-формата должны дублироваться в виде PDF-документов. Причём это должна быть не просто отсканированная картинка, вставленная в PDF, а нормальный searchable PDF, где можно выделять и копировать текст, делать полнотекстовый поиск и т.п.
3) Все документы, предназначенные для заполнения, (бланки, квитанции, анкеты и т.п.) предоставлять в виде редактируемой PDF-формы, где жёстко заполнен текст названия граф + оставлены поля для заполнения пользователем с последующим сохранением или распечаткой.
4) Все документы, которые предназначены для последующей правки получателем, (например, черновики каких-то документов) выкладывать в открытых форматах типа ODF (ну или в редких случаях в TeX), но никакой проприетарщины.

Вот наведём порядок с документообменом в гос.организациях, тогда и остальные подтянутся.
давайте петицию писать, хорошо расписали.
НЛО прилетело и опубликовало эту надпись здесь
ох видал я некоторые формы для заполнения в pdf от любимых госорганов, для которых с особой тщательностью требовалось подбирать версию Adobe Reader чтоб они нормально работали, не говоря уж о полной беспомощности foxit в некоторых случаях.
Да и с проблемным копированием русского текста из pdf думаю все сталкивались и до сих пор такие проблемы есть.
Так что не все тут безоблачно и проприетарные форматы иногда использовать быстрее и удобнее в силу своей распространенности.
ох видал я некоторые формы для заполнения в pdf от любимых госорганов, для которых с особой тщательностью требовалось подбирать версию Adobe Reader чтоб они нормально работали, не говоря уж о полной беспомощности foxit в некоторых случаях.
В дополнение к заполняемым PDF-формам все заполняемые клиентом анкеты/бланки можно продублировать в виде онлайн веб-формы на сайте. Пользователь в онлайне заполняет в веб-браузере все поля, потом жмёт кнопочку «Сохранить документ» и ему на серверной стороне генерируется обычный PDF-документ (разумеется, с возможностью поиска/выделения теккста), который пользователь уже может сохранить/распечатать/переслать.
> 4) Все документы, которые предназначены для последующей правки получателем, (например, черновики каких-то документов) выкладывать в открытых форматах типа ODF (ну или в редких случаях в TeX), но никакой проприетарщины.

Или OOXML? ;)
Спасибо, но нет.
3 и 4 пункт пожалуй слишком резко — предлагаю как как рекомендуемые сделать.
А так да, соглашусь.
Ну и накой надо в pdf делать формы? если надо заполнить — должна быть нормальная форма на html.
pdf на таких сайтах нужен только для печати, да и то печать можно и с html нормально сделать.

документы сохранять — плохая традиция. В них могут быть обновления и правки. По ним можно искать и делать перекрестные ссылки. Любой поисковик прекрасно справляется и находит нужный фрагмент, что не скажешь о поиске в файле.

На самом деле проблема не в том как выкладывать документы, а в том как их хранить на сайте. В конце концов можно сделать экспорт налету. А вот сделать документ для редактирования, поддерживать его актуальность с версионностью, держать перекрестные ссылки и прочее — я лично не знаю как эту проблему решить просто. И видимо не я один, поскольку ходят доки в чем попало.
НЛО прилетело и опубликовало эту надпись здесь
Ну так — взяли и заполнили форму, а потом распечатали. С сайта.
А правильный backend подставит кучу значений по номерам документов и историю работы, например.

Но по хорошему печатать и не нужно — заполненная форма должна упасть на рассмотрение офицеру УФМС, отправиться в ФСБ на проверку и прочие действия, необходоимые для данной активности. А о результате должны известить. И человек приходит уже за паспортом в назначенное время.

А бумагу надо экономить :)
> Ну и накой надо в pdf делать формы? если надо заполнить — должна быть нормальная форма на html.

Про HTML формы согласен, я об этом немного позже тоже написал.
На сайте — онлайн форма, плюс вариант для загрузки PDF для тех, кто захочет заполнить форму в оффлайне.
В PDF обычно загоняем инструкции по использованию внутренних сервисов и внутренние документы (в примеру, заявки на приобретение). К сожалению, так у нас делают не все…
К сожалению, не все PDF одинаково полезны.
Большинство PDF-документов, которые мне присылали по внутрикорпоративной почте, оказывались отсканированным бумажным документом, который в виде картинки вставлен в этот PDF. Т.е. никаких тебе чётких шрифтов, никакого полнотекстового поиска, никакого выделения и копирования текста из документа.

Такой PDF нам не нужен!
НЛО прилетело и опубликовало эту надпись здесь
Не pdf-ом единым. Есть многостраничный Tiff от Microsoft.

Берете Office 2003-2007 (в 2010-м уже вырезали из-за уязвимостей формата), устанавливаете дополнительные компоненты, а точнее Microsoft Document Imaging. Увидите в «Пуск» — «ПО» — «Microsoft Office» — «Инструменты Office» два ярлыка MS Document Scanning и MS Document Imaging.

Первый сканирует в tiff + делает распознавание текста внутри для индексации и поиска.
Второй — просматривает многостраничные tiff'ы.

Плюсы:
1) Эти компоненты ничего не стоят, если есть MS Office. Но они делают полноценные оптические копии, откуда можно копировать куски текста, где можно подвешивать балуны с пометками и т.п.
2) Многостраничные tiff'ы пролистываются любыми графическими смотрелками.
3) Результат так же растровый, хотя защита файла в pdf покуче устроена. В жизни лди не заморачиваются, пихают все в архив и на него ставят пароль.

До какого-то уровня это все живет, но на мощном поточном вводе оптических копий (страховые, медучреждения, соцслужбы) аналогов PDF нету. Фреймфорк технологий Adobe Lifecycle это неплохо, очень неплохо. Только от 500 килоуе на механизм получается ;)
pdf не растровый формат
буквально сегодня столкнулся с невозможностью просмотра и печати многостраничных tiff'ов в убунте. Пока решилось костылем через wine. Pdf как то удобнее всетаки ;-)
НЛО прилетело и опубликовало эту надпись здесь
может быть вы неправильно меня поняли. Менеджеру приходят по мылу многостраничные тифы. До этого приходили всегда пдфки. так вот — «стандартными» средствами в убунте вы не просмотрите и не распечатаете многостраничный tiff. Стандартная смотрелка в убунте — evince. Смотри и печатает только первый лист в tiff'e. PDF куда как удобнее…
НЛО прилетело и опубликовало эту надпись здесь
манагеру бы это объяснить :D
Хранить текстовые документы в растре? Да вы извращенец!
Хоть обминусуйтесь. Сканировать pdf != создавать его из документа путем виртуальной печати.

Еще раз. Я писал про создание электронного архива отсканированных документов. Дешевле описанного пути его не сделать. ABBYY pdf transformer или Finereader дают возможность распознать текст и пожать фон в скане, но это опция.

К вящему сожалению остальных ответивших, в России убунту среди бизнес-пользователей не распространен, а самому умному, взявшему приз про «растровость» pdf прошу попробовать отсканировать договор с подписями и печатями в векторе. И доказать, что это скан с оригинального.
А вообще что этот скан докажет?
Скан практически идентичен ксерокопии. Со всеми вытекающими. Где-то проканает, а где-то нет.

Предлагаю не отклоняться. Я занялся передергиванием, получил в ответ. Предлагаю считать исчерпанным ;)

Просто неприятно, когда люди читают поверхностно, а минусы ставят очень даже в репу.
по моему изначально говорилось об электроном документообмене
если исходный вариант — растр, то тут можно и tiff. Хотя в него вообще ничего не запихнешь из метаданных
Вообще носитель в ЭД не суть важен. Важно удостоверить подпись. Ведь отчеты в налоговую сдают вообще сразу в виде файла нужного ФНС формата. А для подписи — ЭЦП. Потому считаю, что статья относится больше в формату обмена документами, чем к ЭД.

А по жизни если, то что pdf, что tiff нафик никому не нужны, если не надо защищать тело документа от изменений. Собственно, и бумажные служат примерно для того же.

Потому если нет подписи — экспорт, есть — скан.
В 2010 просто сохраняете как PDF и не заморачиваетесь :)
а) Вплоть до последней лет не существовало возможности сгенерировать PDF-документ из стандартных офисных пакетов, кроме как приобретая монструозный Акробат.

б) PDF-неизменяемый формат, а значит, _исходники_ документов всё равно придётся хранить в редактируемом формате. Зачем? Да зачем угодно, например, чтобы использовать как шаблоны для последующих документов (не говорите, что это делается другими способами:) ВСЕ делают это именно так) или чтобы внести быструю правку по результатам переговоров. А если так — зачем делать ещё один формат того же документа?

PDF хорош для публичных неизменяемых оферт и прочих документов, выставленных на всеобщий показ. А для документоОБОРОТА — он элементарно неудобен. Всё равно что в jpeg-ах документами обмениваться.
> стандартных офисных пакетов

Напомните-ка, каким стандартом (может даже ГОСТом?) у нас регламентируются «стандартные офисные пакеты»?
Распространённый — не значит стандартный.
Вы тролльте, тролльте. Если бы этот троллинг что-то менял, я бы тоже им занялся:)
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Cтандартные? Поддерживающие докменты международных стандартов
ISO/IEC 26300. — для документов OpenDocument
ECMA-376 ISO 29500:2008 — для документов Office Open XML
ISO 32000 — для PDF
Стандартный формат документов и стандартное приложение — это совсем не одно и то же.
НЛО прилетело и опубликовало эту надпись здесь
Вплоть до последней лет не существовало возможности сгенерировать PDF-документ [...]

sourceforge.net/projects/pdfcreator/files/ — релизы с 2002.
Я в курсе (и, кстати, РЕЛИЗ у него — 2010-й). Речь не о том, не надо делать вид, что не понимаете.

Во-первых, MS-Word-based электронному документообороту гораздо больше лет, чем любой утилитке по экспорту в PDF. А корпоративные стандарты/привычки так просто не меняются. Во-вторых, легальная (!) работа с PDF до последнего времени была возможна только с благословения Адоба.
А почему этот самый MS-Word-based документооборот стал нормой? Разве не из-за шаговой доступности пиратского ПО? Так что, грубо говоря, в то время было на самом деле не важно, что именно пиратить. Но пиратили именно Windows и Office.
Раз было все равно что пиратить, но пиратили именно офис — не значит ли это, что форматы ворда-экселя банально удобнее для большинства пользователей чем пдф?
Для питона есть библиотека reportlab. Создавать в ней сложные pdf-ки та еще пытка и ресурсов сервера жрет много. Поэтому я против pdf формата.

Также пользуюсь на десктопе линуксом, поэтому недолюбливаю всю продукция Adobe.
То есть, вы считаете, что формат плох просто потому, что в этом мире существует медленная и сложная библиотека для работы с ним? Может png тоже пхолой формат, так как из brainfuck его сложно генерировать?
Нет, потому что Adobe не стремиться делать простые и понятные открытые форматы и кроссплатформенные приложения. Что flash, что pdf, что photoshop.
Добавлю ещё, что сам PDF как формат, мягко говоря, со странностями, что хорошо понимает каждый, кто хоть раз пыталдся его хотя бы программно распарсить. А уж его вечные глюки с кириллицей и изначальная неюникодность (только в последних версиях что-то сдвинулось) знакомы и простым юзерам.
По-вашему doc или docx лучше?
Скажите, я где-то писал, что doc лучше? Или даже odt? Вы правда не понимаете, чем отличается pdf от doc? Блин, зачем задавать заведомо бессмысленный вопрос? Вот мне правда интересно, ответьте пожалуйста — зачем?

Моё мнение — в настоящее время не существует нормального современного финишного формата документов. Структурированного, с нативной поддержкой юникода, с поддержкой современных функций шрифтов, с криптофункциями наконец — не существует. Эту функцию очень криво и тяжело пытается исполнять PDF — со всеми своими устарелостями и корявостями это ЕДИНСТВЕННЫЙ финишный формат документов. Глупо отрицать его распространённость и важность, но как формат он очень плох, он содержит в себе жуткую смесь стандартов разных эпох, для генерации требует гигантского объёма подключаемого кода — тем не менее, это всё что мы имеем. OSS-сообществу этот рынок, вероятно, не интересен, поскольку ни одной альтернативы я до сих пор не видел.

Чем и когда лучше doc/docx/odt/tex/etc — я написал в п. б) постинга, с которого началась эта ветка. Тем же и тогда же, чем исходники программы лучше её скомпилированного бинарника. Что совершенно не означает, что бинарники не нужны.
Вы считаете, что сообщество может придумать новый формат, удовлетворяющий этим требованиям? Меньше, чем 2-3 года до первого черновика не пройдёт (иначе получится docx). А потом нужно учесть все замечания и комментарии. От кого их получать? Хорошо бы не только от других членов сообщества, но и от компаний, им ведь нужно будет внедрять поддержку этого формата. Как этого добиться? Даже пусть выйдет финальная версия спецификации. Нужно написать конвертер, просмотрщик, печатальщик и очень желательно — библиотеку для работы с этим форматом. К этому моменту пройдёт лет 10. Будет ли формат современен, востребован к тому времени или будет вновь представлять жуткую смесь?

Пока все принтеры понимают PS — PS-based форматы будут основными.
а) Думаю, может.
б) Кто же говорит, что будет легко? Естественно, непросто и небыстро. Тут другая проблема — всё, что касается работы с документами, в OSS находится на совершенно зародышевом уровне… Что грустно. Не надо радостьно приводить в пример OpenOffice — все мы знаем, откуда у него ноги растут — НЕ из сообщества. Хотя, думаю, тот же Гугл с удовольствием поддержал бы стандарт, позволяющий отвязаться от адобовского docflow (и привязаться к гуглодоковскому:)). Пока они на издательское дело не замахивались…
в) PS велик, спорить не буду. Но и принтеры эволюционируют. И драйверы к ним.
а вот вроде микрософт пытался делать свой аналог пдф, у них тоже плохо получилось?
Спасибо! Интересно, мне он до сей поры даже не попадался…
любопытно будет потом узнать, что вы о нём думаете
А мы, вроде, на ты были?:)
я уж и забыл, давно не общались: )
НЛО прилетело и опубликовало эту надпись здесь
Может быть, нужно его иногда индексировать или даже, страшно сказать, генерить? Думаю, глупо напоминать профессионалу о том, что не всегда мы вольны выбирать форматы, с которыми приходится работать.
НЛО прилетело и опубликовало эту надпись здесь
Вы это гуглу расскажите, яндексу… ну и прочим умным ребятам. Мне можете не рассказывать:)
Вообще в pdf можно вставить при генерации информцию, которую как раз удобно индексировать
НЛО прилетело и опубликовало эту надпись здесь
Да я не спорю. Вообще считаю что документооборот должен быть текстовым, без форматирвоание: только синтаксическое форматирвоние

Но индексировать pdf можно, если позаботится об этом при генерации. Что полезно, например, при выкладывании pdf в сети
Что-то у меня сквозняк в голове, напомните, плиз, названия форматов. А так я за кошерный html.
НЛО прилетело и опубликовало эту надпись здесь
Я полагал TeX «исходным» форматом.
А как конечные форматы мне нравится: html+svg и postscript.
Но это только имхо.
НЛО прилетело и опубликовало эту надпись здесь
Зато в pdf все детально описано
Вообще достаточно давно существовали эмуляторы принтера в PDF.
В большой конторе, в которой я работал ранее, pdf уже давно был стандартом для обмена, хотя все имели офис. А наружу так вовсе полиси закреплен как единственно возможный стандарт для документов. Но Акробат стоял дай бог у десятка людей из тысяч. Visio и Project и то ставили чаще.
Ждём принятия в России ГОСТ Р ИСО/МЭК 26300.
Не смотря низкую компьютерную грамотность, PDF документы постепенно начинают использоваться в электронном документе обороте. Но активное использование начнется только тогда, когда создание PDF документов станет таким же простым как сохранение файлов. И стандарты здесь мало чем помогут, нам до стандартов еще очень далеко.
OpenOffice — кнопка на панели инструментов «Стандартная». Куда уж проще??
у меня нет статистики какой процент в России и СНГ используют OpenOffice, но я почему уверен что этот процент совсем маленький.
Поэтому все-таки создать обычному пользователю PDF документ не совсем просто.
Для Микрософт Офиса сейчас есть надстройки для создания PDF, но кто у нас будет сам себе устанавливать?
Возможно 2010 офис уже умеет сохранять PDF
Когда за MS Office придется платить всем, процент использования OO сильно вырастет.
PDF не стандарт в России.
А все потому, что Adobe Reader тормозит.
Очень странно в блоге ABBYY читать такой флеймо-генерящий постинг. Почему-то очень сильно «попахивает» скрытой рекламой ABBYY PDF Transformer.
Для разных целей используются разные форматы электронных документов.
PDF — это формат, который изначально разрабатывался как финишный, про это выше уже было сказано. Он по своей сути был расчитан на неизменность. У нас же чаще пересылают по электронной почте, как правило, документы для согласования, т.е. драфты. Использовать для этой цели PDF будет только… (ммм, как бы сказать, чтобы никого не обидеть...) технически не грамотный человек. А когда документ согласован, его подписывают на бумаге и уже в этом виде хранят. Перспектива перехода на электронный документооборот очень не радует, ибо в российских реалиях это только увеличивает кол-во бумажек. Потом, у нас так и не получила нормального распространения «электронная подпись», а без нее какой документооборот?
Про это не знают в ABBYY? Знают…
Пост родился по результатам внутреннего семинара Учебного центра по PDF.

Да, семинар назывался “Формат PDF и ABBYY PDF Transformer”. При подготовке семинара я обратилась в маркетинг ABBYY HQ за англоязычной презентацией по формату PDF. А оказалось – её не готовили: не надо никому в Европе и Америке про формат PDF рассказывать. Всем всё очевидно, и PDF Transformer идет на ура без пояснений, где используется PDF. Везде. (Собственно, это в посте и написано).

А на московском семинаре сам PDF Transformer занял 20 минут, а дискуссия по PDF – вылилась в два часа. Потому интересно было узнать мнение хабровцев, почему в плане распространения PDF наша страна такая отличная от других.

>>У нас же чаще пересылают по электронной почте, как правило, документы для согласования, т.е. драфты.

У нас пересылают все то же, что и не у нас.
> У нас пересылают все то же, что и не у нас.

К сожалению, это не совсем верно. У «них там» внутренний электронный документооборот предприятий развит гораздо лучше. Многие документы вообще никогда не бывают представлены в бумажном виде. Они рождаются в электронном виде, проходят все этапы направления, визирования, согласования и подписания в электронном виде, поступают на исполнение в том же электронном виде и архивируются всё так же электронно.

Т.е. замкнутый цикл, где документ ни разу не распечатывается и вообще не покидает систему электронного документооборота. В такой среде внешний документ используется только в информационных/ознакомительных целей, потому PDF всем достаточно.

А в России же до сих пор «без бумажки ты букашка». Многие документы изначально оформляются исключительно в бумажном виде, подписываются от руки (печать, подпись), если пересылаются, то либо курьером, либо заказным письмом, либо в виде факса или отсканированного изображения (TIFF, JPEG или растровая вставка в PDF или DOC/DOCX). Цифровое подписывание развито крайне слабо. И архивируют/копируют документы в итоге тоже в бумаге (ксерокопия, распечатанный скан и т.п.).
При таком раскладе любое цифровое представление документа — это не основной его экземпляр, а просто побочная промежуточная копия.

В таком каменном веке, где до сих пор главенствует бумажный документооборот, и не удивительно, что «документ в электронном виде» чаще выглядит как скан бумажного документа.
Ради интереса немного помониторил текущую работу офиса, в котором сижу (филиал международной компании):
1. Маркетинг перекидывается е-маейлами, презентациями и мультимедиа-файлами.
2. Продажники — таблицами в Excel по е-мейлу
3. Продуктовый департамент — если и получает PDF, то типа, с перечнем характеристик продуктов.

А вообще вся внутренняя информация гуляет по интранетовским сайтам, а не в виде документов.
Что касается стандартов в России, не тот менталитет, причем везде и всюду.
Русский человек творческий, ну и наша инертность. Это тоже касается всех и власти и мужика, который пока не грянет гром.
Так что трудно и дорого в России проталкивать стандарты.
Вдруг документ на финикийском или древнеегипетском, тут поможет PDF. (Графика вместо текста?)
Никто не пользуется pdf. Конечно, хочется смотреть светлым взором в будущее, но пока это только doc (даже не docx). Иначе рискуете столкнуться с проблемами по срокам, иногда все равно придется пересылать именно документ в Word (и тут еще неизвестно, что было бы проще, создавать изначально в doc или перегонять из pdf). Простите, но бизнес не готов разрывать отношения с партнерами только потому, что они первый раз видят расширение pdf. Можете обвинять меня в консерватизме, но это практика. Даже jpg лучше. Кстати, в doc также можно запрещать редактирование содержания.
Мы давно перешли во внутренней доументации на PDF, очень удобно. Потихоньку начинаем переводить документооборот с партнерами.
НЛО прилетело и опубликовало эту надпись здесь
Работаю граф. дизайнером. Последнее время примерно 50% макетов отправляю заказчикам на согласование в PDF — и доволен. Если уверен, что печатать им его не надо даже для себя, смело ставлю пароль на печать, чтобы неоплаченные макеты не попадали им в готовом виде.
Особенно удобно для многостраничных доков вроде каталогов — можно посмотреть отдельно обложку, развороты все рядом, навигация по закладкам и т. д. Бонусом заказчик получает такой же каталог не только в печатном виде, но и в электронном, и может разместить его на сайте — все довольны. Дело одной минуты сконвертировать хоть из корела, хоть из иллюстратора, хоть из индизайна. Даже из 2010 ворда — легко. Некоторые также приносят на печать в экселе листовки %) — хрен разместишь даже две на лист. Сохраняю как PDF — импортирую в любую печатную программу. Проблемы бывают, но поправимые. Собственно, для меня PDF стал незаменимым.
Если уверен, что печатать им его не надо даже для себя, смело ставлю пароль на печать, чтобы неоплаченные макеты не попадали им в готовом виде

Пароль на печать это всего-лишь бутафорский замок. Если напечатать захотят, обойдут без проблем. А при наличии растровых изображений защитить макет от печати очень просто, достаточно выставить достаточно сильное сжатие и downscale для них. Тогда напечатать то смогут, только выглядеть это будет не очень хорошо.
Собственно, для меня PDF стал незаменимым.

Для того, кто использует адобовские продукты по назначению, неудивительно :) Сейчас и в типографию PDFки отправляют, раньше обычно PS для этого использовали.
А при наличии растровых изображений защитить макет от печати очень просто, достаточно выставить достаточно сильное сжатие и downscale для них.
Работу графических дизайнеров как раз и оценивают по макетам. Сильное сжатие и потеря качества растра может привести к тому, что макет будет смотреться очень непривлекательно. Для дизайнеров это не вариант.
На мониторе рассматривают? ;) 96 DPI для растра и при 100% масштабе на мониторе все будет выглядеть вполне не плохо. А вот на печати уже хуже. С сжатием конечно не стоит перебарщивать, но оно так же будет заметнее проявляться при печати.
Бывает, что растр нужно показать в хорошем качестве. Бывает, что его вообще нет в макете. Ясное дело, что пароль — тут не панацея. Но все же это одна из полезностей формата, кроме перечисленных в статье. Заказчики в основном не очень грамотные в этом деле, пароль для них — хоть какая-то преграда. Все же это нечасто приходится применять, не думаю, что сто́ит так обсуждать. Бо́льшая часть заказчиков постоянные, так что чаще нет необходимости в пароле, просто доверие.
Заказчики в основном и не сами за печатным станком стоят :) Могут передать в типографию, сказав что потеряли оригинал и спросив, смогут ли из этого файла напечатать, там уж как повезет.
Я просто сам работал в издательстве, заказчиками кидали пдфки сделанные индизайном с профилем для веб. Жалоб не было. И пдфка получалась не очень большая.
Резюме отсылаю в pdf; проекты документов, подразумевающие правку получателем — в rtf. Оригиналы храню или в odt, или в гуглдокс. Жаль гуглдокс не распространён, а то бы посылал просто ссылки :)
Мне кажется вопрос «почему у нас не получило распространение pdf» сродни вопросу «почему в России так любят оперу и icq»…
Потому что. Исторически сложилось.
ну, всё-таки опера лишняя в этом списке — она хорошо экономит трафик, что нравится многим владельцам gprs/edge или ещё дайлап интернета. а нормальный интернет в России есть только в городах.
Ненавижу PDF.
PDF сам по себе ни в чём не виноват.
Просто он был разработан для печатных документов. И главная цель при его создании была — сохраните неизменным форматирование. Но неизменное форматирование на разных устройствах — это неудобно. Мне неудобно читать текст, разбитый на страницы, с фиксированной шириной строки. Мне неудобно читать текст, напечатанный неприятным мне шрифтом. Этот ряд можно продолжать очент долго.

Теоретически, вероятно, все проблемы разрешимы. А на практике мне приходится ежедневно читать PDF от вполне уважаемых фирм — Intel, SUN, Oracle, HP — в которых качество иллюстраций просто не позволяет прочесть поясняющие надписи. Текст из которых невозможно адекватно скопировать (в лучшем случае в кашу превращается форматирование, в худшем — копируетс какая-то криптограмма). Которые трудно разместить в окошке на экране (да, у меня экран 24", 1920×1200, но там есть много другой информации, которая тоже важна! Я могу открыть документ на весь экран, но это не удобно!).

Если я получаю от поставщика счёт не в PDF — я могу добавить или убрать строки или колонки, посмотреть, что получится при изменении состава заказа, могу скопировать часть в другой документ, где свожу вместе предложения от их конкурентов, или, скажем, веду некую свою статистику.

А ещё не редкость, что автор документа просто идиот, и не его документ смотреть больно от сочетания цветов и приёмов форматирования. Или, что реже — что идиот — автор их корпоративного стиля. Идиотов вообще большинство. Пересылка в редактируемом формате превращает жуткие гвозди в голове в мелкое безобиное чудачество, которое справляется в течении нескольких секунд.

ненавижу PDF потому что:

1) закрытый формат с проблемами безопасности
2) файлы PDF тормозят, вешают просмотрщики, долго и нудно печатаются
3) программы для него ужасны и монструозны, поделочно-bloatware'ны
4) очень плохо читаются на электронных читалках с экранами 5..6"

нравятся DJVU/PS/OpenOffice/DocBook/CSS/HTML/XML/XSLT
С точки зрения accessibility, а также программ экранного доступа, мне, как незрячему намного удобней Word. Да, можно отправить текстовым слоем, да, есть распознавание, но Word лучше. В OCR могут быть ошибки, на это требуется время. Текстовый слой бывает не всегда. А в ворде можно и по таблицам, и по заголовкам перемещаться через горячие клавиши, в PDF, думаю, такое возможно не всегда. Да и если взять специальные читалки (отдельные устройства) тифло флеш плееры, doc, html, другие могут читать, а PDF — нет.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий