Обновить
Комментарии 22
А что там за комменатрии вообще используются? Вроде есть какие-то просмотрщики PDF, умеющие отображать комментарии, они не там же ли хранятся, где у вас? Вроде Foxit reader (могу путать).
Похоже вы путаете комментарии с аннотациями. Аннотации отображаются и их можно редактировать.
А вот комментарии, как уже в статье упоминалось — наследие PostScript. Согласно стандарту при работе с файлом они игнорируются.
Тогда они при распечатке пропадут, верно? (Представили себе параноиков из службы безопасности, которые не передают документ, а самостоятельно распечатывают его и отдают распечатку. «Мин нет»)
>4.5 Водяной знак в DLP-системах.

Как мне кажется, для полноценной реализации не хватает некоторого условия:
уничтожение водяного знака в файле нестандартными средствами должно уничтожать полезные данные копии.
Почему же? В зависимости от чего защищаемся.
Если от «неосознанного разгильдяйства», то вполне сгодиться.
Если мне не изменяет память, то штатная подпись в ПДФ является неотчуждаемой, если файл защищен от изменения, и тогда и от осознанного, и от неосознанного разгильдяйства штатная подпись поможет лучше.
Если документ защищён и данные не копируются в буфер обмена, то, не говоря уже об использовании «разлоченных» вьюверов, которые плевать хотели на этот запрет, юзер просто сделать PrintScreen и отправит данные картинками.

Причём, если скопированный текс DLP-система хоть как-то может выловить в исходящих сообщениях, то с картинками больше проблем.

Поэтому, фактически, такая защита лишь ухудшает безопасность организации
Существует вероятность, что в тех организациях, где установлена DLP, printscreen работать не будет.
Как обычный юзер я скажу «а камера в телефоне мне зачем»? И это ещё больше усложнит задачу DLP, и ещё ухудшит безопасность ))

А как программер, я сталкивался с «защищёнными» письмами в Outlook. Действительно, Print Screen не работает, если окно с таким письмом на экране. Но ничего не помешало мне выполнить копирование изображения с экрана в Bitmap через BitBlt. Если это отключить, много чего в винде сломается, всякие популярные в начале 2000-х программы с украшалками на стандартных элементах окон, или с полупрозрачностью под окном.

Если сторонний софт не запрещён, то программа типа Fraps может работать.
А как на размер файла влияет такая стеганография?
Увы, т.к. мы вкрапляем комментарий, то размер увеличивается на зашифрованный коммент.

Думали вкраплять данные методом перестановкой obj, но это более сложная задачка — оставили для лучших времен.
На мой взгляд все преимущества сводятся на нет, потому что метка отчуждается. Даже если каким-то неведомым образом нельзя ее просто удалить из комментариев, то можно просто распечатать pdf в pdf (из коробки в декстопном Linux и куча утилит для винды) — и вот у нас чистая копия. Не говоря уже об упомянутом Print Screen.
И да и нет.
У меня есть один знакомый из одной конторы (называть не буду), который зарабатывает на жизнь защитой авторских прав в инете (да-да, это из-за него не всегда можно было скачать в rutrecker'е)…

Так вот, они проводили исследование, оказывается 82% пользователей, которые ищут желаемый контент, бросают поиски после просмотра 5 страниц поиска…

Таким образом если смотреть не с точки зрения «булевой алгебры», а с точки зрения «нечеткой логики Заде», то возможно профит будет.

У нас с ребятами проблема такая: КАК понять, каков у нас %? Если, скажем окажется >70% — то это очень круто!..
Профит в чем? В том чтобы найти тех, кто выложил копию с водяными знаками? После пары инцидентов пираты будут эти знаки удалять.
После пары инцидентов пираты будут эти знаки удалять.
Ну и пускай удаляют. Вопрос не в этом. Вопрос в покрытии.

Есть X подписчиков, из них 0.8 * X вообще никогда не слышало слово «стеганография», а 0.1 * X считают что их и так пронесет.
Итого 0.9 X — прокатит, 0.1 X — не прокатит.
(Цифры 0.8 и 0.1 взяты с потолка.)

+ не вся стеганография = информационное сокрытие. Есть кейсы ИС, в которых не требуется стеганография. Статья называется «Информационное сокрытие в PDF документах», а не «стеганография в PDF документах». Print Screen и пшик стеганографии.
Нативная подпись в PDF представляется в виде структур, которые тоже можно вычленить из документа.
> Самым простым способом пункта 3 являются… комментарии. Вот уж не знаю для кого это оставили;

Комментарии являются неотъемлемой частью документооборота, основанного на PDF.
Используются они примерно так.
Исполнитель отправляет свой документ проверяющему или другому получателю. Тот, не меняя сам текст документа, довешивает к нему комментарии (например, с указаниями на ошибки или со своими предложениями и замечаниями) и возвращает исполнителю или отправляет дальше.
Я не помню уже, позволяет ли стандартный PDF Reader добавлять комментарии, но некоторые специализированные системы документороборота это точно умеют.
Так что использовать комментарии для стеганографии как-то странно.

Надеяться на неотчуждаемость какой-либо информации в PDF с целью контроля за распространением информации по меньшей мере наивно. Всякого рода метки годятся только для подтверждения аутентичности документа (в смысле копия без меток смысла не имеет), но тогда штатный механизм уже вполне себе работает.

Так что в реальности остается только одно применение — сокрытие в документе дополнительной информации.
Почему не редактировать документы в Word, оставив PDF для публикации финальной версии?
geher — вы, как и товарищ Psychosynthesis, вы путаете аннотации и комментарии. Комментарий — элемент синтаксиса формата.
О как.
Я как-то уже привык эти аннотации комментариями обзывать, тем более, что привык к тому, что аннотация — это краткое описание сути документа.
А про комментарии в виде элементов синтаксиса даже не знал.

Чтобы не ждать час.

navion, принципиальной разницы нет. Если документооборот основан на одном из форматов MS Word, или на ODF, механизм использования точно такой же. Защищенный от изменения и подписанный исполнителем документ обычно получателем только комментируется.
А выбор формата определяется либо системой документооборота, либо внутренним стандартом фирмы, либо тем и другим сразу.
В этой статье торчат уши из некоторых специфичных областей в computer science. Из совсем свежего, приведу пример-ссылку на гитхаб: https://github.com/uds-datalab/PDBF. Авторы подробно и четко описывают, что можно с этой технологией сделать, имеются исходники и доки.
Для совсем ленивых, можно скачать вот пдф: http://www.vldb.org/pvldb/vol8/p1972-dittrich.pdf. На самом деле это не просто пдф, но еще и валидный хтмл, а также ova-образ с space invaders :)

Можно использовать этот метод для «тегификации» свободно распространяемых документов. В поисковиках, например, пригодится, ведь почти никто в готовый текст не вставляет облако тегов
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.