Pull to refresh

Comments 25

В некоторых компаниях аналитикам просто запрещено делать в такой базе запросы, которые содержат количество записей меньше определенного порогового значения. Таким образом, анонимность более-менее сохраняется.
UFO just landed and posted this here
Интересно. А как это технически реализовано? Если у аналитика есть доступ к SQL или к написанию кода для MapReduce, то даже поставив прокси сервер, парсящий дерево запроса и дропающий «опасные» запросы (например, делая предзапрос на count(*) на необходимые таблицы с необходимыми условиями, и сравнивая его с порогом), перед СУБД, можно составить запрос, аггрегирующий миллион записей, при этом умножающий значения 999999 из них на 0.
Если же такого доступа нет, а есть что-то вроде уродских блок-схем и программирования мышкой, то да, верю, что, потеряв в перфомансе и возможностях, можно добиться сохранения анонимности, но тем, кто в таких условиях платит аналитикам ЗП, и ждет от них адекватного результата, можно только посочувствовать…
Все запросы логируются
У ИБ будет куча вопросов по каждому запущенному вручную
UFO just landed and posted this here
Сдаётся мне что фраза:
анонимность более-менее сохраняется

полнейший эквивалент: «немножко беременна».-)
Не совсем так. Могут определить какую-то группу людей. Скажем, жителей определенного микрорайона или пользователей провайдера. Вроде и сильно сужается круг по сравнению со всеми жителями Земли (или кто там может быть в датасете) но это далеко не идентификация каждого конкретного человека.
А кому это вообще нужно? С большим успехом можно взломать почту/базу данных/что-то ещё. Конечно, по сравнению с населением Земли, микрорайон будет очень даже конкретным, но дальше процесс если и пойдёт, то довольно туго… Кому это надо?
Кто владеет информацией, тот правит миром. На земле чуть больше 7 миллиардов человек, а значит для идентификации достаточно всего 33 бит.

Если бы кто-то действительно ставил целью дать возможность гражданам обращаться с ПД как со своей собственностью, то для этого бы не требовалось городить весь этот правовой огород. Для регулирования было бы достаточно существующих норм в области авторского права и интеллектуальной собственности.

Очевидно, что данные с возможностью идентификации ценнее, нежели без нее. Задача «защиты» ПД не в ограничении сбора таких данных. Напротив, многие принимаемые законы направлены на упрощение идентификации пользователей. Цель состоит в создании условий при которых массивы данных будут аккумулироваться только на подконтрольных властям территориях и снижении утечек наружу. Вопросы анонимности больше касаются последнего — что, в какой мере и на каких условиях должно раскрываться. Граждане, понятное дело, здесь мимо кассы.
> чуть больше 7 миллиардов человек, а значит для идентификации достаточно всего 33 бит.

Ну это верно только если у каждого человека уникальный сет (set) демографических атрибутов (битов). Что конечно же не так.
Ну, в статье вон пишут, что оперируют базами с 248 атрибутами, причем ещё неизвестно, сколько значений у каждого атрибута. И только для одной страны. С такой избыточностью вычислить можно даже кота и его коврик.

Это только при стабильности атрибутов и уникальности значений, если атрибутов 100500, но уникальных комбинаций 500, то вы неотличимы от коврика (да и для большинства задач не нужно — ну покажут коврику рекламу и ничего страшного, всё равно за неё уже заплатили). Если у вас значения плавают, то сопоставит сильно сложнее (скоращает количество параметров).

Ну или так: чтобы свободными данными не пользовался любой желающий бесплатно. нужна инфа — плати сюда.
Вообще не понимаю, какой смысл защищать ПД от «утечек».
Если ПД утекли (а они утекли, я еще в 2000г. находил свои ПД(паспорт, ОМС и т.п.) в различных «базах» на CD, и я в тех базах был не один) то обратно их не вернешь.
И поменять скомпроментированные данные, мягко говоря, проблематично:
  • Заменить ФИО, адрес и т.п.
  • Поменять все удостоверения личности и т.п.
  • Изменить все документы на «частную собственность».
  • Обновить все заключенные договора.
  • и т.д. и т.п.

Более практичнее ( с точки зрения простого гражданина конечно же), было бы разработать и начать внедрять «систему», которая сделает использование ПД во вред их владельцам невозможным, или хотя бы сильно затруднит.

Ну а так как всем рулят «рыночные отношения», пока будет спрос(на ПД) — будет предложение.
Ужесточение наказания за «кражу» ПД просто увеличит доходы одних и немного уменьшит доходы других участников преступления.
И никуда мы не денемся, с подводной лодки-)
Более практичнее ( с точки зрения простого гражданина конечно же), было бы разработать и начать внедрять «систему», которая сделает использование ПД во вред их владельцам невозможным, или хотя бы сильно затруднит.

Я тоже о таком думал. Например что бы не надо было бояться оставить где-то паспортные данные. Но тут, кажется, немного другая проблема. Связь ваших идентификационных данных и некоторых данных которые бы вы не хотели, что-бы связали с вами. Например, медицинские данные или данные покупок — в том плане что например связать записи из условного датасета о венерических заболеваниях с реальным человеком.

А каким образом можно сделать использование ПД во вред их владельцам невозможным с учётом «рыночных отношений»? У вас прям есть идеи?
Идеи?
У меня есть кое-что получше — алгоритм!-)

1.Надо собрать статистику случаев «неправомерного» использования ПД.
2.Разбить эти «случаи» на категории по признакам «похожести» случаев.
3.Оценить каждую категорию по критерию наибольшего вреда.
4.Взять самую вредную категорию и собрать по ней больше информации по способам «эксплуатации уязвимости» ПД.

Думаю, этих данных должно хватить на первое время, чтобы генерировать идеи-)
Ну не знаю, может быть я пессимист, но по степени реализуемости ваш алгоритм напоминает известный мем:
Step 1. Collect underpants.
Step 2.?
Step 3. PROFIT
Во многом соглашусь с вами, что с подводной лодки деться куда-то сложно. Большинству и не нужно.
Но необходимо иметь инструменты, которые обеспечат возможность быть анонимным тогда и когда захочешь. То есть, «окей, место жительства вы мое выяснили, но съездить и купить себе новую книжку (предположим), а также заплатить за нее полностью приватно, я могу достаточно просто.
Полной анонимности нет, не было и не будет (да и не надо). Даже в нетехнологическом обществе существует человеческая память, которая будет кого-то идентифицировать.
Просто надо дать инструменты для осуществления анонимного взаимодействия между людьми и привить культуру их использования: от темных стекол в такси и ношения масок до использования TOR для входа в сеть и Stegos для платежей и приватного общения.
С какого это ПД должны быть собственностью? ПД это индентификатор. Как название фильма (и уточняющие данные, типа года выпуска). Если названия нельзя будет упоминать в суе без благословления правообладателя, то сильно упростило бы работу с негативными отзывами, конечно. Но обществу такое не нужно.
Если исходить из такой точки зрения и принять, что ПД это публичный идентификатор, тогда зачем весь этот цирк с ограничениями по их хранению и обработке?
Неуловимый Джо неуловим только потому, что он нафиг никому не сдался. Все упирается в цену вопроса! Следы всегда остаются будь они реальные или цифровые. Даже пресловутый ТОР и тот не дает гарантии анонимности. Если кто-то человек/организация/страна очень захотят выяснить личность и найти это будет вопросом времени. (может быть это будет несколько отвлеченным примером, но в 1977 году после теракта в метро буквально из осколков нашли всех причастных)
Тогда уж надо понимать, что и шифрование рано или поздно «хакнут».
совершенно верно. У любой информации есть время жизни и относительно этого надо выбирать шифрование. КАк у военных есть оперативная информация которая устаревает уже через 4..8 часов и для нее нет смысла использовать супер стойкие шифры, достаточно и простого, который хоть и взламывается то происходит это после потери актуальности передаваемого зашифрованным сообщения
Вопрос, какой вред от такого не на 100% подтверждённого деанона. Самая весомая опасность — что медицинские (и не только) страховые компании получат возможность назначать более индивидуальные страховые премии в зависимости от состояния здоровья застраховываемого. Типа везде ругаемого китайского персонального рейтинга, но только в частном порядке и, вроде как, без обязательности применения.
Sign up to leave a comment.

Articles