20 December 2019

Как отслеживают людей по «анонимизированным» датасетам

Дата-центр «Миран» corporate blogInformation SecurityGeoinformation servicesLegislation in ITCellular communication
Утечка данных по всем машинам «Ситимобила» позволяет отслеживать конкретный автомобиль по его координатам. Мы не знаем фамилии водителя или номера, но видим его перемещения. Можете посмотреть в окно — и проверить, откуда приехало конкретное такси и куда оно повезёт следующего пассажира. Представитель компании не считает это проблемой.

На иллюстрации слева — маршрут таксиста, которого отследили по открытым анонимизированным данным. Krupnikas, статья «Как я нашел способ отследить всех водителей ”Ситимобил”»

Сейчас сбором таких данных через мобильные приложения занимаются десятки компаний. Только они отслеживают перемещения не такси, а людей. Всех людей. Совершенно легально.

Вероятно, о большинстве этих фирм вы никогда не слышали, но для их клиентов ваша жизнь — открытая книга. Они видят, куда вы ходите в течение дня, с кем встречаетесь и с кем спите, посещаете ли метадоновую клинику, кабинет психиатра или тайский массаж.

Это не спецслужбы, не корпорации, а обычные компании с обычными клиентами. Не за горами то время, когда вы тоже за скромную сумму в районе $20 сможете заказать полное информационное досье на своего соседа (и наоборот). Давайте посмотрим, какая информация есть у этих фирм.

Журналисты NY Times раздобыли один такой файл от трекинговой компании. Это самый крупный и наиболее информативный массив данных, когда-либо утёкший в открытый доступ. Он содержит более 50 миллиардов местоположений с телефонов более 12 миллионов американцев.



Конечно, это «анонимизированные» данные. Там нет имён и фамилий людей. Но на самом деле это и не нужно. Имена и фамилии хранятся в других базах. А их в любой момент можно привязать. Но до этого момента пользователей уверяют в «анонимности», усыпляя их бдительность. Дата-майнинг этого массива позволяет понять, кто скрывается за каждым «анонимным» объектом. Вы видите людей в Белом доме



и на даче Трампа в Палм-Бич.



В любом здании по любому адресу, даже в Пентагоне.



Очевидно, NY Times приводит примеры таких объектов, чтобы произвести максимальное впечатление на законодателей. В реальности же происходит абсолютная и тотальная слежка за всем населением. Все пользователи представлены как юниты на карте. Единственное, что нельзя обвести их мышкой и отправить на задание.

Файл с более 50 миллиардами записей изучен в рамках проекта Privacy. Каждая запись в базе данных — местоположение одного смартфона. Период — нескольких месяцев в 2016 и 2017 годах. Данные предоставил источник, который попросил сохранить анонимность, поскольку не уполномочен делиться этой информацией, а его компанию могут оштрафовать. Однако источник встревожен масштабом слежки, который ведёт его фирма и её конкуренты — поэтому решил срочно проинформировать общественность и законодателей.

Файл с данными слежки охватывает несколько крупных городов, и там он отслеживает людей практически во всех районах и кварталах, будь то трейлеры нищих пенсионеров или богатые резиденции влиятельных политиков. Файл показывает, кто посещал каждую резиденцию и кто там ночевал (некоторые гости оставались на ночь). В рамках расследования были отслежены посетители особняков Джонни Деппа, Тайгера Вудса и Арнольда Шварценеггера.

Аналогичный трекинг выполняется для любой городской квартиры. Не составляет особого труда определить личность «анонимных» пользователей по конкретному адресу. Нужно понимать, что такая история перемещений собирается буквально на каждого пользователя мобильного телефона. В настоящее время информацию можно получать из нескольких источников. Раньше были только операторы сотовой связи, а сейчас трекинг выполняется через любое мобильное приложение, у которого есть разрешение на доступ к информации о местоположении устройства или если нет такого права. Например, приложение Facebook отслеживает местоположение пользователей даже если запретить это в настройках.


Файл с 50 млрд записей — лишь крохотный кусочек того, что каждый день собирает индустрия по отслеживанию пользователей. Трекинг стал настолько вездесущным в нашей цифровой жизни, что его практически невозможно избежать.

Несколько десятилетий назад граждане США подняли бы вооружённое восстание, если бы государство надело следящее устройство на каждого жителя старше 12 лет. Сегодня 99,9% делают это добровольно.

Неужели коммерческим корпорациям больше доверия, чем государству? Если вы гражданин тоталитарной страны, то это имеет смысл. При условии, что информация хранится за границей — и режим не получит к ней доступ. В противном случае власти могут принудить любую фирму поделиться данными. И тогда сбор информации коммерческими фирмами отнюдь не безопаснее, чем тоталитарная государственная слежка.

Но почему люди соглашаются на эту слежку? Судя по всему, ради удобства современной жизни. Людям просто удобно вызывать такси одной кнопкой по текущим координатам, искать друзей поблизости, видеть коммерческие предложения, таргетированные по координатам: «Соблазн этих потребительских товаров настолько силён, что он ослепляет нас и мы забываем, что есть другой способ получить технологические преимущества без вторжения в частную жизнь, — говорит Уильям Стейплз, директор-основатель исследовательского центра Surveillance Studies в университете Канзаса. — Все эти компании действуют как целый рой, используя разные инструменты для повседневного трекинга».


Некоторые компании из индустрии трекинга. Источники: MightySignal, LUMA Partners и AppFigures

Собирать и продавать эту информацию сегодня совершенно законно в России, США и в большинстве других стран мира. Только внутренняя политика компаний и порядочность отдельных сотрудников не позволяют им заниматься злоупотреблениями — например, следить за бывшей женой или продавать информацию случайным покупателям на форуме.

Компании говорят, что данные передаются лишь проверенным партнёрам. Остаётся только верить на слово в такую корпоративную благотворительность.

Установить личность по истории перемещений легче, чем по ДНК


Исследование в рамках проекта Privacy убедительно показывает, насколько легко производится персонализация данных из анонимизированного датасета. Да, в этом файле миллиарды точек данных без идентифицирующей информации, нет имён и адресов электронной почты. Но связать полную историю о перемещениях с именем конкретного человека проще простого.

В большинстве случаев для этого достаточно посмотреть на домашний адрес и место работы — две точки, где находится смартфон в дневное и ночное время.

Называть данные о местоположении «анонимизированными», как это делает «Ситимобил» и другие — огромное лицемерие. Это совершенно ложное утверждение, которое опровергнуто рядом научных исследований. Все они нашли, что личность человека (или водителя такси) легко установить по истории его перемещений. Учёные пришли к выводу, что действительно точную и длительную историю геолокации невозможно обезличить: «Наверное, только ДНК труднее обезличить, чем точную историю геолокации», — говорит Пол Ом, профессор права и исследователь в юридическом центре Джоржтаунского университета.

Тем не менее, компании продолжают утверждать, что данные являются анонимными. В маркетинговых материалах, на конференциях — повсюду громко заявляют, что данные собираются анонимно, чтобы успокоить людей по поводу столь инвазивного мониторинга.


Перемещения чиновника министерства обороны США и его жены, принявших участие в акции протеста Women's March. Трекинг позволяет идентифицировать всех участников акции, взявших с собой мобильные телефоны

На демонстрационном массиве данных за несколько месяцев журналисты NY Times легко идентифицировали, а потом отследили несколько десятков известных людей. Они проследили маршрут военного офицера с пропуском безопасности, который вечером возвращался домой. Отследили сотрудника правоохранительных органов, когда она вела детей в школу. Наблюдали за влиятельными адвокатами (и их гостями) во время поездок на частные самолеты и курорты.

В данном случае целью журналистов было не выкопать грязь, а лишь задокументировать риски несанкционированной слежки. Но надо понимать, что ничто не мешает отследить точно так же любого из нас, а заказчиком может быть кто угодно — ревнивая жена, подруга, работодатель, бизнес-партнёр или коллега на работе, который захотел подшутить.

«Перемещения точек на карте раскрывают перед вами первые признаки распадающихся браков, свидетельства наркомании, записи посещений психологических учреждений, — пишет NY Times. — Привязка этой истории к реальному человеку по времени и месту похожа на чтение чьего-то дневника».

История геолокации многое говорит о человеке, но трекинговые фирмы собирают гораздо более подробное досье на каждого человека, включая туда информацию с других трекеров, в том числе:


В отсутствие федерального закона о неприкосновенности частной жизни отрасль в значительной степени опирается на саморегулирование. Несколько отраслевых групп предлагают компаниям подписаться под этическими принципами. Например, Ассоциация мобильного маркетинга нготовит проект такого документа. Отдельные штаты начинают принимать собственные законы, чтобы восполнить этот пробел.

Отдельные штаты начинают реагировать своими собственными законами. Например, в 2020 году в Калифорнии вступает в силу закон Consumer Protection Act, который немного расширяет контроль пользователей над их данными. Например, люди могут попросить компанию удалить свои данные или предотвратить их продажу.

Но кроме нескольких новых требований, отрасль в значительной степени действует свободно и без какого-то регулирования: «Если частная компания законно собирает данные о местоположении, они могут свободно распространять их или делиться ими, как они хотят», — поясняет Калли Шрёдер, юрист компании по защите конфиденциальности и данных VeraSafe.

Аналогичное законодательство действует в Российской Федерации. Частные компаниям никто не запрещает свободно собирать и продавать данные о местоположении и другую персональную информацию, пока эта информация считается анонимной.

Компании пользуются этой лазейкой и сейчас активно отслеживают людей. Информация — новая нефть. Данные продаются и покупаются практически в режиме реального времени, так что ваше местоположение может быть передано с вашего смартфона на серверы приложения и экспортировано третьим лицам за миллисекунды. Например, вы можете увидеть в браузере или мобильном приложении рекламу нового автомобиля через некоторое время после того, как пройдёте через дилерский центр.

Большинство населения не возражает против сбора данных в мобильных приложениях, потому что не осознают масштаба слежки и готовы мириться с ней ради удобства потребления и коммуникации. «Самый большой трюк, который когда-либо провернули технологические компании, — они убедили общество следить за собой», — пишет NY Times.

Компромисс современной цифровой гигиены — сохранить преимущества геолокации, но заблокировать сбор истории. Поэтому не разрешайте приложениям отслеживать местоположение на постоянной основе!
Tags: Миран Miran дата-центр "Миран" ситимобил история перемещений деанонимизация персонификация личная жизнь приватность мобильные приложения Consumer Protection Act
Hubs: Дата-центр «Миран» corporate blog Information Security Geoinformation services Legislation in IT Cellular communication
+90
48.3k 182
Comments 157
Ads