Как стать автором
Обновить

Дифференциальная приватность — анализ данных с сохранением конфиденциальности (введение в серию)

Время на прочтение5 мин
Количество просмотров3.4K
Всего голосов 19: ↑18 и ↓1+17
Комментарии3

Комментарии 3

На сегодняшний день появились компании, которые вместо анонимизации данных предлагают «синтетические» (или «сгенерированные» на основе оригинальных) данные, которые статистически и математически не отличаются от оригинальных. Этот новый подход использует, в частности, генеративные нейронные сети.
Можете ли поделиться ссылкой на сравнительный обзор или просто списк таких компаний? В том числе интересует методика отпеределия покзателя «статистически и математически не отличаются от оригинальных».
Присоединюсь к просьбе. Было бы интересно почитать.
И вот первый вопрос который приходит в голову — насколько устойчивее такие наборы данных к описанным проблемам?
Кажется, что и повторная генерация таких наборов данных и слишком узкие выборки все равно оставляют вероятность раскрытия исходных данных.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий