Комментарии 3
На сегодняшний день появились компании, которые вместо анонимизации данных предлагают «синтетические» (или «сгенерированные» на основе оригинальных) данные, которые статистически и математически не отличаются от оригинальных. Этот новый подход использует, в частности, генеративные нейронные сети.
Можете ли поделиться ссылкой на сравнительный обзор или просто списк таких компаний? В том числе интересует методика отпеределия покзателя «статистически и математически не отличаются от оригинальных».
Присоединюсь к просьбе. Было бы интересно почитать.
И вот первый вопрос который приходит в голову — насколько устойчивее такие наборы данных к описанным проблемам?
Кажется, что и повторная генерация таких наборов данных и слишком узкие выборки все равно оставляют вероятность раскрытия исходных данных.
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

Информация

Дата основания
Местоположение
Россия
Сайт
domclick.ru
Численность
501–1 000 человек
Дата регистрации

Блог на Хабре