Comments 3
На сегодняшний день появились компании, которые вместо анонимизации данных предлагают «синтетические» (или «сгенерированные» на основе оригинальных) данные, которые статистически и математически не отличаются от оригинальных. Этот новый подход использует, в частности, генеративные нейронные сети.
Можете ли поделиться ссылкой на сравнительный обзор или просто списк таких компаний? В том числе интересует методика отпеределия покзателя «статистически и математически не отличаются от оригинальных».
Присоединюсь к просьбе. Было бы интересно почитать.
И вот первый вопрос который приходит в голову — насколько устойчивее такие наборы данных к описанным проблемам?
Кажется, что и повторная генерация таких наборов данных и слишком узкие выборки все равно оставляют вероятность раскрытия исходных данных.
Only those users with full accounts are able to leave comments. Log in, please.

Information

Founded
Location
Россия
Website
domclick.ru
Employees
501–1,000 employees
Registered