2012-03-10 91 views
-1

数据是否隐藏匿名化的同义词,或者是匿名化数据的几种方法之一? 我读了很多关于它,但现在我有点困惑。也许这是因为人们用它作为同义词,或者它确实是。正确分类数据屏蔽

回答

1

数据遮蔽不是数据匿名的同义词。

数据匿名化正在制作数据,使其无法唯一映射到给定的实体。

这是非常困难的,因为即使大多数数据匿名化技术已应用于给定的数据集,如果数据中的某些元素之间的关系仍然存在,这些可以与其他非匿名数据集一起使用,以将数据与即使当原始数据集没有直接的实体关联手段时也是如此。

数据屏蔽是一种用于尝试数据匿名化的技术,特别是数据扰动类型的尝试。

在数据匿名化使用的其他技术包括

  • 数据聚合(制作从直接和通过数据关系导致的实体关联精度损失
  • 数据还原(减少从数据旧数据新数据摘要数据集,无论是基于记录还是基于变量,或者通过对该变量或变量组合进行重新编码以确保直接和通过数据关系来损失实体关联精度)
  • 数据扰动(修改数据集中的数据)
  • 合成微数据(代基于所述一些旧的数据集的对统计特性,但具有完全合成的数据的整个新数据集的)

其他参考可用here