2012-07-09 563 views
2

k-匿名和l-多样性是什么意思,它们之间有什么区别?这个概念用于以下IEEE论文:see herek-匿名和l-多样性是什么意思,它们之间有什么区别?

+2

你听说过在网络上的搜索引擎?对于k匿名,请参见[here](http://epic.org/privacy/reidentification/Sweeney_Article.pdf) – hage 2012-07-09 06:46:57

+2

有关k匿名和l多样性的解释,请参阅[本文](https:// missingdata。 wordpress.com/2007/08/23/k-anonymity-and-l-diversity/)。 (我在谷歌搜索'k-anonymity l-diversity'后发现了这个。) – 2012-07-09 07:11:04

+2

究竟是怎么回事?我的答案不是真正的答案吗? “X和Y是什么以及它们有什么不同?”被误解? – 2012-07-13 03:41:59

回答

16

匿名数据集包含多个可用于识别某人(例如年龄,性别,地点)的字段。即使一个领域不是唯一的,他们的组合也可能是(例如,可能只有一名男性,54岁的Squatsville)。大于1的k-匿名意味着即使在所有领域你都不识别一个人 - 你确定了“k”个人。

但这还不够,因为所有由不同领域的不同组合确定的k个人可能具有相同的价值 - 如果在squatsville有10个不同的54岁男性,并且他们都穿女装,那么你知道那个54岁的鲍勃生活在蹲伏地区,穿着女士服装。所以你需要在这个领域确定的群体中有多样性。 l-多样性意味着该组包含“l”(字母L,而不是数字1)不同的值。

[没有违法意图 - 严重 - 交叉梳妆台。我只是想的东西轻度有趣,这不是,那么,癌症...]

和参考 - http://www.cs.colostate.edu/~cs656/reading/ldiversity.pdf

+0

+ +1为生动和生活般的例子:) – biziclop 2012-07-09 12:18:25

+0

很好的解释,但我有一个问题。如果有3名女性穿着女性服装,4名女性穿着女性内衣,其他女性穿着男性服装,那么会有3种多样性? – Pengman 2012-07-09 12:50:21

+1

[假设你很认真],你不会知道他们被称为鲍勃。但如果有10名男性,其中54岁的蹲伏者包含3种不同的类别,则l是3(参见我刚刚链接的论文的4.1节中的“原则2”)。 – 2012-07-09 13:04:16

相关问题