2015-10-17 37 views
0

假设我有一个对象X具有一组10个功能:[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]是否有一个度量标准来评估两个对象之间的相似性,基于它们的属性?

然后,我有两个对象:

  • A : [2, 2, 2, 2, 2, 2, 2, 2, 2, 2]
  • B : [0, 0, 0, 0, 0, 0, 0, 0, 0, 20]

我需要知道从AB是 “接近” X

的想法,我心目中的背后“相似性”是:

较好的是,所有的功能都几乎一样,而不是许多人非常接近,但一些非常不同的。

根据这个 “定义”,A似乎比B接近X

但是,算术平均值似乎并不是实现这一想法的正确工具,因为它对于两个对象都是2。

请问这种问题是否有一个特定的指标?

回答

1

那么euclidean distance呢?在你的情况下,A和X之间的欧几里德距离是40(约6.32)的平方根,B和X之间的距离是20,所以A确实更接近该度量。

+0

好吧,这似乎是我正在寻找的,谢谢! – Delgan

0

在特征非常不相似且情况可能不同的情况下,欧氏距离必须标准化。

这可以使用Mahalanobis distance来完成,其中涉及特征的方差。

Mahalanobis distance

而且,看this question

1

你也可以考虑使用余弦相似度。余弦相似度度量向量相对于原点的相似度,而欧几里德距离度量沿着向量的特定感兴趣点之间的距离。

Here是一篇关于何时从另一篇文章中挑选的文章。

另一个常见的措施是Jaccard相似性。 Here是比较余弦与Jaccard相似性的文章。

相关问题