2011-09-02 116 views
0

有谁知道我可以用来计算两列列表中假阳性百分比的算法。R中的假阳性百分比

以我的情况为例。我有一个聚类向量,显示了一个聚类所属的组,并且我在另一列上有正确的标签。我知道一些分类是错误的,它们没有映射到最常出现的标签。我如何找到所有标签的误报百分比。我在R.

Cluster_vector | Labels 
     1    5  
     3    5 
     1    5 
     1    5 
     6    5 
+0

你可能想扩大你的观点,包括得到一个混淆矩阵。 – Iterator

+0

你真的应该包括一个“假阳性”结果不是未定义的例子。如果没有预测的“5”,你怎么能计算一个FP在“5”?您还应该澄清哪些列代表“真相”或“黄金标准”。目前我无法确定。我会假设它是“R”编码惯例中的“标签”,但是您的文本让我怀疑这是否是您看到它的方式。 –

+0

感谢标签代表黄金标准,我自己也收集了它们。但是你知道R中的聚类矢量是如何得到的,因此你不能获得与我的标签相同的数字。 – damola

回答

1

实现这个你只是找错配的比例,像mean(x[,1] != x[,2])

您可以通过table(x[,1] != x[,2])/nrow(x)得到混淆矩阵。