R中的假阳性百分比

有谁知道我可以用来计算两列列表中假阳性百分比的算法。R中的假阳性百分比

以我的情况为例。我有一个聚类向量，显示了一个聚类所属的组，并且我在另一列上有正确的标签。我知道一些分类是错误的，它们没有映射到最常出现的标签。我如何找到所有标签的误报百分比。我在R.

Cluster_vector | Labels 
     1    5  
     3    5 
     1    5 
     1    5 
     6    5

2011-09-02 damola

你可能想扩大你的观点，包括得到一个混淆矩阵。 – Iterator

你真的应该包括一个“假阳性”结果不是未定义的例子。如果没有预测的“5”，你怎么能计算一个FP在“5”？您还应该澄清哪些列代表“真相”或“黄金标准”。目前我无法确定。我会假设它是“R”编码惯例中的“标签”，但是您的文本让我怀疑这是否是您看到它的方式。 –

感谢标签代表黄金标准，我自己也收集了它们。但是你知道R中的聚类矢量是如何得到的，因此你不能获得与我的标签相同的数字。 – damola

实现这个你只是找错配的比例，像mean(x[,1] != x[,2])？

您可以通过table(x[,1] != x[,2])/nrow(x)得到混淆矩阵。

2011-09-02 23:33:15 Karl

回答