2016-04-14 930 views
1

我有一个包含6个类的数据集,我想绘制多类分类的ROC曲线。 Achim Zeileis给出的第一个答案是非常好的答案。R中多类分类的ROC曲线

ROC curve in R using rpart package?

但这仅适用于二项分类。而我得到的错误是Error in prediction, Number of classes is not equal to 2。任何人为此进行了多级分类?

这是我正在尝试做的一个简单例子。 数据< - read.csv( “colors.csv”)

假设data$cType6值(或等级)为(红,绿,蓝,黄,黑白色

无论如何要绘制这6个类别的ROC曲线吗?任何超过2类的工作示例将不胜感激。

+0

@ achim-zeileis,亲爱的任何提示? – Mahsolid

+0

您希望在多类别分类的ROC曲线中显示什么? ROC曲线旨在显示二进制结果;更准确地说是两种比率:真正的积极与错误的积极您可以为您的六种情况建立每条曲线,但我不明白如何定义多种分类的单一ROC曲线。 – RHertel

+0

我想要做所有的性能测量,就像我们为二进制一样。我已经读过,可以使用名为'pROC'的R包完成它,但我找不到一个工作示例。 – Mahsolid

回答

0

回答一个老问题,同时具有相同的要求 - 我发现scikit文档很好地解释了一些方法。

http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

提及的方法包括:

  • “二值化”,即问题转换为二进制分类,即使用宏平均或微平均
  • 画出多个ROC曲线,一个每标签
  • 一对所有

从上面的链接,使用他们的库这说明了一个与所有微平均复制例如:

print(__doc__) 

import numpy as np 
import matplotlib.pyplot as plt 
from itertools import cycle 

from sklearn import svm, datasets 
from sklearn.metrics import roc_curve, auc 
from sklearn.model_selection import train_test_split 
from sklearn.preprocessing import label_binarize 
from sklearn.multiclass import OneVsRestClassifier 
from scipy import interp 

# Import some data to play with 
iris = datasets.load_iris() 
X = iris.data 
y = iris.target 

# Binarize the output 
y = label_binarize(y, classes=[0, 1, 2]) 
n_classes = y.shape[1] 

# Add noisy features to make the problem harder 
random_state = np.random.RandomState(0) 
n_samples, n_features = X.shape 
X = np.c_[X, random_state.randn(n_samples, 200 * n_features)] 

# shuffle and split training and test sets 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.5, 
                random_state=0) 

# Learn to predict each class against the other 
classifier = OneVsRestClassifier(svm.SVC(kernel='linear', probability=True, 
           random_state=random_state)) 
y_score = classifier.fit(X_train, y_train).decision_function(X_test) 

# Compute ROC curve and ROC area for each class 
fpr = dict() 
tpr = dict() 
roc_auc = dict() 
for i in range(n_classes): 
    fpr[i], tpr[i], _ = roc_curve(y_test[:, i], y_score[:, i]) 
    roc_auc[i] = auc(fpr[i], tpr[i]) 

# Compute micro-average ROC curve and ROC area 
fpr["micro"], tpr["micro"], _ = roc_curve(y_test.ravel(), y_score.ravel()) 
roc_auc["micro"] = auc(fpr["micro"], tpr["micro"]) 

实际上,我在寻找一个JavaScript解决方案(使用https://github.com/mljs/performance),所以我还没有与上述实施它图书馆,但这是迄今为止我发现的最具启发性的例子。