我有我的featuresets
为包含在表单元素的字典:如何实现交叉验证和随机森林分类定功能集作为字典?
({0: 0.48447204968944096,
1: 0.035093167701863354,
2: 0.07453416149068323,
3: 0.046583850931677016,
4: 0.0,
5: 0.09316770186335403,
...
162: 1,
163: 1.0}, 'male')
当我尝试实现从sklearn库cross_val_score
或cross_val_predict
,它总是会导致显示一些错误说
“浮点值不能是字典“。
可能有人请帮助我实现使用线性SVC和随机森林分类Python中的交叉验证?
我曾试图在此之前:
train_set, test_set = featuresets[1:1628], featuresets[1630:3257]
np.asarray(train_set)
np.asarray(test_set)
clf = SVC(kernel='linear', C=5)
predicted = cross_val_predict(clf, train_set, test_set, cv=10)
metrics.accuracy_score(test_set, predicted)
而且,我没有得到如何在这里实现kfold交叉验证。
转换您的数据,以numpy的阵列,就是所有 – lejlot
你上面显示的数据是有两个元素的元组:第一是快译通,另一个是字符串。字符串是你想要预测的目标变量。你的'cross_val_predict'的用法也是错误的。 –
'featuresets'是什么类型? – Tonechas