0
我有一个数据框。变量有很多的名字,像这样:R变量名包含分号
/messages/with/:userid/
/:id/
我读使用数据:
read.csv(file="file-path", header=TRUE,
sep=",", check.names = F)
使原来的名字被保留(通过使用check.names = F
)。 我用rpart包训练从数据决策树模型,然后尝试使用该树模型保存到PMML格式:
saveXML(pmml(dt.model, model.name = "DecisionTree_Model",
app.name = "model_lr.pmml",
description = "Decision Tree Model",
unknownValue=0), "dt_model.pmml")
然而,这会导致以下错误:
Error in field$class[[field$name[i]]] : subscript out of bounds
我认为原因是变量名包含:
,所以列索引被搞砸了。
我可以用check.names = T
读取数据,从而使变量名看起来像:
X.messages.with..userid.
X..id."
然而,因为我需要原始变量名称为PMML文件,我想保持变量名称的原样。有什么办法可以解决这个问题吗?