我想创建一个稀疏矩阵与数值和分类数据将被用作cv.glmnet的输入。当只有数值数据参与,我可以使用下面的语法sparseMatrix与数值和分类数据
sparseMatrix(i=c(1,3,5,2), j=c(1,1,1,2), x=c(1,2,4,3), dims=c(5,2))
对于分类变量创建一个稀疏矩阵,下面的方法似乎工作:
sparse.model.matrix(~-1+automobile, data.frame(automobile=c("sedan","suv","minivan","truck","sedan")))
我非常稀疏的情况下共有1,000,000意见和10000变量。我没有足够的内存来首先创建完整的矩阵。我能想到创建sparseMatrix的唯一方法是通过创建列并以(i,j,x)格式转换数据来手动处理分类变量。我希望有人能提出更好的方法。
如何提供数据样本? – desertnaut