0
我有一个看起来像这样的数据:与结局sklearn:创建选择题稀疏特征向量特征
20003.0, 20003.1, 20004.0, 20004.1, 34
1, 2, 3, 4, 5
其中列*都是选择题,他们采取分类是价值观。
理想情况下,我将能够通过[{'20003': ['1', '2'], '20004': ['3', '4'], '34': 5}]
到DictVectorizer
但尚不支持。
如何把这个数据加载到创建稀疏特征向量?
你是什么数据?它是文本,DataFrame,数组,还有其他的东西吗? – MaxU
这是从CSV读取的数据帧。 – cosmosa
可以总结值类似列?例如:'[{'20003':3,'20004':7,'34':5}]' - 这可以很容易地传递给DictVectorizer – MaxU