0
我有一个arff
文件,其中包含700 entries
,每个42000+ features
用于NLP相关项目。现在格式是密集格式,但如果使用稀疏表示法,则条目可以大大减少。 我在core 2 duo machine with 2 GB RAM
上运行,并且我得到了memory out of range eception
,尽管将限制增加到了1536 MB。weka在一个大的arff数据集文件上运行
如果我将arff文件转换为稀疏表示,还是需要在更强大的机器上运行我的代码,它会有什么优势吗?