2017-09-20 109 views
1

你好。R,有没有什么方法可以通过使用多个内核来创建termdocumentmatrix?

是否有任何方式通过使用多核,并行处理来创建termdocumentmatrix?或者为了获得更快的结果,我可以使用一些软件包,比如parallel,h2o或其他软件包吗?

有人帮我。 谢谢。

+0

查看** quanteda **包。它在分裂和散列令牌方面做了一些并行处理,虽然DFM构造目前并不是并行化的,但其他许多功能都是。 (而dfm的建设速度仍然非常快。) –

+0

谢谢你的回答。我会尝试。 –

回答

0

嗯。我在下面的链接中发现了非常好的信息。

how to read and write TermDocumentMatrix in r?

,当我使用的并行和TM封装, 我必须设置我的变量,函数库,像下面。 (如果没有,会出现错误。)


clusterExport(CL,列表( “josa1”, “josa2”, “josa3”, “josa4”))#为变量,函数

clusterEvalQ( cl,library(stringr))#for libraries


It works。 谢谢。

相关问题