我想在并行多处理器上使用sklearn.grid_search.GridSearchCV()
。这是我第一次这样做,但我最初的测试表明它似乎正在工作。scikit学习:一般问题有关的并行计算
我想了解文档的this部分:
n_jobs
:INT,默认为1的作业数并行运行。
pre_dispatch
:int或字符串,可选控制平行 执行过程中得到派出的就业人数。减少这个数字可能是有用的,以避免 内存消耗爆炸时,更多的就业机会获得比派遣CPU可以 过程。该参数可以是:
无,在这种情况下立即创建所有作业并产生 。使用此轻型和快速运行的作业,以避免 延误,由于作业的int按需产卵,给那些催生了一个字符串就业总数的 确切的数字,给人一种 表达n_jobs的功能,在 '2个* n_jobs'
有人可以打破这种下来吗?我无法理解n_jobs
和pre_dispatch
之间的差异。如果我设置n_jobs = 5
和pre-dispatch=2
,这是怎么从刚刚设置n_jobs=2
不同?
小心细化?我不明白当5个进程必须共享2个数据“块”时会发生什么? – Fequish
'pre_dispatch'主要控制发送的任务的“批次”数量。 – rightskewed