2011-12-21 57 views
1

将参数范围探索和交叉验证折叠整合到单个mclapply()命令中的“最佳”或“推荐”方式是什么?我担心的是,如果我在参数范围内缠绕mclapply(),如果某些交叉验证运行在其他交叉验证运行之前完成,则某些内核可能会处于空闲状态。我的第一个想法是遍历跨产品parameter_range X fold,但是这需要对CV fold结果进行一些混乱的组装。我以“并行”的方式使用R 2.14。mclapply,折叠和参数探索范围

+0

你能给我们一些你使用的(伪)代码吗? – 2011-12-21 12:23:31

回答

1

这取决于 - 通常情况下,您希望无论如何都要超过核心数量,以便只有极少数进程饿死时,不会影响性能。如果你的计算速度足够慢,你可以禁用预先调度,这样空闲内核就会再次得到馈送(虽然对于进程管理有相当大的损失)。如果两者都不起作用,则必须创建交叉产品,但组装并不是那么混乱(因为给定数量的CV实际上很简单)。