2012-10-15 47 views

回答

0

我会考虑将属性选择的迭代作为一个MapReduce作业的方法。遵循这个想法,您可以为每个映射器分配属性以检查信息增益,并且在缩小阶段(使用单个缩减器)可以选择最佳属性。
如果计算一台机器上的单次迭代(在所有属性上)的计算时间稍长一些,那么工作开始时间开始时间大约为20-40秒,我认为这种方法很实用。