2017-02-18 57 views

回答

1

如果您正在使用Hadoop流,那么你就可以在本地测试你的脚本是这样的:

cat *.csv | map.py | sort -k1,1 | reducer.py 

从映射数据传递到减速机在Hadoop的数据流,简单地写"<key>\t<value>"到stdout

+0

这就是我所解决的。但是使用sort -n – Shehryar