使用MultipleOutputs实现多目录/文件输出
org.apache.hadoop.mapreduce.lib.output.MultipleOutputs
在map或者reduce类中加入如下方法
在需要输出数据的地方,可以使用定义好的 mos 进行输出
在Job Driver 时定义一些 Named Output
取消类似part-r-00000的空文件LazyOutputFormat.setOutputFormatClass(job, TextOutputFormat.class)
例子
参考
http://gnailuy.com/dataplatform/2015/11/22/common-techniques-for-mapreduce/
http://blog.csdn.net/zgc625238677/article/details/51524786
https://www.iteblog.com/archives/848