- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
东西■注意!长沙东二环鸭子铺立交桥东西引桥交通管制
-
飞鸟游戏屋|无脑4包2,像极了去年的fpx!,V5给全世界教学:教你怎么制裁tes
-
-
中国新闻网|甘肃学子职业技能比拼 “以赛促学”助现代应用型人才培养
-
成交|三季度北京商业地产大宗交易成交169亿 环比增长超五成
-
微信|微信表情写入判决:你发的每个emoji都可能成为呈堂证供
-
长春、丹东、哈尔滨等方向恢复、增开、重联36趟旅客列车
-
人民网|人民日报乔永清:新基建为高质量发展“强筋壮骨”
-
-
-
儿童水杯能不能放消毒柜里,儿童保温杯可以放消毒柜吗
-
郑爽被税务部门查 税务部门回应是否追究郑爽刑责 罚款细则曝光
-
暖宝Peter妈妈|杀死关羽这么好的战绩,为什么没有名留青史?,吕蒙白衣渡江
-
资本家的丑孩子:牛头马脸、不懂演技只会瞪眼,求你们放过观众吧
-
小史谈影视|6×6亮相!被称为“进川入藏”利器,这款号称国产“巨无霸”的BJ80
-
-
娇柔的柠檬|到底求什么,争什么,气什么,愁什么,人一辈子
-
星星育儿|真拿她没办法”,戚薇的做法很巧妙,“女儿经常玩我的化妆品
-
中国新闻网|感谢救火英雄 南加华联为警察消防员赠送便当
-