- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
|你知道哪些行业赚钱特别迅猛?只要技术好,保你四天挣够六千万
-
软件|华宇软件:实控人邵学解除质押313万股,再质押500万股
-
寿命|50岁以上的人如何活得更久?这4件事做得越早,实际寿命会越长
-
刀郎|爆红后无影无踪,穷困潦倒再度复出,却已发福变光头,胖成200斤大叔!
-
-
-
科怀·伦纳德|美媒评NBA历史前十阵容,50位超巨上榜,哈登伦纳德字母哥第6!
-
-
|绝了!40㎡小户型这样装修,不仅有二分离式卫生间,还有两个卧室
-
教师|7月教师招聘增多,非师范生也能报名,满足3个条件就可以去
-
-
#天天都是稀奇事#色香味俱全,营养又实惠,请客吃饭都不错,几道家常菜推荐
-
上海市知识产权局网站|追忆峥嵘岁月 共话初心使命——市知识产权局邀请退休党员干部为青年党团员做“四史”教育专题讲座
-
-
女子点外卖里面竟有只癞蛤蟆|女子点了份外卖里面竟有只癞蛤蟆 看起来像是风干的
-
-
一婴儿经延吉到日本后新冠呈阳性|一婴儿经延吉到日本后新冠呈阳性,正接受隔离观察
-
爱上女司机|网友回应亮了,比亚迪车标字写错了?书法专家提出质疑
-
[毛毛0513带你看星座]结果自作自受,厄瓜多尔却笑着躺赢,越南学起了美国也找华为麻烦
-
穿搭|睿时尚衣图 | 秋天最流行的三种套装,你想要哪一种?