- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
举人力量|手上戒指却被打码,镜头拉远后才知道原因,李湘半夜在家吃蛋糕
-
-
大国风暴|焚毁波兰出口商品,卢卡申科雷霆手段反击!切断输乌克兰石油管道
-
芭丽阳光|洋气显瘦人见人夸,50岁妈妈别乱穿!新出的优雅“收腰”条纹套装
-
[北晚新视觉综合]钟南山李兰娟张文宏寄语学子:珍惜时间、敬畏生命、崇尚科学
-
问董秘|加快固态研发,不然谁敢买你们家...,投资者提问:贵公司为什么不收购固态电池标的
-
-
『中国男篮』1米75也能打NBA!3年内打爆中国男篮!日本乔丹真狂啊!
-
成交额|收评:三大指数单边下行创指跌2.1% 注册制新股集体走弱
-
凤凰网联想发布首款电竞手机 横屏游戏时也能直播、视频
-
-
|S10冠军皮肤已经想好了!上单选择凯南 中单选择卡牌
-
『全能辣妈plus』孩子易被“胎记”缠身,有你没有,孕妈再不改掉4个坏习惯
-
不一样的我啊19日直播自己摘镜全过程,兰州爱尔眼科医院院长自述超高度近视
-
-
蜜蜡|1965年的10元纸币,现在的收藏价值怎么样?
-
篮球视频资源|詹姆斯坐稳历史第二,现役一次冠军即可封神的球星:哈登保罗上榜
-
重男轻女|电视剧《亲爱的生命》中,又上演了一幕重男轻女的闹剧。
-
-
克隆技术|为何我们不能克隆爱因斯坦?科学家:只因还有一个恶魔会同时出现