- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
穿搭|四套复原款唐制汉服,配色端庄又典雅,带你领略大唐盛世
-
超10万只!多家企业紧急召回大批不合格口罩!看看你买了没
-
-
「黑喵游妮」新指挥官练好这几位轻松刷,碧蓝航线现版本13图红海自律阵容详解
-
新华国际时评:元首共识引领中美经贸磋商加速相向而行
-
飞行员|飞行员私自弃机跳伞,35吨战斗机砸进市区,93名学生成为牺牲品
-
-
阴滋病到底存在吗?如果是恐艾。那为何关节会响?这个症状应该不是精神因素引起的吧。请科学的给我科普一下?
-
从“靠湖吃湖”到“上岸就业”——洪湖渔民的生态转型
-
电竞天堂|继UZI后,又一传奇AD被伤病折磨,坦言:躺在病床上真的很害怕
-
『小学生研究癌症』小学生研究癌症获奖 大赛组委会:已成立专项调查组核查
-
周深 周深李玉刚惊艳亮相 酷狗国风音乐盛典口碑爆棚
-
-
茶艺美女表演,云雾香茶艺队荣获龙岩市第三届茶艺表演赛二等奖
-
-
果粉之家|12下周见,或回归指纹解锁,A14处理器多项跑分曝光!,iPhone
-
上观|长三角电影编剧高级研修班在沪举办 学员希望毕业时剧本100分并顺利孵化
-
王者荣耀|新赛季更新仅两天,对抗路霸主已出现,碾压铠皇超越关羽,脆皮没有游戏体验
-
-
【玲谈育儿】测一测你是什么命!,心理测试:你最喜欢吃下面哪盘鱼肉