- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
米粒呼呼|除许褚外,他也悲伤过度而死,曾因看不起刘备闻名天下,曹操死后
-
-
-
-
白山市康宁医院召开精神疾病专科医联体座谈会议及签约授牌仪式
-
王宝强|《我的兄弟叫顺溜》演员今昔,王宝强有了新女友,顺溜姐越来越美
-
-
-
-
你记忆中有啥理性上分析不恐怖,但莫名感到恐惧的场景
-
维正知识产权维正无锡分公司乔迁升级,迈上新台阶、服务新无锡
-
金投赏|超级汇川金投赏专场实录:全场景全链路智能获客驱动深度营销,赋能价值增长
-
特朗普|特朗普演讲变大秀,烟花喷出“特朗普”,他承诺让美国人登上火星
-
电池:iPhone XR,用18 W充电的电池寿命会比5 W充电的电池寿命长吗?
-
央视网|美国最新研究:中国宣布疫情前 新冠病毒可能就已存在于洛杉矶
-
DNF心情咖啡屋|DNF:深度分析枪魂冰子,老版本走来的主播,为何让玩家讨厌?
-
足球小子|球员谈笑风生,已完全准备好迎接新赛季,多特蒙德训练花样多
-
娱乐圈趣事|蔡徐坤小时候,张艺兴小时候,看到王一博:眼睛这么大!,吴磊小时候
-
老练,目前在中超的16支球队中,热内西奥在近期对国安的球员
-