- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
g2|两连胜却无缘世界赛!就在今天,S10“最神奇”队伍诞生,一级团运营方式打服各大战队!
-
【阿里巴巴】卫健委充分肯定互联网医疗 阿里健康新基建已经准备好了
-
王者荣耀|经济虽倒数,输出却稳居第二?DYG萧玦已将工具法师发挥到极致!
-
[30秒懂车]这三台值得一看 其中一台还是非承载式车身,买国产大空间SUV
-
现实版的“狼”来了,特斯拉汽车的“鲶鱼”效应已经显现
-
【趣头条】15万级自主品牌SUV首选TA,颜值高、空间大、配置高、还安全
-
-
我有车|2.0T中配43万多能落地,豪华SUV销量冠军促销!奔驰GLC全系降5万
-
-
年年都体检,为什么发现癌症却已晚期?这种检查,有很多人漏掉
-
-
宁夏省和现在的宁夏回族自治区有什么关系 宁夏是哪个省
-
中新经纬|【财讯晚班车】百强镇分布图:近七成在苏粤两省
-
#科技圈#985 曝光;安卓版微信更新;Zoom 爆重大安全漏洞,麒麟
-
吃货|经常喝牛奶,长期下来对身体有什么影响?真的有那么好吗?
-
趣闻晨报|关晓彤真实身份隐瞒了20年,难怪鹿晗这么喜欢她,太低调了
-
-
暖宝宝贴上去还可以撕下来吗 暖宝宝揭下来贴别的部位可以吗
-
赵小棠|赵小棠打卡陈赫火锅店,一共点30道“菜品”,结账时却成了哑巴!
-