- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
xyg|想当职业选手而没有门路?大仙杯邀请全网高手参赛,XYG等你加入
-
【科技生活快报】诸葛镇扶贫大棚红樱桃醉了贫困户的脸
-
-
|一点体力活,农民工要800元,没谈成,我不服气自己干,打脸了……
-
-
上海检察|嘉定区院依法办结一起立案监督案件获企业感谢
-
【动感】上汽大众SUV家族亮相“众行无限”SUV品牌之夜
-
绝处逢生!中国将多台光刻机收入囊中,无视荷兰,美国禁令也没用
-
818体育|翟晓川一家三口过七夕!漂亮妻子吃1岁女儿的醋,晓川:还是最喜欢你
-
-
青柠檬檬哒|一出手就让苹果损失60亿,数万款应用被限制使用
-
生科医学|31省份新增25例境外输入确诊!钟南山:不需要延长隔离
-
穿搭|贾静雯近照很胖,穿抹胸裙赘肉泛滥,不修图就是典型大妈身材!
-
中新经纬|工信部:《推动公共领域车辆电动化行动计划》已基本成型
-
-
欣妈育儿经|测你近期有什么好运到来?,心理测试:你最喜欢哪一串转运珠
-
大国新科技:印度富豪重回亚洲首富位置,首富角逐失利?马云“无奈”让位
-
围殴|15年前围殴一小偷致死 13名当事村民被抓捕归案
-
-
环球网|美国又威胁对蚂蚁集团和腾讯支付下手 华春莹回应