- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
-
-
科技説説説|从高端市场跌到中端市场,网友:终于等到了!,从5488降至3428
-
-
第一次提问:我住在大学6人宿舍,我把自己的小地方好好按照我的方式收拾了一次,舍友有些不认可,咋办
-
娱乐圈快看|小露香肩秀完美侧颜,五官精致宛如芭比娃娃,Baby拍时尚大片
-
人到中年越没钱,越不要深交这三种小人,小人只会背叛你,利用你
-
「」上网课,学生的家境被“一览无余”,网友:没有对比就没有伤害
-
地球|印度将成人口第一大国 红利还是陷阱?近17亿人口 风险和压力激增
-
「」为啥强悍如老鹰都不敢碰喜鹊?老鹰:不是不想碰,躲都来不及
-
-
【移动支付】马云也没料到!支付宝不知不觉中,摧毁了一个存在千年之久的行业
-
股票|江南化工:拟发行股份购买北方特种能源集团所持的民用爆破业务子公司股权
-
-
国际狗仔■地铁内人员大量聚集,俄罗斯电子通行证审查首日状况:交通拥堵
-
第一财经|一文读懂公募REITs业务配套文件说了什么
-
中国|无道失德 千夫所指——看清美“三无”政客真面目系列评论之三
-
游侠网|预计9月17日发货,魔兽桌游《小小魔兽世界》开启预购
-
二狗聊科技▲江淮玩起能量转化物尽其用,汽车尾气=电能?
-