- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
-
-
-
-
「亓纪的想法」第一名实力霸榜,安卓手机性能排行洗牌:荣耀第8
-
『省发展改革委』聚焦企业难点堵点痛点!山东出台18条意见深入优化营商环境
-
-
不得不说!32岁就火遍全球的金智媛,在韩娱是个奇迹
-
为什么现在很多女生不化妆只涂口红?看了她们化的妆,我懂了
-
北京冬奥村选址在哪里 北京冬奥村在何时进入全面建设阶段
-
四川汶川县泥石流致4人遇难11人失联 已转移三万余人
-
-
绝望的鸡丁|和平精英山谷地图因太美成为打卡点!还能不能好好玩游戏了?
-
在美中两国之间的紧张关系趋于升级之际,美国外交官们表示
-
小瓶盖|《1917》——优秀但并不惊艳,平庸剧本下的艺术品
-
不少:没有出去打工的农民,可以试试这三种工作,不比去城里打
-
新娘时尚很耐老,想有不老神仙脸?如果你脸上有这些特点
-
「新三板」吃瓜之余,坐看04-27市场短期应对策略
-
-
金瀚|这回终于敢承认恋情了,只因女方长得太美,没办法