- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
北方人的硬菜|北方常说“整俩硬菜”,到底什么是硬菜是有多硬啊
-
明星婚姻|郭晶晶生头胎霍家奖3亿,二胎10亿,三胎为何没有奖?婆婆一句话说出原因
-
-
-
极度危险|英国女子2.5英镑买回一块青苔水泥块,网友:感觉错过了一个亿
-
【每日经济新闻】新技术正崛起、5G商用助推!这个产业迎来新蓝海
-
年度|预增!盛弘股份:预计2020年半年度净利润为4100万元~4600万元
-
-
小可妈咪育儿经|宝宝可以吃蜂蜜吗?什么时候可以吃?
-
废铁最新回收价格及行情趋势 现在废铁回收多少钱一斤
-
废宅小编|央视少儿主持人红果果全家福照曝光,1岁女儿乖巧可爱似小公主
-
大众报业·海报新闻|胖马识球丨危机突至,三轮而已!鲁能:你看我还有机会吗
-
-
量子位■线上碰头也能拥抱,真·沉浸式“云”开会:HTC、IEEE试水VR会议
-
历史那点事儿|因30万两度被母亲送精神病院的女孩,如今释然一切剃度出家,当年
-
海外网|香港疫情变严峻 林郑月娥发文:张弛有度、全力应对
-
澎湃新闻|细说数字人民币|全球央行数字货币竞赛加速,中国的特色在哪
-
-
外交部:强行让中美经济“脱钩”必将遭到包括美企在内的所有利益
-
一个男生,拒绝给你3件东西,他是真心想和你白头偕老,别会错意