- 主页 > 生活百科 > >
package cn.mr.dedup;
import JAVA.io.IOException;
import org.Apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.MApper;
public class DedupMapper extends Mapper<LongWritable, Text, Text, NullWritable> {
private static Text field = new Text();
// <0,2018-3-3 c><11,2018-3-4 d>
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
field = value;
context.write(field, NullWritable.get());
}
// <2018-3-3 c,null> <2018-3-4 d,null>
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
public class DedupReducer extends Reducer<Text, NullWritable, Text, NullWritable> {
// <2018-3-3 c,null> <2018-3-4 d,null><2018-3-4 d,null>
@Override
protected void reduce(Text key, Iterable<NullWritable> values, Context context)
【Hadoop数据去重】throws IOException, InterruptedException {
context.write(key, NullWritable.get());
}
}
package cn.mr.dedup;
import java.io.IOException;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
public class DedupRunner {
public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
Configuration conf = new Configuration();
Job job = Job.getInstance(conf);
job.setJarByClass(DedupRunner.class);
job.setMapperClass(DedupMapper.class);
job.setReducerClass(DedupReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(NullWritable.class);
FileInputFormat.setInputPaths(job, new Path("D:\Dedup\input"));
// 指定处理完成之后的结果所保存的位置
FileOutputFormat.setOutputPath(job, new Path("D:\Dedup\output"));
job.waitForCompletion(true);
}
}
推荐阅读
-
苍南女警察案--苍南女警被杀案开庭时三被告为什么一个是绳子挷的,另外二人带手铐?
-
坎儿井:中国最伟大的地下工程:和长城、大运河齐名,修建工人
-
清镇发布|“数化”未来!清镇市持续强化区块链技术应用走笔,“链上”清镇
-
晓蕾育儿|本不应该出现在两千多年前,为何秦始皇能一统六国?这三样东西
-
-
-
英雄联盟|英雄联盟:全球总决赛主题曲MV发布倒计时海报,你能看出什么线索吗
-
前后40亿!苹果正式了结iPhone降速门,网友:国内用户呢
-
ChatRoads■值不值得你出手?,中期改款的大五座标杆车
-
意甲|孔蒂在干嘛?为得68岁双将,愿让20岁天才中场加盟德比死敌
-
汪火狐说体育|那不勒斯欲卖出前锋米利克,转会费高达5000万欧元,谈判不顺
-
-
林书豪|辟谣!林书豪试训勇士是假消息 御用造型师+超话主持人均发声打假
-
爱情的温暖是什么意思 爱情的终极是什么 是不是彼此的温暖歌词
-
朋友买的200平米别墅,一共才花40万,这简约风格太美了
-
上海黄浦|全市影院复工复业后的首个影展来了 俄罗斯电影大师展正式启动
-
蠢萌新闻|孙悟空娶了天竺国王后,猪八戒才是人生赢家,唐僧娶了中国女首富
-
-
-
小高说历史|救弟弟嫁跛豪的黎姿,改变家人命运,今豪宅曝光,金碧辉煌如城堡黎姿三亿豪宅有多壕?黎姿的选择,改变家人的命运年轻是资本,成功靠坚强