利用Hadoop streaming 进行词频统计

佚名 7年前 (2019-05-10) 随笔 1830人围观抢沙发百度已收录

创建一个文件夹

bin/hdfs dfs -mkdir /input

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

将要统计的文件上传到hadoop
bin/hadoop fs -put /test.txt /input

利用hadoop进行词频统计
bin/hadoop jar share/hadoop/tools/lib/Hadoop-streaming-2-9-2.jar –input /test.txt –output /user/results.txt –mapper /bin/cat -reducer /usr/bin/wc

删除results.txt文件

./bin/hadoop dfs -rmr /user/results.txt

查看results.txt文件目录

bin/hadoop dfs -ls /user/results.txt

查看统计结果

bin/hadoop dfs -ls /user/results.txt/part-0000

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客利用Hadoop streaming 进行词频统计

本文标题：利用Hadoop streaming 进行词频统计

本文链接：https://www.liuyixiang.com/post/86690.html

上一篇 : .net core 使用swagger生成API文档

下一篇 : webpack -- output挖坑

评论列表暂无评论

发表评论

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

利用Hadoop streaming 进行词频统计

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

利用Hadoop streaming 进行词频统计

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.