问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

什么是hadoop

发布网友 发布时间:2022-04-24 19:40

我来回答

8个回答

懂视网 时间:2022-05-06 12:45

在网上收集了一些mapreduce中常用的一些名词的解释,分享一下: Shuffle(洗牌):当第一个map任务完成后,节点可能还要继续执行更多的map 任务,但这时候也开始把map任务的中间输出交换到需要它们的 reducer那里去,这个移动map输出到 reducer 的过程叫做sh

在网上收集了一些mapreduce中常用的一些名词的解释,分享一下:


Shuffle(洗牌):当第一个map任务完成后,节点可能还要继续执行更多的map 任务,但这时候也开始把map任务的中间输出交换到需要它们的 reducer那里去,这个移动map输出到 reducer 的过程叫做shuffle。

?

Partition:每一个reduce节点会分派到中间输出的键集合中的一个不同的子集合,这些子集合(被称为“partitions”)是reduce任务的输入数据。每一个map任务生成的键值对可能会隶属于任意的partition,有着相同键的数值总是在一起被reduce,不管它是来自那个mapper的。因此,所有的map 节点必须就把不同的中间数据发往何处达成一致。Partitioner 类就是用来决定给定键值对的去向,默认的分类器(partitioner)会计算键的哈希值并基于这个结果来把键赋到相应的partition上。

?

排序(Sort):每一个reduce任务负责归约(reduceing)关联到相同键上的所有数值,每一个节点收到的中间键集合在被送到具体的reducer那里前就已经自动被Hadoop排序过了。

?

Combiner:前面展示的流水线忽略了一个可以优化MapReduce作业所使用带宽的步骤,这个过程叫Combiner,它在Mapper之后 Reducer之前运行。Combiner是可选的,如果这个过程适合于你的作业,Combiner 实例会在每一个运行map任务的节点上运行。Combiner会接收特定节点上的 Mapper 实例的输出作为输入,接着 Combiner 的输出会被发送到Reducer那里,而不是发送Mapper的输出。 Combiner是一个“迷你reduce”过程,它只处理单台机器生成的数据。

?

Reporter:是用于Map/Reduce应用程序报告进度,设定应用级别的状态消息, 更新Counters(计数器)的机制。

?

Mapper和Reducer的实现可以利用Reporter 来报告进度,或者仅是表明自己运行正常。在那种应用程序需要花很长时间处理个别键值对的场景中,这种机制是很关键的,因为框架可能会以为这个任务超时了,从而将它强行杀死。另一个避免这种情况发生的方式是,将配置参数mapred.task.timeout设置为一个足够高的值(或者干脆设置为零,则没有超时限制了)。 应用程序可以用Reporter来更新Counter(计数器)。

?

OutputCollector:是一个Map/Reduce框架提供的用于收集 Mapper或Reducer输出数据的通用机制 (包括中间输出结果和作业的输出结果)。

作者:p_3er 发表于2013-7-5 15:59:55 原文链接

阅读:16 评论:0 查看评论

热心网友 时间:2022-05-06 09:53

是大数据的一个专有名词,而且是非常流行的一个专有名词

热心网友 时间:2022-05-06 11:11

这个还是比较容易理解的,因为我们知道这个就是一个网络用语拍的,希望对你有所帮助。

热心网友 时间:2022-05-06 12:46

它的IP就一个设备的代码和设备的名称

热心网友 时间:2022-05-06 14:37

可以说一个东西,这个东西还是非常好用的东西。

热心网友 时间:2022-05-06 16:45

就是和这你看看看专业的一些介绍吧,或者从书中查查这方面的一些信息上。

热心网友 时间:2022-05-06 19:10

这是没办法,还能运气等一下,功能不是完全像了。

热心网友 时间:2022-05-06 21:51

Philip里边的话是不是愿意的,非常的深的意思,还低配?
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
教你认星星内容简介 教你认星星:探索星空的奥秘内容简介 相约星空下:我的第一本星空认知书目录 古往今来有许多文人墨客都赞美过星星你还读过哪些有关星星的文章... ps4两个手柄连电脑 剑网3怀旧服怎样做顽皮孩童任务 剑网3指尖江湖PVP系统好玩吗 PVP系统玩法介绍 ...就给我贴了几贴膏药,现在已经有一个多星... 今天去拔火罐,理疗师说我的寒气已经渗入五脏六腑,那是怎么样,会不会... XFX讯景RX 5700 XT海外三风扇版显卡8GB黑色 Hadoop是什么?能不能给点具体的解释?怎么用? hadoop的三大组件及其作用是什么? Hadoop能做什么? hadoop应用在哪些领域或场景 hadoop是什么意思? 学完hadoop组件可以做什么项目 hadoop是什么意思?与大数据有什么关系? hadoop能做什么 hadoop可以做什么 Hadoop:是什么,如何工作,可以用来做什么 大数据的Hadoop是做什么的? 锌合金水桶和不锈钢水桶装水食用哪个好? 请问用不锈钢桶盛放自来水,对人体有害吗? 装配式不锈钢水箱可以做多高的? 组装个玩游戏电脑要多少钱 不锈钢水箱需要些什么样的材料? 自己组装一台电脑需要多少钱 天台不锈钢水桶水发绿怎么办 自己组装电脑大概需要多少钱? 我想自己花钱组装一个笔记本电脑(不是品牌货),配置要高,大约要多少钱? 注意配置要高啊 梦见猫丢了是什么意思? 是一个很小的猫 很可爱 丢了我还在哭呢 可是有人捡到猫了 在敲诈我 说让我给多少多 梦见捡到小花猫,然后又正在捡到是什么预兆? 做梦梦到捡到一只猫,很温顺很漂亮,还会变身人形,是个小姑娘。 梦见一只小猫 特别可爱 能听懂我说话 会点头摇头 但事实别人家的 我捡来的 是什么意思 是好是坏???? 梦见自己丢弃的猫被有钱人捡走 解梦,梦见猫 各种水表怎么看 数字水表怎么看的 家用水表怎么看 水表怎么读? 怎样认水表 那个水表用了多少水,应该怎么看?红色的字是什么意思,是50还是5? 水表上数字怎样归零 酒驾撞人保险公司是否理赔 我酒驾撞了人保险公司能赔钱吗?但是责任五五分? 酒驾保险公司理赔吗 酒后撞人保险公司赔吗 如果我酒驾撞了对方,我全责,保险公司不赔我的,会赔对方的损失吗? 酒后驾驶撞人该怎么赔偿 苹果手机文本朗读设置在哪里 酒驾撞人重伤是否要承担刑事责任 苹果手机图片上的文字怎么读出声