问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

hadoop pig和hive有什么区别?

发布网友 发布时间:2022-04-29 13:17

我来回答

2个回答

热心网友 时间:2022-05-06 10:06

Pig是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、表达转换数据以及存储最终结果。Pig内置的操作使得半结构化数据变得有意义(如日志文件)。同时Pig可扩展使用Java中添加的自定义数据类型并支持数据转换。

Hive在Hadoop中扮演数据仓库的角色。Hive添加数据的结构在HDFS(hive superimposes structure on data in HDFS),并允许使用类似于SQL语法进行数据查询。与Pig一样,Hive的核心功能是可扩展的。

Hive更适合于数据仓库的任务,Hive主要用于静态的结构以及需要经常分析的工作。Hive与SQL相似促使其成为Hadoop与其他BI工具结合的理想交集。Pig赋予开发人员在大数据集领域更多的灵活性,并允许开发简洁的脚本用于转换数据流以便嵌入到较大的应用程序。Pig相比Hive相对轻量,它主要的优势是相比于直接使用Hadoop Java APIs可大幅削减代码量。

本质上说说Pig与Hive。
经过Pig Latin的转换后变成了一道MapRece的作业,通过MapRece多个线程,进程或者独立系统并行执行处理的结果集进行分类和归纳。Map() 和 Rece() 两个函数会并行运行,即使不是在同一的系统的同一时刻也在同时运行一套任务,当所有的处理都完成之后,结果将被排序,格式化,并且保存到一个文件。Pig利用MapRece将计算分成两个阶段,第一个阶段分解成为小块并且分布到每一个存储数据的节点上进行执行,对计算的压力进行分散,第二个阶段聚合第一个阶段执行的这些结果,这样可以达到非常高的吞吐量,通过不多的代码和工作量就能够驱动上千台机器并行计算,充分的利用计算机的资源,打消运行中的瓶颈。

也就是说,Pig最大的作用就是对maprece算法(框架)实现了一套shell脚本 ,类似我们通常熟悉的SQL语句,在Pig中称之为Pig Latin,在这套脚本中我们可以对加载出来的数据进行排序、过滤、求和、分组(group by)、关联(Joining),Pig也可以由用户自定义一些函数对数据集进行操作,也就是传说中的UDF(user-defined functions)。
结论性的阅读感觉是:Pig用来写一些即时脚本吧,比如领导问你要份数据,半个小时要出来之类;Hive嘛,就是一个产品经理过来,问这个啥回事?于是你Hive一下,一个简洁的类SQL语句...Done!
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
获取oracle中表的表结构、约束和索引信息 若3的x次方等于二十七分之一,则3的负x次方 若x的2x-1次方=1,则x=多少。若3的x次方=27分之1,则x=多少 3的x次方=1/81,x=? ...为什么?。。。若3的x次方等于81分之一,则x等于什么??急 语文句子成分分析详解 初三英语,关于被动语态 级品飞车lo如何下载? 极品飞车全球在线(nfsol)现在可以在大陆玩么?内测完毕了?听说要个登... ...一个星期不理我了怎么办,电话也不接信息也不回,问她是不是有男人了... 胡彦斌父母是干什么的 如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系? 胡彦斌父母是做什么的 某电商双11数据分析与预测为什么会用到hive,可不可以直接用Hadoop? 胡彦斌爸爸是什么时候怎么死的? hadoop、hive,hadoop streaming有什么区别? 相当开明的胡彦斌父母,为何唯独在其玩乐队这件事上如此反对? 胡彦斌是谁的儿子 hadoop与hive是什么关系? 胡彦斌爸爸是干嘛的?胡彦斌家庭背景一般身价多少 胡彦斌父母做什么的 胡彦斌谈父亲,是个“传奇人物”?你怎么看? 家境优越,父母都是设计师的胡彦斌是如何走上音乐之路的? 胡彦斌的爸爸叫什么? 胡彦斌的父母是干什么的 胡寅寅和胡彦斌是什么关系 胡彦斌跟胡寅寅是亲戚吗 鸿雁和公牛的开关插座哪个更安全? 鸿雁和公牛的开关插座哪个更安全?请知情人透露下,谢谢 想搞自媒体分析金融经济形势,需要考什么证? 胡彦斌《父亲》这首歌的写作背景 Hadoop和hive搭建的问题 hadoop中的pig与hive的区别?各自有什么优势? 胡彦斌不愿提及的往事,被雪藏六年的事到底是什么? Hadoop 用Hive还是HBase 这是胡彦斌《父亲》的音频吗?如果不是请告诉我这段话的出处,谢谢! 胡彦斌看孟美岐露出老父亲的微笑,你期待他们在《天赐的声音》中的合作吗? vivo手机刚才不小心屏蔽了网易云音乐,结果那里就没有显示网易云音乐了... 用的vivo 手机,以前用网易云音乐,通知栏会有显示,现在没有了,但我... Vivo x9s 通知栏不显示网易云状态 没有禁用通知 为什么vivo手机的网易云音乐通知栏不显示? Vivo x9s 通知栏不显示网易云状态 怎么解决 没有禁用通知 为什么vivo通知栏图标美化后网易云这个显示不出来 只有… Vivo手机放着网易云玩游戏 为什么突然就没了? vivo手机状态栏和通知栏被删怎样还原 抖音怎么屏蔽所以人,就是别人不管用手机号,,QQ号都搜索不到我看不到我。 【合集】日本的深夜剧,【在线观看】免费百度云资源 word怎么转换为图片免费使用的 想在线看忠臣藏147求百度云高清资源链接 求1981年日本电影《车站》免费百度云资源哪位大神有谢谢了