问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何用好spark?

发布网友 发布时间:2022-04-24 06:47

我来回答

1个回答

热心网友 时间:2022-04-27 10:12

Spark是一种快速、通用、可扩展的大数据分析引擎,2009年诞生于加州大学伯克利分校AMPLab,2010年开源,2013年6月成为Apache孵化项目,2014年2月成为Apache顶级项目。目前,Spark生态系统已经发展成为一个包含多个子项目的集合,其中包含SparkSQL、Spark Streaming、GraphX、MLlib等子项目,Spark是基于内存计算的大数据并行计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。Spark得到了众多大数据公司的支持,这些公司包括Hortonworks、IBM、Intel、Cloudera、MapR、Pivotal、百度、阿里、腾讯、京东、携程、优酷土豆。当前百度的Spark已应用于凤巢、大搜索、直达号、百度大数据等业务;阿里利用GraphX构建了大规模的图计算和图挖掘系统,实现了很多生产系统的推荐算法;腾讯Spark集群达到8000台的规模,是当前已知的世界上最大的Spark集群。
与Hadoop的MapRece相比,Spark基于内存的运算要快100倍以上,基于硬盘的运算也要快10倍以上。Spark实现了高效的DAG执行引擎,可以通过基于内存来高效处理数据流。
Spark支持Java、Python和Scala的API,还支持超过80种高级算法,使用户可以快速构建不同的应用。而且Spark支持交互式的Python和Scala的shell,可以非常方便地在这些shell中使用Spark集群来验证解决问题的方法。
Spark可以非常方便地与其他的开源产品进行融合。比如,Spark可以使用Hadoop的YARN和Apache Mesos作为它的资源管理和调度器,器,并且可以处理所有Hadoop支持的数据,包括HDFS、HBase和Cassandra等。这对于已经部署Hadoop集群的用户特别重要,因为不需要做任何数据迁移就可以使用Spark的强大处理能力。Spark也可以不依赖于第三方的资源管理和调度器,它实现了Standalone作为其内置的资源管理和调度框架,这样进一步降低了Spark的使用门槛,使得所有人都可以非常容易地部署和使用Spark。此外,Spark还提供了在EC2上部署Standalone的Spark集群的工具。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
康复者的血清中含有什么免疫分子 血清里面有什么 走读的定义在哪些教育阶段适用? PostgreSQL修改数据库表的列属性操作 Ubuntu调整postgresql默认路径 ubuntu – Postgresql:更改默认数据路径 刘邦几个老婆刘邦老婆吕雉和戚夫人的不同结局 刘邦几个老婆?. 如何防止父母在微信群里抢红包? 有哪些适合夏天选择的长裙款式值得推荐? 顺德是美食之都,你还知道哪些顺的美食? 图片中的韩国明星是谁啊? 《寻味顺德》百度云无删减完整版在线观看,李立宏主演的 韩国哪些男明星最帅? spark快速大数据分析怎么样 鱼生是顺德的特色美食吗?除了鱼生你还知道顺德什么美食? 梦到熊了怎么办? 韩国男明星图片 为什么spark比mapreduce快 spark为什么比mapreduce快 spark为什么比hadoop快 Spark连接到MySQL并执行查询为什么速度会快 《Spark快速大数据分析》epub下载在线阅读,求百度网盘云资源 钢结构工程质量验收规范 《spark快速大数据分析》pdf下载在线阅读全文,求百度网盘云资源 钢结构工程施工质量验收标准和规范的区别? 钢结构厂房以什么标准验收 钢结构工程质量检测鉴定办理单位有哪些 钢结构工程施工质量验收时,检验批合格质量标准应符合哪些规定? 钢结构厂房交接验收并交付使用了三年,甲方提出对钢结构进行化学成分检测,是否合理? 梦见熊头是怎么回事? 舌尖中国老介绍的广东那个地方是什么地方? hadoop和spark的都是并行计算,有什么相同和区别? 乐教乐学帐号重名怎么办? 梦见熊代表什么啊??? 顺德有没有比较出名的食品? spark处理4亿数据要多久 韩国最帅的男明星50名 我国最出名的美食城市,是哪个呢?有哪些美食代表? 这是韩国的哪个男明星? 韩国哪个男明星最高? 乐教乐学里签到时显示别人的名字怎么回事 SparkSQL和普通的Spark任务运行速度上哪个快 什么情况下MR的效率要比spark强? 韩国男明星 王一博和《舌尖上的中国》超相配,你还知道哪些高分美食纪录片? 韩国男明星图片及名字,小眼睛 乐教乐学上绑定孩子时总提示用户名错误怎么办? 在中国,什么地方的人最会吃鱼? 求图片中韩国男明星的名字!