问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

spark之RDD详解---五大特性

发布网友 发布时间:2022-10-02 03:40

我来回答

1个回答

热心网友 时间:2024-12-01 08:02

spark Github: https://github.com/apache/spark/
RDD: 让开发者大大降低开发分布式应用程序的门槛以及执行效率。

RDD源码: https://github.com/apache/spark/tree/master/core/src/main/scala/org/apache/spark/rdd

弹性:代表着spark在分布式计算的时候,可以容错 ---计算层面
分布式:把一份数据拆分成多份,在各个节点上并行的运行,他们之间没有任何的依赖关系
数据集:一个文件就是一个数据集

partitioned collection of elements :数据可以拆分成分区
that can be operated on in parallel.:每个分区的内容可以并行的被操作
解释:
RDD(1,2,3,4,5,6,7,8,9) 假如需要 + 1
那么数据被分成三个分区,只要每个分区上的内容都执行+1的操作就可以
Hadoop001: (1,2,3) +1
Hadoop002: (4,5,6) +1
Hadoop003: (7,8,9) +1

@transient private var sc: SparkContext,
@transient private var deps: Seq[Dependency[ ]]
) extends Serializable with Logging {

(1)抽象类:RDD必然是由子类实现的,我们使用的直接使用其子类即可
(2)Serializable:可以序列化
(3)Logging:spark1.6可以使用,spark2.0之后不可以使用
(4)T:存储各种数据类型
(5)SparkContext
(6)@transient

大数据里面一般是移动数据不是移动计算,所以数据本地化计算这样性能更高。

def compute(split: Partition, context: TaskContext): Iterator[T]
RDD计算是对RDD里面的分区做计算,所以传入split: Partition 对应的RDD特点第二点

protected def getPartitions: Array[Partition]:
拿到分区,RDD是由一系列的分区构成,所以得到的一定是分区 Array[Partition] 对应着第一大特点
......

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
小米摄像头离线人在外地怎么办 win11如何固定电脑桌面图标 QQ三国的当代杰出少年是怎么得的? 三国人物风云榜的作者简介 三国人物风云榜作者简介 三国人物风云榜目录 三国人物风云榜内容提要 w10电脑不动黑屏w10系统开机黑屏只有鼠标箭头怎么回事 ...FRAMEWORK中的Action, Control, Resource, Model到底是什么关系... windframework特点 ...想过的敷衍是什么歌 想对现在告别不想过的敷衍歌词原文 茅台仁酒53度怎么样 前列腺液检查 白细胞15-20/HP 卵磷脂小体 60% 请问大家我是前列腺炎... 怎么杀这个病毒:自动改变我的电脑日期 请问高手IE11浏览器被修改成123导航要怎么还原成原来的主页?谢谢!_百度... 主管护师每次刷题都是50多分,真正考试的时候能及格吗? 什么是品牌 品牌是什么意思 2019年护士专业资格证分数多少分才算合格 西餐厅服务员一周小节报告怎么写? 怎样解解封 描写关于女子的句子 华夏天骄txt全集下载 头顶上墙的插座,滋滋啦啦响,还有烧焦的味道了怎么办 难忘的一件事放鞭炮把头发烧焦了450字作文 火锅底料选择 怎样解解封 淘宝怎么看自己的等级 如何查看自己淘宝帐号的等级 请问怎样单独使用1个淘宝红包?比如我有多个红包,其中有一个快过期了... 哪个牌子有迷你果汁机 我想问一下电脑怎么设置默认打开方式 Spark RDD到底是个什么东西 用不锈钢奶锅熬稀饭,加入了用酱油炒过的肉粒,然后放置两三个小时加盐... 杨字书名字可以打几分 杨书和杨舒男孩叫哪个好听? 猪流感怎么预防跟治疗 ...a. 将域名翻译成对应的IP地址 b. 在域名和IP地址之间相互翻译... 苹果6竖排方向锁定了为什么还会旋转 苹果6手机旋转屏幕关了怎么还动 求一个最好玩的单机游戏 喷香蕉水灯罩会裂口吗 新宝骏前上流水灯罩怎么拆卸 e300近光灯右侧故障是怎么回事,灯不亮了,且有水灯罩里 水草灯罩发黄 从山东日照发件到黑龙江黑河市逊克县,用什么快递 重庆到黑龙江黑河市快递选择哪家比较好? 广西南宁这个季节还有现挖的沙地蜜薯吗? 摩斯密码记忆口诀? 为什么OC门输出端能并联使用 下列各种门电路中哪些可以将输出端并联使用 门电路中哪些输出端可以并联使用