问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

Google Trace统计分析

发布网友 发布时间:2024-09-26 07:41

我来回答

1个回答

热心网友 时间:2024-10-04 02:02

Google Trace统计分析主要收集静态配置信息,包括机器特性、CPU(平台、芯片组、频率)、内存、磁盘、网络以及各种加速器等。这些与应用相关或调度需要考虑的属性都需要记录。

此外,在scheduler处收集的信息具有sub second级别的收集粒度,包括用户、作业、任务、优先级、约束和请求以及授权。

node处收集的任务资源使用信息主要包括CPU和内存,每5分钟收集一次。

收集到这些信息后,可以进行trace分析。首先,可以分析整体资源申请和使用状况,包括CPU、内存的申请量和利用率,以及按priority class、user等分类的使用信息。这些信息有助于判断集群负载状况和集群的超卖程度。

接下来,可以对workload进行分析。整个系统包含多个实体和维度,可以单独绘制CDF图来观察分布,或者进行关联分析以找到强关联。通过统计所有维度的信息,可以得到分布,并寻找显著的现象和特征,针对这些显著的特征进行优化。

典型的维度包括job、task、user、priority、资源request、资源usage和run time等。以下是一些典型分析示例:

各维度单独分析,多维度叉乘以观察联合分布。虽然建模对于认知来说可能没有太大帮助,但从预测资源使用和协助调度的角度来看,可能仍然有一定价值。然而,鉴于软硬件环境的频繁变化,模型的时效性可能存在问题,调度算法的时效性也可能有问题。这本质上可能是一个机器学习的问题,需要不断收集集群数据,观察结果,调整模型和参数。

总体来说,trace分析的创新性不多,只需参考文章并按照套路进行分析即可。关键是从数据中找到关键的insight,并根据系统设计实现进行相应的改动。

有许多论文分析了Google的trace,得到了许多观察。其中一些观察太细节,除非真的需要去做,否则记住也没啥意义。真正有用的观察包括引用最高的一篇论文《Heterogeneity and Dynamicity of Clouds at Scale: Google Trace Analysis》,它提到的insight包括大规模、异构的硬件环境、异常多的软件workload以及复杂多变的使用需求与使用pattern。这导致调度变得困难。

还有一篇LANL出的ATC文章《On the diversity of cluster workloads and its impact on research results》,主要目的是揭示先前工作对Google trace特征的过度拟合。这篇论文的两个贡献是重新在新的集群上收集trace,并重新进行分析,比较与Google trace的相同点和不同点。

这篇文章的最大启示是,根据硬件、软件以及业务的不同,你的集群的trace特征可能与Google的trace大不相同。Google的trace的通用性可能并不好,因此许多被提出的调度方法和策略可能需要重新考虑。

此外,这篇文章的分析metrics和分析对比方法也非常值得学习,尤其是其中的figure 1列举了常用的trace characteristics。

热心网友 时间:2024-10-04 02:06

Google Trace统计分析主要收集静态配置信息,包括机器特性、CPU(平台、芯片组、频率)、内存、磁盘、网络以及各种加速器等。这些与应用相关或调度需要考虑的属性都需要记录。

此外,在scheduler处收集的信息具有sub second级别的收集粒度,包括用户、作业、任务、优先级、约束和请求以及授权。

node处收集的任务资源使用信息主要包括CPU和内存,每5分钟收集一次。

收集到这些信息后,可以进行trace分析。首先,可以分析整体资源申请和使用状况,包括CPU、内存的申请量和利用率,以及按priority class、user等分类的使用信息。这些信息有助于判断集群负载状况和集群的超卖程度。

接下来,可以对workload进行分析。整个系统包含多个实体和维度,可以单独绘制CDF图来观察分布,或者进行关联分析以找到强关联。通过统计所有维度的信息,可以得到分布,并寻找显著的现象和特征,针对这些显著的特征进行优化。

典型的维度包括job、task、user、priority、资源request、资源usage和run time等。以下是一些典型分析示例:

各维度单独分析,多维度叉乘以观察联合分布。虽然建模对于认知来说可能没有太大帮助,但从预测资源使用和协助调度的角度来看,可能仍然有一定价值。然而,鉴于软硬件环境的频繁变化,模型的时效性可能存在问题,调度算法的时效性也可能有问题。这本质上可能是一个机器学习的问题,需要不断收集集群数据,观察结果,调整模型和参数。

总体来说,trace分析的创新性不多,只需参考文章并按照套路进行分析即可。关键是从数据中找到关键的insight,并根据系统设计实现进行相应的改动。

有许多论文分析了Google的trace,得到了许多观察。其中一些观察太细节,除非真的需要去做,否则记住也没啥意义。真正有用的观察包括引用最高的一篇论文《Heterogeneity and Dynamicity of Clouds at Scale: Google Trace Analysis》,它提到的insight包括大规模、异构的硬件环境、异常多的软件workload以及复杂多变的使用需求与使用pattern。这导致调度变得困难。

还有一篇LANL出的ATC文章《On the diversity of cluster workloads and its impact on research results》,主要目的是揭示先前工作对Google trace特征的过度拟合。这篇论文的两个贡献是重新在新的集群上收集trace,并重新进行分析,比较与Google trace的相同点和不同点。

这篇文章的最大启示是,根据硬件、软件以及业务的不同,你的集群的trace特征可能与Google的trace大不相同。Google的trace的通用性可能并不好,因此许多被提出的调度方法和策略可能需要重新考虑。

此外,这篇文章的分析metrics和分析对比方法也非常值得学习,尤其是其中的figure 1列举了常用的trace characteristics。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
mrna转录试剂盒 windows7应用程序损坏或丢失怎么办? 联想windows7怎么恢复不小心删除的应用 Win7电脑图标不见了如何恢复解决Win7电脑图标丢失问题的有效方法_百 ... 美女主播软件有哪些 什么软件看美女直播? 什么视频直播软件可以免费看女神直播? 钣金工业设计 钣金灰本段用途 关于刮胡子的相关问题 ia移植是什么意思? 软著开发运行环境、主要功能、技术特点等如何撰写? 大数据需要什么样的硬件和软件环境? u盘重装系统后资料都没了怎么恢复 u盘重装系统后如何将u盘文件恢复 新买的羽博移动电源YB-627给手机充不进电 vivoy627更新后显示sim一关闭,怎么变回以前啊 香奈儿627口红试色 香奈儿627是什么颜色 我是120v的电动车,可以用72v充电器加48v充电器充电 ...7AH的电池,可以用吗?原来的充电器能用吗?怎样接? 70v/20的充电器和72v17_22AH充电器有何区别? 笔记本电脑的cpu温度高怎么办? 笔记本显卡和CPU温度过高怎么办? 肉眼牛排在哪个部位 牛肉眼牛排是什么部位做的 牛肉眼牛排是哪个部位的牛肉制作的 世界上度数最高的啤酒是多少度 世界上度数最高的啤酒介绍 Jocker——一场盛宴 黑羊,中国重庆人。 名片:头号通缉艺术家 宣言:艺术是玩出来的 警句:艺 ... DNF2024五一套至尊光环属性怎么样-SNK联动臻选礼包至尊光环属性 本人小侄女要改名,姓李,要求姓名一个字带虫或米偏旁, 一个字带火偏旁... 6平方的电线直径是多少毫米 南京福客通信设备有限公司怎么样 你都为了保持身材作出了哪些努力? ...南京南站用二代身份证直接检票上车,可是不知道在哪个检票口进站啊... 我买的火车票没有写着检票口,进站有南北站,不知道是从哪个站近? ...南京南站的检票口不是会分A·B?为什么这个不分?这个检票口在哪... 巨大生命体怎么清除 《群星stellaris》机器人简易处理办法介绍_《群星stellaris》机器... 地球有什么特殊之处 非洲巨大内陆盆地 乍得盆地 教师资料手册:科学社会目录 永久冻土层对全球气候变暖有什么影响? 中国文化产业促进会宗 旨 中国文化产业新年国际论坛论坛简介 中华传统文化产业发展促进会机构宗旨 辽宁广播电视台公共频道《中小学生春季安全教育第一课》观后感_百度知 ... ...早上8:30的广东公共频道的“中小学生安全教育知识讲座 观后感!!_百 ... ...养尊处优的,不管是吃的喝的穿的用的都要用最好的,上档次的,属于那... word中回车后不换行 ...信息提示:没有可用于支付本交易的帐户,这是什么意思?卡你有钱的...