问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

python和r数据分析哪个更好

发布网友 发布时间:2022-04-24 04:56

我来回答

3个回答

热心网友 时间:2022-04-07 10:25

2012年的时候我们说R是学术界的主流,但是现在Python正在慢慢取代R在学术界的地位。不知道是不是因为大数据时代的到来。

Python与R相比速度要快。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果。所以有人说:Python=R+SQL/Hive,并不是没有道理的。

Python的一个最明显的优势在于其胶水语言的特性,很多书里也都会提到这一点,一些底层用C写的算法封装在Python包里后性能非常高效
(Python的数据挖掘包Orange canve
中的决策树分析50万用户10秒出结果,用R几个小时也出不来,8G内存全部占满)。但是,凡事都不绝对,如果R矢量化编程做得好的话(有点小难度),会
使R的速度和程序的长度都有显著性提升。

R的优势在于有包罗万象的统计函数可以调用,特别是在时间序列分析方面,无论是经典还是前沿的方法都有相应的包直接使用。
相比之下,Python之前在这方面贫乏不少。但是,现在Python有了
pandas。pandas提供了一组标准的时间序列处理工具和数据算法。因此,你可以高效处理非常大的时间序列,轻松地进行切片/切块、聚合、对定期
/不定期的时间序列进行重采样等。可能你已经猜到了,这些工具中大部分都对金融和经济数据尤为有用,但你当然也可以用它们来分析服务器日志数据。于是,近
年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大替代方案。

做过几个实验:
1. 用python实现了一个统计方法,其中用到了ctypes,multiprocess。
之后一个项目要做方法比较,又用回R,发现一些bioconctor上的包已经默认用parallel了。(但那个包还是很慢,一下子把所有线程都用掉了,导致整个电脑使用不能,看网页非常卡~)
2. 用python pandas做了一些数据整理工作,类似数据库,两三个表来回查、匹配。感觉还是很方便的。虽然这些工作R也能做,但估计会慢点,毕竟几十万行的条目了。
3. 用python matplotlib画图。pyplot作图的方式和R差异很大,R是一条命令画点东
西,pylot是准备好了以后一起出来。pyplot的颜色选择有点尴尬,默认颜色比较少,之后可用html的颜色,但是名字太长了~。pyplot
的legend比R 好用多了,算是半自动化了。pyplot画出来后可以自由拉升缩放,然后再保存为图片,这点比R好用。

总的来说Python是一套比较平衡的语言,各方面都可以,无论是对其他语言的调用,和数据源的连接、读取,对系统的操作,还是正则表达和文字处
理,Python都有着明显优势。
而R是在统计方面比较突出。但是数据分析其实不仅仅是统计,前期的数据收集,数据处理,数据抽样,数据聚类,以及比较复杂的数据挖掘算法,数据建模等等
这些任务,只要是100M以上的数据,R都很难胜任,但是Python却基本胜任。

结合其在通用编程方面的强大实力,我们完全可以只使用Python这一种语言去构建以数据为中心的应用程序。
但世上本没有最好的软件或程序,也鲜有人能把单一语言挖掘运用到极致。尤其是很多人早先学了R,现在完全不用又舍不得,所以对于想要学以致用的人来说,如果能把R和Python相结合,就更好不过了。

热心网友 时间:2022-04-07 11:43

R是统计分析的专用语言。Python是一门通用语言,应用领域更广。如果专注数据分析,挖掘选用哪个差别不大,如果除了数据处理,还涉及到其他开发,则只能选Python了

热心网友 时间:2022-04-07 13:18

、K均值聚类 K-Means算法思想简单,效果却很好,是最有名的聚类算法。聚类算法的步骤如下: 1:初始化K个样本作为初始聚类中心; 2:计算每个样本点到K个中心的距离,选择最近的中心作为其分类,直到所有样本点分类完毕; 3:分别计算K个类中所...
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
教你如何使用苹果压缩照片成一个文件简单操作轻松保存手机空间 苹果手机怎么将照片压缩成文件苹果手机怎么把照片弄成压缩文件 苹果手机照片怎么弄成压缩包苹果手机照片怎么弄成压缩包发送 郑州技校十大排名是哪些学校全国的技校介绍 苏州南站到勤达模具怎么走 给空调加氟是夏天加还是冬天加 空调冬天能加氟吗 冬天为什么别加氟 小米11ultra屏幕总成划算换吗 小米11 Ultra维修报价公布!换个主板比K40都贵 Python用matplotlib 画3d图怎么才能看到绘制过程? Python使用matplotlib做出的图,怎么输出高清的图像 见图。python matplotlib 子图图例不显示完全。怎么解决? python matplotlib label不显示 python 画折线图加一个legend 在python中采用plt.text形式描点绘图时,怎么通过legend添加图例? Python使用matplotlib绘图,如何在绘图结果上显示每个点的坐标 python使用matplotlib怎么画光滑曲线 python matlibplot 怎样画图例 BUG什么意思? 格兰仕微波炉烤肉用什么材料的盘子? 什么叫镀铝烤盘?? 它的本身材质是什么的?? 烤盘材质 烤盘材质有哪些 家用烧烤盘哪种最健康 北京建行etc怎么办理 一个手机怎么一边听YY一边抖音答题? yy签约主播去抖音没有签约开播违约吗 想换地方 不清楚手机跟电脑直播选哪个 YY平台跟抖音怎么选择? 在yy签约还没到期可以在抖音直播吗 抖音开播怎么套用yy开播 python怎么画折线图 请问python该用什么matplotlib方法或方程得到这些信息? python计算折线图的波宽 python plt.plot(x,y,'ro') 不使用8种内置的颜色 八年的戴尔笔记本电脑内存有多大 戴尔n4010笔记本最大支持多大内存拓展,单条最大支持多大? 戴尔 Inspiron N5010 笔记本电脑 加内存加多大的比较合适 配置如下 戴尔5485-1605,15寸笔记本电脑内存多大,多少钱? 2006年的戴尔笔记本电脑内存是什么样的 请问这台戴尔笔记本电脑加什么内存条比较合适? 戴尔13r笔记本支持多大的内存? DELL笔记本INSPIRON M4010最大支持多大内存 戴尔笔记本电脑Inspiron 14-5457有多少个内存槽? 我购买的是戴尔N5010笔记本电脑,请问它的内存可以扩展到多大? 股票阳光电源代码是多少?阳光电源的价位是多少?阳光电源股票今日价格是多少钱? 戴尔笔记本inspire14R-5437支持多大扩展内存?还有请问我的电脑买内存... Dell笔记本 cpu i3-2310m 的 最高配多少G的内存、 华为手机的智能助手怎么开启 我的戴尔笔记本电脑加内存条,加什么内存条比较合适? 华为智能助手怎么设置?