问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

数据分析、数据挖掘、数据统计、OLAP 之间的差异是什么?告诉yunmar吧...

发布网友 发布时间:2022-04-26 10:39

我来回答

2个回答

热心网友 时间:2022-05-03 21:35

OLAP的核心是"维", 可以说是*分析, 它是让分析人员从不同的角度, 不同的粒度查看数据仓库中的数据, 所以他的实质是查询数据, 但是这个查询也是有技巧的, 需要理解业务, 理解业务之后,提出相应的假设, 然后通过特定维度的数据来验证假设是否正确, 所以OLAP是分析思路是从假设到验证,方法是查询数据, OLAP里的模型是指*数据模型, 通过哪些维度的数据来描述分析对象, OLAP的建模是指选择哪些维度。
而数据挖掘主要不是查询, 而是做更多的计算, 例如分类,回归是拟合计算, 找到标签与其他特征的规律, 形成模型, 数据挖掘算法会有很多迭代计算, 比OLAP的计算要复杂很多, 另外, 数据挖掘做的更多的是探索式的分析, 分析前是没有假设的. 所以数据挖掘往往能发现一些人为经验忽略的因素。
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
广义的数据分析,应当是包含数据挖掘和统计的。数据挖掘是面对海量数据时的有效工具,而数据统计是为分析过程提供可靠模型和结果检验的 有效工具。这两个工具可以用在数据分析中,但不只用在数据分析中。数据分析就是数据到有效信息的过程。
数据统计。专注于建模及统计分析,通过概率、统计、离散等数学知识建立合理模型,充分发掘数据内容。例如用回归分析,充分利用网站历史数据,进行评估、预测、反向预测、发掘因素。利用贝叶斯方法建立模型来进行机器学习、聚类、垃圾邮件过滤等。常用工具如:SAS,R,SPSS。

热心网友 时间:2022-05-03 22:53

数据分析。专注于中小网站分析优化,网站地图、结构优化,SEO。多使用第三方工具如:开源分析模块(BIRT),CNZZ,Google Analytics(以下简称GA)。通过对网站属性数据(如pv, uv, 新用户占比,搜索词,跳出率,蹦失率,访问时长,忠诚度等)的分析,对网站结构、内容进行优化。此方向更偏产品一些,极大的依赖分析经验和对数据的敏感度。
代表人物Justin Cutroni,网站分析领军人物,精通GA/GWO,作有博客Analytics Talk:

国内代表人物宋星,经营网站分析在中国 ,蓝鲸,经营蓝鲸的网站分析笔记: ,经营网站数据分析:
数据挖掘。数据挖掘主要是面向决策,从海量数据中挖掘不为人知、无法直观得出的结论。例如内容推荐、相关度计算等。此工作更注重数据内在联系,数据仓库组建,分析系统开发,挖掘算法设计,甚至很多时候要亲力而为的从ETL开始处理原始数据,因此对计算机水平有较高要求。一般广度上不及数据分析,但深度上更为深入。使用工具除海量数据库如Oracle,分布式计算Hadoop,C++,Java,Python等编程语言外,也有可能会用到第三方挖掘工具如Weka。
此方向更偏技术一些,代表人物Jeff Hammerbacher,曾经的*首席科学家,曾参与编写《数据之美》
数据统计。专注于建模及统计分析,通过概率、统计、离散等数学知识建立合理模型,充分发掘数据内容。例如用回归分析,充分利用网站历史数据,进行评估、预测、反向预测、发掘因素。利用贝叶斯方法建立模型来进行机器学习、聚类、垃圾邮件过滤等。常用工具如:SAS,R,SPSS。
此方向更偏重数学,尤其是统计学。像哈佛数学毕业的Hammerbacher在这方面也很强。数据统计不局限于互联网,像传统行业尤其是医疗、金融等领域中,用处也是极大。

而OLAP其实是一个建立数据系统的方法,核心思想就是建立*度的数据立方体,以维度(Dimension)和度量(Measure)为基本概念,辅以元数据,实现可以钻取、切片、切块、旋转等灵活、系统、直观的数据展现。这种思想可以被以上三种方向借用,像GA就带有这种风格,数据仓库也经常用到此种模式。
但由于互联网的数据量较大、维度众多,会导致数据爆炸。因此一般会灵活变通,综合使用。严格使用OLAP的一般都是些制造业、零售业等相对传统的行业,作为BI的延伸,对公司决策提供有力支撑。
---------------------------------------------------------------------------------
由于此问题回答的比较早,当时就只考虑了互联网的定义,现在看来很片面。感谢@吕高明 的补充:
数据分析是指用适当的统计方法对收集来的大量第一手资料和第二手资料进行分析,以求最大化地开发数据资料的功能,发挥数据的作用。是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。
广义的数据分析,应当是包含数据挖掘和统计的。数据挖掘是面对海量数据时的有效工具,而数据统计是为分析过程提供可靠模型和结果检验的 有效工具。这两个工具可以用在数据分析中,但不只用在数据分析中。数据分析就是数据到有效信息的过程。

转自知乎
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
历史要怎么读,有啥诀窍 高中历史诀窍 年终会活动策划方案 深度解析:第一财经回放,探索财经新风向 逆水寒手游庄园怎么邀请好友同住 逆水寒手游 逆水寒不同区可以一起组队吗? 逆水寒手游 逆水寒怎么进入好友世界? 逆水寒手游 逆水寒怎么去别人的庄园? 使用puppeteer实现将htmll转成pdf 内卷时代下的前端技术-使用JavaScript在浏览器中生成PDF文档 淘宝号为什么商家会给降权 淘宝网宝贝只要出现差评,淘宝就会隐形降权一个月? 宝贝收到差评会不会降权 淘宝差评对卖家还有约束作用吗? 淘宝店铺的商品,被差评降权怎么办? 如何将pdf多页合成一页 住房公积金有何政策 多地调整住房公积金政策 滨州住房公积金最高额度是多少 11月1日起 多地调整住房公积金政策 姓吴男宝宝,取一个有寓意好听的名字,最好不要重名 滨州的住房公积金为何只让提取一次 山东12市公积金政策有变 济宁月缴存基数最高不超16302元 给吴姓的男宝宝起个名字吧 高手进,姓吴小孩起名男孩 为什么我的手机(zte c2016)已经root了!也给烧饼修改器授权了。 2016外国root软件 2016年怎样用手机应用宝取消root权限 三星on7 2016版怎么root 三星手机怎么开Root权限? 淘宝买家账号被降权,以为能自己恢复,好几个月了,查询还是降权,怎么处理?是给差评商家标记的吗? 在淘宝闲鱼上卖的二手物品如果被差评了,会不会影响淘宝店铺的信用?淘宝店铺会被扣分吗? 淘宝给店家差评自己的淘宝号会有什么后果? 在国内学习数据挖掘就业前景如何? 淘宝卖家受到差评有什么影响?如果是金牌卖家又有什么影响? 数据分析和运营哪个好 创业的小故事 梦见在一堆新鞋子里找自己的左脚鞋? 梦到妈妈给买的两只鞋子都是左脚的。 梦见一双鞋都是一只脚上的 女人梦见自己穿了俩只不同的鞋子,且都是左脚? 梦见自己穿一撇的鞋子,全是左脚的鞋子,是同一款两个颜色的棉鞋。代表什么 梦见左脚穿的鞋 求解梦!2双鞋子,一双全是左脚,一双全是右脚~~ 关于购买免税车的详细指南 留学生回国可以购买进口免税车吗 武汉留学生 购车 回国留学生如何购买免税车 归国留学生到车行购车能免车辆购置税吗? 怎么办理? 留学生购买免税车需要哪些材料