问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

学习数据挖掘需要那些基础知识?

发布网友 发布时间:2022-04-23 19:04

我来回答

3个回答

热心网友 时间:2022-04-06 15:33

入门推荐你看《机器学习实战》,不需要你跑去学习算法和数据结构,不需要解析几何的知识,但是数理统计的基础你必须要有,期望、方差、常用的几种概率分布,尤其注意一下条件概率,因为朴素贝叶斯模型你一定要懂,线性代数至少你要明白矩阵乘法、行列式计算,再就是微积分知识,不然你看不懂所有基于梯度下降法的文献,行业内用的比较多的是c++,java和python,推荐你用python,很多模型不需要你造轮子,python有相关的第三方模块,很方便。

数据挖掘涉及的内容比较泛,机器学习、数据挖掘、人工智能,但实际上这些知识大多是相通的,机器学习实战这本书是我看的启蒙书里很好的一本了,该有的都有,难度较小,有理论有实践,可以较快的对各种知识有个大概的了解,但是想要长期在这个行业发展,还需要学习更多的知识,比如说提到回归模型,你不仅仅要知道最小二乘法,你还要想到怎么进行数据清洗、哪些数据需要清洗,怎么规范数据,数据是否过多,要不要进行归约和降维,采用哪种回归模型,精确度大致要达到什么水平,要不要考虑过拟合和欠拟合,要不要进行交叉验证,几折交叉验证效果好,如果回归模型不适用,有哪些备选方案。比如说决策树模型,书上简单的讲了个if-then就完了,按照什么规则生成树,怎么分层,要不要剪枝,最终的效果怎么样,造成误差的原因是模型太复杂还是太简单,怎么综合其他模型对决策树进行改进,数据的聚类方法用k均值还是DBSCAN,需要对数据进行分类的时候要考虑数据量大不大,SVM还是神经网络,数据量计算机吃不吃得消,一次吃不消该怎么做,等你对这些有了大致的了解之后,好好看看《统计学习方法》这本书,深入地了解一下理论部分,看一看核心部分的数学模型,看一看如何算法实现,着重理解一下拉格朗日微分法和拉格朗日对偶,解决等式约束和不等式约束很有用,这个也是使用智能算法尝试解决NP完全问题的一个结合点。

除了看书以外,其他时间全部用在学习编程上,python常用的numpy、matplotlib、scipy、sklearn、nltk这些包你都要大致了解怎么用,推荐你看看图灵程序设计丛书里的《python学习手册》《python自然语言处理》《python科学计算》,至少要知道怎么定义类、方法、属性,常用模块里有哪些好用的方法,常见的异常怎么排除,其他的在有时间的时候随用随学,至于算法和数据结构,有时间的话看看《算法导论》,肯定有所收获。

至于说书单就上豆瓣搜一搜,评分高的一般都比较靠谱,英文版的也比较靠谱

热心网友 时间:2022-04-06 16:51

学习数据挖掘需要学习编程语言(Python、C、C++、Java、Delphi等),数据结构和算法,操作系统和网络编程。

数据挖掘涉及的内容比较泛,机器学习、数据挖掘、人工智能,这些知识大多是相通的。编程语言主要是C语言、C++和Java,。我首先这里可以学习C语言圣经《C程序设计语言》以及《C++ Primer》,数据结构和算法推荐《数据结构与算法分析(C语言描述)》。最好有机器学习,涉及到数据挖掘,自然语言处理和深度学习。数据挖掘主要是搜索排序,反作弊,个性化推荐,信用评价等;需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),明白MapRece的原理操作以及熟练使用Hadoop系列工具。

如果想提升关于数据挖掘方面的能力,这里推荐CDA数据分析师的相关课程,教你学企业需要的敏捷算法建模能力,可以学到前沿且实用的技术,挖掘数据的魅力;课程中安排了Sklearn/LightGBM、Tensorflow/PyTorch、Transformer等工具的应用实现,并根据输出的结果分析业务需求,为进行合理、有效的策略优化提供数据支撑点击预约免费试听课。

热心网友 时间:2022-04-06 18:26

数据挖掘相关的内容包括数据库、数据仓库、机器学习、信息检索。 学习数据挖掘基础:数据库理论、数学基础(包括数理统计、概率、图论等)、熟练掌握一种编程语言(java,python)、会使用数据挖掘工具软件(weka、matlab、spss) 数据挖掘的.
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
怀孕四个月补钙可以吗 孕妇吃什么时候钙片好 孕妇吃什么钙片最好 怀孕补钙是必须的吗?孕妇钙片品牌哪个好? ...在长高的黄金发育时期,会影响容貌五官的变化吗,不仅没有发育到变... 冬至吃饺子的诗词 立冬吃饺子的暖心诗词 宁波全封闭学校有哪些 宁波市北仑区小港镇会计学校在那? 或红联镇也可以 江南教育集团小港中心幼儿园园况介绍 红联哪里有报暑假班 数据分析中的数据挖掘侧重学习什么? 数据挖掘培训有用吗? 数据挖掘方面的经典书籍有什么? 数据挖掘方向难吗?都需要用到什么技术, 想学数据挖掘,培训靠谱吗? 数据挖掘统计的课程内容是什么?? 数据挖掘需要哪些学科的基础? 数据挖掘的相关学科有哪些 支付宝里面 转账到银行卡 剩余免费余额 能用吗 是哪里的钱? 手机尾号是7878好还是5858好? 手机尾号都不一样吗 手机号码尾号0好吗? 手机尾号是从前数还是从后数? 手机号尾号678还是555好 手机尾号0到9的意思是什么? 怎么查手机尾号? 所有手机尾号指的一定是后四位数吗? 手机尾号是什么意思 抖音发作品的时候怎样能快速找到自己收藏的适合视频的音乐? 如何把抖音收藏好的音乐传到另一个抖音号上 数据挖掘大概要学习多久 如何学习数据挖掘 什么是数据挖掘?数据挖掘与传统分析方法有什么区别 想自学数据挖掘需要什么基础? 在S赛小组赛里,uzi是不是从没掉过链子? 数据挖掘与数据分析是学什么的 Natuzi三人沙发链接如何打开 墨西哥一名说唱歌手将金链植入头皮,你对这种审美有什么看法? 数据挖掘工程师要具备哪些技能? 数据挖掘工程师培训多长时间?一般需要多久? 谁能帮我找下gunduzi这首歌的链接,就是空间能用的链接,我给好评 但是这链接不好找 看你们水平 区块链电子发票平台如何修改收款人 薇娅再陷售假疑云,直播带货产业链到底出了什么问题? 求布洛克 莱斯纳完整的出场音乐,环球摔迷网上的不完整,求个链接或者发我邮箱:rouzi2006@163.com 泰拉瑞亚有剃刀松,猪鲨链球,海啸,无头骑士剑,乌兹*,能过霜月第 明代青花碗图片及拍卖价格是多少 明代青花碗图片及拍卖价格是多少 北宋或南宋碗图片和拍卖价格 北宋或南宋碗图片和拍卖价格 中国最贵的黄金碗图片