问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

知识挖掘过程

发布网友 发布时间:2024-10-01 02:33

我来回答

1个回答

热心网友 时间:2024-12-13 04:43

知识挖掘,简称KDD,是一项关键任务,其目标是从大量数据中挖掘出有价值的知识。这一过程包括数据开采,即通过专门的算法从数据中提取出模式或规律。Fayyad、Piatetsky-Shapiror和Smyth在1996年给出了KDD的定义:它是一个非平凡的过程,旨在从数据中提炼出新颖、有用且可理解的知识。知识挖掘的质量在很大程度上取决于所使用的算法,研究焦点主要集中在算法和应用上。


尽管数据开采和知识发现有时被混淆使用,但在学术和工程领域有所区别。KDD通常用于科研,而工程领域则更多地关注知识挖掘。KDD过程是一个复杂且交互性强的流程,包含多个步骤:首先,需要理解应用领域和目标;其次,选择合适的数据集,可能需要对多个数据集进行筛选;接着,对数据进行预处理,处理噪声和无关信息,考虑时间序列和数据变化等因素。


数据转换是关键环节,通过维数变换或转换方法,减少变量数量或找出数据的不变特征。接下来,确定知识挖掘的目标和方法,选择适合的挖掘工具,如分类、聚类或回归等,来寻找数据中的模式。在发现模式后,进行解释,剔除不相关的内容,以便用户理解。最后,将这些发现的知识应用到实际系统中,通过验证和解决潜在矛盾,确保知识的效用和可靠性。


扩展资料

知识挖掘源于全球范围内数据库中存储的数据量急剧增加,人们的需求已经不只是简单的查询和维护,而是希望能够对这些数据进行较高层次的处理和分析以得到关于数据总体特征和对发展趋势的预测。知识挖掘最新的描述性定义是由UsamaM.Fayyyad等给出的:知识挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
和面的和是什么读音? win10 应用打不开。全都打不开。 进入win10打不开软件 win10电脑软件都打不开是什么原因win10突然软件都打不开软件是怎么回事... 软件打不开怎么办win10电脑点不开软件最简单办法 请问下,离厦门市岛内的台湾路的国联大厦最近的建设银行和农业银行... 从巴黎都市到建设银行怎么坐公交车,最快需要多久 东莞万江官桥窖离建设银行哪路车最近? 建行七支分行有那些公交车经过 佛山哪里有飞越丛林拓展 瘦骨精油真能瘦骨头吗? 有用过瘦骨精油的吗 绝句里的千秋雪是什么意思? 网上买的瘦骨精油真的有用吗,是可以改变脸型嘛,如果有用哪个牌子... 梦见被蓝白相间的大蛇追,已经成精了 谁用过瘦骨隆鼻的精油真的好用么 昌平哪个温泉好 2023龙脉温泉度假村攻略 儿童重疾险上限是多少? 王者荣耀ad通用铭文2016 熟普洱茶最好的保存方法 深入了解Linux内核版本的世界如何看linux内核版本 熟普洱怎么保存方法 高沟中学简介 Win8系统官方给出的最低配置要求是什么? 华硕自带Win8系统如何重装 如何在U盘上安装原版Win8系统? 尼康J1怎么样?尼康J1好吗 尼康J1怎么样啊 尼康J1怎么样?用过的回答 别直接从百度复制... 大辣椒得了小叶病,辣椒不长个,发弯,个头小。怎么治?急 知识挖掘简介 辣椒小叶病用啥药特效 申论范文:挖掘知识价值促进文明发 养老社保中断了有什么影响 盘点养老社保中断的危害 厨师刀哪个牌子好 厨师切片刀哪个牌子的好 股票加杠杆需要什么条件? Voyager Linux 23.04:具有华丽外观且无 Snap 的 Ubuntu 体验 | Lin... 为什么说opensuse是最华丽的linux "怀赤璧以待惠者,挂佳伦以求明士"中的"佳伦"是什么意思? 登封oa协同办公软件 会展策划与管理专业怎么样_就业方向_主要课程 苹果手机怎么作为midi键盘直接连接电脑编曲软件使用? 王霜将与巴黎解约是怎么回事 如何将某个Excel文件中的特定sheet复制到一个另一个Excel文件中去?_百... 小米3天天p图不要的图片怎么删 游乐园的游戏不敢玩却敢飚车 迪士尼城堡概况 上海迪士尼哪个城堡