问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

K均值算法介绍

发布网友 发布时间:2022-12-05 07:17

我来回答

1个回答

热心网友 时间:2024-11-04 14:06

从没有标记过的数据中学习称之为非监督学习。
在非监督学习中,通过算法来定义一些数据的结构,将数据分别聚合到这些子集中,这种算法称之为聚类算法。

K均值 (K-means) 算法是最常用的一种聚类算法。


假设有如上的数据集,可以看到只有输入 ,没有输出 。

下面说明一下K均值算法的过程

K均值算法的代价函数为:

优化目标就是使用上面的代价函数最小化所有参数。

上述步骤中
第3步集群分配,是通过找到离样本最近的聚类中心点来最小化代价函数;
第4步移动质心,是通过改变样本和聚类中心点的距离来最小代价函数。
在K均值算法中,代价函数是一直下降的,不可能出现上升的情况。

聚类中心的个数 一般都是小于样本数量 的,因此可以随机取 个样本来作为聚类中心。

步骤

这样做的优点是方便快捷,缺点是不一定能够找到最佳的聚类中心,容易陷入局部最优。
这种陷入局部最优的情况在聚类中心过少时一般会出现,一般在 的情况下,解决办法是多次执行该步骤,比较代价函数的值,取最小值。

聚类中心数量的选择没有固定的方法,跟主观上的判断有很大关系,也跟业务,以及一些客观条件,以及使用K均值算法的目标有关。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
arrive in和arrive at 有什么区别? 磁力泵为什么可空转? 为什么不让衬氟塑料磁力泵空转?怎样提升设备稳定性? 工业软管泵 塑料磁力泵为什么不能空转 求推荐男主和女配在一起的小说? 《红衣天下》txt全集下载 检测公司检测哪些 检测公司是怎么样的 检测公司属于什么企业 小米智能开关怎么变成自回弹模式 网店卖激活的手机是修复的吗 密室逃脱绝境系列10木偶人怎么摆 有一种糖,外包装是阿尔卑斯条装的那种,白色包装纸,白色的糖,菱形... 同日而语是什么意思 同日而语造句 近义词反义词 同年而语的意思是什么 近义词 销售企业如何激励员工 迈为研发岗加班严重吗 吴江迈为科技本科进去怎么样 苏州迈为科技公司转正怎么样 苏州迈为科技股份有限公司待遇质量工程师待遇怎样 西餐厨师的前景如何? iOS详解多线程(实现篇——pThread) iOS ——多线程原理 pluswell收费吗 用在酒店管理系统方面的,双机热备的详细方案?网络、存储各方面都需要的... 咸姓的来源 怎么取名寓意聪明 匡姓的来源 怎么取名寓意聪明 红米1s更新miui khhcnbl14.0之后耗电快了怎么办 巫姓的来源 怎么取名寓意聪明 K-means++算法 iOS的一个小技巧——AutoLayout约束的优先级 iOS UI状态保存和恢复(一) 教师停课不停学教学工作总结范文5篇 水稻培育的 顺序 ?(耕耘,施肥,播种,然后呢?或者前面还少什么步骤?_百 ... 手机无法连接无线路由器的解决方法 农村信用社联合社app官方下载全国通用吗 湘电风能有限公司怎么样? 福建风力发电有限公司怎么样? 朋友圈发奶茶怎么配字 朋友圈发奶茶的文案 情景英语教学视频:这20句论文答辩相关英语表达对话,收藏备用! 胶原蛋白到底有什么功效。那么多人都在补充! 胶原蛋白适合什么样的人 胶原蛋白如何美白 胶原蛋白还有那些一般人不知道的特性功能? A3驾驶证为什么不能开b1 云门穴:治疗咳嗽咳痰,它最灵 云门和中府简单找法 云门中府怎么找最简单 中府、云门、孔最,三穴联用治鼻炎! 什么样子的人容易被精神控制