K mean clustering后续类中心或者质心centroid的决定步骤是怎样的，麻烦介绍一下



你还未登录〜

天堂之歌

听歌而来，送我踏青云〜

0元

充值
0橙宝

充值

首页
版块大全

财经学院

CFA FRM CFRM 量化投资

从业资格

证券从业银行从业

会计学院

CPA 会计职称 ACCA CMA 财会求职灌水闲聊

金程考研

公共课 199管综 396经综金融学硕金融专硕经济学硕士会计硕士考研院校考研就业

投资理财

RFP

金融杂谈

金融动态金融八卦吐槽专区

求职招聘

职业发展金融求职职场经验职场修养

研招信息

专业院校热点资讯考研交流考研经验

考研科目

专业课公共课 199管理类联考 396经济类联考

生活日常

运动音乐电影美食交友租房

个人发展
论坛

您现在的坐在位置：首页>智汇问答>CFA二级

Shihairong2024-05-04 17:55:23

K mean clustering后续类中心或者质心centroid的决定步骤是怎样的，麻烦介绍一下

回答（1）

最佳

爱吃草莓的葡萄2024-05-06 14:28:47

同学你好。K-means聚类算法，用于将数据集划分为K个簇（cluster），其目标是使得每个数据点与其簇中心的距离之和最小。算法的核心步骤包括初始化聚类中心、分配数据点到最近的聚类中心，以及更新聚类中心。
1. 初始化聚类中心：随机选择K个数据点作为初始聚类中心。
2. 分配数据点到最近的聚类中心：
   - 对于数据集中的每一个数据点，计算它与每个聚类中心的距离。
   - 将每个数据点分配到最近的聚类中心所代表的簇中。
3. 更新聚类中心：
   - 当所有数据点都被分配到簇后，计算每个簇的新中心。
   - 新的聚类中心是簇内所有数据点的均值，即对于每一个簇，计算所有属于该簇的数据点的平均值，这个平均值就是新的聚类中心。
4. 迭代直至收敛：
   - 重复步骤2和步骤3，直至满足停止条件。停止条件可以是聚类中心的变化小于某个阈值，或者达到预设的迭代次数。
   - 在每次迭代中，聚类中心的更新将导致数据点被重新分配到更合适的簇，最终达到一个稳定状态，此时聚类中心不再有显著变化。