天堂之歌

听歌而来,送我踏青云〜

您现在的坐在位置:首页>智汇问答>CFA二级

Shihairong2024-05-04 17:55:23

K mean clustering后续类中心或者质心centroid的决定步骤是怎样的,麻烦介绍一下

回答(1)

最佳

爱吃草莓的葡萄2024-05-06 14:28:47

同学你好。K-means聚类算法,用于将数据集划分为K个簇(cluster),其目标是使得每个数据点与其簇中心的距离之和最小。算法的核心步骤包括初始化聚类中心、分配数据点到最近的聚类中心,以及更新聚类中心。
1. 初始化聚类中心:随机选择K个数据点作为初始聚类中心。
2. 分配数据点到最近的聚类中心:
   - 对于数据集中的每一个数据点,计算它与每个聚类中心的距离。
   - 将每个数据点分配到最近的聚类中心所代表的簇中。
3. 更新聚类中心:
   - 当所有数据点都被分配到簇后,计算每个簇的新中心。
   - 新的聚类中心是簇内所有数据点的均值,即对于每一个簇,计算所有属于该簇的数据点的平均值,这个平均值就是新的聚类中心。
4. 迭代直至收敛:
   - 重复步骤2和步骤3,直至满足停止条件。停止条件可以是聚类中心的变化小于某个阈值,或者达到预设的迭代次数。
   - 在每次迭代中,聚类中心的更新将导致数据点被重新分配到更合适的簇,最终达到一个稳定状态,此时聚类中心不再有显著变化。

  • 评论(0
  • 追问(2
评论
追问
关于:新的聚类中心是簇内所有数据点的均值,即对于每一个簇,计算所有属于该簇的数据点的平均值,这个平均值就是新的聚类中心。 平均值的计算是不是每一点都有一个座标(x,y),类中心的座标为(西格玛Xi/n,西格玛Yi/n). 谢谢。
追答
同学你好。思路是的,但是是何种平均方法依具体情况而言。

精品推荐

评论

0/1000

追答

0/1000

+上传图片

    400-700-9596
    (每日9:00-21:00免长途费 )

    ©2025金程网校保留所有权利

    X

    注册金程网校

    验证码

    同意金程的《用户协议》
    直接登录:

    已有账号登录