聚类算法| K-Means++聚类算法(Matlab源代码,聚类结果可视化)

作品简介

K-Means++聚类算法,聚类结果可视化,Matlab源代码。

K-Means++算法是K-Means算法的改进版,主要是为了选择出更优的初始聚类中心,以提高聚类结果的准确性。

算法基本思路如下:

1.在数据集中随机选择一个样本作为第一个初始聚类中心;

2.选择出其余的聚类中心:

  • 计算数据集中的每一个样本与已经初始化的聚类中心之间的距离,并选择其中最短的距离,记为 id ;
  • 以概率选择距离最大的样本作为新的聚类中心,重复上述过程,直到k kk个聚类中心都被确定。

3.对k 个初始的聚类中心,利用K-Means算法计算出最终的聚类中心。

从Excel表格中读取数据,直接替换数据就可以使用。程序内有详细注释,便于理解程序运行。

运行效果展示:

资料包含的文件及数据样式展示:




创作时间: