K-Means++聚类算法,聚类结果可视化,Matlab源代码。
K-Means++算法是K-Means算法的改进版,主要是为了选择出更优的初始聚类中心,以提高聚类结果的准确性。
算法基本思路如下:
1.在数据集中随机选择一个样本作为第一个初始聚类中心;
2.选择出其余的聚类中心:
- 计算数据集中的每一个样本与已经初始化的聚类中心之间的距离,并选择其中最短的距离,记为 id ;
- 以概率选择距离最大的样本作为新的聚类中心,重复上述过程,直到k kk个聚类中心都被确定。
3.对k 个初始的聚类中心,利用K-Means算法计算出最终的聚类中心。
从Excel表格中读取数据,直接替换数据就可以使用。程序内有详细注释,便于理解程序运行。
运行效果展示:
资料包含的文件及数据样式展示: