【AI底层逻辑】——篇章5(下):机器学习算法之聚类&降维&时间序列

柯宝最帅 2024-07-05 16:31:03 阅读 50

续上:

目录

4、聚类

5、降维

6、时间序列

三、无完美算法

往期精彩:


4、聚类

聚类即把相似的东西归在一起,与分类不同的是,聚类要处理的是没有标签的数据集,它根据样本数据的分布特性自动进行归类

人在认知是事物时倾向于简化,虽然世界上不存在完全相同的个体,但是却不影响对它们进行归类,大脑用抽取共性的方式使得我们快速记忆不同的事物。

聚类是典型的无监督学习算法,基本思路都是利用每个数据样本所表示的向量之间的“距离”或密集程度来进行归类。这与分类算法中的K邻近算法思路相近。典型的“计算距离”的聚类算法有K均值(K-Means)算法,具体步骤如下:

<code>1、任意取k个数据点作为初始中心

2、依次计算其他点到这些中心的距离;

3、将每个点归类到与它距离最近的中心,每个类别下点下的集合是一个类簇;

4、重新计算各类簇的中心位置(即类簇中所有点的中心——质心;

5、重复上述2、3、4步骤,直到所有数据点都被归类,且类簇的中心位置没有明显变化;

此时可认为聚类任务完成,其基本思路就是不断拉拢身边距离相近的样本数据,将它们归为同类。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。