文档备案控制台

开发者社区人工智能文章正文

【机器学习算法】6、K-Means流程结束要不要多问几个为什么呢？（一）

2023-05-17 178

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 【机器学习算法】6、K-Means流程结束要不要多问几个为什么呢？（一）

简介

K-Means算法是一种基于样本间相似性度量的据类算法，即将数据点到原型的某种距离作为优化的目标函数。

K-Means算法聚类过程示意图

算法的流程

距离度量

1、欧式距离

2、曼哈顿距离

3、切比雪夫距离

4、余弦距离

5、Jaccard相关系数

6、相关系数

而K-Means算法选择的距离度量方法是误差平方和（SSE,Sum of the Square Error），也就是欧式距离，作为聚类的目标函数。该算法的最终目的式得到紧凑且独立的簇。因此两次运行K-Means算法产生两个不同的簇类中，SSE小的那个簇类更优：

其中K表示聚类中心的个数，Ci表示第几个聚类中心，dist表示欧式距离聚类，xi是划分到Ci中的样本。

文章标签：

机器学习/深度学习

数据挖掘

算法

关键词：

机器学习算法

人工智能平台 PAI算法

算法流程

人工智能平台 PAI k-means

算法k-means

5i77ajz5u7ji6

目录

相关文章

yunqingjishu

|

机器学习/深度学习人工智能算法

算法备案全流程实操

随着《生成式人工智能服务管理暂行办法》在2024年实施，算法备案成为强制性要求。未合规将导致APP下架或高额罚款。本文详解算法备案的核心逻辑与流程，涵盖必备案算法类型、三大监管红线、六大阶段的关键节点，并提供阿里云工具支持，如合规预评估平台和备案助手插件。内容包括金融风控算法的可解释性要求、生成式AI的内容安全措施及个人开发者的技术能力证明方法，助力开发者实现持续合规。

yunqingjishu

1585 4 4

游客rj7kdyude6p6g

|

6月前

|

机器学习/深度学习数据采集人工智能

【机器学习算法篇】K-近邻算法

K近邻（KNN）是一种基于“物以类聚”思想的监督学习算法，通过计算样本间距离，选取最近K个邻居投票决定类别。支持多种距离度量，如欧式、曼哈顿、余弦相似度等，适用于分类与回归任务。结合Scikit-learn可高效实现，需合理选择K值并进行数据预处理，常用于鸢尾花分类等经典案例。（238字）

游客rj7kdyude6p6g

1940 7 7

martinzh717

|

11月前

|

机器学习/深度学习数据采集人工智能

20分钟掌握机器学习算法指南

在短短20分钟内，从零开始理解主流机器学习算法的工作原理，掌握算法选择策略，并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻，帮助你告别算法选择的困惑，轻松踏入AI的大门。

martinzh717

802 8 10

杭州奥零数据科技

|

机器学习/深度学习存储 Kubernetes

【重磅发布】AllData数据中台核心功能：机器学习算法平台

杭州奥零数据科技有限公司成立于2023年，专注于数据中台业务，维护开源项目AllData并提供商业版解决方案。AllData提供数据集成、存储、开发、治理及BI展示等一站式服务，支持AI大模型应用，助力企业高效利用数据价值。

杭州奥零数据科技

774 6 7

云流雨洄

|

机器学习/深度学习人工智能自然语言处理

AI训练师入行指南（三）：机器学习算法和模型架构选择

从淘金到雕琢，将原始数据炼成智能珠宝！本文带您走进数字珠宝工坊，用算法工具打磨数据金砂。从基础的经典算法到精密的深度学习模型，结合电商、医疗、金融等场景实战，手把手教您选择合适工具，打造价值连城的智能应用。掌握AutoML改装套件与模型蒸馏术，让复杂问题迎刃而解。握紧算法刻刀，为数字世界雕刻文明！

云流雨洄

474 6 6

简简单单做算法

|

机器学习/深度学习算法数据安全/隐私保护

基于机器学习的人脸识别算法matlab仿真,对比GRNN,PNN,DNN以及BP四种网络

本项目展示了人脸识别算法的运行效果（无水印），基于MATLAB2022A开发。核心程序包含详细中文注释及操作视频。理论部分介绍了广义回归神经网络（GRNN）、概率神经网络（PNN）、深度神经网络（DNN）和反向传播（BP）神经网络在人脸识别中的应用，涵盖各算法的结构特点与性能比较。

简简单单做算法

454 9 9

技术小达人

|

人工智能编解码算法

使用 PAI-DSW x Free Prompt Editing图像编辑算法，开发个人AIGC绘图小助理

使用 PAI-DSW x Free Prompt Editing图像编辑算法，开发个人AIGC绘图小助理

技术小达人

559 0 0

龙大吉

|

机器学习/深度学习算法数据挖掘

K-means聚类算法是机器学习中常用的一种聚类方法，通过将数据集划分为K个簇来简化数据结构

K-means聚类算法是机器学习中常用的一种聚类方法，通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理，包括初始化、数据点分配与簇中心更新等步骤，以及如何在Python中实现该算法，最后讨论了其优缺点及应用场景。

龙大吉

1637 6 6

Echo_Wish

|

机器学习/深度学习人工智能算法

机器学习算法的优化与改进：提升模型性能的策略与方法

机器学习算法的优化与改进：提升模型性能的策略与方法

Echo_Wish

2487 13 13

机器学习算法的优化与改进：提升模型性能的策略与方法

楠竹11

|

机器学习/深度学习算法网络安全

CCS 2024：如何严格衡量机器学习算法的隐私泄露？ ETH有了新发现

在2024年CCS会议上，苏黎世联邦理工学院的研究人员提出，当前对机器学习隐私保护措施的评估可能存在严重误导。研究通过LiRA攻击评估了五种经验性隐私保护措施（HAMP、RelaxLoss、SELENA、DFKD和SSL），发现现有方法忽视最脆弱数据点、使用较弱攻击且未与实际差分隐私基线比较。结果表明这些措施在更强攻击下表现不佳，而强大的差分隐私基线则提供了更好的隐私-效用权衡。

楠竹11

382 14 15

热门文章

最新文章

阿里云工程师用机器学习破解雾霾成因

SparkML机器学习之特征工程（二）特征转化（Binarizer、StandardScaler、MaxAbsScaler、Normalizer、N-gram、Tokenizer等）

手把手丨我们在UCL找到了一个糖尿病数据集，用机器学习预测糖尿病

【机器学习】numpy实现Adam优化器

上手体验华为AI平台ModelArts

机器学习：物联网成功的诀窍？

构建高效机器学习模型：从数据预处理到模型优化

机器学习-ROC曲线：技术解析与实战应用

通过阿里云 Milvus 与 PAI 搭建高效的检索增强生成（RAG）系统

【机器学习】Spark ML 对数据进行规范化预处理 StandardScaler 与向量拆分

深度学习500问——Chapter02：机器学习基础（5）

深度学习500问——Chapter02：机器学习基础（2）

深度学习500问——Chapter02：机器学习基础（1）

【机器学习】样本、特征、标签：构建智能模型的三大基石

【机器学习】包裹式特征选择之基于模型的特征选择法

利用机器学习优化数据中心的能源效率

利用机器学习优化数据中心的能源效率

构建高效机器学习模型的策略与实践

利用机器学习算法改善电商推荐系统的效率

构建高效机器学习模型的策略与实践

相关课程

更多

场景实践 - 机器学习PAI实现精细化营销

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

场景实践 - 基于机器学习进行收入预测分析

机器学习概览及常见算法

机器学习入门-概念原理及常用算法

神经网络概览及算法详解

相关电子书

更多

微博机器学习平台架构和实践

机器学习及人机交互实战

大数据与机器学习支撑的个性化大屏

下一篇

ECS账号安全防护最佳实践