文档备案控制台

开发者社区人工智能文章正文

机器学习实战-K-nearest neighbors 算法的优缺点

2015-12-10 1244

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： K临近算法是基于实例的学习，使用算法的时候我们必须要有接近分类结果的实例训练样本数据。优点：精度高，对异常值不敏感缺点：时间复杂度和空间复杂度比较大。（如果训练样本数据集比较大，需要大量的空间来保存数据，并且需要待预测数据和训练样本数据集每条数据的距离，耗费时间。

K临近算法是基于实例的学习，使用算法的时候我们必须要有接近分类结果的实例训练样本数据。

优点：精度高，对异常值不敏感

缺点：

时间复杂度和空间复杂度比较大。（如果训练样本数据集比较大，需要大量的空间来保存数据，并且需要待预测数据和训练样本数据集每条数据的距离，耗费时间。）
无法给出任何数据的基础结构信息，因此无法知晓平均实例样本和典型事例样本有什么特征。
无法持久化分类器。

作者： HarlanC

博客地址： http://www.cnblogs.com/harlanc/
个人博客： http://www.harlancn.me/
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出, 原文链接

如果觉的博主写的可以，收到您的赞会是很大的动力，如果您觉的不好，您可以投反对票，但麻烦您留言写下问题在哪里，这样才能共同进步。谢谢！

文章标签：

算法

机器学习/深度学习

关键词：

人工智能平台 PAI算法

机器学习算法

人工智能平台 PAI实战

实战算法

人工智能平台 PAI优缺点

harlanc

目录

相关文章

青云交（Java大数据AI云原生Python）

|

负载均衡算法关系型数据库

大数据大厂之MySQL数据库课程设计：揭秘MySQL集群架构负载均衡核心算法：从理论到Java代码实战，让你的数据库性能飙升！

本文聚焦 MySQL 集群架构中的负载均衡算法，阐述其重要性。详细介绍轮询、加权轮询、最少连接、加权最少连接、随机、源地址哈希等常用算法，分析各自优缺点及适用场景。并提供 Java 语言代码实现示例，助力直观理解。文章结构清晰，语言通俗易懂，对理解和应用负载均衡算法具有实用价值和参考价值。

青云交（Java大数据AI云原生Python）

736 14 15

大数据大厂之MySQL数据库课程设计：揭秘MySQL集群架构负载均衡核心算法：从理论到Java代码实战，让你的数据库性能飙升！

Deephub

|

10月前

|

算法数据可视化测试技术

HNSW算法实战：用分层图索引替换k-NN暴力搜索

HNSW是一种高效向量检索算法，通过分层图结构实现近似最近邻的对数时间搜索，显著降低查询延迟。相比暴力搜索，它在保持高召回率的同时，将性能提升数十倍，广泛应用于大规模RAG系统。

Deephub

795 10 10

HNSW算法实战：用分层图索引替换k-NN暴力搜索

游客rj7kdyude6p6g

|

10月前

|

机器学习/深度学习数据采集人工智能

【机器学习算法篇】K-近邻算法

K近邻（KNN）是一种基于“物以类聚”思想的监督学习算法，通过计算样本间距离，选取最近K个邻居投票决定类别。支持多种距离度量，如欧式、曼哈顿、余弦相似度等，适用于分类与回归任务。结合Scikit-learn可高效实现，需合理选择K值并进行数据预处理，常用于鸢尾花分类等经典案例。（238字）

游客rj7kdyude6p6g

2321 7 7

魔羯座liaotianfeile

|

10月前

|

机器学习/深度学习缓存算法

微店关键词搜索接口核心突破：动态权重算法与语义引擎的实战落地

本文详解微店搜索接口从基础匹配到智能推荐的技术进阶路径，涵盖动态权重、语义理解与行为闭环三大创新，助力商家提升搜索转化率、商品曝光与用户留存，实现技术驱动的业绩增长。

魔羯座liaotianfeile

330 1 1

蒋星熠Jaxonic

|

11月前

|

机器学习/深度学习资源调度算法

遗传算法模型深度解析与实战应用

摘要遗传算法（GA）作为一种受生物进化启发的优化算法，在复杂问题求解中展现出独特优势。本文系统介绍了GA的核心理论、实现细节和应用经验。算法通过模拟自然选择机制，利用选择、交叉、变异三大操作在解空间中进行全局搜索。与梯度下降等传统方法相比，GA不依赖目标函数的连续性或可微性，特别适合处理离散优化、多目标优化等复杂问题。文中详细阐述了染色体编码、适应度函数设计、遗传操作实现等关键技术，并提供了Python代码实现示例。实践表明，GA的成功应用关键在于平衡探索与开发，通过精心调参维持种群多样性同时确保收敛效率

蒋星熠Jaxonic

529 7 7

蒋星熠Jaxonic

|

11月前

|

机器学习/深度学习边缘计算人工智能

粒子群算法模型深度解析与实战应用

蒋星熠Jaxonic是一位深耕智能优化算法领域多年的技术探索者，专注于粒子群优化（PSO）算法的研究与应用。他深入剖析了PSO的数学模型、核心公式及实现方法，并通过大量实践验证了其在神经网络优化、工程设计等复杂问题上的卓越性能。本文全面展示了PSO的理论基础、改进策略与前沿发展方向，为读者提供了一份详尽的技术指南。

蒋星熠Jaxonic

502 0 0

粒子群算法模型深度解析与实战应用

aliyun4145988376

|

10月前

|

存储人工智能算法

从零掌握贪心算法Java版：LeetCode 10题实战解析（上）

在算法世界里，有一种思想如同生活中的"见好就收"——每次做出当前看来最优的选择，寄希望于通过局部最优达成全局最优。这种思想就是贪心算法，它以其简洁高效的特点，成为解决最优问题的利器。今天我们就来系统学习贪心算法的核心思想，并通过10道LeetCode经典题目实战演练，带你掌握这种"步步为营"的解题思维。

aliyun4145988376

507 0 0

Deephub

|

机器学习/深度学习存储运维

机器学习异常检测实战：用Isolation Forest快速构建无标签异常检测系统

本研究通过实验演示了异常标记如何逐步完善异常检测方案和主要分类模型在欺诈检测中的应用。实验结果表明，Isolation Forest作为一个强大的异常检测模型，无需显式建模正常模式即可有效工作，在处理未见风险事件方面具有显著优势。

Deephub

1083 46 46

martinzh717

|

机器学习/深度学习数据采集人工智能

20分钟掌握机器学习算法指南

在短短20分钟内，从零开始理解主流机器学习算法的工作原理，掌握算法选择策略，并建立对神经网络的直观认识。本文用通俗易懂的语言和生动的比喻，帮助你告别算法选择的困惑，轻松踏入AI的大门。

martinzh717

1016 8 10

热门文章

最新文章

大规模模型训练tricks集锦

MME-CoT：多模态模型推理能力终极评测！六大领域细粒度评估，港中大等机构联合推出

【机器学习】支持向量机SVM、逻辑回归LR、决策树DT的直观对比和理论对比，该如何选择（面试回答）？

探索机器学习中的过拟合与欠拟合：原理与实践

利用机器学习进行股票市场预测

FFA 2021 专场解读 - 生产实践 / 机器学习

【机器学习】RLHF：在线方法与离线算法在大模型语言模型校准中的博弈

Hadoop与机器学习的融合：案例研究

使用机器学习技术进行时间序列缺失数据填充：基础方法与入门案例

分布式机器学习系统：设计原理、优化策略与实践经验

基于Python_opencv人脸录入、识别系统（应用dlib机器学习库）（下）

基于Python_opencv人脸录入、识别系统（应用dlib机器学习库）（上）

深入Scikit-learn：掌握Python最强大的机器学习库

OpenCV（Open Source Computer Vision Library）是一个开源的计算机视觉和机器学习库，它提供了大量的函数和工具，用于处理图像和视频数据。

介绍文本分类的基本概念、常用方法以及如何在Python中使用机器学习库进行文本分类

探索Scikit-learn：机器学习库的入门与进阶

深度解析Python中的机器学习库：Scikit-learn

【Python机器学习专栏】Python环境下的机器学习库概览

探秘scikit-learn：机器学习库的核心功能详解

机器学习实战第3天：手写数字识别

相关课程

更多

场景实践 - 机器学习PAI实现精细化营销

场景实践 - 基于阿里云PAI机器学习平台使用时间序列分解模型预测商品销量

场景实践 - 基于机器学习进行收入预测分析

机器学习概览及常见算法

机器学习入门-概念原理及常用算法

神经网络概览及算法详解

相关电子书

更多

阿里巴巴机器学习平台AI

微博机器学习平台架构和实践

机器学习及人机交互实战

下一篇

一条命令迁移，帮你实现 OpenClaw 与 Hermes Agent 记忆互通！