Machine Learning-L11-KNN

简介: Machine Learning-L11-KNN

1. 急切学习 v.s. 惰性学习


急切学习法(Eager leaner)

在接收检验元组前就构造泛化模型(分类模型),学习后的模型已就绪,并急于对未见过的元组进行分类。

惰性学习法(Lazy leaner)

简单存储训练元组,并一直等待,直到给定一个检验元组才进行泛化,以便根据与存储的训练元组的相似性对该元组进行分类。

惰性学习也称基于实例的学习(Instance based learner)、基于类比学习、“赢家通吃”学习或者“基于记忆的学习”。


算法模型先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较,通过这种方式来寻找最佳的匹配。即通过将给定的检验元组与和它相似的训练元组进行比较来学习。


具有以下优点:


适合在并行硬件上实现

天生支持增量学习

能对复杂决策空间建模

常见的算法包括:


KNN(K-Nearest Neighbor)

学习矢量量化(Learning Vector Quantization, LVQ)

自组织映射算法(Self-Organizing Map, SOM)


2. KNN


KNN所有训练元组都存放在n维模式空间中,当给定一个未知元组时,搜索模式空间,找出最接近未知元组的k个训练元组(k个“最近邻”)。


对于k-近邻分类,返回k个最近邻的多数类

KNN也可用于数值预测,返回k个最近邻的数值的平均值


202004262054398.png


“邻近性”用距离度量,对于x = ( X1 X2    , . . . ,Xn)


欧几里得距离:


image.png

曼哈顿距离:

image.png


闵可夫斯基距离:


image.png

目录
打赏
0
0
0
0
54
分享
相关文章
基于阿里云文档智能和RAG快速构建企业"第二大脑"
在数字化转型的背景下,企业面临海量文档管理的挑战。传统的文档管理方式效率低下,难以满足业务需求。阿里云推出的文档智能(Document Mind)与检索增强生成(RAG)技术,通过自动化解析和智能检索,极大地提升了文档管理的效率和信息利用的价值。本文介绍了如何利用阿里云的解决方案,快速构建企业专属的“第二大脑”,助力企业在竞争中占据优势。
当心成本陷阱,这可能会给宝贵的网络安全预算带来压力
当心成本陷阱,这可能会给宝贵的网络安全预算带来压力
kde
|
22天前
|
Docker镜像加速指南:手把手教你配置国内镜像源
配置国内镜像源可大幅提升 Docker 拉取速度,解决访问 Docker Hub 缓慢问题。本文详解 Linux、Docker Desktop 配置方法,并提供测速对比与常见问题解答,附最新可用镜像源列表,助力高效开发部署。
kde
10970 82
阿里云百炼全新发布Qwen3-Coder-Plu并开源,重磅升级Qwen3-235B
面向全球的智能编程引擎Qwen3-Coder正式开源!首发旗舰版Qwen3-Coder-480B-A35B-Instruct,拥有480B参数、35B有效参数,基于MoE架构,模型在Agentic Coding、浏览器智能操作及基础编码任务中刷新SOTA纪录,并同步开源完整工具链,包括Qwen Code命令行工具、Claude Code集成、VS Code插件及阿里云平台API支持。Qwen3-Coder支持256K上下文,最高可扩展至1M,适用于仓库级代码理解。通过强化学习技术,实现多轮交互与自主决策,大幅提升代码执行成功率。开发者可通过阿里云百炼平台直接体验或调用API使用。
947 0
连续四年,阿里云再获市场份额第一
IDC报告:阿里云再获公有云云工作负载安全市场份额第一!
云上十五年——弹性计算系列客户故事(一)
技术的价值在于解决真实业务挑战。为记录这十五年的共同成长,阿里云特别推出《云上十五年》客户故事专栏,分享与各行业伙伴的实践成果。新起点开启新征程,阿里云持续突破核心技术,让云计算的“澎湃算力”,持续为各行各业提供“创新动力”。
云上十五年——弹性计算系列客户故事(一)
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等