机器学习中的常见学习模型

简介: Linear Model fθ(x)=∑j=1bθjϕj(x)=θTϕ(x)f_{\theta}(x)=\sum_{j=1}^{b}\theta_{j}\phi_{j}(x)=\theta^{T}\phi(x) where ϕ(x)\phi(x ) is the basis function vector and θ\theta is the parameter ve

Linear Model

fθ(x)=j=1bθjϕj(x)=θTϕ(x)

where ϕ(x) is the basis function vector and θ is the parameter vector. As you can see, there are b basis functions.
Basis functions can be of different form, such as polynomial:
ϕ(x)=(1,x,x2,,xb1)T

or triangular polynomial:
ϕ(x)=(1,sinx,cosx,sin2x,cos2x,,sinmx,cosmx)T

x may be a vector rather than a scalar. However, linear models have nothing to do with the training set.
Multiplicative Model
Taking the one-dim basis functions as factors in order to get multi-dim basis functions.

fθ(x)=j1=1bjd=1bθj1,jdϕj1(x(1))ϕjd(x(d))

Obvious curse of dimension.
Additive Model
fθ(x)=k=1dj=1bθk,jϕj(x(k))

Kernal Model
Kernal functions are binary, relate to the training set. Kernal models are defined as linear combinations of kernal functions.

fθ(x)=j=1nθjK(x,xj)

There are many types of kernal functions, however, Gaussian kernal functions enjoy the most popularity.
K(x,c)=exp(xc22h2)

As you can see, kernal models assign kernals with respect to the training sample xi and then learn their height θi. Therefore, they can approximate functions only in the neighborhood of training samples regardless of the dimension of xi.

Hierarchy Model
Hierarchy models belong to nonlinear models.

fθ(x)=j=1bαjϕ(x,βj)

Hence, θ=(αT,βT1,,βTb)T. ϕ(x,βj) are basis functions. There are 2 typical basis functions:
S function (or Artificial Neural Network)
ϕ(x,β)=11+exp(xTωγ),β=(ωT,γ)T

Gaussian function
ϕ(x,β)=exp(xc22h2),β=(cT,h)T

Note that θ and fθ are not one to one corresponded.
相关文章
|
2月前
|
人工智能 自然语言处理 IDE
模型微调不再被代码难住!PAI和Qwen3-Coder加速AI开发新体验
通义千问 AI 编程大模型 Qwen3-Coder 正式开源,阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型,并可在交互式建模环境中使用 Qwen3-Coder 模型。
674 109
|
3月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
月之暗面发布开源模型Kimi K2,采用MoE架构,参数达1T,激活参数32B,具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署,提供企业级方案。
301 0
【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型
|
6月前
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
7月前
|
人工智能 运维 API
PAI-Model Gallery云上一键部署阶跃星辰新模型Step1X-Edit
4月27日,阶跃星辰正式发布并开源图像编辑大模型 Step1X-Edit,性能达到开源 SOTA。Step1X-Edit模型总参数量为19B,实现 MLLM 与 DiT 的深度融合,在编辑精度与图像保真度上实现大幅提升,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力;支持文字替换、风格迁移等11 类高频图像编辑任务类型。在最新发布的图像编辑基准 GEdit-Bench 中,Step1X-Edit 在语义一致性、图像质量与综合得分三项指标上全面领先现有开源模型,比肩 GPT-4o 与 Gemin。PAI-ModelGallery 支持Step1X-Edit一键部署方案。
|
4月前
|
机器学习/深度学习 算法 安全
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
本文探讨在敏感数据上应用差分隐私(DP)进行机器学习的挑战与实践。通过模拟DP-SGD算法,在模型训练中注入噪声以保护个人隐私。实验表明,该方法在保持71%准确率和0.79 AUC的同时,具备良好泛化能力,但也带来少数类预测精度下降的问题。研究强调差分隐私应作为模型设计的核心考量,而非事后补救,并提出在参数调优、扰动策略选择和隐私预算管理等方面的优化路径。
365 3
差分隐私机器学习:通过添加噪声让模型更安全,也更智能
|
3月前
|
人工智能 自然语言处理 运维
【新模型速递】PAI-Model Gallery云上一键部署gpt-oss系列模型
阿里云 PAI-Model Gallery 已同步接入 gpt-oss 系列模型,提供企业级部署方案。
|
4月前
|
机器学习/深度学习 人工智能 算法
Post-Training on PAI (4):模型微调SFT、DPO、GRPO
阿里云人工智能平台 PAI 提供了完整的模型微调产品能力,支持 监督微调(SFT)、偏好对齐(DPO)、强化学习微调(GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级,分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。
|
4月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。
|
4月前
|
机器学习/深度学习 存储 Java
Java 大视界 -- Java 大数据机器学习模型在游戏用户行为分析与游戏平衡优化中的应用(190)
本文探讨了Java大数据与机器学习模型在游戏用户行为分析及游戏平衡优化中的应用。通过数据采集、预处理与聚类分析,开发者可深入洞察玩家行为特征,构建个性化运营策略。同时,利用回归模型优化游戏数值与付费机制,提升游戏公平性与用户体验。

热门文章

最新文章