机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
71735内容
炎鹊「Nexus Agent V1.0」:垂直领域AI应用的原生能力引擎
炎鹊AI「Nexus Agent V1.0」是垂直行业专属AI原生引擎,融合大模型、AIGA决策大脑、行业知识图谱与专属模型,打造“感知-决策-执行”闭环。支持21个行业低代码构建工具型、员工型、决策型AI应用,实现技术到业务价值的高效转化,推动AI从实验走向规模化落地。(239字)
|
11小时前
|
从贝叶斯视角解读Transformer的内部几何:mHC的流形约束与大模型训练稳定性
大模型训练常因架构改动破坏内部贝叶斯几何结构,导致不稳定。研究表明,Transformer通过残差流、注意力与值表征在低维流形上实现类贝叶斯推理。mHC通过约束超连接保护这一几何结构,确保规模化下的训练稳定与推理一致性。
构建AI智能体:七十九、从SVD的理论到LoRA的实践:大模型低秩微调的内在逻辑
本文系统介绍了奇异值分解(SVD)的核心原理及其在大模型微调中的应用。文章首先通过水果沙拉制作、员工评选等生活化案例,形象解释了SVD将复杂矩阵分解为三个简单矩阵乘积的过程。随后详细阐述了SVD公式A=UΣVᵀ的数学含义,包括奇异值矩阵Σ作为"重要性权重表"的关键作用。重点剖析了SVD的低秩近似特性,展示了如何通过保留主要奇异值实现数据压缩。最后深入探讨了SVD对LoRA技术的指导作用:通过分析权重更新矩阵的奇异值分布,科学确定低秩适配器的秩参数,实现大模型的高效微调。
|
17小时前
|
2026年2核4G云服务器租用价格指南:不同时长(月付/年付/3年/5年)配置费用对比
2026年2核4G云服务器租用多少钱?本文介绍了最新的2 核4G云服务器租用价格:实例收费标准、活动价格及选配教程,以阿里云为例。
构建AI智能体:八十一、SVD模型压缩的艺术:如何科学选择K值实现最佳性能
本文探讨了SVD(奇异值分解)在深度学习模型压缩中的应用。随着模型规模不断扩大,面临的存储、计算和能耗问题日益突出。SVD通过将大型矩阵分解为三个特殊矩阵(U、Σ、Vᵀ),并根据奇异值大小进行截断,实现模型的高效压缩。文章详细分析了SVD的数学原理、压缩机制和参数选择策略,重点讨论了如何通过能量保留、目标压缩率和拐点检测等方法确定最佳截断秩k。以一个500×300的用户-物品矩阵为例,实证显示k=32时能实现82.93%的压缩率,99.97%的能量保留和5.86倍计算加速,达到了精度损失与压缩收益的最佳平衡
2026年阿里云AI服务器配置与价格详解:GPU服务器1个月、1年及1小时租赁费用对比
2026年阿里云AI服务器配置与价格详解:GPU服务器1个月、1年及1小时租赁费用对比。2026年阿里云 AI 服务器提供多样化硬件组合方案,涵盖 CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC 等多种加速卡配置,具备超强计算能力,主要适用于人工智能、机器学习、深度学习等计算密集型任务,同时也可满足科学计算、图形可视化、视频处理等场景的算力需求。以下是其 GPU 服务器的具体规格、价格及适用场景整理:
2026年阿里云服务器费用详解:年付、月付与小时计费全览
2026年阿里云服务器推出多重优惠活动,覆盖 ECS 云服务器、轻量应用服务器、GPU 服务器等主流机型,支持北京、上海、中国香港、新加坡、日本、美国等多地域部署。爆款配置性价比突出,轻量应用服务器低至 38 元 / 年,ECS 经济型服务器 99 元 / 年起,GPU 服务器小时计费 1.2 元起,满足个人开发者、企业及 AI 训练等不同场景需求。
|
1天前
|
DeepSeek 开年王炸:mHC 架构用流形约束重构 ResNet 残差连接
大过节DeepSeek在arXiv发布mHC新论文,挑战Transformer残差连接范式。通过流形约束(谱范数+双重随机矩阵),在保持高带宽信息通路的同时恢复恒等映射稳定性,解决深层网络梯度传播难题,理论扎实且兼顾系统效率,或成“后Transformer时代”架构新方向。
|
1天前
| |
来自: 弹性计算
阿里云服务器架构解析:从X86、ARM计算到GPU加速和高性能计算架构的区别与选型指南
在我们选购阿里云服务器的时候,云服务器的架构有多种选项,涵盖X86计算、ARM计算、GPU加速、弹性裸金属服务器以及高性能计算等,每种架构均具备独特的技术特性与适用场景。有的新手用户可能不知道他们之间的区别以及主要适用场景,本文为大家解析这些架构的差异,以及不同架构的核心优势与典型应用场景,为大家提供一套云服务器架构选型参考指南。
免费试用