异构计算

首页 标签 异构计算
# 异构计算 #
关注
19352内容
|
9小时前
|
大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了
在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......
|
14小时前
|
AI 十大论文精讲(四):0.01% 参数实现全量大模型微调效果?LoRA 的低秩适配之谜
本文解读AI十大核心论文之二《LoRA:大语言模型的低秩适配》。该技术通过冻结预训练权重、引入低秩矩阵更新,实现参数效率提升万倍,显存占用降70%,推理无延迟,使大模型微调从资源密集转向轻量化,成为当前高效微调的事实标准。
|
1天前
|
《Unity渲染实战宝典:突破平台限制的优化策略》
本文聚焦Unity渲染的核心优化逻辑,深入解构渲染管线、材质系统、光照阴影、后处理、纹理资源及管线适配六大关键环节。针对开发者易陷入的参数堆砌误区,结合不同平台硬件特性,提出“分层适配”“视觉欺骗”“精准裁剪”等实战策略—如动态平衡实时光源与烘焙光照、精简Shader冗余变体、分级配置后处理效果、优化纹理分辨率与压缩格式。
PAIFuser:面向图像视频的训练推理加速框架
阿里云PAI推出PAIFuser框架,专为视频生成模型设计,通过模型并行、量化优化、稀疏运算等技术,显著提升DiT架构的训练与推理效率。实测显示,推理耗时最高降低82.96%,训练时间减少28.13%,助力高效低成本AI视频生成。
|
1天前
| |
来自: 云原生
ModelScope 模型一键上线?FunModel 帮你 5 分钟从零到生产
FunModel 依托 Serverless + GPU,天然提供了简单,轻量,0 门槛的模型集成方案,给个人开发者良好的玩转模型的体验,也让企业级开发者快速高效的部署、运维和迭代模型。在阿里云 FunModel 平台,开发者可以做到:模型的快速部署上线:从原来的以周为单位的模型接入周期降低到 5 分钟,0 开发,无排期;一键扩缩容,让运维不再是负担:多种扩缩容策略高度适配业务流量,实现“无痛运维”。
|
1天前
| |
来自: 云原生
AI 原生应用开发实战营·深圳站分享材料
本书基于已发布并广受业界关注的 《AI 原生应用架构白皮书》(累计下载超 10,000 份),围绕 AI 原生应用的 DEVOPS 全生命周期,从架构设计、技术选型、工程实践到运维优化,对概念和难点进行系统化地分享。
|
2天前
|
《Unity优化指南:直击引擎本质的非典型技术路径》
本文聚焦Unity开发中突破性能瓶颈的深层技术逻辑,跳出常规优化思维,从引擎底层运行本质出发,解构资源导入管线、渲染管线协同、内存与缓存联动、多平台适配重构、逻辑架构设计、调试与性能监控六大核心维度。文章摒弃表层API应用,深入剖析各模块隐性关联与协同规律,提供非典型优化路径——从资源导入的标准化适配,到渲染各阶段的高效联动,再到内存数据的结构化布局、跨平台的底层适配、架构的解耦扩展及进阶调试监控方案。通过系统性的底层认知与实操思路,帮助开发者跳出"单点优化"困境,解决性能波动、兼容性故障等核心痛点,实现项目性能与体验的双重突破,为Unity进阶开发提供深度技术指引。
|
4天前
|
《服务器行为规范》实施细则(第一版)
《服务器成精鉴定指南》以幽默笔调规范机房行为:严禁用手机摸鱼、违规支架,违者断电、支教或通报;发现拟人化、跨兴趣、身份错乱等“成精”迹象,分级处置并引导正向发展,兼顾纪律与创意。(238字)
容器市场高速增长,阿里云连续3年蝉联第一
国际数据机构IDC发布《中国容器市场份额,2024:从云原生到AI原生》最新报告,2024年中国容器市场整体市场规模增长46.7%。其中,阿里云以26.6%的占比稳居第一,市场份额超过二、三名总和,连续3年蝉联榜首。
免费试用