异构计算

首页 标签 异构计算
# 异构计算 #
关注
19352内容
|
2小时前
|
大模型微调有必要做吗?全参数微调、LoRA还是RAG?看完这篇你就懂了
在人工智能时代,若想以最小成本、最高效率赋能通用大模型专业的行业能力,关键在于找到效果、成本与灵活性的黄金平衡点......
|
7小时前
|
AI 十大论文精讲(四):0.01% 参数实现全量大模型微调效果?LoRA 的低秩适配之谜
本文解读AI十大核心论文之二《LoRA:大语言模型的低秩适配》。该技术通过冻结预训练权重、引入低秩矩阵更新,实现参数效率提升万倍,显存占用降70%,推理无延迟,使大模型微调从资源密集转向轻量化,成为当前高效微调的事实标准。
|
22小时前
|
《Unity渲染实战宝典:突破平台限制的优化策略》
本文聚焦Unity渲染的核心优化逻辑,深入解构渲染管线、材质系统、光照阴影、后处理、纹理资源及管线适配六大关键环节。针对开发者易陷入的参数堆砌误区,结合不同平台硬件特性,提出“分层适配”“视觉欺骗”“精准裁剪”等实战策略—如动态平衡实时光源与烘焙光照、精简Shader冗余变体、分级配置后处理效果、优化纹理分辨率与压缩格式。
PAIFuser:面向图像视频的训练推理加速框架
阿里云PAI推出PAIFuser框架,专为视频生成模型设计,通过模型并行、量化优化、稀疏运算等技术,显著提升DiT架构的训练与推理效率。实测显示,推理耗时最高降低82.96%,训练时间减少28.13%,助力高效低成本AI视频生成。
|
1天前
| |
来自: 云原生
ModelScope 模型一键上线?FunModel 帮你 5 分钟从零到生产
FunModel 依托 Serverless + GPU,天然提供了简单,轻量,0 门槛的模型集成方案,给个人开发者良好的玩转模型的体验,也让企业级开发者快速高效的部署、运维和迭代模型。在阿里云 FunModel 平台,开发者可以做到:模型的快速部署上线:从原来的以周为单位的模型接入周期降低到 5 分钟,0 开发,无排期;一键扩缩容,让运维不再是负担:多种扩缩容策略高度适配业务流量,实现“无痛运维”。
|
2天前
|
《Unity优化指南:直击引擎本质的非典型技术路径》
本文聚焦Unity开发中突破性能瓶颈的深层技术逻辑,跳出常规优化思维,从引擎底层运行本质出发,解构资源导入管线、渲染管线协同、内存与缓存联动、多平台适配重构、逻辑架构设计、调试与性能监控六大核心维度。文章摒弃表层API应用,深入剖析各模块隐性关联与协同规律,提供非典型优化路径——从资源导入的标准化适配,到渲染各阶段的高效联动,再到内存数据的结构化布局、跨平台的底层适配、架构的解耦扩展及进阶调试监控方案。通过系统性的底层认知与实操思路,帮助开发者跳出"单点优化"困境,解决性能波动、兼容性故障等核心痛点,实现项目性能与体验的双重突破,为Unity进阶开发提供深度技术指引。
|
3天前
|
《服务器行为规范》实施细则(第一版)
《服务器成精鉴定指南》以幽默笔调规范机房行为:严禁用手机摸鱼、违规支架,违者断电、支教或通报;发现拟人化、跨兴趣、身份错乱等“成精”迹象,分级处置并引导正向发展,兼顾纪律与创意。(238字)
容器市场高速增长,阿里云连续3年蝉联第一
国际数据机构IDC发布《中国容器市场份额,2024:从云原生到AI原生》最新报告,2024年中国容器市场整体市场规模增长46.7%。其中,阿里云以26.6%的占比稳居第一,市场份额超过二、三名总和,连续3年蝉联榜首。
不懂 Attention 不算懂 AI?十大奠基论文(一):一文读懂《Attention Is All You Need》
摘要 《Attention Is All You Need》论文开创性地提出Transformer架构,彻底改变了自然语言处理领域的技术路径。该论文解决了传统RNN/CNN模型的三大痛点:通过自注意力机制实现全局语义捕捉,摆脱了序列处理的低效性;多头注意力设计支持并行计算,大幅提升训练效率;缩放点积注意力有效解决长距离依赖问题。Transformer的核心创新包括:1)完全基于注意力机制取代循环结构;2)编码器-解码器堆叠架构;3)残差连接和层归一化优化训练稳定性。这一架构为GPT、BERT等大模型奠定了基
|
4天前
|
《C++在量化、KV缓存与推理引擎的深耕》
本文聚焦C++在LLM底层优化中的核心实践与技术突破,围绕量化部署、异构计算、高并发处理、KV缓存管理、推理引擎构建、大规模服务部署六大关键场景展开。文章结合实际优化案例,揭示C++如何通过极致的底层控制权,破解LLM落地中的核心瓶颈:自定义混合精度量化策略平衡精度与性能,构建异构硬件协同逻辑突破传输壁垒,以连续批处理技术提升高并发吞吐量,重构KV缓存架构降低内存占用并扩展上下文长度,定制轻量化推理引擎剔除冗余开销,搭建鲁棒架构保障大规模服务稳定运行。
免费试用