异构计算

首页 标签 异构计算
# 异构计算 #
关注
19267内容
|
1天前
|
阿里云无影云电脑具体价格——企业版、个人版收费标准及免费领取规则解析
阿里云无影云电脑2025年最新价格出炉!企业版4核8G仅199元/年,6核12G 267元/3个月;个人版黄金款14元/月起,黑金款149元/月。GPU图形型配备RTX 5880显卡,适合设计与云游戏。支持免费试用1个月,畅享高效云端体验。
用Macbook微调Qwen3!手把手教你用微调给Qwen起一个新名字
本文介绍如何在MacBook上使用苹果MLX框架高效微调Qwen3大模型。借助MLX的高性能计算与统一内存架构,仅需2分钟即可完成训练,内存占用低至2GB,推理速度达400 Token/s,并支持快速部署为本地API服务,展现Mac轻薄本的强大AI生产力潜力。
|
1天前
|
大模型4-bit量化技术详解
本文系统阐述大语言模型的4-bit量化技术,深入解析GPTQ、AWQ等主流量化方法的原理与实现。通过详细的数学推导、代码实现和实验对比,展示4-bit量化如何将模型内存占用降低75%以上同时保持模型性能。文章涵盖量化感知训练、后训练量化、混合精度量化等关键技术,为开发者提供完整的模型压缩解决方案。
|
2天前
|
《3D游戏场景烘焙优化:间接光照反弹次数的精准调控方案》
本文围绕3D游戏场景光照烘焙优化展开,结合奇幻开放世界游戏开发实践,针对初始版本森林场景的色块断层、噪点、12小时长烘焙耗时及中端设备帧率骤降问题,提出多维度解决方案。通过“模型复杂度与烘焙分辨率动态匹配”降低显存占用35%,基于光照梯度布局光照探针提升动态物体光照过渡平滑度80%,采用“全局基础+局部增强”间接光照反弹模式缩短烘焙耗时至6小时,以“格式自适应”解决烘焙贴图压缩问题,开发自动化校验工具将校验时间缩至15分钟。
|
2天前
|
喜讯!阿里云国产异构GPU云平台技术荣获“2025算力中国·年度重大成果”
2025年8月23日,在工业和信息化部新闻宣传中心、中国信息通信研究院主办的2025中国算力大会上,阿里云与浙江大学联合研发的“国产异构GPU云平台关键技术与系统”荣获「算力中国·年度重大成果」。该评选旨在选拔出算力产业具有全局性突破价值的重大成果,是业内公认的技术创新“风向标”。
【万字长文】大模型训练推理和性能优化算法总结和实践
我们是阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。
|
2天前
| |
来自: 倚天
多线程
多线程是现代计算的核心技术,通过并发执行提升程序性能与响应速度。它允许多个任务共享资源并行运行,广泛应用于高性能计算、UI 响应优化及 I/O 处理。然而,竞态条件、死锁等问题也带来挑战。掌握同步机制与编程模型,方能驾驭其强大潜力。
|
5天前
| |
《大模型驱动的智能文档解析系统:从领域适配到落地优化的全链路开发实践》
本文聚焦大模型在高端装备制造企业智能文档解析系统的落地实践,针对领域术语理解断层、长文档上下文限制、知识提取精准度不足、响应缓慢、微调成本高、稳定性差等核心痛点,提出对应解决方案:构建领域术语知识底座适配行业语境,以语义分块+关联图谱突破长文档解析瓶颈,用多轮校验+规则库保障知识可靠性,通过分层部署+多级缓存优化响应速度,采用增量微调+prompt工程降低成本并提升泛化能力,依托全链路监控+自动化运维保障长期稳定。优化后,术语识别准确率、知识逻辑完整性显著提升,单文档初步解析响应缩至3秒内,故障发生率降至1.2%,印证大模型落地需全链路协同且贴合领域需求。
|
5天前
| |
来自: 弹性计算
阿里云gpu云服务器全方位介绍:产品功能、应用场景、收费价格参考
阿里云gpu云服务器怎么样?阿里云GPU云服务器,凭借其卓越性能与丰富应用,吸引着众多企业与开发者的目光。当下,阿里云针对gpu云服务器也推出了一系列优惠,为有算力需求的用户提供了绝佳的入手时机。包月五折、包年四折起的优惠力度。本文将从产品优势、应用场景以及收费价格等多个维度,对阿里云GPU云服务器展开全面而深入的介绍,帮助大家更好地了解这款强大的算力工具。
免费试用