异构计算

首页 标签 异构计算
# 异构计算 #
关注
19345内容
|
2天前
|
基于有限体积法(FVM)的MATLAB流体力学求解程序
基于有限体积法(FVM)的MATLAB流体力学求解程序
阶跃星辰发布首个开源 LLM 级音频编辑大模型 Step-Audio-EditX
阶跃星辰发布全球首个开源LLM级音频编辑大模型Step-Audio-EditX,支持零样本TTS、多语言方言及情感、风格、副语言特征精准控制,采用统一LLM框架,实现文本驱动音频创作。
从“皮囊”到“灵魂”:构建实时交互型数字人的核心技术栈与实践
数字人已从银幕上的炫技特效,逐步走向直播、客服、教育等实时交互场景。作为一名开发者,如何理解并动手构建一个“能听、会说、能思考、有表情”的实时交互数字人?本文将为你拆解其背后的四大核心技术栈,并分享基于阿里云服务的架构实践,助你快速踏入数字人开发的大门。
2025最新阿里云服务器租用费用:包年包月、按量付费价格整理
2025阿里云服务器优惠汇总:轻量应用服务器200M带宽38元/年起,ECS云服务器2核2G 99元/年,2核4G 199元/年,4核16G 89元/月,8核32G 160元/月,香港轻量服务器25元/月起,新老用户同享,续费不涨价。
Transformer参数规模深度解析:从模型聪明说到实际影响
Transformer参数规模显著影响模型能力,参数越多,知识容量与模式识别能力越强,但存在边际效应和过拟合风险。现代大模型通过混合专家、量化压缩等技术提升参数效率,未来趋势是优化参数使用而非盲目扩大规模,实现性能与效率的平衡。(238字)
|
5天前
|
TensorRT 和 ONNX Runtime 推理优化实战:10 个降低延迟的工程技巧
模型性能优化关键在于细节:固定输入形状、预热、I/O绑定、精度量化、图优化与CUDA Graph等小技巧,无需重构代码即可显著降低延迟。结合ONNX Runtime与TensorRT最佳实践,每个环节节省几毫秒,累积提升用户体验。生产环境实测有效,低延迟从此有据可依。
|
5天前
| |
来自: 弹性计算
现在选购阿里云服务器有哪些优惠政策?最新包年包月与按量付费优惠和活动价格参考
阿里云为用户准备了哪些云服务器购买优惠政策?不管是通过云服务器ECS产品详情页购买还是通过活动购买,用户都可以享受不同程度的优惠政策,本文为大家详细讲解现在选购阿里云服务器具体的包年包月和按量付费优惠政策,以及最新活动价格情况,以供大家选择参考。
解决方案体验 | 基于 GPU 云服务器微调 Qwen3 模型
本方案通过模型蒸馏,利用大模型生成标注数据,微调Qwen3-0.6B小模型,实现高效、低成本的结构化信息抽取。结合ms-swift与vLLM框架,仅需一行命令完成训练与部署,准确率从14%提升至98%,显著提升推理速度与性价比,适用于物流填单等实际场景。
哈希极化、拓扑盲点与拥塞抖动:主流端网协同方案如何缓解万卡集群通信瓶颈?
随着大模型参数规模迈向万亿级,万卡乃至十万卡 GPU 集群正成为 AI 训练基础设施的标配,而万卡集群三大通信瓶颈——哈希极化、拓扑盲点与拥塞抖动,对网络架构提出了前所未有的挑战。本文基于主流互联网大厂的公开实践,深入剖析超大规模集群中端网协同架构的设计思路,并探讨面向 MoE 与 DeepSeek 等新型模型的下一代 AI 网络演进方向。
裸机云与GPU性能深度解析:为何它是高性能计算的基石
在追求极致计算能力的今天,无论是复杂的人工智能模型训练、高精度科学模拟还是实时渲染,对GPU性能的压榨都达到了前所未有的程度。当企业在云上寻求强大的GPU算力时,一个关键的选择摆在面前:是选择传统的虚拟化云服务器,还是专为性能而生的裸机云?本文将深入探讨裸机云如何成为释放GPU全部潜能的终极平台。
免费试用