异构计算

首页 标签 异构计算
# 异构计算 #
关注
19148内容
|
27天前
| |
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。
|
28天前
|
《WebGPU资源同步屏障效率提升10大实用技巧》
本文针对前端WebGPU资源同步屏障的效率优化,提出10个实用技巧。从精准匹配屏障类型、合并相邻屏障,到利用子资源范围缩小同步域、延迟屏障触发以并行执行无依赖任务,再到避免跨队列屏障、复用参数、按资源生命周期调整策略等,覆盖同步设计、资源管理、硬件适配多维度。同时强调通过监控屏障耗时定位瓶颈,结合硬件特性差异化适配。这些技巧需结合应用场景灵活组合,核心是在数据安全与GPU性能释放间找平衡,为前端WebGPU应用(如3D渲染、AI推理)突破性能瓶颈提供技术支撑,也深化对WebGPU底层并行模型的理解。
|
29天前
|
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云,打造全球首个K12教育超级智能体“寒雪老师”,依托弹性计算实现AI一对一教育普惠愿景。面对实时交互与流量潮汐挑战,借助阿里云算力实现低延迟、高并发服务,保障千万学子流畅学习体验。
|
29天前
|
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云打造全球首个K12教育超级智能体“寒雪老师”,通过弹性计算实现AI一对一教学,助力教育普惠。
波动跃迁:基于 Knative 加速 AI Agent 应用落地
Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。
|
30天前
|
《从原理到实践:ASTC与ETC2的WebGL压缩技术深度解析》
本文深入解析前端领域WebGL技术中ASTC与ETC2两种主流纹理压缩格式。从技术特性看,ETC2以固定块压缩适配广泛设备,优化透明通道处理;ASTC凭借自适应块大小设计,灵活平衡压缩率与画质,尤其擅长处理复杂纹理。文章对比两者在兼容性、应用场景等方面的差异,探讨开发者的选择逻辑,还展望了纹理压缩技术与硬件、AI结合的未来趋势,揭示它们对WebGL视觉体验的重要支撑作用。
|
30天前
|
《WebGL纹理加载指南:10个颠覆认知的优化技巧》
本文围绕前端WebGL的纹理加载与管理,分享10个实用技巧。涵盖纹理预加载的分层策略、尺寸选择的隐藏规则、压缩格式的动态适配,以及纹理复用、加载时机控制、内存释放等方面。强调结合场景需求与设备特性,通过精细化调度、智能适配和动态管理,平衡纹理视觉效果与性能,突破加载瓶颈,为WebGL 3D应用打造流畅体验,展现了从技术实现到场景适配的深层优化逻辑。
|
1月前
| |
JAX快速上手:从NumPy到GPU加速的Python高性能计算库入门教程
JAX是Google开发的高性能数值计算库,旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API,还引入了自动微分、GPU/TPU加速和即时编译(JIT)等关键功能,显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景,为Python在高性能计算领域开辟了新路径。
|
1月前
|
现在浏览器的渲染原理及流程
这篇文章介绍了浏览器渲染原理及流程,包括HTML解析、样式计算、布局、分层、绘制、分块、光栅化和画等阶段,以及各个阶段的输入输出和任务执行过程。文章还解释了浏览器如何处理外部CSS和JS文件的下载和解析,以及这些文件如何影响渲染流程。
免费试用