异构计算

首页 标签 异构计算
# 异构计算 #
关注
19114内容
|
13天前
|
【MUSIC、最大似然与克拉美-罗下界】MUSIC与ESPRIT 算法来估计到达角(AoA),并尝试推导克拉美-罗下界(CRLB)以分析其性能研究(Matlab代码实现)
【MUSIC、最大似然与克拉美-罗下界】MUSIC与ESPRIT 算法来估计到达角(AoA),并尝试推导克拉美-罗下界(CRLB)以分析其性能研究(Matlab代码实现)
|
13天前
|
具有多种最大功率点跟踪(MPPT)方法的光伏发电系统(P&O-增量法-人工神经网络-模糊逻辑控制-粒子群优化)之使用粒子群算法的最大功率点追踪(MPPT)(Simulink仿真实现)
具有多种最大功率点跟踪(MPPT)方法的光伏发电系统(P&O-增量法-人工神经网络-模糊逻辑控制-粒子群优化)之使用粒子群算法的最大功率点追踪(MPPT)(Simulink仿真实现)
|
15天前
| |
MXFP4量化:如何在80GB GPU上运行1200亿参数的GPT-OSS模型
GPT-OSS通过MXFP4量化技术实现1200亿参数模型在单个80GB GPU上的高效运行,将权重压缩至每参数4.25位,大幅降低内存需求,同时保持高精度和竞争力的基准性能,为大规模模型部署提供了新思路。
|
15天前
| |
深度解析四大LLM微调工具:从单卡到千亿级训练的四大解决方案
本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed,覆盖从单卡实验到万亿参数分布式训练场景,助你掌握主流框架选型策略,提升微调效率。建议点赞收藏。
|
16天前
| |
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试
本文介绍了使用四块Framework主板构建AI推理集群的过程,并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试,重点评估其并行推理能力及集群表现。
|
17天前
|
《WebGPU资源同步屏障效率提升10大实用技巧》
本文针对前端WebGPU资源同步屏障的效率优化,提出10个实用技巧。从精准匹配屏障类型、合并相邻屏障,到利用子资源范围缩小同步域、延迟屏障触发以并行执行无依赖任务,再到避免跨队列屏障、复用参数、按资源生命周期调整策略等,覆盖同步设计、资源管理、硬件适配多维度。同时强调通过监控屏障耗时定位瓶颈,结合硬件特性差异化适配。这些技巧需结合应用场景灵活组合,核心是在数据安全与GPU性能释放间找平衡,为前端WebGPU应用(如3D渲染、AI推理)突破性能瓶颈提供技术支撑,也深化对WebGPU底层并行模型的理解。
|
18天前
|
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云,打造全球首个K12教育超级智能体“寒雪老师”,依托弹性计算实现AI一对一教育普惠愿景。面对实时交互与流量潮汐挑战,借助阿里云算力实现低延迟、高并发服务,保障千万学子流畅学习体验。
|
18天前
|
【云故事探索】NO.16:阿里云弹性计算加速精准学 AI 教育普惠落地
智能精准学联合阿里云打造全球首个K12教育超级智能体“寒雪老师”,通过弹性计算实现AI一对一教学,助力教育普惠。
免费试用