异构计算

首页 标签 异构计算
# 异构计算 #
关注
20076内容
|
29天前
|
HagiCode 为什么选择 Hermes 作为综合 Agent 核心
HagiCode 为什么选择 Hermes 作为综合 Agent 核心 在构建 AI 辅助编码平台时,选择合适的 Agent 核心直接决定了系统能力的天花板。毕竟有些事情,勉强不来——选错了框架,怎么折腾都不得劲。本文分享 HagiC...
别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)
别再单卡硬扛了:一文讲透 Python 多 GPU / 分布式训练怎么写(附完整实战代码)
Transformer 时代的语言模型:大规模语言模型的发展脉络与技术演化
本文系统梳理大语言模型技术演进脉络:从Transformer与Attention机制奠基,到BERT/GPT的范式分野;从提示工程、RLHF对齐优化,到LLaMA开源引爆生态;再到LoRA微调、FlashAttention加速、RAG增强、MCP协议互联、Skills技能封装,直至Openclaw桌面级GUI智能体。覆盖模型架构、训练优化、推理加速、应用落地全链条。
|
30天前
|
黄仁勋在GTC宣判了训练时代的死亡
3月17日,黄仁勋站在GTC 2026的舞台上,讲了将近两个小时。他说了两句话,足以让整个行业坐立不安。
|
30天前
| |
Infiniband/以太网,算力组网布线方案
本文详解SuperPOD构建:以32台DGX H100/H200为单元(SU),采用叶脊(Spine-Leaf)网络架构,通过多模光纤/DAC短距连接服务器与叶交换机,单模光纤长距连接叶与脊交换机;支持点对点与结构化布线,提升扩展性、管理效率与运维灵活性。(239字)
|
30天前
|
你的GPU正在“等米下锅”:RDMA如何修出一条绕过CPU的高速公路?
本文深度解析现代集群网络的底层革命:从冯·诺依曼瓶颈出发,剖析RDMA如何通过零拷贝、内核旁路与硬件卸载突破TCP/IP桎梏;直击其易用性差、连接爆炸、内存注册昂贵等痛点;并揭示Mooncake(面向LLM KV Cache的张量传输引擎)与Infinistore(万卡级分布式KV底座)如何以内存池化、拓扑感知、RC/UD混合等架构创新, bridging hardware power and software simplicity。
|
30天前
| |
56.大模型应用:大模型瘦身:量化、蒸馏、剪枝的基础原理与应用场景深度解析.56
本文深入对比大模型轻量化三大核心技术:量化(降精度,快部署)、蒸馏(知识迁移,高精度)、剪枝(删冗余,结构精简)。详解原理、分类、适用场景、代码实现及选型建议,助开发者根据硬件条件、精度要求与落地周期科学决策。
基于深度学习的图像分割MATLAB实现
基于深度学习的图像分割MATLAB程序,使用U-Net架构实现语义分割任务
|
1月前
| |
大模型应用:高精度量化感知训练(QAT)与低成本后训练量化(PTQ)方案优选.55
本文深入解析大模型量化两大核心技术:后训练量化(PTQ)与量化感知训练(QAT)。涵盖原理、流程、代码实现及选型策略,对比其在精度损失、算力成本、部署效率等方面的差异,助开发者根据数据、算力与精度需求,科学选择最优量化方案。
基于颜色衰减先验的图像去雾MATLAB实现
基于颜色衰减先验(Color Attenuation Prior, CAP)的图像去雾MATLAB程序。该算法通过分析图像中亮度和饱和度的关系来估计雾的浓度,从而实现高效的图像去雾
免费试用