AI芯片的搜索结果_文章_第9页-阿里云开发者社区

技术员阿伟

|

博文

TPU（张量处理单元）是谷歌为应对深度学习模型计算需求而设计的专用硬件。其核心矩阵乘法单元（MXU）采用脉动阵列架构，显著提升矩阵运算效率；内存管理单元优化数据流通，减少瓶颈；控制单元协调系统运作，确保高效稳定。TPU在训练和推理速度、能耗方面表现出色，大幅缩短BERT等模型的训练时间，降低数据中心成本。尽管通用性和易用性仍有挑战，但TPU已为深度学习带来革命性变化，未来有望进一步优化。

# GPU云服务器 # 机器学习/深度学习 # 存储 # 数据中心 # 异构计算 # AI芯片

1330219825944132

|

博文

基于昇腾用PyTorch实现传统CTR模型WideDeep网络

本文介绍了如何在昇腾平台上使用PyTorch实现经典的WideDeep网络模型，以处理推荐系统中的点击率（CTR）预测问题。

# 机器学习/深度学习 # 搜索推荐 # PyTorch # 算法框架/工具 # AI芯片

游客jnstwksgqnrgi

|

博文

|

来自：大数据与机器学习

新手入门：DGL在昇腾上的安装问题

本文介绍了在aarch64架构和Python 3.10环境下安装DGL（Deep Graph Library）的过程。首先通过`uname -a`确认硬件架构，接着使用`python --version`检查Python版本。为确保兼容性，从指定链接下载适合的whl包或通过pip安装dgl。过程中遇到了torchdata版本不兼容的问题，通过降级torchdata至0.7.1版本解决。此外，针对NPU芯片适配，重新安装了与CANN 8.0.RC2兼容的torch和torch_npu组件。最终成功导入dgl包并准备进行模型训练验证。

# PyTorch # 算法框架/工具 # 芯片 # Python # AI芯片

TsingtaoAI

|

博文

内部干货 | 基于华为昇腾910B算力卡的大模型部署和调优-课程讲义

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 资源管理 # 自然语言处理 # 性能测试 # 负载均衡 # 日志服务 # 机器学习/深度学习 # PyTorch # 调度 # 算法框架/工具 # AI芯片

楠竹11

|

博文

登上Nature的AI芯片设计屡遭质疑，谷歌发文反击，Jeff Dean：质疑者连预训练都没做

2020年，谷歌的AlphaChip在Nature上发表并开源，其深度强化学习方法能生成超越人类水平的芯片布局，引发AI在芯片设计领域的研究热潮。然而，ISPD 2023的一篇论文对其性能提出质疑，指出未按Nature论文方法运行、计算资源不足等问题。谷歌DeepMind团队回应，强调AlphaChip已在多代TPU和Alphabet芯片中成功应用，并批驳ISPD论文的主要错误。此外，针对Igor Markov的“元分析”和无根据猜测，谷歌提供了详细的时间线和非机密部署情况，澄清事实并重申AlphaChip的开放性和透明度。

# 机器学习/深度学习 # 人工智能 # 测试技术 # 芯片 # AI芯片

TsingtaoAI

|

博文

企业内训｜基于华为昇腾910B算力卡的大模型部署和调优-上海某央企智算中心

近日上海，TsingtaoAI为某央企智算中心交付华为昇腾910B算力卡的大模型部署和调优课程。课程深入讲解如何在昇腾NPU上高效地训练、调优和部署PyTorch与Transformer模型，并结合实际应用场景，探索如何优化和迁移模型至昇腾NPU平台。课程涵盖从模型预训练、微调、推理与评估，到性能对比、算子适配、模型调优等一系列关键技术，帮助学员深入理解昇腾NPU的优势及其与主流深度学习框架（如PyTorch、Deepspeed、MindSpore）的结合应用。

# GPU云服务器 # 性能测试 # 机器学习/深度学习 # 机器人 # PyTorch # 算法框架/工具 # AI芯片

游客7dgyrbdm3doqi

|

博文

MindIE推理采样后处理参数temperature和top_k的引发的精度问题

在MindIE跑Qwen系列模型推理时，发现当后处理参数top_k较大且temperature=2时，Ascend npu和gpu上均出现模型输出精度问题。原因在于temperature增大导致logits值差距缩小，softmax后概率接近，难以选到正确token。通过减小top_k或top_p可避免此问题。总结：后处理顺序为temperature > top_k > softmax > top_p，temperature越大，logits差距越小，易引发精度问题。

# 异构计算 # AI芯片

hw2020hw

|

博文

昇腾集群PFC现象分析

负责集群运维的同学可能都遇到过PFC现象，那么PFC到底是啥？产生原因是什么？这篇文章提供了一些分析。

# 缓存 # 人工智能 # 运维 # AI芯片

游客dnh4fn5yp5gom

|

博文

sam模型迁移昇腾训练loss不收敛问题的解决办法

在将SAM模型迁移到昇腾平台时，遇到了精度问题。具体表现为NPU训练的loss图从一开始就未收敛，而GPU则正常收敛。通过使用Ascend开源仓的msprobe工具进行精度对比，发现NPU丢失了image_embedding的梯度，原因在于torch_npu版本与PyTorch不匹配，导致`repeat_interleave_backward_tensor`函数调用失败。最终通过选择与PyTorch配套的torch_npu版本解决了问题，loss图恢复正常。

# 数据采集 # PyTorch # 算法框架/工具 # 异构计算 # AI芯片

Alter聊科技

|

博文

首个全球AI出口管制规则出台，中国AI路在何方？

在CES 2025上，英伟达宣布Blackwell芯片全面投产，GB200芯片为大语言模型推理带来30倍性能提升，成本和能耗降低25倍。然而，1月13日白宫公布的“临时最终规则”对AI芯片出口进行严格限制，引发市场悲观情绪。新规将全球分为三级，中国大陆被列为Tier 3，面临先进芯片进口禁令和模型权重管控，加剧了中国AI产业的挑战。尽管如此，华为云、科大讯飞等企业通过自主创新，如昇腾AI云服务，提供了稳定可靠的算力解决方案，展现了中国科技企业的韧性和创新精神，推动大模型生态的发展。

# 人工智能 # 安全 # 数据中心 # 芯片 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片