AI芯片的搜索结果_文章_第5页-阿里云开发者社区

安全风信子

|

8月前

|

博文

# 大模型优化与压缩技术：2025年的实践与突破

2025年，随着大语言模型的规模和复杂度不断提升，模型优化与压缩技术已成为AI产业落地的关键瓶颈和研究热点。根据最新统计，顶级大语言模型的参数规模已突破万亿级别，如DeepSeek-R1模型的6710亿参数规模，这带来了前所未有的计算资源需求和部署挑战。在这种背景下，如何在保持模型性能的同时，降低计算成本、减少内存占用、提升推理速度，已成为学术界和产业界共同关注的核心问题。

# 机器学习/深度学习 # 人工智能 # 物联网 # 异构计算 # AI芯片

UUhz

|

9月前

|

博文

|

来自：物联网

H4H：面向AR/VR应用的NPU-CIM异构系统混合卷积-Transformer架构搜索——论文阅读

H4H是一种面向AR/VR应用的混合卷积-Transformer架构，基于NPU-CIM异构系统，通过神经架构搜索实现高效模型设计。该架构结合卷积神经网络（CNN）的局部特征提取与视觉Transformer（ViT）的全局信息处理能力，提升模型性能与效率。通过两阶段增量训练策略，缓解混合模型训练中的梯度冲突问题，并利用异构计算资源优化推理延迟与能耗。实验表明，H4H在相同准确率下显著降低延迟和功耗，为AR/VR设备上的边缘AI推理提供了高效解决方案。

# 机器学习/深度学习 # 人工智能 # vr&ar # Ruby # AI芯片

Deephub

|

10月前

|

博文

|

来自：大数据与机器学习

AMD Ryzen AI Max+ 395四机并联：大语言模型集群推理深度测试

本文介绍了使用四块Framework主板构建AI推理集群的过程，并基于AMD Ryzen AI Max+ 395处理器进行大语言模型推理性能测试，重点评估其并行推理能力及集群表现。

# 人工智能 # 测试技术 # 芯片 # 异构计算 # AI芯片

Deephub

|

10月前

|

博文

|

来自：大数据与机器学习

JAX快速上手：从NumPy到GPU加速的Python高性能计算库入门教程

JAX是Google开发的高性能数值计算库，旨在解决NumPy在现代计算需求下的局限性。它不仅兼容NumPy的API，还引入了自动微分、GPU/TPU加速和即时编译（JIT）等关键功能，显著提升了计算效率。JAX适用于机器学习、科学模拟等需要大规模计算和梯度优化的场景，为Python在高性能计算领域开辟了新路径。

# GPU云服务器 # 机器学习/深度学习 # API # 异构计算 # Python # AI芯片

游客nzxqk2keol6fs

|

12月前

|

博文

了解集合通信与模型并行策略

了解集合通信基础概念及常见的集合通信原语；以及大模型并行策略：包括数据并行、流水并行、张量并行和专家并行。

# 机器学习/深度学习 # 存储 # 并行计算 # 物联网 # AI芯片

hw2020hw

|

12月前

|

博文

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用

# 机器学习/深度学习 # 存储 # 缓存 # Shell # AI芯片

游客jnstwksgqnrgi

|

博文

昇腾AI4S图机器学习：DGL消息传递接口的PyG替换

DGL (Deep Graph Learning) 和 PyG (Pytorch Geometric) 是两个主流的图神经网络库，它们在API设计和底层实现上有一定差异，在不同场景下，研究人员会使用不同的依赖库，昇腾NPU对PyG图机器学习库的支持亲和度更高，因此有些时候需要做DGL接口的PyG替换。

# 机器学习/深度学习 # PyTorch # API # 算法框架/工具 # AI芯片

Star时光

|

博文

AI进化论：从识别模式到创造世界的“数字大脑”

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # AI芯片

游客jnstwksgqnrgi

|

博文

基于昇腾适配电力潮流计算模型PowerFlowNet

ai for science 、昇腾

# 机器学习/深度学习 # 数据采集 # API # Python # AI芯片

游客jnstwksgqnrgi

|

博文

|

来自：大数据与机器学习

OpenFold2.0 基于NPU的推理适配与测试

本教程详细介绍了 OpenFold 的环境搭建、代码部署、依赖安装、数据集准备及推理测试全流程。首先通过 Anaconda 创建 Python3.9 环境并配置相关库，接着克隆 OpenFold 代码仓库并安装必要依赖（如 PyTorch、dllogger、hhsuite 等）。随后准备 PDB 数据集与模型参数，调整脚本路径以适配运行环境。最后执行推理脚本完成测试，并针对常见报错提供了解决方案，例如更新 NumPy、SciPy 或调整 GPU 配置等，确保流程顺利运行。

# 并行计算 # PyTorch # 算法框架/工具 # AI芯片 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片