AI芯片的搜索结果_热门_第7页-阿里云开发者社区

aliyun9170107523-43660

|

1月前

|

博文

|

在2025年的今天，大语言模型（LLM）已经成为人工智能领域的核心技术之一。从GPT-4到Llama 3.1，从专业领域应用到消费级产品，LLM正在以前所未有的速度改变着我们的工作和生活方式。然而，这些强大模型的训练和部署背后，都离不开高性能计算硬件的支持，尤其是GPU（图形处理单元）的选择，往往直接决定了项目的可行性、效率和成本。

# GPU云服务器 # 人工智能 # 自然语言处理 # 数据中心 # 异构计算 # AI芯片

aliyun9170107523-43660

|

1月前

|

博文

|

来自： ModelScope模型即服务

118_LLM模型量化与压缩：从理论到2025年实践技术详解

大型语言模型（LLM）在自然语言处理领域取得了前所未有的成功，但模型规模的快速增长带来了巨大的计算和存储挑战。一个典型的大型语言模型（如GPT-4或LLaMA 3）可能包含数千亿甚至万亿参数，需要数百GB甚至TB级的存储空间，并且在推理时需要大量的计算资源。这种规模使得这些模型难以在边缘设备、移动设备甚至资源有限的云服务器上部署和使用。

# 机器学习/深度学习 # PyTorch # 算法框架/工具 # 异构计算 # AI芯片

极智视界

|

博文

|

来自：视觉智能

极智AI | 一文看懂Google TPU脉动阵列加速卷积计算原理

本教程详细解释了 Google TPU 脉动阵列加速卷积计算原理。

# 机器学习/深度学习 # 存储 # 人工智能 # 编解码 # AI芯片

游客7dgyrbdm3doqi

|

8月前

|

博文

NPU上运行onnxruntime

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

算精通

|

博文

NPU（Neural Processing Unit）和GPGPU（

NPU（Neural Processing Unit）和GPGPU（General-Purpose Graphics Processing Unit）在AI任务处理方面虽然都能发挥重要作用，但它们在设计、功能和适用场景上存在一些明显的差异。

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 图形学 # 异构计算 # AI芯片

阿里云

|

博文

架构师长文 | 七千字详解阿里云CIPU技术架构

# GPU云服务器 # 云原生大数据计算服务 MaxCompute # 弹性裸金属服务器 # 存储 # 运维 # 安全 # 虚拟化 # 云计算 # 网络虚拟化 # 芯片 # 异构计算 # AI芯片 # 内存技术

ZOMI酱

|

12月前

|

博文

【AI系统】寒武纪介绍

中科寒武纪科技股份有限公司，成立于2016年，致力于打造云边端一体、软硬件协同的智能芯片产品和平台化基础系统软件。寒武纪的产品线涵盖了终端智能处理器IP、边缘端和云端智能加速卡，形成了从1A处理器核到思元系列MLU100、MLU200、MLU300的完整布局。其核心技术包括高效的MLU Core架构和Cambricon Neuware软件栈，支持高性能AI计算，助力机器更好地理解和服务人类。

# GPU云服务器 # 人工智能 # 算法框架/工具 # 芯片 # AI芯片 # 内存技术

ZOMI酱

|

博文

【AI系统】AI系统的组成

本文详细解析了AI系统的多层次架构，涵盖应用与开发层、AI框架层、编译与运行时及硬件体系结构等，阐述各部分如何协同支撑AI应用的开发与运行，提升整体性能与效率，并随著AI技术进步持续演进。从编程语言到AI芯片设计，每一层都对系统的最终表现起着至关重要的作用。

# 人工智能 # 算法 # 调度 # 开发者 # AI芯片

1744812029540769

|

博文

|

来自：云原生

揭秘A100、A800、H800、V100在高性能计算与大模型训练中的地位

英伟达前段时间发布GH 200包含 36 个 NVLink 开关，将 256 个 GH200 Grace Hopper 芯片和 144TB 的共享内存连接成一个单元。除此之外，英伟达A100、A800、H100、V100也在大模型训练中广受欢迎。

# 超级计算集群 # 数据传输服务 # GPU云服务器 # 自然语言处理 # 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # 算法 # 数据中心 # 芯片 # 开发者 # 异构计算 # AI芯片

hw2020hw

|

5月前

|

博文

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用

# 机器学习/深度学习 # 存储 # 缓存 # Shell # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片