AI芯片的搜索结果_热门_第7页-阿里云开发者社区

淘系技术小助手

|

博文

【端智能】MNN CPU性能优化年度小结

2020年5月，MNN发布了1.0.0版本，作为移动端/服务端/PC均适用的推理引擎，在通用性与高性能方面处于业界领先水平。

# 存储 # tengine # 算法 # 测试技术 # 开发工具 # git # 异构计算 # AI芯片

ZOMI酱

|

博文

【AI系统】NPU 基础

近年来，AI技术迅猛发展，催生了NPU和TPU等AI专用处理器，这些处理器专为加速深度学习任务设计，相比传统CPU和GPU，展现出更高效率和性能。本文将介绍AI芯片的概念、技术发展、部署方式及应用场景，涵盖从数据中心到边缘设备的广泛领域，探讨其如何成为AI技术落地的关键推手。

# GPU云服务器 # FPGA云服务器 # 人工智能 # 自动驾驶 # 芯片 # 异构计算 # AI芯片

ModelScope运营小助手

|

博文

|

来自： ModelScope模型即服务

NPU推理&微调大模型实战

本文为魔搭社区轻量级训练推理工具SWIFT微调实战教程系列

# 物联网 # Shell # Swift # 开发者 # AI芯片

coder一枚

|

博文

阿里云GPU服务器价格表（Nvidia M40/P100/P4/V100）

# GPU云服务器 # 弹性裸金属服务器 # 超级计算集群 # 云服务器 ECS # 弹性计算 # 虚拟化 # 异构计算 # AI芯片

ZOMI酱

|

博文

【AI系统】谷歌 TPU v4 与光路交换

TPU v4 是谷歌在 TPU v3 发布四年后推出的最新一代 AI 加速器，采用了 7nm 工艺，MXU 数量翻倍，内存容量和带宽显著提升。TPU v4 引入了 Sparse Core 以优化稀疏计算，首次采用了 3D Torus 互联方式，通过 Palomar 光路开关芯片减少系统延迟和功耗。TPU v4 Pod 实现了 1.126 Exaflops 的 BF16 峰值算力，展现了谷歌在大规模并行计算领域的突破。然而，TPU v4 也面临着系统成熟度低、拓扑僵硬和负载均衡问题等挑战。

# 机器学习/深度学习 # 人工智能 # 芯片 # AI芯片 # Perl

即兴小索奇

|

博文

ASIC到底是什么？

# 自然语言处理 # 芯片 # 异构计算 # AI芯片

布客飞龙

|

博文

JAX 中文文档（一）（1）

JAX 中文文档（一）

# GPU云服务器 # 并行计算 # Linux # 异构计算 # AI芯片 # Python

aliyun5606190238

|

博文

|

来自： ModelScope模型即服务

智谱开源端侧大语言和多模态模型GLM-Edge系列！

GLM-Edge系列模型是由智谱开源，专为端侧应用设计的大语言对话模型和多模态理解模型，包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B四种尺寸。这些模型针对手机、车机及PC等不同平台进行了优化，通过量化的技术手段，实现了高效运行。例如，在高通骁龙8 Elite平台上，1.5B对话模型和2B多模态模型能够达到每秒60 tokens以上的解码速度，而通过应用投机采样技术，这一数字可提升至100 tokens以上。

# 数据采集 # 文字识别 # 测试技术 # Swift # AI芯片

技术员阿伟

|

博文

《脉动阵列：AI硬件加速的“秘密武器”》

脉动阵列（Systolic Array）是一种高效的并行计算架构，灵感源自人体血液循环系统。它通过网格排列的处理单元（PE），以同步并行方式处理数据，尤其在矩阵乘法和卷积运算中表现出色，极大提升了AI计算效率。其优势包括降低内存带宽需求、高运算吞吐率和设计简洁，但也面临灵活性有限、全局同步难等挑战。尽管如此，脉动阵列仍为AI硬件加速提供了重要支持，推动了人工智能技术的发展。

# 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # AI芯片

安全风信子

|

8月前

|

博文

|

来自： ModelScope模型即服务

75_TPU集成：Google Cloud加速

在大型语言模型(LLM)训练和推理的竞赛中，计算硬件的选择直接决定了研发效率和成本。Google的Tensor Processing Unit(TPU)作为专为AI计算设计的专用芯片，正逐渐成为大规模LLM开发的首选平台之一。随着2025年第七代TPU架构Ironwood的发布，Google在AI计算领域再次确立了技术领先地位。

# PyTorch # 算法框架/工具 # 异构计算 # AI芯片 # Perl

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片