AI芯片的搜索结果_热门_第6页-阿里云开发者社区

ZOMI酱

|

博文

TPU v4 是谷歌在 TPU v3 发布四年后推出的最新一代 AI 加速器，采用了 7nm 工艺，MXU 数量翻倍，内存容量和带宽显著提升。TPU v4 引入了 Sparse Core 以优化稀疏计算，首次采用了 3D Torus 互联方式，通过 Palomar 光路开关芯片减少系统延迟和功耗。TPU v4 Pod 实现了 1.126 Exaflops 的 BF16 峰值算力，展现了谷歌在大规模并行计算领域的突破。然而，TPU v4 也面临着系统成熟度低、拓扑僵硬和负载均衡问题等挑战。

# 机器学习/深度学习 # 人工智能 # 芯片 # AI芯片 # Perl

布客飞龙

|

博文

JAX 中文文档（一）（1）

JAX 中文文档（一）

# GPU云服务器 # 并行计算 # Linux # 异构计算 # AI芯片 # Python

aliyun5606190238

|

博文

|

来自： ModelScope模型即服务

智谱开源端侧大语言和多模态模型GLM-Edge系列！

GLM-Edge系列模型是由智谱开源，专为端侧应用设计的大语言对话模型和多模态理解模型，包括GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat、GLM-Edge-V-2B和GLM-Edge-V-5B四种尺寸。这些模型针对手机、车机及PC等不同平台进行了优化，通过量化的技术手段，实现了高效运行。例如，在高通骁龙8 Elite平台上，1.5B对话模型和2B多模态模型能够达到每秒60 tokens以上的解码速度，而通过应用投机采样技术，这一数字可提升至100 tokens以上。

# 数据采集 # 文字识别 # 测试技术 # Swift # AI芯片

技术员阿伟

|

博文

《脉动阵列：AI硬件加速的“秘密武器”》

脉动阵列（Systolic Array）是一种高效的并行计算架构，灵感源自人体血液循环系统。它通过网格排列的处理单元（PE），以同步并行方式处理数据，尤其在矩阵乘法和卷积运算中表现出色，极大提升了AI计算效率。其优势包括降低内存带宽需求、高运算吞吐率和设计简洁，但也面临灵活性有限、全局同步难等挑战。尽管如此，脉动阵列仍为AI硬件加速提供了重要支持，推动了人工智能技术的发展。

# 机器学习/深度学习 # 存储 # 人工智能 # 并行计算 # AI芯片

安全风信子

|

8月前

|

博文

|

来自： ModelScope模型即服务

75_TPU集成：Google Cloud加速

在大型语言模型(LLM)训练和推理的竞赛中，计算硬件的选择直接决定了研发效率和成本。Google的Tensor Processing Unit(TPU)作为专为AI计算设计的专用芯片，正逐渐成为大规模LLM开发的首选平台之一。随着2025年第七代TPU架构Ironwood的发布，Google在AI计算领域再次确立了技术领先地位。

# PyTorch # 算法框架/工具 # 异构计算 # AI芯片 # Perl

5i77ajz5u7ji6

|

博文

首个完全量化Vision Transformer的方法FQ-ViT | AI大模型落地加速还会远吗？（二）

# 存储 # 编解码 # 人工智能 # 算法 # 数据可视化 # 数据挖掘 # 计算机视觉 # 异构计算 # 索引 # AI芯片

即兴小索奇

|

博文

ASIC到底是什么？

# 自然语言处理 # 芯片 # 异构计算 # AI芯片

安全风信子

|

8月前

|

博文

|

来自： ModelScope模型即服务

65_GPU选择：A100 vs RTX系列

在2025年的今天，大语言模型（LLM）已经成为人工智能领域的核心技术之一。从GPT-4到Llama 3.1，从专业领域应用到消费级产品，LLM正在以前所未有的速度改变着我们的工作和生活方式。然而，这些强大模型的训练和部署背后，都离不开高性能计算硬件的支持，尤其是GPU（图形处理单元）的选择，往往直接决定了项目的可行性、效率和成本。

# GPU云服务器 # 人工智能 # 自然语言处理 # 数据中心 # 异构计算 # AI芯片

虫无涯

|

6天前

|

博文

大模型落地核心拆解：训练、算力硬件与真实落地瓶颈全解析

本文深度剖析大模型落地核心难点：厘清训练与推理的本质区别，揭秘算力真相（显存/带宽/通信比FLOPS更关键），对比CPU/GPU/TPU/NPU选型逻辑，并直击“爆显存”“多卡拖慢”等真实瓶颈。助你从调API进阶到底层实战。（239字）

# 机器学习/深度学习 # 人工智能 # 调度 # 异构计算 # AI芯片

云吞铺子

|

博文

阿里云GPU服务器租用Nvidia和AMD性能价格详解

阿里云GPU服务器租用Nvidia和AMD性能价格详解，阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用，阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡，GPU云服务器gn6i可享受3折优惠，阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表

# GPU云服务器 # 云服务器 ECS # 弹性计算 # 异构计算 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片