AI芯片的搜索结果_第3页-阿里云开发者社区

1330219825944132

|

6月前

|

博文

04_昇腾推荐系统：单双层架构解析

单双层架构互补共存：单层追求极致性能，适用于小规模特征；双层突破内存瓶颈，支持大规模扩展。结合动态扩容、准入淘汰与高效查表，实现推荐系统大规模稀疏参数的高效训练与管理。

# 存储 # 搜索推荐 # 索引 # AI芯片 # 内存技术

1330219825944132

|

6月前

|

博文

05_推荐系统准入与淘汰策略技术详解

本文详解推荐系统多级缓存中的准入淘汰策略，涵盖基于访问频次、概率、ShowClick等准入机制，以及基于时间、L2范数、频次等淘汰机制，结合CPU-PS控制流程与NPU执行优化，实现缓存资源高效利用，提升模型训练效率与推荐精度。

# 存储 # 机器学习/深度学习 # 缓存 # 搜索推荐 # AI芯片

1330219825944132

|

6月前

|

博文

07_昇腾嵌入表性能提升

本文介绍嵌入表性能优化的六大策略：多流并行掩盖通信延迟，Pin Memory加速数据传输，两级去重减少计算冗余，通信模式优化降低开销，梯度累积节省内存，并结合实验验证效果，全面提升训练效率与资源利用率。

# 存储 # 并行计算 # PyTorch # 算法框架/工具 # AI芯片

1330219825944132

|

6月前

|

博文

06_昇腾流水线优化技术详解

本文详解昇腾流水线优化技术，涵盖NPU与GPU侧多级流水实现。通过Stage划分、异步调度与计算通信重叠，提升训练吞吐与硬件利用率。NPU基于Rec SDK实现五阶段流水，支持动态换入换出；GPU则利用CUDA Stream构建StagedTrainPipeline，实现高效prefetch与梯度更新协同。

# 缓存 # 调度 # 开发工具 # 异构计算 # AI芯片

1330219825944132

|

6月前

|

博文

03_嵌入表分片与哈希管理：支撑万亿参数的关键技术

本文介绍支撑万亿参数推荐系统的核心技术：嵌入表分片与哈希管理。通过单/双层Hash模式实现稀疏ID高效映射，结合分桶策略均匀分配数据；采用Row-Wise、Table-Wise等分片机制，优化存储与计算负载，提升大规模模型训练效率。

# 存储 # 缓存 # 搜索推荐 # 索引 # AI芯片

1330219825944132

|

6月前

|

博文

02_昇腾推荐系统架构解析：嵌入表存储到多级缓存的全链路设计

昇腾推荐系统采用多级缓存架构，基于达芬奇架构NPU实现HBM与DDR协同的Embedding存储。通过FastHashMap与动态Swap机制，结合LRU/LFU准入淘汰策略，支持大规模稀疏特征高效训练。软件层面深度适配TorchRec，提供统一接口，实现计算与通信重叠，提升端到端性能，适用于电商、短视频等大模型推荐场景。

# 存储 # 缓存 # 搜索推荐 # AI芯片 # 内存技术

Echo_Wish

|

6月前

|

博文

|

来自：大数据与机器学习

算力不一定越猛越好：聊聊 AI 设备的低功耗算力优化这条现实之路

# 人工智能 # 算法 # PyTorch # 算法框架/工具 # AI芯片

忆~遂愿

|

6月前

|

博文

昇腾 Triton-Ascend 开源实战：架构解析、环境搭建与配置速查

本文深度解析Triton-Ascend开源项目，涵盖源码结构、编译流程与环境部署，重点针对Ascend 910B硬件提供从CANN安装到算子开发的保姆级指南，并详解Autotune调优策略与性能分析工具，助力开发者高效构建高性能AI算子。

# 开发工具 # 开发者 # AI芯片 # Python # 容器

忆~遂愿

|

6月前

|

博文

vLLM-Ascend 安装部署与环境配置指南

vLLM-Ascend 是 vLLM 项目专为华为昇腾 NPU 设计的硬件插件，支持主流大模型与多模态架构，提供高性能推理能力。项目结构清晰，涵盖核心算子、工具脚本与容器化部署方案，兼容单/多节点环境，助力高效构建昇腾上的 AI 推理服务。

# 负载均衡 # Docker # Python # AI芯片 # 容器

Alter聊科技

|

6月前

|

博文

CANN全面开源开放：把创新的主动权交给开发者

CANN全面开源，打破AI生态“黑盒”与绑定困局。从算子库到编程语言全栈开放，赋能开发者透明调试、灵活定制，推动从“能用”到“敢用”再到“好用”的跨越。通过社区共建、分层解耦、千行万业协同创新，重塑计算产业规则，助力AI落地可信、可持续发展。（239字）

# 人工智能 # 并行计算 # 开发者 # AI芯片 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片