AI芯片的搜索结果_热门_第3页-阿里云开发者社区

hw2020hw

|

12月前

|

博文

大模型推理显存和计算量估计方法

最近做吞吐量调试涉及到输入batch_size的设置，为了把算力和显存用起来，同时不触发out of memory，需要提前估计大模型推理过程中的显存占用

# 机器学习/深度学习 # 存储 # 缓存 # Shell # AI芯片

王嘉祥

|

博文

国产NAS也支持本地部署DeepSeek了：极空间Z423上手

极空间Z423 NAS新增本地部署DeepSeek大模型功能，支持7B和14B两种参数量级模型。本文通过实际测试展示了其性能表现：14B模型运行缓慢，Token输出速度低于每秒10个，而7B模型速度稍快但仍不理想。硬件资源占用高，温度显著上升，风扇噪音增大。作者建议优化交互逻辑、提供局域网接口及更好GPU支持，并预测未来NAS可能加入GPU或NPU以提升推理能力。此功能目前更像战略布局，为后续硬件升级铺垫。

# 监控 # 文件存储 # 异构计算 # AI芯片 # 内存技术

9589

|

2月前

|

博文

边缘智能崛起——云端之外的AI新战场

过去十年，人工智能的叙事几乎被“云端”主导——海量数据上传，巨量算力集中，大模型在数据中心里吞吐亿万参数。

# 传感器 # 人工智能 # 安全 # 芯片 # AI芯片

-开发达人-

|

博文

双芯片四芯粒互联，寒武纪发布AI训练卡MLU370-X8：性能超越RTX

# GPU云服务器 # 机器学习/深度学习 # 人工智能 # 编解码 # 自动驾驶 # 搜索推荐 # 测试技术 # 开发工具 # 芯片 # 异构计算 # AI芯片

极智视界

|

博文

|

来自：视觉智能

极智AI | 一文看懂Google TPU脉动阵列加速卷积计算原理

本教程详细解释了 Google TPU 脉动阵列加速卷积计算原理。

# 机器学习/深度学习 # 存储 # 人工智能 # 编解码 # AI芯片

modelscope

|

博文

|

来自： ModelScope模型即服务

实战 | Intel OpenVINO™ Day0 实现 Qwen3 快速部署

# API # 开发者 # 异构计算 # Python # AI芯片

游客7dgyrbdm3doqi

|

博文

NPU上运行onnxruntime

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

1330219825944132

|

6月前

|

博文

02_昇腾推荐系统架构解析：嵌入表存储到多级缓存的全链路设计

昇腾推荐系统采用多级缓存架构，基于达芬奇架构NPU实现HBM与DDR协同的Embedding存储。通过FastHashMap与动态Swap机制，结合LRU/LFU准入淘汰策略，支持大规模稀疏特征高效训练。软件层面深度适配TorchRec，提供统一接口，实现计算与通信重叠，提升端到端性能，适用于电商、短视频等大模型推荐场景。

# 存储 # 缓存 # 搜索推荐 # AI芯片 # 内存技术

卿云阁

|

6天前

|

博文

|

来自：大数据与机器学习

人工智能|YOLOv8实战

本内容为安全帽检测实战项目，基于YOLOv8模型，涵盖Kaggle数据获取、自定义yaml配置、模型训练（yolo_train.py）与测试（yolo_test.py），并提供服务器（FastAPI+Docker）、边缘（Jetson+TensorRT）及国产嵌入式（RK3588+RKNN）三类部署方案，支持工业场景实时智能识别。（239字）

# 人工智能 # 机器人 # 芯片 # 异构计算 # AI芯片

阿里云基础设施

|

博文

阿里云首款单相浸没液冷解决方案正式对外发布！

# 云原生大数据计算服务 MaxCompute # 存储 # 人工智能 # 运维 # 大数据 # 数据中心 # 云计算 # 芯片 # 异构计算 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片