AI芯片的搜索结果_热门_第17页-阿里云开发者社区

-开发达人-

|

博文

|

来自： ModelScope模型即服务

有了Fine-tune-CoT方法，小模型也能做推理，完美逆袭大模型

# 人工智能 # 自然语言处理 # API # AI芯片

5i77ajz5u7ji6

|

博文

目标检测模型设计准则 | YOLOv7参考的ELAN模型解读，YOLO系列模型思想的设计源头（一）

# 机器学习/深度学习 # 人工智能 # 算法 # Go # 网络架构 # 计算机视觉 # 异构计算 # AI芯片

书香度年华

|

博文

【RISC-V 理论篇】指令集架构详解 WIP

# 存储 # 安全 # 程序员 # 编译器 # 虚拟化 # 异构计算 # SoC # AI芯片

-开发达人-

|

博文

一个开源方案，极速预训练650亿参数LLaMA

# 人工智能 # PyTorch # 测试技术 # 算法框架/工具 # 开发工具 # 计算机视觉 # 异构计算 # AI芯片 # 内存技术

-开发达人-

|

博文

降龙十八掌：这套优化transformer内存占用的组合技值得收藏

# GPU云服务器 # 机器学习/深度学习 # 存储 # PyTorch # 测试技术 # 调度 # 算法框架/工具 # 异构计算 # AI芯片

阿里云助手

|

博文

阿里云gpu云服务器最新收费标准与优惠价格表参考

阿里云gpu云服务器最新收费标准与优惠价格表参考，阿里云GPU服务器租用价格表包括包年包月价格、一个小时收费以及学生GPU服务器租用费用，阿里云GPU计算卡包括NVIDIA V100计算卡、T4计算卡、A10计算卡和A100计算卡，GPU云服务器gn6i可享受3折优惠，阿里云百科分享阿里云GPU服务器租用价格表、GPU一个小时多少钱以及学生GPU服务器收费价格表

# GPU云服务器 # 云服务器 ECS # 超级计算集群 # 弹性裸金属服务器 # 弹性计算 # 虚拟化 # 异构计算 # AI芯片

极智视界

|

博文

|

来自：视觉智能

极智AI | 一文看懂winograd卷积加速算法

本文详细解释了 winograd 算法加速卷积的实现原理。

# 存储 # 人工智能 # 算法 # 计算机视觉 # AI芯片

ZOMI酱

|

博文

【AI系统】数据并行

数据并行是一种在分布式AI系统中广泛应用的技术，通过将数据集划分成多个子集并在不同计算节点上并行处理，以提高计算效率和速度。在大规模机器学习和深度学习训练中，数据并行可以显著加快模型训练速度，减少训练时间，提升模型性能。每个计算节点接收完整的模型副本，但处理不同的数据子集，从而分摊计算任务，提高处理速度和效率。数据并行按同步方式可分为同步数据并行和异步数据并行，按实现方式包括数据并行、分布式数据并行、完全分片的数据并行等。其中，分布式数据并行（DDP）是当前应用最广泛的并行算法之一，通过高效的梯度聚合和参数同步机制，确保模型一致性，适用于大型NPU集群和AI系统。

# 机器学习/深度学习 # 人工智能 # PyTorch # 算法框架/工具 # AI芯片

其名美曰

|

博文

YOLOv11改进策略【模型轻量化】| 替换骨干网络为EfficientNet v2，加速训练，快速收敛

# 机器学习/深度学习 # 文件存储 # 异构计算 # AI芯片

RaceSnail

|

博文

飞桨x昇腾生态适配方案：08_性能调优方法

本文主要探讨性能优化中的问题定界与解决方法，针对计算时间和调度时间两方面展开分析。对于计算时间长的问题，可能源于算子运行在 AI_CPU 或使用较慢的 aclop 算子，可通过数据类型转换、切换至 aclnn 算子或优化底层算子来改善。调度时间长则常因算子运行在 CPU、重复编译或通讯耗时过多引起，可采取算子适配优化、减少编译次数及避免冗余 copy 操作等手段解决。此外，文章还介绍了适配层优化策略，包括未注册算子排查、重复编译优化以及通过更换算子、调整数据类型和引入融合算子提升性能。

# API # 调度 # AI芯片

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

AI芯片