并行计算的搜索结果_热门_第16页-阿里云开发者社区

阿里云大数据Al技术

|

8月前

|

博文

|

Pai-Megatron-Patch 是一款由阿里云人工智能平台PAI 研发的围绕英伟达 Megatron 的大模型训练配套工具，旨在帮助开发者快速上手大模型，打通大模型相关的高效分布式训练、有监督指令微调、下游任务评估等大模型开发链路。本文以 Qwen2-VL 为例，从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术

# 云解析DNS # 人工智能平台 PAI # 编解码 # 人工智能 # 并行计算 # 网络性能优化 # 异构计算

游客i66wb7w7cg4tk

|

博文

粒子群优化算法详细讲解（附完整代码实现一元二次方程求解）

# 机器学习/深度学习 # 并行计算 # 算法 # 决策智能 # 计算机视觉

aliyun7561534101-12421

|

博文

Anaconda+Cuda+Cudnn+Pytorch（GPU版）+Pycharm+Win11深度学习环境配置

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # 算法框架/工具 # 异构计算 # Python

YOLO创新改进大师

|

博文

【YOLOv8改进 - 特征融合】DySample ：超轻量级且高效的动态上采样器

# 并行计算 # 数据挖掘 # PyTorch # 算法框架/工具 # 计算机视觉

1941623231718325

|

博文

R语言性能优化：提升代码运行速度的技巧

【8月更文挑战第28天】R语言的性能优化是一个复杂而细致的过程，需要综合考虑数据结构、算法、并行计算、编译以及内存管理等多个方面。通过应用上述技巧，你可以在不牺牲代码可读性和灵活性的前提下，显著提高R代码的执行效率。记住，优化是一个迭代的过程，需要不断地测试、分析和调整你的代码。

# 存储 # 并行计算 # 算法 # Java # C++

代码bug生产队

|

博文

请详细介绍GPU加速

【10月更文挑战第20天】请详细介绍GPU加速

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # 数据挖掘 # API # 异构计算

阿里云基础设施.

|

12月前

|

博文

从UALink近期发展再看GPU Scale Up的互连方向

ALink System的目标是聚焦GPU算力需求、驱动云计算定义的开放生态，形成智算超节点的竞争力。

# GPU云服务器 # 人工智能 # 并行计算 # 云计算 # 芯片 # 异构计算

游客7dgyrbdm3doqi

|

8月前

|

博文

NPU上运行onnxruntime

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

阿里云开发者

|

4月前

|

博文

10分钟微调，让0.6B模型媲美235B模型！免费体验进行中

本方案介绍如何通过模型蒸馏技术，利用大参数模型生成数据并微调小参数模型（如 Qwen3-0.6B），使其在特定任务（如从一句话中提取结构化信息）中达到接近大模型的效果。通过 GPU 云服务器进行高效微调，结合魔搭社区的 ms-swift 框架，用户可快速完成模型训练与部署，显著提升推理速度并降低成本。方案包含详细步骤：数据准备、模型微调、效果验证及部署建议，并提供免费试用资源，助力开发者快速上手实践。

# 机器学习/深度学习 # JSON # 并行计算 # 开发者 # 异构计算

delacroix_xu-15509

|

2月前

|

博文

|

来自：大数据与机器学习

完整教程：从0到1在Windows下训练YOLOv8模型

本文详细介绍在Windows系统下使用YOLOv8训练目标检测模型的完整步骤，涵盖环境配置、数据集准备、模型训练与测试、常见问题解决及GPU加速技巧。提供详细命令与代码示例，并推荐现成数据集与工具，助您高效完成模型训练。

# 并行计算 # 数据格式 # 异构计算 # Windows # JSON