并行计算的搜索结果_热门_第12页-阿里云开发者社区

小小爱吃香菜

|

问答

|

来自： ModelScope模型即服务

cuda 是11.3，ModelScope的mmcv怎么安装？

# 并行计算

孙叫兽

|

博文

推荐一些机器学习系统MLSys中的值得研究的方向

MLsys不能算是一种方向，而是一种思路。比如对于system研究者来说，可以把ML作为我们开发的系统要适配的一种benchmark，就像transaction对于数据库、某种文件场景对于File System的意义一样。这样一想可做的空间就宽广多了

# 机器学习/深度学习 # 分布式计算 # 并行计算 # 算法 # 编译器 # Serverless # 数据库 # C++ # 异构计算 # 数据库管理

delacroix_xu-15509

|

8月前

|

博文

|

来自：大数据与机器学习

Step-Audio2 声音克隆详细介绍

Step-Audio2是StepFun于2024年推出的中文语音克隆大模型，支持“一句话克隆+情感可控+实时流式”一体化生成，参数总量300M，首包延迟低至120ms，MOS达4.4+，采用Apache-2.0协议开源，适配商业应用，是当前中文TTS领域开源落地门槛最低的方案之一。

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 并行计算 # 语音技术

liuyunshengsir

|

博文

|

来自：大数据与机器学习

基于HPC场景的集群任务调度系统LSF/SGE/Slurm/PBS

在HPC场景中，集群任务调度系统是资源管理和作业调度的核心工具。LSF、SGE、Slurm和PBS是主流调度系统。LSF适合大规模企业级集群，提供高可靠性和混合云支持；SGE为经典开源系统，适用于中小规模集群；Slurm成为HPC领域事实标准，支持多架构和容器化；PBS兼具商业和开源版本，擅长拓扑感知调度。选型建议：超大规模科研用Slurm，企业生产环境用LSF/PBS Pro，混合云需求选LSF/PBS Pro，传统小型集群用SGE/Slurm。当前趋势显示Slurm在TOP500系统中占比超60%，而商业系统在金融、制造等领域保持优势。

# 分布式计算 # 并行计算 # 调度 # 异构计算 # 容器

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

KTransformers：告别天价显卡！国产框架让单卡24G显存跑DeepSeek-R1 671B大模型：推理速度飙升28倍

KTransformers 是由清华大学和趋境科技联合推出的开源项目，能够优化大语言模型的推理性能，降低硬件门槛。支持在仅24GB显存的单张显卡上运行671B参数的满血版大模型。

# GPU云服务器 # 自然语言处理 # 存储 # 人工智能 # 并行计算 # API # 异构计算

AI未闻花名

|

2月前

|

博文

|

来自：千问大模型

大模型应用：大模型运行全流程解析：从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程：从硬盘加载权重、CPU内存预处理、GPU显存计算，到自回归生成与自然语言解码。涵盖硬件协同（硬盘→内存→GPU）、软件步骤（分词、注意力、采样、后处理）及资源调度优化，揭示其软硬协同的本质。

# 大模型服务平台百炼 # 存储 # 缓存 # 自然语言处理 # 并行计算 # 异构计算

9589

|

8天前

|

博文

C++在量化交易回测系统中的运用（性能与正确性并重）

量化交易策略在实盘前，必须用历史数据验证其表现（收益、最大回撤、夏普比率）。回测系统接收数年的tick级数据（每秒数千笔），逐笔模拟订单成交，统计指标。

# 缓存 # 并行计算 # 数据可视化 # C++ # Python

喜欢猪猪

|

博文

谈谈分布式训练框架DeepSpeed与Megatron

【11月更文挑战第3天】随着深度学习技术的不断发展，大规模模型的训练需求日益增长。为了应对这种需求，分布式训练框架应运而生，其中DeepSpeed和Megatron是两个备受瞩目的框架。本文将深入探讨这两个框架的背景、业务场景、优缺点、主要功能及底层实现逻辑，并提供一个基于Java语言的简单demo例子，帮助读者更好地理解这些技术。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # Java # 算法框架/工具 # 异构计算

Deephub

|

6月前

|

博文

TensorRT 和 ONNX Runtime 推理优化实战：10 个降低延迟的工程技巧

模型性能优化关键在于细节：固定输入形状、预热、I/O绑定、精度量化、图优化与CUDA Graph等小技巧，无需重构代码即可显著降低延迟。结合ONNX Runtime与TensorRT最佳实践，每个环节节省几毫秒，累积提升用户体验。生产环境实测有效，低延迟从此有据可依。

# 缓存 # 并行计算 # 算法 # 异构计算 # Python

万俟淋曦

|

博文

[Eigen中文文档] 概述（总目录）

Eigen是基于线性代数的C ++模板库，主要用于矩阵，向量，数值求解器和相关算法。常用的Ceres、G2O等项目均是基于Eigen库。本系列文章将通过官方文档带你了解Eigen。

# 存储 # 并行计算 # 算法 # API # C++

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

并行计算