并行计算的搜索结果-阿里云开发者社区

游客7dgyrbdm3doqi

|

11小时前

|

博文

在Ascend环境下使用onnxruntime推理时，若安装了GPU版本的onnxruntime（`onnxruntime-gpu`），可能会因缺少CUDA组件报错。正确做法是卸载`onnxruntime-gpu`，并根据官方文档适配NPU，通过源码构建支持CANN的onnxruntime whl包。具体步骤为克隆onnxruntime源码，使用`--use_cann`参数构建，并安装生成的whl包。最后，配置CANNExecutionProvider进行推理。

# 并行计算 # 开发工具 # git # 异构计算 # AI芯片

阿里云大数据Al技术

|

3天前

|

博文

|

来自：大数据与机器学习

基于 Megatron 的多模态大模型训练加速技术解析

Pai-Megatron-Patch 是一款由阿里云人工智能平台PAI 研发的围绕英伟达 Megatron 的大模型训练配套工具，旨在帮助开发者快速上手大模型，打通大模型相关的高效分布式训练、有监督指令微调、下游任务评估等大模型开发链路。本文以 Qwen2-VL 为例，从易用性和训练性能优化两个方面介绍基于 Megatron 构建的 Pai-Megatron-Patch 多模态大模型训练的关键技术

# 云解析DNS # 编解码 # 人工智能 # 并行计算 # 网络性能优化 # 异构计算

阿里云基础设施.

|

3天前

|

博文

|

来自：弹性计算

kTransformers DeepSeek R1 部署全流程指南

# 并行计算 # Ubuntu # Docker # 异构计算 # 容器

蓝易云

|

3天前

|

博文

全面提升Python性能的十三种优化技巧

通过应用上述十三种优化技巧，开发者可以显著提高Python代码的执行效率和性能。每个技巧都针对特定的性能瓶颈进行优化，从内存管理到并行计算，再到使用高效的数值计算库。这些优化不仅能提升代码的运行速度，还能提高代码的可读性和可维护性。希望这些技巧能帮助开发者在实际项目中实现更高效的Python编程。

# 缓存 # 并行计算 # 数据处理 # 开发者 # Python

张飞的猪

|

5天前

|

博文

|

来自：大数据与机器学习

Claude 3.7登顶webdev榜首，国内怎么使用Claude 3.7

Claude 3.7 登顶 Webdev 榜首,Claude 3.7 Sonnet 以 1363.7 分的竞技场评分位列榜首，远超第二名。相比前代，它在数学与编码能力上提升显著，尤其在代理编码测试中准确率达 62.3%，工具交互测试中达 81.2% 的 SOTA 表现。支持 128k Token 输入，上下文处理能力提升 16 倍，并引入扩展思考模式，大幅提升复杂任务解决效率。 Claude 3.7 是 Anthropic 推出的新一代 LLM，具备卓越的推理和编程能力。国内用户可参考特定指南注册使用。

# 人工智能 # 并行计算 # 测试技术

蚝油菜花

|

5天前

|

博文

|

来自： ModelScope模型即服务

NotaGen：中央音乐学院联合清华推出AI音乐生成模型，古典乐谱一键生成，音乐性接近人类！

NotaGen 是由中央音乐学院、北京航空航天大学、清华大学等机构联合推出的音乐生成模型，基于模仿大型语言模型的训练范式，能够生成高质量的古典乐谱。该模型通过预训练、微调和强化学习相结合的方式，显著提升了符号音乐生成的艺术性和可控性。

# 图像识别 # 机器学习/深度学习 # 人工智能 # 并行计算 # 算法 # PyTorch

游客4rnkeq2m7q5hy

|

5天前

|

博文

Python 高级编程与实战：构建分布式系统

本文深入探讨了 Python 中的分布式系统，介绍了 ZeroMQ、Celery 和 Dask 等工具的使用方法，并通过实战项目帮助读者掌握这些技术。ZeroMQ 是高性能异步消息库，支持多种通信模式；Celery 是分布式任务队列，支持异步任务执行；Dask 是并行计算库，适用于大规模数据处理。文章结合具体代码示例，帮助读者理解如何使用这些工具构建分布式系统。

# 消息中间件 # 分布式计算 # 并行计算 # 数据处理 # Python

胖胖雕

|

6天前

|

博文

Windows下CUDA+pytorch安装

以下是关于在Windows下安装CUDA和PyTorch的简要介绍及参考链接：

# 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

游客nsyhaoxcmeiq6

|

6天前

|

博文

这可能是最轻量级的列存技术了

列式存储通过减少硬盘访问量和高效压缩，显著提升数据分析性能。然而，传统列存技术如Hadoop、MPP数据库等架构复杂、成本高。esProc的ctx文件提供了一种轻量级列存解决方案，支持高效的数据压缩、分段并行计算及简单易用的SPL编程语言。ctx文件适用于大数据量存储，读取性能优于ORC和Parquet，且无需复杂环境配置，适合嵌入Java应用，特别适用于报表缓存场景。SPL已开源免费，欢迎了解。

# 存储 # 分布式计算 # 并行计算 # Java # Hadoop

Echo_Wish

|

7天前

|

博文

|

来自：大数据与机器学习

量子计算：材料科学中的革命性创新

# 并行计算 # 算法 # 新能源 # 大数据 # 量子技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

并行计算