算法框架/工具的搜索结果_文章-阿里云开发者社区

聚搜云-服务器运维-JuSouYun

|

5天前

|

博文

手搓一套能跑通大模型实验的环境，常常卡在CUDA版本、驱动兼容、PyTorch编译这些体力活上，消磨掉的耐心比调参还多。阿里云PAI-DSW搭建大模型环境的逻辑正好反过来——它把算力、镜像、存储和分布式工具整合成云端工作台，让环境准备不再是门槛。本系列将拆解从实例创建到模型部署的完整步骤。

# 存储 # 并行计算 # PyTorch # 算法框架/工具 # 对象存储

AI未闻花名

|

7天前

|

博文

|

来自：千问大模型

本地大模型常见异常全解：显存溢出、推理慢、驱动报错、环境冲突调试指南.181

本文系统讲解本地大模型部署的核心原理与实战避坑指南：涵盖定义优势、硬件要求（GPU/内存）、软件生态（CUDA/PyTorch/量化框架）、九大标准部署流程，并深度解析显存溢出、推理缓慢、驱动/CUDA版本冲突、环境依赖混乱等高频问题的根因与解决方案，附可直接运行的优化代码示例。

# 大模型服务平台百炼 # 自然语言处理 # 并行计算 # 调度 # 算法框架/工具 # 异构计算

AI未闻花名

|

13天前

|

博文

|

来自：千问大模型

全新服务器大模型部署进阶：RTX 4090显卡驱动安装与模型运行容错适配指南.176

本文详解在openEuler 22.03服务器上适配RTX 4090显卡的完整流程：涵盖系统与内核信息查询、硬件识别、禁用Nouveau驱动、编译安装NVIDIA官方驱动（含常见报错排查）、PyTorch GPU环境部署（含国内镜像加速与依赖冲突修复），以及中文字体安装解决可视化乱码问题，全流程贴合真实运维场景。

# 并行计算 # PyTorch # Linux # 算法框架/工具 # 异构计算

AI未闻花名

|

14天前

|

博文

|

来自：千问大模型

新服务器从0到1完整部署实践：openEuler环境搭建ChatGLM2大模型完整流程.175

本文详述基于openEuler 22.03的Dell PowerEdge R740服务器从零部署大模型服务全流程：涵盖硬件核查、多网卡精准识别与静态IP配置、Python 3.11源码编译安装、PyTorch/Transformers/ModelScope等依赖适配、FastAPI接口搭建及防火墙放行，附典型报错解析与标准化解决方案，助新手快速落地。

# 大模型服务平台百炼 # PyTorch # Linux # 网络安全 # 算法框架/工具 # Python

AI算力小知识

|

16天前

|

博文

英伟达三代旗舰显卡性能测试：5090、4090、3090

本文通过ResNet-50模型在CIFAR-10数据集上的PyTorch训练实测，对比RTX 3090/4090/5090三代旗舰显卡性能。结果显示：5090单精/混精吞吐达1076/1822 samples/s，较4090提升约50%，4090较3090提升约45%，为深度学习选卡提供实证参考。

# 性能测试 # 机器学习/深度学习 # 测试技术 # PyTorch # 算法框架/工具 # 异构计算

给我一碗炒粉

|

18天前

|

博文

HAMi - Kubernetes GPU 共享部署与使用手册

HAMI

# 容器服务Kubernetes版 # Kubernetes # 并行计算 # 算法框架/工具 # 异构计算 # 容器

云老大运维

|

23天前

|

博文

|

来自：弹性计算

阿里云国际版：函数计算FC超时怎么办？依赖、内存与日志排查指南

函数计算FC超时的本质，是函数在用户设定的最大执行时间内没能返回结果。这个时间理论上最长可以配到300秒甚至更久，但很多业务场景里，即便把上限拉满，一次冷启动配合模型推理依然会让函数撞线。

# SQL # 监控 # Serverless # API # 算法框架/工具

小白学大数据

|

26天前

|

博文

无库无捷径，PyTorch 手写完整 Transformer 大语言模型 LLM

# 数据采集 # JSON # 自然语言处理 # PyTorch # 算法框架/工具

仙踪问道

|

2月前

|

博文

如何从零撰写一份专业的求职简历？让AI帮你诚实且有策略地脱颖而出

tailored-resume-generator是Hermes平台上的AI简历定制工具，专为应届生、转行者及经验匹配度低的求职者设计。它通过JD深度解析、经历-岗位智能匹配、多格式输出三步，坚持“诚实优化”原则——不虚构技能，只用数据化表达放大真实优势，助力高效通过ATS筛选与HR初筛。

# 人工智能 # 测试技术 # PyTorch # TensorFlow # 算法框架/工具

Deephub

|

2月前

|

博文

百亿参数模型的并行训练：节点内张量并行、节点间数据并行

训练百亿参数模型，显存瓶颈远超算力限制：100B模型仅权重（bfloat16）就需200GB，叠加梯度、优化器状态与激活值，总内存需求达800GB–1.2TB。单纯堆GPU无效，关键在于科学切分——张量并行降单卡参数、流水线并行减层内存、数据并行扩样本，混合策略才是破局核心。

# 存储 # PyTorch # 算法框架/工具 # 异构计算

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

算法框架/工具