GPU云服务器的搜索结果_第12页-阿里云开发者社区

提个问题

|

18天前

|

问答

云服务器ECS在GPU计算型实例中安装GRID驱动

# 云服务器 ECS # GPU云服务器 # 弹性计算 # 异构计算

Deephub

|

18天前

|

博文

|

来自：大数据与机器学习

使用PyTorch Profiler进行模型性能分析，改善并加速PyTorch训练

加速机器学习模型训练是工程师的关键需求。PyTorch Profiler提供了一种分析工具，用于测量CPU和CUDA时间，以及内存使用情况。通过在训练代码中嵌入分析器并使用tensorboard查看结果，工程师可以识别性能瓶颈。Profiler的`record_function`功能允许为特定操作命名，便于跟踪。优化策略包括使用FlashAttention或FSDP减少内存使用，以及通过torch.compile提升速度。监控CUDA内核执行和内存分配，尤其是避免频繁的cudaMalloc，能有效提升GPU效率。内存历史记录分析有助于检测内存泄漏和优化批处理大小。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

提个问题

|

19天前

|

问答

GPU云服务器如何下载并配置Stable Diffusion模型

# GPU云服务器

楠竹11

|

19天前

|

博文

单GPU训练一天，Transformer在100位数字加法上就达能到99%准确率

【6月更文挑战第11天】Transformer模型在算术任务上取得重大突破，通过引入Abacus Embeddings，一天内在100位数字加法上达到99%准确率。该嵌入方法帮助模型跟踪数字位置，提升处理长序列的能力。实验还显示，Abacus Embeddings可与其他嵌入方法结合，提升乘法任务性能。然而，模型在更长序列的扩展性和其他类型任务的效果仍有待探究，具体训练技术的影响也需要进一步研究。论文链接：https://arxiv.org/pdf/2405.17399

# GPU云服务器 # 机器学习/深度学习 # 自然语言处理 # 异构计算

游客p4tvkbzt46vw4

|

19天前

|

博文

以LLaMa 65B模型训练实例来计算AI/HPC算力光模块数量

本文介绍了如何根据LLaMa 65B模型训练需求计算所需的AI/HPC光模块数量。在案例中，使用2048个A100 GPU，单GPU算力为156 TFLOPS。模型算力需求为546*10^21 FLOPS，预计训练时间为20天。采用两层Fat-Tree网络架构，需1024个400G网卡，48台交换机，若全用400G光模块则需4096个，交换机间2048个，网卡间1024个。大成鹏通信提供200G至800G的解决方案，并提供咨询与支持服务。

# GPU云服务器 # 人工智能 # 网络架构 # 异构计算

嘟嘟嘟嘟嘟嘟

|

19天前

|

博文

|

来自：云原生

Serverless 应用引擎产品使用合集之在访问量过大的情况下，函数配置的cpu和内存会自动扩容吗

阿里云Serverless 应用引擎（SAE）提供了完整的微服务应用生命周期管理能力，包括应用部署、服务治理、开发运维、资源管理等功能，并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景，帮助企业快速构建、部署、运维和扩展微服务架构，实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述，包括应用管理、服务治理、开发运维、资源管理等方面。

# GPU云服务器 # 函数计算 # Serverless 应用引擎 # 运维 # Serverless # Nacos # 异构计算 # 微服务

嘟嘟嘟嘟嘟嘟

|

20天前

|

博文

|

来自：云原生

Serverless 应用引擎产品使用合集之执行命令时，提示no space left on device，是什么意思

阿里云Serverless 应用引擎（SAE）提供了完整的微服务应用生命周期管理能力，包括应用部署、服务治理、开发运维、资源管理等功能，并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景，帮助企业快速构建、部署、运维和扩展微服务架构，实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述，包括应用管理、服务治理、开发运维、资源管理等方面。

# GPU云服务器 # 函数计算 # Serverless 应用引擎 # Serverless # 开发工具 # git # 异构计算 # Python

嘟嘟嘟嘟嘟嘟

|

20天前

|

博文

|

来自：云原生

Serverless 应用引擎产品使用合集之如何加载新模型到云端上

阿里云Serverless 应用引擎（SAE）提供了完整的微服务应用生命周期管理能力，包括应用部署、服务治理、开发运维、资源管理等功能，并通过扩展功能支持多环境管理、API Gateway、事件驱动等高级应用场景，帮助企业快速构建、部署、运维和扩展微服务架构，实现Serverless化的应用部署与运维模式。以下是对SAE产品使用合集的概述，包括应用管理、服务治理、开发运维、资源管理等方面。

# 对象存储 # Serverless 应用引擎 # GPU云服务器 # 函数计算 # 文件存储NAS # 日志服务 # 存储 # Serverless # 文件存储 # 对象存储 # 异构计算

嘟嘟嘟嘟嘟嘟

|

20天前

|

博文

|

来自：大数据与机器学习

人工智能平台PAI产品使用合集之如何设置DCluster参数

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台，旨在降低AI开发门槛，加速创新，助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务，共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述，涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

# GPU云服务器 # 人工智能平台 PAI # 机器学习/深度学习 # 人工智能 # TensorFlow # 算法框架/工具 # 异构计算

众所周知

|

20天前

|

博文

详细介绍Flutter Profiler的功能、使用方法以及如何利用它来提升应用的性能

【6月更文挑战第11天】Flutter Profiler是用于优化Flutter应用的关键工具，提供CPU、GPU、内存和网络分析。它帮助开发者监控运行时性能，识别瓶颈，如CPU过度使用、渲染问题、内存泄漏和网络效率低。通过选择分析类型、开始分析、查看结果，开发者可进行针对性优化。最佳实践包括定期分析、结合实际场景、关注关键指标及结合其他工具。有效利用Profiler能提升应用性能和用户体验。

# GPU云服务器 # Dart # 监控 # 开发者 # UED # 异构计算