并行计算的搜索结果_第4页-阿里云开发者社区

阿里开发者

|

7天前

|

博文

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

# 缓存 # 并行计算 # 负载均衡 # 算法 # 物联网

1941623231718325

|

7天前

|

博文

PyTorch与CUDA：加速深度学习训练

【4月更文挑战第18天】本文介绍了如何使用PyTorch与CUDA加速深度学习训练。CUDA是NVIDIA的并行计算平台，常用于加速深度学习中的矩阵运算。PyTorch与CUDA集成，允许开发者将模型和数据迁移到GPU，利用`.to(device)`方法加速计算。通过批处理、并行化策略及优化技巧，如混合精度训练，可进一步提升训练效率。监控GPU内存和使用调试工具确保训练稳定性。PyTorch与CUDA的结合对深度学习训练的加速作用显著。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # PyTorch # 算法框架/工具 # 异构计算

wljslmz

|

7天前

|

博文

如何创建Java线程？

【4月更文挑战第13天】

# 并行计算 # Java

4as3qn2go3ure

|

7天前

|

博文

马尔可夫区制转移模型Markov regime switching

# 资源调度 # 并行计算

4as3qn2go3ure

|

8天前

|

博文

r语言中对LASSO回归，Ridge岭回归和弹性网络Elastic Net模型实现1

r语言中对LASSO回归，Ridge岭回归和弹性网络Elastic Net模型实现

# 并行计算 # 算法 # 数据可视化

三分钟热度的鱼

|

8天前

|

问答

|

来自： ModelScope模型即服务

modelscope-funasr直接运行这个出现错误，如何解决？

# 对象存储 # 自然语言处理 # 语音技术 # 并行计算 # Shell

三分钟热度的鱼

|

8天前

|

问答

|

来自：云原生

函数计算部署GPU服务，调用经常报错，如何解决？

# GPU云服务器 # 函数计算 # 并行计算 # Serverless # 异构计算 # API

三分钟热度的鱼

|

8天前

|

问答

|

来自：云原生

函数计算FC出图报错在，解决？

# 函数计算 # Serverless # 并行计算

1941623231718325

|

8天前

|

博文

PyTorch入门指南：从安装到基础操作

【4月更文挑战第17天】PyTorch入门指南介绍了安装、Tensor操作、自动微分、神经网络构建及训练。安装PyTorch可通过官网选择相应环境的预构建包或使用conda命令。Tensor是基本计算单元，支持多种操作。自动微分简化了梯度计算。使用`torch.nn`定义神经网络，如示例中的全连接网络。训练网络涉及前向传播、损失计算、反向传播和权重更新，常用优化器如SGD。模型评估与测试包括在验证集或测试集上计算性能指标，如准确率。本文为初学者提供了PyTorch基础操作的快速入门。

# 机器学习/深度学习 # 人工智能 # 并行计算 # PyTorch # 算法框架/工具

1941623231718325

|

8天前

|

博文

TensorFlow与GPU加速：提升深度学习性能

【4月更文挑战第17天】本文介绍了TensorFlow如何利用GPU加速深度学习， GPU的并行处理能力适合处理深度学习中的矩阵运算，显著提升性能。TensorFlow通过CUDA和cuDNN库支持GPU，启用GPU只需简单代码。GPU加速能减少训练时间，使训练更大、更复杂的模型成为可能，但也需注意成本、内存限制和编程复杂性。随着技术发展，GPU将继续在深度学习中发挥关键作用，而更高效的硬件解决方案也将备受期待。

# GPU云服务器 # 机器学习/深度学习 # 并行计算 # TensorFlow # 算法框架/工具 # 异构计算