文章标签：

异构计算

存储

自然语言处理

机器学习/深度学习

运维

关键词：

分布式策略

分布式训练

bert模型

分布式模型

人工智能平台 PAI模型

探索云世界

7月前

人工智能自然语言处理 IDE

模型微调不再被代码难住！PAI和Qwen3-Coder加速AI开发新体验

通义千问 AI 编程大模型 Qwen3-Coder 正式开源，阿里云人工智能平台 PAI 支持云上一键部署 Qwen3-Coder 模型，并可在交互式建模环境中使用 Qwen3-Coder 模型。

探索云世界

1158 109 109

荔枝科研社

7月前

传感器算法安全

基于分布式模型预测控制DMPC的单向拓扑结构下异构车辆车队研究（Matlab代码实现）

荔枝科研社

236 4 4

探索云世界

8月前

人工智能自然语言处理运维

【新模型速递】PAI-Model Gallery云上一键部署Kimi K2模型

月之暗面发布开源模型Kimi K2，采用MoE架构，参数达1T，激活参数32B，具备强代码能力及Agent任务处理优势。在编程、工具调用、数学推理测试中表现优异。阿里云PAI-Model Gallery已支持云端部署，提供企业级方案。

探索云世界

476 0 0

安全风信子

6月前

存储监控算法

117_LLM训练的高效分布式策略：从数据并行到ZeRO优化

在2025年，大型语言模型（LLM）的规模已经达到了数千亿甚至数万亿参数，训练这样的庞然大物需要先进的分布式训练技术支持。本文将深入探讨LLM训练中的高效分布式策略，从基础的数据并行到最先进的ZeRO优化技术，为读者提供全面且实用的技术指南。

安全风信子

664 2 2

荔枝科研社

7月前

算法调度

【孤岛划分】分布式能源接入弹性配电网模型研究【IEEE33节点】（Matlab代码实现）

荔枝科研社

697 10 10

安全风信子

6月前

机器学习/深度学习监控 PyTorch

68_分布式训练技术：DDP与Horovod

随着大型语言模型（LLM）规模的不断扩大，从早期的BERT（数亿参数）到如今的GPT-4（万亿级参数），单卡训练已经成为不可能完成的任务。分布式训练技术应运而生，成为大模型开发的核心基础设施。2025年，分布式训练技术已经发展到相当成熟的阶段，各种优化策略和框架不断涌现，为大模型训练提供了强大的支持。

安全风信子

828 0 0

安全风信子

6月前

机器学习/深度学习数据采集人工智能

35_BERT与RoBERTa：优化编码器模型

2018年，Google发布的BERT（Bidirectional Encoder Representations from Transformers）模型彻底改变了自然语言处理领域的格局。作为第一个真正意义上的双向预训练语言模型，BERT通过创新的掩码语言模型（Masked Language Model, MLM）预训练策略，使模型能够同时从左右两侧的上下文信息中学习语言表示，从而在多项NLP任务上取得了突破性进展。

安全风信子

652 0 0

荔枝科研社

8月前

边缘计算运维算法

含分布式电源的配电网日前两阶段优化调度模型（Matlab代码实现）

荔枝科研社

168 1 1

Deephub

9月前

机器学习/深度学习算法安全

差分隐私机器学习：通过添加噪声让模型更安全，也更智能

本文探讨在敏感数据上应用差分隐私（DP）进行机器学习的挑战与实践。通过模拟DP-SGD算法，在模型训练中注入噪声以保护个人隐私。实验表明，该方法在保持71%准确率和0.79 AUC的同时，具备良好泛化能力，但也带来少数类预测精度下降的问题。研究强调差分隐私应作为模型设计的核心考量，而非事后补救，并提出在参数调优、扰动策略选择和隐私预算管理等方面的优化路径。

Deephub

585 3 3

大数据与机器学习

热门文章

最新文章

相关课程

相关电子书

相关实验场景