官方博客-第16页-阿里云开发者社区

新念

2025-02-14

1464

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,464

澄潭计缘望宸

2025-03-14

1017

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,017

阿里云云原生

2025-04-23

985

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

Spring AI Alibaba Graph 的核心开发已完成，即将发布正式版本。开发者可基于此轻松构建工作流、智能体及多智能体系统，功能丰富且灵活。文章通过三个示例展示了其应用：1) 客户评价处理系统，实现两级问题分类与自动处理；2) 基于 ReAct Agent 的天气预报查询系统，循环执行用户指令直至完成；3) 基于 Supervisor 多智能体的 OpenManus 实现，简化了流程控制逻辑并优化了工具覆盖度。此外，还提供了运行示例的方法及未来规划，欢迎开发者参与贡献。

阿里云云原生

985

ModelScope

2024-05-15

767

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

767

千习

2024-07-22

15909

Spring Cloud Alibaba 集成分布式定时任务调度功能

Spring Cloud Alibaba 发布了 Scheduling 任务调度模块 [#3732]提供了一套开源、轻量级、高可用的定时任务解决方案，帮助您快速开发微服务体系下的分布式定时任务。

千习

15,909

阿里云云原生

2025-01-22

649

AI 短剧遇上函数计算，一键搭建内容创意平台

为了帮助更多内容创作者和企业快速实现 AI 短剧创作，函数计算 FC 联合百炼联合推出“AI 剧本生成与动画创作解决方案”，通过函数计算 FC 构建 Web 服务，结合百炼模型服务和 ComfyUI 生图平台，实现从故事剧本撰写、插图设计、声音合成和字幕添加到视频合成的一站式自动化流程。创作者只需通过简单操作，就能快速生成高质量的剧本，并一键转化为精美的动画。

阿里云云原生

649

王晨

2025-04-03

848

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

848

阿里云云原生

2024-05-15

63380

All in One：Prometheus 多实例数据统一管理最佳实践

当管理多个Prometheus实例时，阿里云Prometheus托管版相比社区版提供了更可靠的数据采集和便捷的管理。本文比较了全局聚合实例与数据投递方案，两者在不同场景下各有优劣。

阿里云云原生

63,380

坤硕

2024-07-29

20130

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,130

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

联合XTuner，魔搭社区全面支持数据集的长文本训练

Spring Cloud Alibaba 集成分布式定时任务调度功能

AI 短剧遇上函数计算，一键搭建内容创意平台

大模型上下文协议 MCP 带来了哪些货币化机会

All in One：Prometheus 多实例数据统一管理最佳实践

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

十几行代码实现 Manus，Spring AI Alibaba Graph 快速预览

联合XTuner，魔搭社区全面支持数据集的长文本训练

Spring Cloud Alibaba 集成分布式定时任务调度功能

AI 短剧遇上函数计算，一键搭建内容创意平台

大模型上下文协议 MCP 带来了哪些货币化机会

All in One：Prometheus 多实例数据统一管理最佳实践

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅