官方博客-第25页-阿里云开发者社区

新念

2025-02-14

1391

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,391

阿里云云原生

2025-05-23

528

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

528

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

阿里云云原生

2024-05-15

857

MSE Nacos，解决敏感配置的安全隐患

本文向大家介绍，MSE Nacos 是如何解决敏感配置的安全隐患，并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

阿里云云原生

857

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

陈浩章颖强

2024-05-29

55697

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

PolarDB Serverless如何在0.5秒内实现跨机迁移？

陈浩章颖强

55,697

资源编排ROS

2024-06-04

1159

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

ChatTTS是一款针对对话场景的文本转语音模型，支持英中两种语言，训练数据超过10万小时。ChatTTS可通过WebUI和API访问。阿里云的资源编排服务(ROS)提供了一键部署ChatTTS到云端的方案，用户只需在ROS控制台配置模板参数，如区域和实例类型，即可完成部署。部署后，从资源栈输出获取ChatTTS服务地址。ROS利用IaC理念自动化部署云资源和应用，提高了部署效率和稳定性。

资源编排ROS

1,159

阿里云大数据Al技术

2024-08-09

9091

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,091

问思望宸

2024-08-12

8687

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,687

官方博客-第25页-阿里云开发者社区

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MSE Nacos，解决敏感配置的安全隐患

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

基于RAG搭建企业级知识库在线问答

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

官方博客-第25页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

DeepSeek-V3 高效训练关键技术分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MSE Nacos，解决敏感配置的安全隐患

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

ICDE’24｜中国企业首获最佳论文，详解PolarDB Serverless如何在0.5秒内实现跨机迁移

一键云部署：资源编排 ROS 轻松部署文本转语音系统 ChatTTS

基于RAG搭建企业级知识库在线问答

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关