官方博客-第22页-阿里云开发者社区

资源编排ROS

2024-06-24

398

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

基于 IaC 的理念，通过定义一个模板，使用 ROS 提供的 Terraform 托管服务进行自动化部署，可以非常高效快捷地部署任意云资源和应用（比如 ChatTTS 服务）。相比于手动部署或者通过 API、SDK 的部署方式，有着高效、稳定等诸多优势，也是服务上云的最佳实践。

资源编排ROS

398

阿里云云原生

2024-07-30

3552

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

3,552

阿里云云原生

2024-08-12

459

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

459

阿里云云原生

2024-09-23

1082

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

近日，阿里云可观测产品家族正式发布云监控 2.0，隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。

阿里云云原生

1,082

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

柳遵飞

2024-12-11

931

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

931

新念

2025-02-14

1391

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,391

阿里云云原生

2025-05-23

528

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

528

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

5 大场景上手通义灵码企业知识库问答

5 大场景上手通义灵码企业知识库 RAG

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

Serverless GPU：助力 AI 推理加速

SpringCloud 应用 Nacos 配置中心注解

DeepSeek-V3 高效训练关键技术分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 ROS 的 Terraform 托管服务轻松部署文本转语音系统 ChatTTS

5 大场景上手通义灵码企业知识库问答

5 大场景上手通义灵码企业知识库 RAG

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

Serverless GPU：助力 AI 推理加速

SpringCloud 应用 Nacos 配置中心注解

DeepSeek-V3 高效训练关键技术分析

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践