官方博客-第24页-阿里云开发者社区

阿里云云原生

2024-11-01

953

Serverless GPU：助力 AI 推理加速

近年来，AI 技术发展迅猛，企业纷纷寻求将 AI 能力转化为商业价值，然而，在部署 AI 模型推理服务时，却遭遇成本高昂、弹性不足及运维复杂等挑战。本文将探讨云原生 Serverless GPU 如何从根本上解决这些问题，以实现 AI 技术的高效落地。

阿里云云原生

953

柳遵飞

2024-12-11

931

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

931

新念

2025-02-14

1391

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,391

濯光翼严

2025-04-15

524

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

无论是使用 Nacos-Controller 实现配置的双向同步，还是直接在应用中接入 Nacos SDK 以获得更高级的配置管理特性，都能显著提升配置管理的灵活性、安全性和可维护性。使用 Nacos，您能够更好地管理和优化您的应用配置，从而提高系统的稳定性和可靠性。

濯光翼严

524

阿里云云原生

2025-05-23

528

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

528

阿里云云原生

2025-06-30

404

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

404

阿里云云原生

2024-05-15

857

MSE Nacos，解决敏感配置的安全隐患

本文向大家介绍，MSE Nacos 是如何解决敏感配置的安全隐患，并提供使用 MSE Nacos 加解密敏感配置的最佳实践。

阿里云云原生

857

德灵

2024-05-15

118027

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,027

ModelScope

2024-05-15

480

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

480

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

SpringCloud 应用 Nacos 配置中心注解

DeepSeek-V3 高效训练关键技术分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Serverless GPU：助力 AI 推理加速

SpringCloud 应用 Nacos 配置中心注解

DeepSeek-V3 高效训练关键技术分析

Nacos-Controller 2.0：使用 Nacos 高效管理你的 K8s 配置

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

MSE Nacos，解决敏感配置的安全隐患

阿里云PAI大模型RAG对话系统最佳实践

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了