官方博客-第29页-阿里云开发者社区

言澈

2025-02-28

1177

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,177

阿里云云原生

2025-04-22

1333

本文介绍如何使用Serverless Devs CLI工具从零开发并一键部署MCP Server到阿里云函数计算（FC）。首先通过初始化MCP Server项目，完成本地代码编写，利用Node.js实现一个简单的Hello World工具。接着对代码进行打包，并通过Serverless Devs工具将项目部署至云端。部署完成后，提供三种客户端接入方式：官方Client、其他本地Client及在FC上部署的Client。最后可通过内置大模型的inspector测试部署效果。Serverless Devs简化了开发流程，提升了MCP Server的构建效率。

阿里云云原生

1,333

阿里云基础设施.

2025-05-01

376

ACK AI Profiling：从黑箱到透明的问题剖析

本文从一个通用的客户问题出发，描述了一个问题如何从前置排查到使用AI Profiling进行详细的排查，最后到问题定位与解决、业务执行过程的分析，从而展现一个从黑箱到透明的精细化的剖析过程。

阿里云基础设施.

376

ModelScope

2024-05-15

508

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

近日，元象发布其首个Moe大模型 XVERSE-MoE-A4.2B，采用混合专家模型架构（Mixture of Experts），激活参数4.2B，效果即可媲美13B模型。该模型全开源，无条件免费商用，支持中小企业、研究者和开发者可在元象高性能“全家桶”中按需选用，推动低成本部署。

ModelScope

508

徒钟

2024-05-15

189492

Apache RocketMQ ACL 2.0 全新升级

RocketMQ ACL 2.0 不管是在模型设计、可扩展性方面，还是安全性和性能方面都进行了全新的升级。旨在能够为用户提供精细化的访问控制，同时，简化权限的配置流程。欢迎大家尝试体验新版本，并应用在生产环境中。

徒钟

189,492

阿里云实时数仓Hologres

2024-05-15

75060

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,060

问思望宸

2024-08-12

8711

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

本文分享了作为一款全能型网关【云原生 API 网关】是如何帮助企业落地统一网关架构的。

问思望宸

8,711

赵世振

2024-08-21

1463

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

通过使用阿里云百炼平台，您可以快速构建一个多代理（Multi-Agent）架构的智能导购助手。该助手能够通过多轮互动了解顾客的具体需求，收集详细信息后，利用阿里云百炼的知识检索增强功能或已有的商品数据库进行商品搜索，为顾客推荐最合适的产品。

赵世振

1,463

阿里云云原生

2024-08-26

666

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

666

官方博客-第29页-阿里云开发者社区

类目筛选

内容类型

进行GPU算力管理

从零开始开发 MCP Server

ACK AI Profiling：从黑箱到透明的问题剖析

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Apache RocketMQ ACL 2.0 全新升级

大数据分析平台之 OLAP 架构的最佳实践

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

官方博客-第29页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

进行GPU算力管理

从零开始开发 MCP Server

ACK AI Profiling：从黑箱到透明的问题剖析

元象开源首个MoE大模型：4.2B激活参数，效果堪比13B模型，魔搭社区最佳实践来了

Apache RocketMQ ACL 2.0 全新升级

大数据分析平台之 OLAP 架构的最佳实践

统一多层网关好处多，阿里云云原生 API 网关打造全能型网关

阿里云百炼应用实践系列-10分钟构建能主动提问的智能导购

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力