官方博客-第12页-阿里云开发者社区

子白

2024-05-15

102457

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,457

阿里云云原生

2024-05-16

57067

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

本文介绍了 Kubernetes 中的容器工作内存（WorkingSet）概念，它用于表示容器内存的实时使用量，尤其是活跃内存。

阿里云云原生

57,067

阿里云云原生

2024-09-25

786

新场景、新能力，AI-native 时代的可观测革新

借助 AI-native 可观测解决方案，阿里云为用户提供开箱即用的覆盖大模型应用、大模型到基础设施的全链路实时观测、告警与诊断能力，帮助企业在复杂的数字化转型过程中更有效地确保资源的高效利用与业务的持续成功。

阿里云云原生

786

昱临

2024-11-14

1057

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,057

柳遵飞

2024-12-11

970

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

970

阿里云云原生

2025-01-26

1262

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,262

阿里云云原生

2025-05-15

896

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

896

宗衡

2025-07-10

732

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

本文记录了一次从灵光一现到快速落地的 AI + 地图服务实践，通过结合 Cursor 与高德 MCP 地图服务平台，作者仅用几个小时就实现了一个可交互、可筛选、可推荐的杭州美食地图应用。

宗衡

732

ModelScope

2024-05-15

1398

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

本期文章，我们会介绍一下AgentScope的一个设计哲学（Agent-oriented programming）

ModelScope

1,398

官方博客-第12页-阿里云开发者社区

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

新场景、新能力，AI-native 时代的可观测革新

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

SpringCloud 应用 Nacos 配置中心注解

最近谈论 SSE 和 WebSocket 的人越来越多的原因

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

官方博客-第12页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大语言模型推理提速，TensorRT-LLM 高性能推理实践

容器内存可观测性新视角：WorkingSet 与 PageCache 监控

新场景、新能力，AI-native 时代的可观测革新

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

SpringCloud 应用 Nacos 配置中心注解

最近谈论 SSE 和 WebSocket 的人越来越多的原因

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

用 AI + 高德地图 MCP，3 小时做出杭州美食地图

Multi-Agent实践第6期：面向智能体编程：狼人杀在AgentScope

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结