官方博客-第18页-阿里云开发者社区

元泊

2024-10-10

900

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

本文主要介绍了 ARMS 用户体验监控的基本功能特性，并介绍了在几种常见场景下的最佳实践。

元泊

900

昱临

2024-11-14

1094

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,094

榆松

2025-01-14

1219

网络分析与监控：阿里云拨测方案解密

阿里云网络拨测业务提供了全球、多种协议、多种网络态势的用户网络性能和用户体验监控场景的全面可观测方案。该文章从拨测场景下，介绍了用户如何快速的构建一套全球用户视角的服务可用性大盘，为客户的业务保驾护航。

榆松

1,219

阿里云云原生

2025-01-26

1288

最近谈论 SSE 和 WebSocket 的人越来越多的原因

实时通信已经成了大模型应用的标配。

阿里云云原生

1,288

王晨

2025-04-03

852

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

852

ModelScope

2024-05-15

1185

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,185

寒空横槊娜米公仪等

2024-12-26

452

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

阿里云云消息队列 Kafka 版 Serverless 系列凭借其卓越的弹性能力，为道旅科技提供了灵活高效的数据流处理解决方案。无论是应对突发流量还是规划长期资源需求，该方案均能帮助企业实现资源动态调整和成本优化，同时保障业务的高可用性和连续性。

寒空横槊娜米公仪等

452

望宸

2025-02-20

686

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

686

亦达

2025-02-20

750

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

750

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

网络分析与监控：阿里云拨测方案解密

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型上下文协议 MCP 带来了哪些货币化机会

vLLM部署Yuan2.0：高吞吐、更便捷

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

网络分析与监控：阿里云拨测方案解密

最近谈论 SSE 和 WebSocket 的人越来越多的原因

大模型上下文协议 MCP 带来了哪些货币化机会

vLLM部署Yuan2.0：高吞吐、更便捷

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结