官方博客-第18页-阿里云开发者社区

何亮阿里云云原生

2025-01-24

805

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

Apache Dubbo 3.3.3（即将发布）实现了与 OpenAPI 的深度集成，通过与 OpenAPI 的深度集成，用户能够体验到从文档生成到接口调试、测试和优化的全流程自动化支持。不论是减少手动工作量、提升开发效率，还是支持多语言和多环境，Dubbo 3.3.3 都展现了其对开发者体验的极大关注。结合强大的 Mock 数据生成和自动化测试能力，这一版本为开发者提供了极具竞争力的服务治理解决方案。如果你正在寻找高效、易用的微服务框架，Dubbo 3.3.3 将是你不容错过的选择。

何亮阿里云云原生

805

望宸

2025-02-20

664

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

664

闵子

2023-12-01

2888

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,888

德灵

2024-05-15

118067

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,067

ModelScope

2024-05-15

110016

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

Arm 架构的服务器通常具备低功耗的特性，能带来更优异的能效比。相比于传统的 x86 架构服务器，Arm 服务器在相同功耗下能够提供更高的性能。这对于大模型推理任务来说尤为重要，因为大模型通常需要大量的计算资源，而能效比高的 Arm 架构服务器可以提供更好的性能和效率。

ModelScope

110,016

ModelScope

2024-05-15

104704

手把手教你捏一个自己的Agent

Modelscope AgentFabric是一个基于ModelScope-Agent的交互式智能体应用，用于方便地创建针对各种现实应用量身定制智能体，目前已经在生产级别落地。

ModelScope

104,704

自扬

2024-08-16

8761

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

本文从“空间”这一维度，聊一聊PolarDB-X在跨空间部署能力上的不断发展和延伸，以及在不同空间范围下的高可用和容灾能力，并着重介绍一下最新的产品能力——GDN(Global Database Network)。

自扬

8,761

阿里云云原生

2024-09-23

1132

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

近日，阿里云可观测产品家族正式发布云监控 2.0，隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。

阿里云云原生

1,132

亦达

2025-02-20

725

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

725

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

大模型推理服务全景图

从浏览器原理出发聊聊Chrome插件

阿里云PAI大模型RAG对话系统最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

使用 Apifox、Postman 测试 Dubbo 服务，Apache Dubbo OpenAPI 即将发布

大模型推理服务全景图

从浏览器原理出发聊聊Chrome插件

阿里云PAI大模型RAG对话系统最佳实践

FunASR 语音大模型在 Arm Neoverse 平台上的优化实践

手把手教你捏一个自己的Agent

让X不断延伸, 从跨AZ到跨Region再到跨Cloud

重磅！阿里云可观测产品家族全新升级，AI +数据双驱动，打造全栈可观测体系

破解 vLLM + DeepSeek 规模化部署的“不可能三角”