官方博客-第14页-阿里云开发者社区

阿里云大数据Al技术

2024-08-09

9137

基于RAG搭建企业级知识库在线问答

本文介绍如何使用搜索开发工作台快速搭建基于RAG开发链路的知识库问答应用。

阿里云大数据Al技术

9,137

钰诚

2024-08-12

572

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

572

柳遵飞

2024-11-22

1340

Spring Cloud+Nacos+KMS 动态配置最佳实践

本文讲述了 Spring Cloud 应用中结合 Nacos 实现了运行期配置动态更新的功能，以及在此基础上结合 KMS 在不改动代码的情况下对应用使用的敏感配置进行保护，解决将配置迁移到 Nacos 中可能存在的数据安全顾虑，并对其底层工作原理做了简单介绍。

柳遵飞

1,340

涯海

2025-01-17

697

链路诊断最佳实践：1 分钟定位错慢根因

本文聚焦于线上应用的风险管理，特别是针对“错”（程序运行不符合预期）和“慢”（性能低下或响应迟缓）两大类问题，提出了一个系统化的根因诊断方案。

涯海

697

亦达

2025-02-20

734

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

734

言澈

2025-02-28

1197

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,197

王晨

2025-04-03

834

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

834

闵子

2023-12-01

2891

从浏览器原理出发聊聊Chrome插件

本文从浏览器架构演进、插件运行机制、插件基本介绍和一些常见的插件实现思路几个方向聊聊Chrome插件。

闵子

2,891

欧叔

2024-05-15

1152

云端短视频批量混剪解决方案

“批量生产”、“快速裂变”和“去重”是制作营销短视频的关键，基于有限数量的基础素材大规模生成指定数量的新视频，是营销短视频创作的常见思路。本篇介绍使用智能媒体生产ICE创作营销短视频，自由设定脚本顺序模拟手动剪辑，实现自动化批量制作高质量原创视频。

欧叔

1,152

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

基于RAG搭建企业级知识库在线问答

使用 Higress 快速构建 AI 应用

Spring Cloud+Nacos+KMS 动态配置最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

从浏览器原理出发聊聊Chrome插件

云端短视频批量混剪解决方案

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于RAG搭建企业级知识库在线问答

使用 Higress 快速构建 AI 应用

Spring Cloud+Nacos+KMS 动态配置最佳实践

链路诊断最佳实践：1 分钟定位错慢根因

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

进行GPU算力管理

大模型上下文协议 MCP 带来了哪些货币化机会

从浏览器原理出发聊聊Chrome插件

云端短视频批量混剪解决方案