官方博客-第9页-阿里云开发者社区

ModelScope

2024-05-15

1321

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,321

探索云世界

2025-11-17

245

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

245

恭常

2024-09-04

2618

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,618

旭煦

2024-11-06

3951

再也不用心惊胆战地使用FastJSON了——序列化篇

本篇将主要介绍json序列化的详细流程。本文阅读的FastJSON源码版本为2.0.31。

旭煦

3,951

阿里云开发者

2024-11-29

1329

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,329

德灵

2024-05-15

118206

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

118,206

阿里云云原生

2024-05-15

74009

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,009

阿里云云原生

2025-05-15

1078

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

本文介绍了将社区主流STDIO MCP Server一键转为企业内可插拔Remote MCP Server的方法，以及存量API智能化重生的解决方案。通过FunctionAI平台模板实现STDIO MCP Server到SSE MCP Server的快速部署，并可通过“npx”或“uvx”命令调试。同时，文章还探讨了如何将OpenAPI规范数据转化为MCP Server实例，支持API Key、HTTP Basic和OAuth 2.0三种鉴权配置。该方案联合阿里云百练、魔搭社区等平台，提供低成本、高效率的企业级MCP Server服务化路径，助力AI应用生态繁荣。

阿里云云原生

1,078

阿里云云原生

2025-06-03

1269

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,269

官方博客-第9页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

再也不用心惊胆战地使用FastJSON了——序列化篇

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阿里云PAI大模型RAG对话系统最佳实践

通义灵码技术解析，打造 AI 原生开发新范式

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

实现企业级 MCP 服务统一管理和智能检索的实践

官方博客-第9页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

再也不用心惊胆战地使用FastJSON了——序列化篇

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阿里云PAI大模型RAG对话系统最佳实践

通义灵码技术解析，打造 AI 原生开发新范式

MCP Server On FC之旅2: 从0到1-MCP Server市场构建与存量OpenAPI转MCP Server

实现企业级 MCP 服务统一管理和智能检索的实践