官方博客-第10页-阿里云开发者社区

ModelScope

2024-05-15

1321

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,321

阿里云中间件

2024-07-23

15825

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,825

阿里云网络

2025-01-16

1098

NSDI'24 | 阿里云飞天洛神云网络论文解读——《Poseidon》揭秘新型超高性能云网络控制器

NSDI‘24于4月16-18日在美国加州圣塔克拉拉市举办，汇聚全球网络系统领域的专家。阿里云飞天洛神云网络的两篇论文入选，标志着其创新能力获广泛认可。其中，《Poseidon: A Consolidated Virtual Network Controller that Manages Millions of Tenants via Config Tree》介绍了波塞冬平台，该平台通过统一控制器架构、高性能配置计算引擎等技术，实现了对超大规模租户和设备的高效管理，显著提升了云网络性能与弹性。实验结果显示，波塞冬在启用EIP时的完成时间比Top 5厂商分别快1.8至55倍和2.6至4.8倍。

阿里云网络

1,098

探索云世界

2025-11-17

246

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

246

阿里云云原生

2024-09-06

1675

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

单点登录（SSO）可解决用户在多系统间频繁登录的问题，OIDC 因其标准化、简单易用及安全性等优势成为实现 SSO 的优选方案，本文通过具体步骤示例对 Higress 中开源的 OIDC Wasm 插件进行了介绍，帮助用户零代码实现 SSO 单点登录。

阿里云云原生

1,675

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43869

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,869

恭常

2024-09-04

2618

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,618

阿里云开发者

2024-11-29

1329

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,329

阿里云大数据Al技术

2025-07-18

1071

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

1,071

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

NSDI'24 | 阿里云飞天洛神云网络论文解读——《Poseidon》揭秘新型超高性能云网络控制器

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

NSDI'24 | 阿里云飞天洛神云网络论文解读——《Poseidon》揭秘新型超高性能云网络控制器

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO