官方博客-第10页-阿里云开发者社区

ModelScope

2024-05-15

1321

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,321

阿里云中间件

2024-07-23

15825

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

大语言模型的革命性突破使智能编程成为了可能，通义灵码正是基于通义大模型打造的 AI 编程助手，通过 IDE 插件的形式提供代码补全、单元测试生成等功能，能达到毫秒级的响应速度。目前，通义灵码已在阿里云内部及多家企业中应用，阿里云也在探索多智能体产品，即 AI 程序员，助力数字世界的蓬勃发展，颠覆 IT 生产力。

阿里云中间件

15,825

探索云世界

2025-11-17

246

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

本系列文章将围绕东南亚头部科技集团的真实迁移历程展开，逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇，MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破。注：客户背景为东南亚头部科技集团，文中用 GoTerra 表示。

探索云世界

246

阿里云云原生

2024-09-06

1675

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

单点登录（SSO）可解决用户在多系统间频繁登录的问题，OIDC 因其标准化、简单易用及安全性等优势成为实现 SSO 的优选方案，本文通过具体步骤示例对 Higress 中开源的 OIDC Wasm 插件进行了介绍，帮助用户零代码实现 SSO 单点登录。

阿里云云原生

1,675

不琢

2025-11-13

230

重构一个类，JVM竟省下2.9G内存？

通过重构核心类，将 `HashMap<Long, HashSet<String>>` 优化为 `Long2ObjectOpenHashMap<int[]>`，结合数据分布特征与紧凑存储，JVM 堆内存从 3.13GB 降至 211MB，降幅达 94%，验证了高效数据结构在海量场景下的巨大价值。

不琢

230

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43869

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,869

恭常

2024-09-04

2618

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,618

阿里云开发者

2024-11-29

1329

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,329

阿里云云原生

2024-05-15

93837

当 OpenTelemetry 遇上阿里云 Prometheus

本文以构建系统可观测为切入点，对比 OpenTelemetry 与 Prometheus 的相同与差异，重点介绍如何将应用的 OpenTelemetry 指标接入 Prometheus 及背后原理以及介绍阿里云可观测监控 Prometheus 版拥抱 OpenTelemetry及相关落地实践案例。

阿里云云原生

93,837

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

重构一个类，JVM竟省下2.9G内存？

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

当 OpenTelemetry 遇上阿里云 Prometheus

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

一文梳理我们是如何打造出国内领先的 AI 编程助手「通义灵码」

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

API 网关 OpenID Connect 实战：单点登录（SSO）如此简单

重构一个类，JVM竟省下2.9G内存？

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

当 OpenTelemetry 遇上阿里云 Prometheus