官方博客-第10页-阿里云开发者社区

ModelScope

2024-05-15

1330

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,330

耘越

2024-10-29

1638

AI 辅助编程的效果衡量

本文主要介绍了如何度量研发效能，以及 AI 辅助编程是如何影响效能的，进而阐述如何衡量 AI 辅助编程带来的收益。

耘越

1,638

右予故黎

2024-11-21

1238

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,238

阿里云云原生

2025-02-25

1332

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,332

濯光于怀

2025-04-07

571

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

571

阿里云大数据Al技术

2025-07-28

1751

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,751

阿里云云原生

2025-09-24

687

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

本文所阐述的配置驱动智能 Agent 架构，其核心价值在于为 Agent 开发领域提供了一套通用的、可落地的标准化范式。

阿里云云原生

687

柳遵飞

2024-12-11

1160

在 Spring Cloud 应用中可以非常低成本地集成 Nacos 实现配置动态刷新，在应用程序代码中通过 Spring 官方的注解 @Value 和 @ConfigurationProperties，引用 Spring enviroment 上下文中的属性值，这种用法的最大优点是无代码层面侵入性，但也存在诸多限制，为了解决问题，提升应用接入 Nacos 配置中心的易用性，Spring Cloud Alibaba 发布一套全新的 Nacos 配置中心的注解。

柳遵飞

1,160

董元吴

328

为什么说多模态是推荐系统破局的关键？来自饿了么一线的实战复盘

推荐系统作为互联网时代连接用户与信息的核心技术，正在经历从传统协同过滤向多模态智能推荐的重要变革。随着深度学习技术的快速发展，特别是大语言模型和多模态预训练技术的成熟，推荐系统开始从单纯依赖用户行为ID特征转向充分利用商品图像、文本描述等丰富内容信息的新范式。

董元吴

328

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

AI 辅助编程的效果衡量

“无”中生有：基于知识增强的RAG优化实践

解锁 DeepSeek 安全接入、稳定运行新路径

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

SpringCloud 应用 Nacos 配置中心注解

为什么说多模态是推荐系统破局的关键？来自饿了么一线的实战复盘

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

AI 辅助编程的效果衡量

“无”中生有：基于知识增强的RAG优化实践

解锁 DeepSeek 安全接入、稳定运行新路径

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

SpringCloud 应用 Nacos 配置中心注解

为什么说多模态是推荐系统破局的关键？来自饿了么一线的实战复盘