官方博客-第10页-阿里云开发者社区

ModelScope

2024-05-15

1329

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,329

阿里云云原生

2025-02-25

1331

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,331

阿里云云原生

2025-09-24

686

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

本文所阐述的配置驱动智能 Agent 架构，其核心价值在于为 Agent 开发领域提供了一套通用的、可落地的标准化范式。

阿里云云原生

686

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43877

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,877

坤硕

2024-07-29

20299

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

基于大语言模型的应用在性能、成本、效果等方面存在一系列实际痛点，本文通过分析 LLM 应用模式以及关注点差异来阐明可观测技术挑战，近期阿里云可观测推出了面向 LLM 应用的可观测解决方案以及最佳实践，一起来了解下吧。

坤硕

20,299

恭常

2024-09-04

2633

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

2,633

濯光于怀

2025-04-07

568

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

AI 应用开发中，总有一些让人头疼的问题：敏感信息（比如 API-KEY）怎么安全存储？模型参数需要频繁调整怎么办？Prompt 模板改来改去，每次都得重启服务，太麻烦了！别急，今天我们就来聊聊如何用 Nacos 解决这些问题。

濯光于怀

568

阿里云云原生

2024-05-15

74019

通义灵码技术解析，打造 AI 原生开发新范式

本文第一部分先介绍 AIGC 对软件研发的根本性影响，从宏观上介绍当下的趋势；第二部分将介绍 Copilot 模式，第三部分是未来软件研发 Agent 产品的进展。

阿里云云原生

74,019

阿里云开发者

2024-11-29

1334

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,334

官方博客-第10页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

解锁 DeepSeek 安全接入、稳定运行新路径

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

通义灵码技术解析，打造 AI 原生开发新范式

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

官方博客-第10页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

解锁 DeepSeek 安全接入、稳定运行新路径

配置驱动的动态 Agent 架构网络：实现高效编排、动态更新与智能治理

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

LLM 应用可观测性：从 Trace 视角展开的探索与实践之旅

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

Nacos托管LangChain应用Prompts和配置，助力你的AI助手快速进化

通义灵码技术解析，打造 AI 原生开发新范式

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现