官方博客-第15页-阿里云开发者社区

ModelScope

2024-05-15

1898

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,005

昱临

2024-11-14

1094

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,094

易定

2024-12-06

1064

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,064

阿里云云原生

2025-04-07

711

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

711

ModelScope

2024-05-15

1185

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,185

张智超

2025-02-07

485

巧用通义灵码，提升前端研发效率

本次分享，主题是利用通义灵码提升前端研发效率。分享内容主要包括以下几部分：首先，我将从前端开发的角度介绍对通义灵码的基本认识；其次，我将展示通义灵码在日常研发中的应用案例；然后，我将通过实例说明，良好的设计能够显著提升通义灵码的效果。在第四个部分，我将介绍通义灵码的企业知识库以及如何利用 RAG 构建团队智能研发助手。最后，我将总结本次分享并展望未来方向。

张智超

485

亦达

2025-02-20

750

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

750

ModelScope

2025-06-16

570

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

570

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

Multi-Agent实践第7期：智能体的高效协作

RAG效果优化：高质量文档解析详解

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

【实战干货】AI大模型工程应用于车联网场景的实战总结

极氪汽车云原生架构落地实践

vLLM部署Yuan2.0：高吞吐、更便捷

巧用通义灵码，提升前端研发效率

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

Multi-Agent实践第7期：智能体的高效协作

RAG效果优化：高质量文档解析详解

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

【实战干货】AI大模型工程应用于车联网场景的实战总结

极氪汽车云原生架构落地实践

vLLM部署Yuan2.0：高吞吐、更便捷

巧用通义灵码，提升前端研发效率

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结