官方博客-第7页-阿里云开发者社区

右予故黎

2024-11-21

1232

“无”中生有：基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验，分享了从初识RAG的潜力到面对实际应用挑战的心路历程，以及如何通过一系列优化措施逐步解决这些挑战的过程。

右予故黎

1,232

子潍

2025-05-22

1674

本文介绍了通过MCP（Model Context Protocol）结合通义千问大模型实现跨平台、跨服务的自动化任务处理方案。使用Qwen3-235B-A22B模型，配合ComfyUI生成图像，并通过小红书等社交媒体发布内容，展示了如何打破AI云服务的数据孤岛。具体实践包括接入FileSystem、ComfyUI和第三方媒体Server，完成从本地文件读取到生成图像再到发布的全流程。方案优势在于高可扩展性和易用性，但也存在大模型智能化不足、MCP Server开发难度较大及安全风险等问题。未来需进一步提升模型能力、丰富应用场景并解决安全挑战，推动MCP在更多领域落地。

子潍

1,674

阿里云云原生

1056

警惕日志采集失败的 6 大经典雷区：从本地管理反模式到 LoongCollector 标准实践

本文探讨了日志管理中的常见反模式及其潜在问题，强调科学的日志管理策略对系统可观测性的重要性。文中分析了6种反模式：copy truncate轮转导致的日志丢失或重复、NAS/OSS存储引发的采集不一致、多进程写入造成的日志混乱、创建文件空洞释放空间的风险、频繁覆盖写带来的数据完整性问题，以及使用vim编辑日志文件导致的重复采集。针对这些问题，文章提供了最佳实践建议，如使用create模式轮转日志、本地磁盘存储、单线程追加写入等方法，以降低日志采集风险，提升系统可靠性。最后总结指出，遵循这些实践可显著提高故障排查效率和系统性能。

阿里云云原生

1,056

赵世振

2024-12-24

1568

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,568

灵杰开发者

2024-08-16

16581

RAG效果优化：高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

灵杰开发者

16,581

阿里云云原生

2025-02-25

1325

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,325

李德

2025-03-27

1353

大模型联网搜索的短板与突破之路

本文作者详细分析了当前大模型在联网搜索功能中存在的几个主要问题，并提供了具体的案例和解决方案。

李德

1,353

望宸

2025-02-20

862

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

862

阿里云大数据Al技术

2025-07-28

1742

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,742

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

“无”中生有：基于知识增强的RAG优化实践

自媒体创作场景实践｜通义千问3 + MCP=一切皆有可能

警惕日志采集失败的 6 大经典雷区：从本地管理反模式到 LoongCollector 标准实践

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

RAG效果优化：高质量文档解析详解

解锁 DeepSeek 安全接入、稳定运行新路径

大模型联网搜索的短板与突破之路

大模型推理服务全景图

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型