2024-11-21
223

剖析大模型连“Strawberry”的“r”都数不对的原因

本文将从两个常见的大模型翻车问题入手解析这些问题背后体现的大模型技术原理,并解释了为什么会导致这些问题,接着我们利用CoT(思维链)方法解决这些问题并基于上述原理试图剖析CoT方法起作用的可能原因,最后提出【理由先行】风格这一简单有效的Prompt Trick。

223
2024-11-21
82

构建理想容器镜像——以CSI为例

本文围绕阿里云CSI(Container Storage Interface)镜像构建的实际案例,探讨了一系列优化容器镜像的最佳实践。

82
2024-11-21
320

“无”中生有:基于知识增强的RAG优化实践

本文作者基于自身在RAG技术领域长达半年的实践经验,分享了从初识RAG的潜力到面对实际应用挑战的心路历程,以及如何通过一系列优化措施逐步解决这些挑战的过程。

2024-11-15
95

【提效】docker镜像构建优化-提速10倍

本文主要记录了自己通过查阅相关资料,一步步排查问题,最后通过优化Docerfile文件将docker镜像构建从十几分钟降低到1分钟左右,效率提高了10倍左右。

95
2024-11-15
116

AI经营|多Agent择优生成商品标题

商品标题中关键词的好坏是商品能否被主搜检索到的关键因素,使用大模型自动优化标题成为【AI经营】中的核心能力之一,本文讲述大模型如何帮助商家优化商品素材,提升商品竞争力。

116
2024-11-15
628

通义千问Qwen2.5-Coder 全系列来咯!强大、多样、实用

千问团队开源了强大的 Qwen2.5-Coder 系列模型,涵盖 0.5B 到 32B 六种尺寸,旨在推动开放代码模型的发展。该系列模型在代码生成、修复和推理等方面表现出色,支持多种编程语言,并在多个基准测试中达到 SOTA 水平。此外,Qwen2.5-Coder 还提供了丰富的应用场景,如代码助手、Artifacts 和 Interpreter,满足不同开发者的需求。

2024-11-14
159

万字干货|复杂表格多Agent方案:从LLM洞察、系统性 思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点,结合大模型的哲学三问(“是谁、从哪里来、到哪里去”),穿插阐述自己对大模型的一些理解与判断,以及面向公共云LLM的建设模式思考,并分享软件设计+模型算法结合的一些研发实践经验。

159
2024-11-14
58

通义灵码 SWE-GPT:从 静态代码建模 迈向 软件开发过程长链推理

在本文中,作者介绍了 Lingma SWE-GPT,一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

137

云+AI时代下,Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新,打造全方位安全可信的服务器操作系统。

1
2
3
4
...
16
到第
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2/16