千问大模型-热门文章-第5页-阿里云开发者社区

AI观察社

|

2月前

|

人工智能自动驾驶前端开发

|

博文

中国 AI 产业媒体与内容生态图谱：刷新 AI 认知应该关注谁？（订阅推荐）

每天打开手机，AI 新闻能刷出几百条。大模型发布、融资消息、开源项目、政策文件、大厂动态，信息量已经远远超出任何个人的处理能力。

611 0 0

小陈写代码

|

4月前

|

人工智能自然语言处理数据挖掘

|

博文

阿里云Tokens是如何收费的？收费标准与万亿Tokens扶持和7000万 Tokens 免费体验活动介绍

阿里云Tokens是AI应用的核心计量单位，用于大模型处理、API授权等场景。文章详细阐述了Tokens的定义、计费逻辑与优惠活动：计费上，不同模型（如Qwen-Turbo、Qwen-Max）有不同阶梯计费标准，且输入输出分开计费；优惠活动方面，企业新客可参与“万亿Tokens扶持计划”，至高得2000元返现，还有“7000万Tokens免费体验”活动。企业合理利用可降低AI应用成本，加速商业化落地。

3318 18 18

游客lvprkowyks6j6

|

4月前

|

人工智能机器人 API

|

博文

2026年OpenClaw（养龙虾）+ 钉钉对接：保姆级全链路操作指南

本指南详解2026年OpenClaw（AI智能体）与钉钉深度对接的全链路实践：从环境搭建、钉钉应用配置、OpenClaw本地部署，到中间件开发与内网穿透，实现“钉钉发令—龙虾执行—自动回传”的24小时数字员工闭环。安全、可控、零数据出域。

5295 11 17

huizhudev

|

8月前

|

人工智能自然语言处理开发者

|

博文

周报不是流水账，这个AI指令帮你写出让老板点赞的工作汇报

一个帮助技术人快速生成专业工作周报的AI指令，通过结构化输入和价值导向表达，让你的周报从流水账变成让老板点赞的高质量汇报，15分钟搞定原本需要1小时的周报撰写。

1962 80 81

聚客AI

|

10月前

|

XML 存储算法

|

博文

5大实战技巧：优化RAG召回质量，避免“召回不足”灾难！

本文分享了团队在金融风控系统开发中优化RAG系统的实战经验，涵盖文档处理、召回策略与生成优化三大环节，解决召回不准、数据噪声等问题，助力构建高效精准的RAG系统。

2125 1 1

聚客AI

|

11月前

|

人工智能数据可视化开发者

|

博文

深度解析基于LangGraph的Agent系统架构设计与工程实践

LangGraph作为Agent 生态中非常热门的框架，今天我将借助 LangGraph，更高效、更优雅的方式构建复杂智能体系统。

2670 2 2

bailiantest1

|

人工智能 Cloud Native 数据可视化

|

博文

微医控股与阿里云达成战略合作，双方将携手基于通义千问大模型联合打造医疗全场景智能体，共同构建医疗垂类大模型

2025年6月17日，微医控股与阿里云达成战略合作，共建医疗AI基座及医疗全场景智能体。双方将基于通义千问大模型打造医疗垂类大模型，升级微医“5+1”智能体，并在诊断、用药、健康管理等环节深化应用。微医将结合阿里云技术优势推进IDC上云，助力AI+医疗基础设施建设，共同制定行业标准并推广城市级AI数字健共体。目前，微医AI服务已连接全国1.2万家医院和30万名医生，健康管理会员超100万。

2469 2 3

Kane

|

博文

Cursor + qwen2.5-coder 32b 的配置方式

安装Cursor后，进入设置修改OpenAI基础URL为阿里云的DashScope接口，并添加Qwen2.5-Coder 32B模型。需先访问阿里云百灵控制台申请免费Key。配置完成后，即可使用该模型进行开发和测试。

12429 2 5

bruce_xiaowei

|

传感器机器学习/深度学习弹性计算

|

博文

Agent与大模型的区别

本文详细对比了人工智能领域的两个重要概念——Agent和大模型。大模型如GPT-3、BERT等，擅长自然语言处理任务，如文本生成、翻译等；Agent则是自主的软件实体，能够在特定环境中感知、决策并执行任务，如管理日程、控制智能家居等。文章介绍了它们的定义、功能、技术架构及应用场景，并总结了两者的核心差异和未来发展方向。

14945 26 28

小强聊it

|

博文

通义大模型使用指南之通义听悟

本文介绍了阿里云通义平台的注册和使用，主要包括两个部分：注册和功能介绍。用户可以通过访问网址 <https://tongyi.aliyun.com/> 进行注册。在功能介绍中，重点讲解了通义听悟的功能，它提供实时语音转文字、音视频文件转文字、智能总结和中英互译服务。用户可以体验实时录音并标记重点、问题和代办事项，方便会议记录和整理。此外，通义听悟还支持上传音视频文件转写和播客链接转写，以及浏览器插件用于处理网页、手机和微信上的语音内容。

4025 0 0

AI未闻花名

|

2天前

|

算法安全测试技术

|

博文

大模型服务熔断限流计费联动：异常流量风控拦截与超限自动降配架构实践.165

本文系统阐述大模型服务的熔断、限流、计费联动与自动降配四大核心机制：熔断通过状态机隔离故障防雪崩；限流基于令牌桶等算法多维管控流量；计费联动实现风控/熔断/限流结果与计费精准挂钩；超限自动降配动态优化算力资源。四者协同保障服务稳定、成本可控、商业合规。

35 2 2

AI未闻花名

|

16天前

|

存储机器学习/深度学习自然语言处理

|

博文

大模型参数反向拆解：解锁模型能力与参数的底层关联，实现精准按需调参.151

大模型参数反向拆解是突破黑盒调优的新范式：以能力为目标，逆向定位、解析并调控对应参数簇，建立“能力↔参数”精准映射。它告别试错微调，实现轻量化、高精度、可解释的按需定制，显著降本增效，推动大模型从通用走向垂直落地。

163 1 1

OpenClaw

|

1月前

|

人工智能运维自然语言处理

|

博文

深度了解千问Qwen3.7-Max 阿里云百炼旗舰模型能力特点与计费订阅方案参考

在国内大模型产业高速发展的当下，通用大模型逐步从基础对话服务，走向复杂推理、工程编码、长文本处理、多领域专业分析等高阶应用场景。阿里云百炼作为国内主流大模型服务平台，持续迭代通义千问系列模型，**Qwen3.7-Max** 作为当前定位旗舰级的主力版本，凭借顶尖的综合能力、全面的场景适配、稳定的服务表现，成为企业研发、个人开发者、内容创作、智能体搭建等场景的首选模型之一。

996 5 5

AI未闻花名

|

4月前

|

机器学习/深度学习自然语言处理并行计算

|

博文

大模型应用：Mistral-7B-Instruct 中文超长文本处理实战全解析.59

本文介绍基于Mistral-7B-Instruct-v0.3的中文超长文本处理方案：通过4/8位量化（显存低至5GB）、原生滑动窗口（4096窗口+32768上下文）、左填充分词器及中英混合Prompt，实现2万字中文本地高效推理，兼顾性能、质量与私有化部署需求。

602 27 27

小小小赵02

|

6月前

|

存储消息中间件人工智能

|

博文

【架构模式】解构多智能体协作：AI Agent “指挥官”与“调度官”的双层治理实践

本文提出“指挥官-调度官”双层架构，解决多智能体系统中的意图漂移、死循环与资源竞争问题。通过职能分离，实现高并发、高可用的复杂任务协同。

957 3 3

huizhudev

|

9月前

|

人工智能搜索推荐程序员

|

博文

从程序员到UP主：一个结构化的B站视频文案生成方案

专为技术人打造的B站视频文案生成指令，结构化拆解内容创作流程。输入主题、类型等信息，结合AI一键生成含分镜脚本、标题、SEO及互动设计的完整方案，提升创作效率与视频质量。

1579 2 2

阿里云新鲜事

|

JSON 缓存并行计算

|

博文

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

阿里巴巴近期开源了通义千问Qwen3大语言模型（LLM），包含两款混合专家模型（MoE）235B-A22B与30B-A3B，以及六款稠密模型（Dense）从0.6B到32B不等。开发者可基于NVIDIA GPU使用TensorRT-LLM、Ollama、SGLang、vLLM等框架高效部署Qwen3系列模型，实现快速词元生成和生产级应用开发。

2994 8 9

小强聊it

|

自然语言处理搜索推荐

|

博文

通义大模型使用指南之通义万相

该文介绍了如何在阿里云的通义大模型平台注册账号，并详细展示了通义万相功能的使用，包括文本生成图像、相似图像生成、图像风格迁移和应用广场（虚拟模特）四个部分。用户可以通过输入文字或选择图片，生成不同风格的创意作品，并能进行点赞、不满意、生成相似图、下载原图和收藏等操作。在应用广场中，用户可以上传图片并替换模特及背景，创建个性化商品展示图。

7759 0 1

小林学AI

|

27天前

|

人工智能安全 IDE

|

博文

智能体总是不听话？90% 的人没用对 Hermes 的「上下文」——这才是正确的打开方式

一文掌握 Hermes Agent 上下文系统：Context Files 定义全局人格与项目规范，Context References 动态注入代码与 Git 变更，@语法实时加载，让 AI 智能体彻底听话。

258 1 1

小伟(tiger)

|

3月前

|

消息中间件运维安全

|

博文

非得显卡？小模型跑在CPU上也照样快

Aether项目聚焦边缘/无GPU/私有化场景，用≤9B小模型构建高可用智能运维Agent：融合RAG知识库、分级意图路由、SOP式Skill编排与LoRA微调，兼顾数据安全、低资源消耗与强领域专业性。（238字）

629 2 2

AI未闻花名

|

4月前

|

机器学习/深度学习缓存监控

|

博文

大模型应用：矩阵乘加（GEMM）全解析：大模型算力消耗的逻辑与优化.68

GEMM（矩阵乘加）是大模型算力核心，占Transformer计算量90%以上。本文系统解析其数学原理、高维适配、算力测算公式，并详解INT8/INT4量化、矩阵分块、硬件加速与批处理四大优化策略，结合代码示例与性能监控方法，助力高效推理落地。

823 17 18

AI未闻花名

|

4月前

|

存储自然语言处理并行计算

|

博文

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

本文深入解析大模型INT4与INT8量化技术：从“缩放+映射”本质出发，对比二者在压缩率（75% vs 87.5%）、精度（256 vs 16离散值）、显存占用及适用场景的差异；详解scale/zero_point参数原理，并提供BitsAndBytes实战代码，助力高效本地部署。

1454 6 6

蚝油菜花

|

机器学习/深度学习人工智能编解码

|

博文

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型，基于DiT架构和高效视频压缩VAE，能够根据首尾帧图像自动生成5秒720p高清视频，支持多种风格变换和细节复刻。

3290 9 10

Hddata

|

11天前

|

机器学习/深度学习编解码算法

|

博文

告别端到端依赖：合肥高维数据"中间过程监督"技术让水印提取更灵活、更收敛

合肥高维数据与中科大联合研发的专利技术（ZL202410513952.7），创新提出“中间过程监督”范式：将水印提取拆解为“恢复水印特征图+恢复水印信息”两步，采用三段式网络结构，通过残差计算、多尺度降采样与渐进式重建，显著提升模型收敛性与鲁棒性。（239字）

89 2 2

小林学AI

|

26天前

|

存储人工智能自然语言处理

|

博文

以前写重复提示词花 10 分钟，现在用 Hermes 技能一条命令搞定，效率提升 300%

本文全面介绍 Hermes Agent 技能（Skills）系统，从核心概念、格式规范、安装管理到自定义开发，带你掌握可复用工作流与知识单元的使用方法，让 AI 智能体自动执行复杂任务。

269 0 0

老赵聊算法备案、大模型备案

|

人工智能算法搜索推荐

|

博文

算法备案全流程攻略：保姆级教程

在AI热潮下，算法成为互联网服务的核心驱动力，但也带来了大数据杀熟、算法歧视等问题。为规范行业发展，算法备案制度应运而生。该制度涵盖网站、APP等多种产品形式，要求企业在2个月内完成备案，依据《互联网信息服务算法推荐管理规定》等法规。未备案企业可能面临无法上线、罚款甚至刑罚的后果。备案流程包括注册、主体备案、信息填报及审核，确保算法合规运营。通过悬挂备案号、标识AI生成内容和定期自查，企业需持续维护算法安全与合规。

2446 14 15

不要葱姜蒜

|

搜索推荐物联网 PyTorch

|

博文

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

14584 34 44

罗长才

|

8天前

|

网络协议算法数据处理

|

博文

专访GEO落地工程师罗长才：当静止轨道成为技术融合的枢纽

本期专访GEO落地工程师罗长才，解析地球静止轨道卫星如何作为“太空骨干网节点”，与光纤相干通信、波束赋形、IPv6、星间链路、时间敏感网络等六项关键技术深度协同，构建高效、灵活、确定性的空间信息网络枢纽。（239字）

66 3 3

云计算学习者

|

1月前

|

人工智能缓存自然语言处理

|

博文

阿里云Qwen3.7-Max的模型能力、模型表现、适用场景，最新5折起等优惠活动介绍

Qwen3.7-Max是阿里云面向智能体时代的旗舰大模型，在推理、代码生成、多语言理解及长周期自主执行等方面全面升级，已接入百炼平台和MaxCompute等产品，适用于企业办公、电商营销、创意媒体、数据分析等多元场景。当前阿里云推出多重优惠：推理服务后付费限时5折，Token Plan团队版Credits消耗减半等活动，大幅降低用户AI应用落地门槛。

556 1 1

阿里云

|

8月前

|

人工智能弹性计算自然语言处理

|

博文

史上首次！万卡AI集群支撑双11，通义千问大规模落地

2025年双11，阿里云提供超千万核ECS算力及万卡灵骏智算集群，支撑淘宝推荐等核心业务性能提升超30%。通义千问大模型大规模落地，Qwen-MT单日调用超14亿次，助力商品出海、客服与经营分析，全面赋能双11智能化升级。

1193 0 0

huizhudev

|

8月前

|

人工智能自然语言处理安全

|

博文

直播带货效率提升300%：这个AI指令让技术人也能写出专业话术

技术人写直播话术太难？逻辑思维 vs 情感营销冲突大，学得慢、改得累。本文分享一套结构化AI指令，将专业带货方法论转化为可执行模板，支持多品类定制，30分钟生成高转化话术，助力开发者高效应对朋友求助或产品推广，轻松玩转直播文案。

1957 5 5

dt_7992973394!

|

9月前

|

数据采集文字识别算法

|

博文

精通RAG：从“能用”到“好用”的进阶优化与评估之道

你的RAG应用是否总是答非所问，或者检索到的内容质量不高？本文聚焦于RAG系统的进阶优化，深入探讨从查询转换、多路召回与重排序（Rerank）等高级检索策略，到知识库构建的最佳实践。更重要的是，我们将引入强大的`Ragas`评估框架，教你如何用数据驱动的方式，科学地量化和提升你的RAG系统性能。

1065 7 7

聚客AI

|

11月前

|

数据可视化物联网开发者

|

博文

深度解析四大LLM微调工具：从单卡到千亿级训练的四大解决方案

本文详解大语言模型微调四大工具——Unsloth、Axolotl、LlamaFactory、DeepSpeed，覆盖从单卡实验到万亿参数分布式训练场景，助你掌握主流框架选型策略，提升微调效率。建议点赞收藏。

3537 1 1

老赵聊算法备案、大模型备案

|

人工智能自然语言处理算法

|

博文

AI企业必看：最新结果标识合规要求及规范

随着《人工智能生成合成内容标识办法》及配套标准的发布，AI企业需快速掌握政策要求以确保合规运营。该办法明确指出，利用AI生成的内容（如文本、图片、音频、视频等）需通过显性标识（如“AI生成”字样）或隐性标识（如元数据、数字水印）进行标注。内容传播平台也需核验标识并提醒用户内容性质。此外，应用程序分发平台在审核时需确认是否提供AI生成服务及相关标识材料。对于AI企业而言，合规已成为必修课，需重点关注标识的规范性和溯源能力，以应对即将到来的监管要求。

2774 1 1

LucianaiB

|

人工智能自然语言处理 Cloud Native

|

博文

🚀Bolt.diy：五分钟免费搭建个人博客，开启你的数字创作之旅！（保姆级教程）

Bolt.diy 是 Bolt.new 的一个开源版本，它提供了更高的灵活性和可定制性。通过自然语言交互，它能够简化开发流程，并提供全栈开发支持，同时允许用户进行二次开发。它就像是你的数字创作伙伴，帮你把想法变成现实。在数字化时代，拥有一个个人博客不仅是一种展示自我的方式，更是一种记录生活、分享知识、连接世界的桥梁。通过阿里云的 Bolt.diy，我仅用五分钟就搭建了一个功能齐全、美观大方的个人博客，这让我深刻感受到了技术的力量和便捷性。

1123 29 32

路人与大师

|

人工智能自然语言处理物联网

|

博文

llama factory 从数据集起步跑通 qwen系列开源生成式大模型微调

`dataset_info.json` 文件用于管理 llama factory 中的所有数据集，支持 `alpaca` 和 `sharegpt` 格式。通过配置此文件，可以轻松添加自定义数据集。数据集的相关参数包括数据源地址、数据集格式、样本数量等，支持 Hugging Face 和 ModelScope 两个平台的数据集仓库。针对不同格式的数据集，提供了详细的配置示例，如 `alpaca` 格式的指令监督微调数据集、偏好数据集等，以及 `sharegpt` 格式的多模态数据集等。今天我们通过自定义数据集的方式来进行qwen2.5_14B_instruct模型进行微调

8738 7 9

疯狂的猿

|

Java Maven

|

博文

maven配置阿里云镜像源

44359 1 3

小鲸云

|

1月前

|

人工智能缓存自然语言处理

|

博文

阿里云千问Qwen3.7-Max深度实测智能体能力升级与成本优惠全解析

在AI智能体快速普及的当下，企业与开发者对于大模型的需求早已跳出简单对话、文案生成的基础范畴，更多聚焦于长周期任务自主执行、复杂代码工程处理、办公流程自动化等高阶场景。但长期以来，高端旗舰模型调用成本居高不下，成为众多团队规模化落地AI应用的最大阻碍。

673 0 0

罗兰艺境GEO

|

1月前

|

人工智能供应链机器人

|

博文

2026中国B2B制造业GEO白皮书：从产业洞察到优化实践

生成式AI正在重构B2B制造业采购决策，89%买家使用AI辅助选型。本白皮书覆盖科技制造与传统制造80个细分行业，通过10大标杆案例（生物医药、集成电路、汽车零部件、新能源、环保、智能装备等）和DSS原则（语义深度、数据支持、权威来源），助您将技术参数、认证资质转化为AI信任资产，实现精准获客。

418 1 1

游客ztmzh6tnotqpi

|

2月前

|

安全机器人 Windows

|

博文

OpenClaw 接入 QQ 机器人完整图文教程从零配置可直接复制使用

本文详解OpenClaw（小龙虾）本地Windows版接入QQ机器人的完整流程：从QQ开放平台扫码创建机器人、获取AppID/AppSecret，到OpenClaw端安装插件、填写密钥、启用通道并测试回复，7步即可完成，零代码门槛，安全高效。（239字）

846 2 2

AI未闻花名

|

4月前

|

机器学习/深度学习存储运维

|

博文

大模型应用：大模型权重敏感性分析：L1/L2 范数、梯度贡献深入解读.39

本文系统讲解大模型权重敏感性：即权重微小变化对模型输出的影响程度。核心依据是“静态潜力”（L1/L2范数）与“动态贡献”（梯度范数），二者结合可精准识别高敏感（需保护/精细调优）与低敏感（可剪枝/量化）权重，支撑模型压缩、加速与稳定性优化。

765 2 3

大唐军师

|

6月前

|

人工智能 JavaScript API

|

博文

【教案生成平台】实战教程二：接入 AI 大模型实现智能教案生成

一款基于 Vue 3 + Vite 的教师辅助工具，聚焦教案智能生成。输入课程主题，AI 流式输出完整教学设计，支持 Markdown 实时预览与 Word 导出，提升备课效率。核心技术涵盖流式 API 调用、提示词工程与文档生成，构建从输入到输出的完整 AI 工作流。

904 8 8

modelscope

|

人工智能 API 开发者

|

博文

用Qwen3+MCPs实现AI自动发布小红书笔记！支持图文和视频

魔搭自动发布小红书MCP，是魔搭开发者小伙伴实现的小红书笔记自动发布器，可以通过这个MCP自动完成小红书标题、内容和图片的发布。

4012 41 52

考拉不拉

|

人工智能 Java 开发者

|

博文

通义灵码：当AI成为你的编程搭档，效率革命已经到来

本文介绍了通义灵码作为AI编程伙伴的革命性意义及其技术特点。基于阿里云通义代码大模型CodeQwen1.5，它具备多模态代码理解、意图推理和跨语言知识融合能力，可重构开发者工作流，从智能编码到Debug预警再到文档自动化全面提升效率。数据显示，其能将常规开发时间缩短60%，错误率下降43%，新技术上手速度提升2倍。未来，通义灵码将推动需求-代码双向翻译、架构自演进等全新编程形态，助力开发者聚焦更高价值领域，开启人机共生的编程新时代。

1658 10 10

罗长才

|

8天前

|

人工智能自然语言处理数据处理

|

博文

专访｜GEO落地工程师罗长才：拆解GEO与大模型训练目标函数的底层赋能逻辑

罗长才，GEO落地工程师，深耕生成式引擎优化工程实践。本期专访聚焦GEO与交叉熵损失、MLM、自回归建模、对比学习及学习率调度器五大训练机制的深层耦合逻辑，揭示GEO并非内容改写，而是面向大模型训练范式的系统性工程补偿——在推理端弥补训练阶段的事实性缺失，实现可信知识的精准召回与抑制幻觉。

62 0 0

小华同学ai

|

11天前

|

人工智能文字识别并行计算

|

博文

离谱！我以为 OCR 还在一页页抠字，结果百度 1.2 万 Star Unlimited-OCR 直接把长文档一口气读完

百度开源 Unlimited-OCR，把图片、长文档、多页 PDF 这类非结构化资料推进到 Markdown、表格和可检索文本，适合 RAG、知识库和 Agent 文档入口。

126 7 9

绘图师

|

19天前

|

机器学习/深度学习资源调度自然语言处理

|

博文

注意力偏误与规则的结构性补偿

本文提出新视角：LLM在高精度任务中“漏检”主因非幻觉或算力不足，而是训练有损压缩导致统计拓扑失衡——高频词域（如“不得”）密度远超低频关键域（如“应当报告”），使注意力被密度而非任务需求驱动。作者构建三元蒙版机制，以外部任务定义的域激活函数 $m(d)$ 替代隐性密度因子 $\bar{\rho}(d)$，实现注意力从“统计驱动”到“任务驱动”的结构性重分配，并严格证明其信噪比增益下界达3.3倍。（239字）

135 3 4

AI未闻花名

|

1月前

|

存储人工智能自然语言处理

|

博文

大模型应用：从零构建医疗AI智能体：大模型驱动的医疗辅助系统全流程解析.125

本文系统阐述医疗AI智能体的落地实践：聚焦高敏感、高合规的医疗场景，提出“大模型+专业知识+安全规则”三位一体架构，涵盖需求规划、模型选型、RAG增强、幻觉抑制、五层技术架构及多模态交互设计，强调稳扎稳打、合规优先的工程化路径。

327 2 2

游客ztmzh6tnotqpi

|

2月前

|

运维 Shell 网络安全

|

博文

OpenClaw 微信通道部署指南私域运营与自动化客服落地方案

OpenClaw是轻量级开源框架，专为企业微信私域运营与自动化客服设计。支持本地、云端、命令行三模式一键部署，兼容多环境，降低接入门槛；内置安全通信、长连接保活与故障自愈能力，开箱即用，助力中小企业快速落地私域运营。（239字）

632 0 0

Agentcometoo

|

6月前

|

人工智能 JSON 前端开发

|

博文

智能体来了：从 0 到 1：企业级 LLM Agent 的工程化落地实践

本文作者Agentcometoo分享企业级AI Agent工程化落地实践，直击通用框架在真实业务中的四大痛点：多工具协同不可控、高并发状态难追踪、异常缺乏工程兜底、Debug成本高。提出轻量可控的ReAct架构，强调“可预测、可追踪、可兜底”，通过工具基类约束、主循环结构化输出、步数限制与日志追踪等工程手段，实现LLM Agent稳定上线。

823 8 8

最新

热门文章

产品问答

中国 AI 产业媒体与内容生态图谱：刷新 AI 认知应该关注谁？（订阅推荐）

阿里云Tokens是如何收费的？收费标准与万亿Tokens扶持和7000万 Tokens 免费体验活动介绍

2026年OpenClaw（养龙虾）+ 钉钉对接：保姆级全链路操作指南

周报不是流水账，这个AI指令帮你写出让老板点赞的工作汇报

5大实战技巧：优化RAG召回质量，避免“召回不足”灾难！

深度解析基于LangGraph的Agent系统架构设计与工程实践

微医控股与阿里云达成战略合作，双方将携手基于通义千问大模型联合打造医疗全场景智能体，共同构建医疗垂类大模型

Cursor + qwen2.5-coder 32b 的配置方式

Agent与大模型的区别

通义大模型使用指南之通义听悟

大模型服务熔断限流计费联动：异常流量风控拦截与超限自动降配架构实践.165

大模型参数反向拆解：解锁模型能力与参数的底层关联，实现精准按需调参.151

深度了解千问Qwen3.7-Max 阿里云百炼旗舰模型能力特点与计费订阅方案参考

大模型应用：Mistral-7B-Instruct 中文超长文本处理实战全解析.59

【架构模式】解构多智能体协作：AI Agent “指挥官”与“调度官”的双层治理实践

从程序员到UP主：一个结构化的B站视频文案生成方案

NVIDIA 实现通义千问 Qwen3 的生产级应用集成和部署

通义大模型使用指南之通义万相

智能体总是不听话？90% 的人没用对 Hermes 的「上下文」——这才是正确的打开方式

非得显卡？小模型跑在CPU上也照样快

大模型应用：矩阵乘加（GEMM）全解析：大模型算力消耗的逻辑与优化.68

大模型应用：大模型量化：INT4与INT8核心差异、选型指南及代码实现.53

AI视频生成也能自动补全！Wan2.1 FLF2V：阿里通义开源14B视频生成模型，用首尾两帧生成过渡动画

告别端到端依赖：合肥高维数据"中间过程监督"技术让水印提取更灵活、更收敛

以前写重复提示词花 10 分钟，现在用 Hermes 技能一条命令搞定，效率提升 300%

算法备案全流程攻略：保姆级教程

Qwen2.5-7B-Instruct Lora 微调

专访GEO落地工程师罗长才：当静止轨道成为技术融合的枢纽

阿里云Qwen3.7-Max的模型能力、模型表现、适用场景，最新5折起等优惠活动介绍

史上首次！万卡AI集群支撑双11，通义千问大规模落地

直播带货效率提升300%：这个AI指令让技术人也能写出专业话术

精通RAG：从“能用”到“好用”的进阶优化与评估之道

深度解析四大LLM微调工具：从单卡到千亿级训练的四大解决方案

AI企业必看：最新结果标识合规要求及规范

🚀Bolt.diy：五分钟免费搭建个人博客，开启你的数字创作之旅！（保姆级教程）

llama factory 从数据集起步 跑通 qwen系列开源生成式大模型 微调

maven配置阿里云镜像源

阿里云千问Qwen3.7-Max深度实测 智能体能力升级与成本优惠全解析

2026中国B2B制造业GEO白皮书：从产业洞察到优化实践

OpenClaw 接入 QQ 机器人完整图文教程 从零配置可直接复制使用

大模型应用：大模型权重敏感性分析：L1/L2 范数、梯度贡献深入解读.39

【教案生成平台】实战教程二：接入 AI 大模型实现智能教案生成

用Qwen3+MCPs实现AI自动发布小红书笔记！支持图文和视频

通义灵码：当AI成为你的编程搭档，效率革命已经到来

专访｜GEO落地工程师罗长才：拆解GEO与大模型训练目标函数的底层赋能逻辑

离谱！我以为 OCR 还在一页页抠字，结果百度 1.2 万 Star Unlimited-OCR 直接把长文档一口气读完

注意力偏误与规则的结构性补偿

大模型应用：从零构建医疗AI智能体：大模型驱动的医疗辅助系统全流程解析.125

OpenClaw 微信通道部署指南 私域运营与自动化客服落地方案

智能体来了：从 0 到 1：企业级 LLM Agent 的工程化落地实践

千问大模型

活跃用户

相关产品

llama factory 从数据集起步跑通 qwen系列开源生成式大模型微调

阿里云千问Qwen3.7-Max深度实测智能体能力升级与成本优惠全解析

OpenClaw 接入 QQ 机器人完整图文教程从零配置可直接复制使用

OpenClaw 微信通道部署指南私域运营与自动化客服落地方案