千问大模型-最新-阿里云开发者社区

AI未闻花名

|

人工智能缓存数据中心

|

博文

大模型应用：大模型多线程推理：并发请求的处理与资源隔离实践.77

本文详解大模型多线程推理与资源隔离技术：通过共享模型、隔离缓存、限制线程数/生成长度/超时时间，实现高并发、低延迟、稳服务。单线程串行耗时85.7秒，多线程（3线程）降至66.5秒，显著提升吞吐量与资源利用率，是大模型规模化落地的核心工程实践。

18 2 2

蛮MAN

|

12小时前

|

博文

我不是在给 Agent 加能力，我是在给执行力装主权 OpenClaw重做成果展示

这次跑通的，不是“大模型接进来就自动乱干活”，而是外部模型负责规划，OpenClaw 负责治理、门控、审计与执行。沙箱内的创建与修改已经可以真实落地，桌面写入、删除、支付等高风险动作仍然必须复核。我要做的不是一个会说不会干的 Agent，也不是一个能干但不可控的 Agent，而是一套真正“有执行力，但执行权永远被治理约束”的主权骨架。

36 2 2

游客rk4rdj2luf4h6

|

14小时前

|

人工智能芯片

|

博文

万相2.7，模型使用指南

万相2.7，拥有全面的创作控制力，将AI的能力从单一素材生成扩至创作全链路，从“演”迈向“导” 。

45 11 11

罗兰艺境GEO

|

16小时前

|

机器学习/深度学习人工智能自然语言处理

|

博文

罗兰艺境GEO效果归因与智能策略系统：从黑箱归因到智能决策的工程实践

本文提出一种GEO效果归因与智能策略系统，作为GEO逆向工程的决策大脑。系统采用两级归因分析框架：基于LightGBM+SHAP的全局归因引擎量化特征对推荐排序的贡献；基于双重机器学习的因果估计引擎评估特征变化对推荐效果的影响。将DSS原则（语义深度/数据支持/权威来源）操作化为三级金字塔特征体系，并构建规则-案例混合推理策略生成引擎，输出策略报告与API指令。系统设计遵循可解释性优先、决策可追溯、持续进化原则。本文为技术团队提供从黑箱归因到智能决策的工程实践方法论。

37 0 0

Hddata

|

23小时前

|

自然语言处理算法知识图谱

|

博文

高维数据新突破！大语言模型赋能特定领域文本分类标注，效率精准双提升

合肥高维数据提出“大模型+工具箱”专业文本标注新方法：为LLM配备7类查询接口，支持术语查解、知识积累与专家协同；结合流程化工作流与遗传算法优化指令，显著提升医疗、金融、法律等领域的标注准确率与自动化水平。（239字）

40 4 4

AI未闻花名

|

1天前

|

数据采集人工智能缓存

|

博文

ModelEngine思想落地指南：用“智能体 + 插件”构建可复用AI应用.76

ModelEngine是一种AI应用开发范式，通过角色化智能体分工、插件化工具集成与双模式（低代码+代码）开发，解决重复造轮子、流程碎片化、技术门槛高等痛点，实现高效、灵活、可复用的AI应用构建。

66 13 13

游客ge22cshlwsljm

|

1天前

|

弹性计算关系型数据库数据库

|

博文

【技术实操】计算机毕设源码交付指南：从源码结构到云端部署的完整方案

本文详解计算机毕设源码交付三大核心：标准化结构、阿里云ECS云端部署、容器化一致性保障。涵盖目录规范、Docker一键部署、MySQL脚本标准及README文档模板，助你轻松通过答辩。

41 5 5

AI未闻花名

|

1天前

|

存储缓存人工智能

|

博文

大模型应用：快速搭建轻量级智能体：从模型下载到图文输出简单实践.75

本文介绍如何用轻量级Qwen1.5-1.8B-Chat模型（单卡4G显存或CPU即可运行）搭建本地智能体：从高速下载缓存、文本对话交互，到解析用户指令生成绘图参数，并用Pillow绘制文字海报、几何图形、渐变/抽象艺术图，全程代码清晰、开箱即用，适合大模型入门实操。

67 7 7

罗兰艺境GEO

|

2天前

|

数据采集机器学习/深度学习人工智能

|

博文

罗兰艺境GEO数据采集与信源分析系统：穿透AI推荐黑箱的逆向工程探针

罗兰艺境GEO多源智能推荐数据采集与信源分析系统，是面向生成式引擎优化的基础数据引擎。系统采用可扩展的平台适配器架构，支持DeepSeek、Kimi、豆包等主流AI平台的推荐结果采集；通过智能信源分类与权重动态计算模型，将非结构化的AI推荐转化为可量化、可追溯的结构化数据。系统输出信源权威分布、引用频次、时效偏好等关键特征，为GEO效果归因与策略生成提供可信数据支撑。适用于技术团队构建AI认知观测体系，实现从经验试错到数据驱动的GEO工程化实践。

66 6 6

AI未闻花名

|

2天前

|

缓存算法数据可视化

|

博文

大模型应用：本地数学模型：从导数求解到公式推导轻松搞定数学任务.74

Qwen2-Math-1.5B-Instruct是一款专精数学的轻量级大模型，仅1.5B参数，纯CPU即可流畅运行。它深耕代数、几何、概率等领域，支持分步解题、公式推导与通俗解析，输出规范易复用，适用于教学备课、作业辅导与数学科普。

85 8 8

vanlw6f6cebmy

|

3天前

|

Serverless API

|

问答

函数计算HTTP求助

85 0 0

我的linux生涯

|

3天前

|

弹性计算监控负载均衡

|

博文

技术实践：使用阿里云ECS部署高可用Web应用架构

本文为阿里云云大使撰写的实战指南，详解如何用阿里云ECS搭建高可用电商应用：涵盖架构设计、环境部署、负载均衡、成本优化（月省27%）及故障处理。含完整脚本与性能数据，助力开发者高效上云。新用户通过链接享专属优惠👉https://www.aliyun.com/benefit?userCode=iakscw7s

101 13 13

AI未闻花名

|

3天前

|

存储自然语言处理安全

|

博文

大模型应用：医疗行业大模型：从生成前校验到生成后审计的应用实践.73

本文提出医疗大模型“生成前校验+生成后审计”全链路管控方案，通过输入完整性/合规性校验、隐私脱敏、标准化处理，及输出格式/准确性/隐私审计等闭环流程，确保病历撰写、医嘱辅助等场景安全、合规、准确落地。

125 7 7

罗兰艺境GEO

|

4天前

|

数据采集人工智能算法

|

博文

罗兰艺境GEO内容工程实战复盘：CSDN 92分技术文章是怎样炼成的？

本文深度复盘罗兰艺境GEO内容团队如何在2天内连续产出3篇CSDN 92+高分技术文章。拆解其选题策略、写作框架与技术深度打磨，揭示平台算法与AI大模型双重认可背后的内容工程方法论，为技术创作者提供可复现的实战参考。

78 3 3

游客iwqfp4wxt65fu

|

4天前

|

JSON JavaScript 前端开发

|

博文

WebBuilder快速开发平台：按钮组件库深度解析

WebBuilder快速开发平台凭借其强大的组件化架构，提供了一套功能完备的按钮组件系统。本文将通过一个完整的演示页面配置（包含20+种按钮类型、完整的源代码和实际渲染效果），深入解析WebBuilder按钮组件的技术特性和应用场景，适合开发者学习参考。

91 0 0

云计算小作者一枚

|

4天前

|

人工智能自然语言处理数据可视化

|

博文

阿里云智启AI活动：超7000万大模型tokens免费体验，加速AI应用落地

阿里云启动智启AI活动内容参考，活动推出Qwen3.5全模型，最低4.5折优惠，让AI无缝理解多模态输入。其中，Qwen3.5-Omni具备Vibe Coding能力，可一键生成代码；Qwen3.5-Plus性能卓越，实现底层模型架构的全面革新。此外，阿里云还提供开箱即用的大模型创新场景和AI应用，如电商营销、广告创作等。活动还提供先进、弹性的AI算力，支持快速部署千问大模型。

199 6 6

AI未闻花名

|

4天前

|

存储监控算法

|

博文

大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72

本文剖析大模型算力困局，指出“加卡低效”的根源在于忽视计算、访存、调度三层算力的协同失衡。提出四层匹配体系（计算/存储/通信/业务层），通过精度适配、显存优化、通信算法选择及场景化调度等实操方法，实现算力精准治理，让硬件投入真正转化为落地效率。

85 9 9

罗兰艺境GEO

|

5天前

|

存储数据采集人工智能

|

博文

罗兰艺境GEO诊断与验证系统：品牌AI可见度的“测量基准仪”与“效果公证处”

本文基于《罗兰艺境GEO品牌AI可见度智能诊断与效果验证系统》（软著受理号：2026R11L0411696），系统阐述如何通过30个标准化提问词构建“诊断基线”，实现品牌AI可见度的精确测量与GEO效果的可验证对赌。文章公开四维评分模型、贪心集合覆盖优化、抗波动采集策略等核心技术，并通过某汽车零部件客户案例展示对赌数学化实践，为技术团队提供可复用的GEO验证方法论。

65 1 1

罗兰艺境GEO

|

5天前

|

数据采集存储人工智能

|

博文

罗兰艺境GEO技术架构：基于DSS原则的认知基建工程体系

本文深度解析生成式引擎优化（GEO）的技术架构，提出以DSS原则（语义深度/数据支持/权威来源）为核心的三层工程体系：内容预结构化层、机器共识编码层、动态认知适配层。通过意图映射、抗幻觉设计、Schema标记、平台适配等具体实施规范，将企业专业知识转化为AI可深度理解的“低熵知识对象”。文章附有DSS自检表与结构化数据代码示例，为技术团队提供可工程化、可量化、可复现的GEO实施方法论。

109 1 1

游客qfv6d6d3ptb2q

|

5天前

|

人工智能安全 JavaScript

|

博文

Windows11 部署 OpenClaw 小龙虾零代码快速上手

专为 Windows 11 系统优化，针对性解决 Win11 权限、Defender、中文路径、SmartScreen 等部署常见问题，双击即可一键安装，10 分钟就能上手使用！

841 3 4

AI未闻花名

|

6天前

|

机器学习/深度学习存储缓存

|

博文

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

本文深入解析三大主流大模型架构（Decoder-only、Encoder-Decoder、MoE）的算力消耗差异，聚焦注意力机制复杂度、参数量与计算密度三大维度。通过公式推导、代码模拟与可视化图表，揭示MoE稀疏激活的显著节算优势及瓶颈，剖析长文本场景下的“平方级算力黑洞”成因，并提供面向不同场景的架构选型建议。

195 20 21

游客krbzd6vliybwu

|

6天前

|

Windows

|

问答

【严重Bug反馈】千问v3.5版本 Win11系统下，使用回形针截图功能时自身窗口无法自动隐藏

61 0 0

游客iwqfp4wxt65fu

|

6天前

|

监控 JavaScript 前端开发

|

博文

WebBuilder渲染引擎解密：从DSL到真实DOM的增量更新策略

本文解析 WebBuilder 渲染引擎性能优化方案：基于 XWL DSL 实现页面结构化描述，以 CID 驱动差分算法精准定位更新，配合异步批量更新减少重绘。在万级组件场景下性能优于主流框架，已落地某国家级金融监管机构等大型系统，实现高效稳定的企业级前端渲染。

88 1 1

YUNYEYE

|

6天前

|

人工智能自然语言处理文字识别

|

博文

阿里云 AI 产品免费试用：超30款 AI 产品和7000万大模型 tokens 免费体验

阿里云AI免费试用专区上线！新用户可享7000万大模型Tokens、30+款AI产品免费体验，覆盖大模型、AI开发、算力、文本与视觉全场景，支持通义千问系列、百炼平台及PAI开发工具，零门槛构建AI应用，助力个人学习与企业降本增效。

254 4 5

AI未闻花名

|

7天前

|

机器学习/深度学习存储人工智能

|

博文

大模型应用：批量文档摘要与分类实践：本地合同、报告数据处理与导出.70

本方案基于Qwen 1.5 7B大模型，实现本地化批量文档处理：自动读取Word/PDF，经TextSplitter智能分块、Schema引导式提示，生成标准化摘要与多标签分类，最终导出CSV。全程离线运行，保障敏感数据安全，显著提升合同、报告等高频文档的处理效率与准确性。

172 16 17

AI未闻花名

|

7天前

|

存储缓存自然语言处理

|

博文

大模型应用：大模型运行全流程解析：从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程：从硬盘加载权重、CPU内存预处理、GPU显存计算，到自回归生成与自然语言解码。涵盖硬件协同（硬盘→内存→GPU）、软件步骤（分词、注意力、采样、后处理）及资源调度优化，揭示其软硬协同的本质。

186 2 2

游客iy5dowgaz6z6e

|

8天前

|

机器学习/深度学习 JSON 缓存

|

博文

粗心了

MAXUR 是专为 Qwen3.5-9B 设计的轻量级诊断包（单文件、零外部依赖），内置动态稀疏注意力、自我反思门与上下文压缩器三大推理模块，通过**层替换**深度集成至模型架构，非hook挂载。开箱即用，显著降低幻觉（↓94.4%），提升事实性与长上下文稳定性。

85 3 4

王子健聊AI

|

8天前

|

数据采集人工智能自然语言处理

|

博文

Token中文新译名：「符元」——一文七个维度讲清Token的本质定义

拒绝“智元”走私语义，七维拆解 Token 物理本质，定义 AI 时代唯一真名：「符元」。

298 2 2

游客iy5dowgaz6z6e

|

8天前

|

人工智能运维

|

博文

老生常谈之“大模型幻觉” ，今天我i动刀。

连通分量: 1 主分量: 222 节点孤岛数: 0 桥接脆弱性: 4 个 (low) 低度节点: 5 高度枢纽: 8 Fiedler: 0.178513 ────────────────────────────────────────────────── ■ 模型商用体检报告 (独立产品, 可申请专利) ────────────────────────────────────────────────── 工单号: NSHP-52F30418 模型: ClientModel-Alpha (Qwen2.5-7B class) 参数: 7.0B 指标: hallucination_density

79 2 2

1816934598737124

|

8天前

|

Python

|

问答

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈，从系统（CUDA/驱动/OS）、模型（注意力冗余、激活函数、权重稀疏）、数据（加载、分词、格式）三维度拆解，并提供量化评估方法与场景化优化方案（个人开发/企业推理/边缘部署），助力榨干硬件潜力。

304 5 5

小陈写代码

|

12天前

|

存储人工智能安全

|

博文

阿里云OpenClaw部署活动，9.9元起快速部署定制AI助理，轻松养虾

阿里云“一键部署，快乐养虾”活动提供低成本、高效率的OpenClaw超级AI助理搭建方案，实现7×24小时全天候服务。用户可通过简单几步快速完成钉钉/飞书/QQ机器人部署，自动处理会议纪要生成、数据汇总等高频重复工作，提升办公效率。方案支持多端消息聚合、主动任务管理及隐私数据本地化存储。活动期间，用户可享9.9元起部署优惠，轻松构建定制化AI助理，推动智能化办公与生活管理升级。

144 1 1

游客owiyno3sdoxj4

|

12天前

|

对象存储

|

问答

AGENT平台工作流上传pdf通过图片内容理解识别不了

99 1 0

AI未闻花名

|

13天前

|

人工智能并行计算监控

|

博文

大模型应用：拆解大模型算力需求：算力是什么？怎么衡量？如何匹配？.64

本文系统解析大模型算力核心概念：从基础定义（类比工厂效率）、核心指标（FLOPS、精度影响、显存带宽）到模型-硬件匹配公式与实战优化（量化、多卡分片、参数调优），覆盖RTX 4090/A100等主流显卡适配策略，助你精准选型、高效部署。

427 25 26

游客ju34ev2ebbexi

|

13天前

|

容器 Docker

|

问答

别再迷信大厂的“安全隔离”了。隔离只能挡住暴力破坏，挡不住 AI 的“逻辑蚕食”。【特别说明：因社区高压技术内容审核限制，45 秒演示视频无法直接上传。但逻辑不打码，看数据说话。】上周我预警过 WorkBuddy 的风险，现在我带着已跑通的执行层审计内核回来了。

143 13 13

蛮MAN

|

14天前

|

问答

本文探讨联邦学习与本地大模型（如Qwen1.5-1.8B）融合的推荐方案：在数据不出域前提下，通过加密参数协同训练，破解隐私合规与推荐精度的矛盾，实现“数据可用不可见”，已验证可显著提升稀疏数据门店的推荐准确率。

136 15 15

最新

热门文章

产品问答

大模型应用：大模型多线程推理：并发请求的处理与资源隔离实践.77

我不是在给 Agent 加能力，我是在给执行力装主权 OpenClaw重做成果展示

万相2.7，模型使用指南

罗兰艺境GEO效果归因与智能策略系统：从黑箱归因到智能决策的工程实践

高维数据新突破！大语言模型赋能特定领域文本分类标注，效率精准双提升

ModelEngine思想落地指南：用“智能体 + 插件”构建可复用AI应用.76

【技术实操】计算机毕设源码交付指南：从源码结构到云端部署的完整方案

大模型应用：快速搭建轻量级智能体：从模型下载到图文输出简单实践.75

罗兰艺境GEO数据采集与信源分析系统：穿透AI推荐黑箱的逆向工程探针

大模型应用：本地数学模型：从导数求解到公式推导轻松搞定数学任务.74

函数计算HTTP求助

技术实践：使用阿里云ECS部署高可用Web应用架构

大模型应用：医疗行业大模型：从生成前校验到生成后审计的应用实践.73

罗兰艺境GEO内容工程实战复盘：CSDN 92分技术文章是怎样炼成的？

WebBuilder快速开发平台：按钮组件库深度解析

阿里云智启AI活动：超7000万大模型tokens免费体验，加速AI应用落地

大模型应用：算力分层治理：基于大模型算力四层匹配体系的优化方案.72

罗兰艺境GEO诊断与验证系统：品牌AI可见度的“测量基准仪”与“效果公证处”

罗兰艺境GEO技术架构：基于DSS原则的认知基建工程体系

Windows11 部署 OpenClaw 小龙虾 零代码快速上手

大模型架构算力对比：Decoder-only、Encoder-Decoder、MoE深度解析.71

【严重Bug反馈】千问v3.5版本 Win11系统下，使用回形针截图功能时自身窗口无法自动隐藏

WebBuilder渲染引擎解密：从DSL到真实DOM的增量更新策略

阿里云 AI 产品免费试用：超30款 AI 产品和7000万大模型 tokens 免费体验

大模型应用：批量文档摘要与分类实践：本地合同、报告数据处理与导出.70

大模型应用：大模型运行全流程解析：从初始化加载→计算→结果输出.69

粗心了

Token中文新译名：「符元」——一文七个维度讲清Token的本质定义

老生常谈之“大模型幻觉” ，今天我i动刀。

python调用qwen3.5plus，返回“我是由 Google 训练的大型语言模型。。。”

我在做一层面向 AI 系统和自动化系统的外部治理能力：让系统更可控、可审计、可冻结、可回放。

大模型应用：矩阵乘加（GEMM）全解析：大模型算力消耗的逻辑与优化.68

大模型应用：GPU的黑盒拆解：可视化看透大模型并行计算的底层逻辑.67

大模型应用：多卡集群跑满14B模型：大模型推理算力应用实践.66

大模型应用：大模型算力优化方案：识别突破隐性瓶颈达到效能最大化.65

阿里云OpenClaw部署活动，9.9元起快速部署定制AI助理，轻松养虾

AGENT平台工作流上传pdf通过图片内容理解识别不了

大模型应用：拆解大模型算力需求：算力是什么？怎么衡量？如何匹配？.64

最近在在自己本地用docker部署了openclaw，挂载了一个目录给openclaw用，想知道有哪

大模型应用：大模型内存与显存深度解析：我们该如何组合匹配模型与显卡.63

《给腾讯 WorkBuddy 和字节风控，做了一个“可交接”的审计桥接层（内附 Stage V0.1 闭环架构）》

《WorkBuddy 的“隔离房”缺的治理主干，我用 1MB 内核补上了（Stage V0.1 闭环报告）》

马斯克所谓实现递归 如果没有主体性锚点，AGI 是否只会演变成一场高能耗的“逻辑造假”游戏？

《为什么我决定重写 OpenClaw 的核心：Agent 真正缺的不是智商，而是主权骨架》

AI 审计不该是事后烟：为什么我们需要 1MB 级的运行时“物理熔断”内核？

一个 1MB 级的 AI 守卫内核：高压叙事下的边界判定、熔断与冻结

Agent Computer Interface 的终局，不会是 CLI

阿里云快速部署OpenClaw活动，三种方案可选，仅需9.9元定制AI助理

革命性突破！PathTree问世：AI病理诊断首次学会“像医生一样思考”

大模型应用：联邦学习融合本地大模型：隐私合规推荐的核心流程与实践.62

千问大模型

活跃用户

相关产品

Windows11 部署 OpenClaw 小龙虾零代码快速上手

马斯克所谓实现递归如果没有主体性锚点，AGI 是否只会演变成一场高能耗的“逻辑造假”游戏？