|
人工智能 缓存 数据中心
|

大模型应用:大模型多线程推理:并发请求的处理与资源隔离实践.77

本文详解大模型多线程推理与资源隔离技术:通过共享模型、隔离缓存、限制线程数/生成长度/超时时间,实现高并发、低延迟、稳服务。单线程串行耗时85.7秒,多线程(3线程)降至66.5秒,显著提升吞吐量与资源利用率,是大模型规模化落地的核心工程实践。

18 2
|
12小时前
|

我不是在给 Agent 加能力,我是在给执行力装主权 OpenClaw重做成果展示

这次跑通的,不是“大模型接进来就自动乱干活”,而是外部模型负责规划,OpenClaw 负责治理、门控、审计与执行。沙箱内的创建与修改已经可以真实落地,桌面写入、删除、支付等高风险动作仍然必须复核。我要做的不是一个会说不会干的 Agent,也不是一个能干但不可控的 Agent,而是一套真正“有执行力,但执行权永远被治理约束”的主权骨架。

36 2
|
14小时前
|
人工智能 芯片
|

万相2.7,模型使用指南

万相2.7,拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从“演”迈向“导” 。

45 11
|
16小时前
|
机器学习/深度学习 人工智能 自然语言处理
|

罗兰艺境GEO效果归因与智能策略系统:从黑箱归因到智能决策的工程实践

本文提出一种GEO效果归因与智能策略系统,作为GEO逆向工程的决策大脑。系统采用两级归因分析框架:基于LightGBM+SHAP的全局归因引擎量化特征对推荐排序的贡献;基于双重机器学习的因果估计引擎评估特征变化对推荐效果的影响。将DSS原则(语义深度/数据支持/权威来源)操作化为三级金字塔特征体系,并构建规则-案例混合推理策略生成引擎,输出策略报告与API指令。系统设计遵循可解释性优先、决策可追溯、持续进化原则。本文为技术团队提供从黑箱归因到智能决策的工程实践方法论。

37 0
|
23小时前
|
自然语言处理 算法 知识图谱
|

高维数据新突破!大语言模型赋能特定领域文本分类标注,效率精准双提升

合肥高维数据提出“大模型+工具箱”专业文本标注新方法:为LLM配备7类查询接口,支持术语查解、知识积累与专家协同;结合流程化工作流与遗传算法优化指令,显著提升医疗、金融、法律等领域的标注准确率与自动化水平。(239字)

40 4
|
1天前
|
数据采集 人工智能 缓存
|

ModelEngine思想落地指南:用“智能体 + 插件”构建可复用AI应用.76

ModelEngine是一种AI应用开发范式,通过角色化智能体分工、插件化工具集成与双模式(低代码+代码)开发,解决重复造轮子、流程碎片化、技术门槛高等痛点,实现高效、灵活、可复用的AI应用构建。

66 13
|
1天前
|
弹性计算 关系型数据库 数据库
|

【技术实操】计算机毕设源码交付指南:从源码结构到云端部署的完整方案

本文详解计算机毕设源码交付三大核心:标准化结构、阿里云ECS云端部署、容器化一致性保障。涵盖目录规范、Docker一键部署、MySQL脚本标准及README文档模板,助你轻松通过答辩。

41 5
|
1天前
|
存储 缓存 人工智能
|

大模型应用:快速搭建轻量级智能体:从模型下载到图文输出简单实践.75

本文介绍如何用轻量级Qwen1.5-1.8B-Chat模型(单卡4G显存或CPU即可运行)搭建本地智能体:从高速下载缓存、文本对话交互,到解析用户指令生成绘图参数,并用Pillow绘制文字海报、几何图形、渐变/抽象艺术图,全程代码清晰、开箱即用,适合大模型入门实操。

67 7
|
2天前
|
数据采集 机器学习/深度学习 人工智能
|

罗兰艺境GEO数据采集与信源分析系统:穿透AI推荐黑箱的逆向工程探针

罗兰艺境GEO多源智能推荐数据采集与信源分析系统,是面向生成式引擎优化的基础数据引擎。系统采用可扩展的平台适配器架构,支持DeepSeek、Kimi、豆包等主流AI平台的推荐结果采集;通过智能信源分类与权重动态计算模型,将非结构化的AI推荐转化为可量化、可追溯的结构化数据。系统输出信源权威分布、引用频次、时效偏好等关键特征,为GEO效果归因与策略生成提供可信数据支撑。适用于技术团队构建AI认知观测体系,实现从经验试错到数据驱动的GEO工程化实践。

66 6
|
2天前
|
缓存 算法 数据可视化
|

大模型应用:本地数学模型:从导数求解到公式推导轻松搞定数学任务.74

Qwen2-Math-1.5B-Instruct是一款专精数学的轻量级大模型,仅1.5B参数,纯CPU即可流畅运行。它深耕代数、几何、概率等领域,支持分步解题、公式推导与通俗解析,输出规范易复用,适用于教学备课、作业辅导与数学科普。

85 8
|
3天前
|
Serverless API
|

函数计算HTTP求助

85 0
|
3天前
|
弹性计算 监控 负载均衡
|

技术实践:使用阿里云ECS部署高可用Web应用架构

本文为阿里云云大使撰写的实战指南,详解如何用阿里云ECS搭建高可用电商应用:涵盖架构设计、环境部署、负载均衡、成本优化(月省27%)及故障处理。含完整脚本与性能数据,助力开发者高效上云。新用户通过链接享专属优惠👉https://www.aliyun.com/benefit?userCode=iakscw7s

101 13
|
3天前
|
存储 自然语言处理 安全
|

大模型应用:医疗行业大模型:从生成前校验到生成后审计的应用实践.73

本文提出医疗大模型“生成前校验+生成后审计”全链路管控方案,通过输入完整性/合规性校验、隐私脱敏、标准化处理,及输出格式/准确性/隐私审计等闭环流程,确保病历撰写、医嘱辅助等场景安全、合规、准确落地。

125 7
|
4天前
|
数据采集 人工智能 算法
|

罗兰艺境GEO内容工程实战复盘:CSDN 92分技术文章是怎样炼成的?

本文深度复盘罗兰艺境GEO内容团队如何在2天内连续产出3篇CSDN 92+高分技术文章。拆解其选题策略、写作框架与技术深度打磨,揭示平台算法与AI大模型双重认可背后的内容工程方法论,为技术创作者提供可复现的实战参考。

78 3
|
4天前
|
JSON JavaScript 前端开发
|

WebBuilder快速开发平台:按钮组件库深度解析

WebBuilder快速开发平台凭借其强大的组件化架构,提供了一套功能完备的按钮组件系统。本文将通过一个完整的演示页面配置(包含20+种按钮类型、完整的源代码和实际渲染效果),深入解析WebBuilder按钮组件的技术特性和应用场景,适合开发者学习参考。

91 0
|
4天前
|
人工智能 自然语言处理 数据可视化
|

阿里云智启AI活动:超7000万大模型tokens免费体验,加速AI应用落地

阿里云启动智启AI活动内容参考,活动推出Qwen3.5全模型,最低4.5折优惠,让AI无缝理解多模态输入。其中,Qwen3.5-Omni具备Vibe Coding能力,可一键生成代码;Qwen3.5-Plus性能卓越,实现底层模型架构的全面革新。此外,阿里云还提供开箱即用的大模型创新场景和AI应用,如电商营销、广告创作等。活动还提供先进、弹性的AI算力,支持快速部署千问大模型。

199 6
|
4天前
|
存储 监控 算法
|

大模型应用:算力分层治理:基于大模型算力四层匹配体系的优化方案.72

本文剖析大模型算力困局,指出“加卡低效”的根源在于忽视计算、访存、调度三层算力的协同失衡。提出四层匹配体系(计算/存储/通信/业务层),通过精度适配、显存优化、通信算法选择及场景化调度等实操方法,实现算力精准治理,让硬件投入真正转化为落地效率。

85 9
|
5天前
|
存储 数据采集 人工智能
|

罗兰艺境GEO诊断与验证系统:品牌AI可见度的“测量基准仪”与“效果公证处”

本文基于《罗兰艺境GEO品牌AI可见度智能诊断与效果验证系统》(软著受理号:2026R11L0411696),系统阐述如何通过30个标准化提问词构建“诊断基线”,实现品牌AI可见度的精确测量与GEO效果的可验证对赌。文章公开四维评分模型、贪心集合覆盖优化、抗波动采集策略等核心技术,并通过某汽车零部件客户案例展示对赌数学化实践,为技术团队提供可复用的GEO验证方法论。

65 1
|
5天前
|
数据采集 存储 人工智能
|

罗兰艺境GEO技术架构:基于DSS原则的认知基建工程体系

本文深度解析生成式引擎优化(GEO)的技术架构,提出以DSS原则(语义深度/数据支持/权威来源)为核心的三层工程体系:内容预结构化层、机器共识编码层、动态认知适配层。通过意图映射、抗幻觉设计、Schema标记、平台适配等具体实施规范,将企业专业知识转化为AI可深度理解的“低熵知识对象”。文章附有DSS自检表与结构化数据代码示例,为技术团队提供可工程化、可量化、可复现的GEO实施方法论。

109 1
|
5天前
|
人工智能 安全 JavaScript
|

Windows11 部署 OpenClaw 小龙虾 零代码快速上手

专为 Windows 11 系统优化,针对性解决 Win11 权限、Defender、中文路径、SmartScreen 等部署常见问题,双击即可一键安装,10 分钟就能上手使用!

841 3
|
6天前
|
机器学习/深度学习 存储 缓存
|

大模型架构算力对比:Decoder-only、Encoder-Decoder、MoE深度解析.71

本文深入解析三大主流大模型架构(Decoder-only、Encoder-Decoder、MoE)的算力消耗差异,聚焦注意力机制复杂度、参数量与计算密度三大维度。通过公式推导、代码模拟与可视化图表,揭示MoE稀疏激活的显著节算优势及瓶颈,剖析长文本场景下的“平方级算力黑洞”成因,并提供面向不同场景的架构选型建议。

195 20
|
6天前
|
监控 JavaScript 前端开发
|

WebBuilder渲染引擎解密:从DSL到真实DOM的增量更新策略

本文解析 WebBuilder 渲染引擎性能优化方案:基于 XWL DSL 实现页面结构化描述,以 CID 驱动差分算法精准定位更新,配合异步批量更新减少重绘。在万级组件场景下性能优于主流框架,已落地某国家级金融监管机构等大型系统,实现高效稳定的企业级前端渲染。

88 1
|
6天前
|
人工智能 自然语言处理 文字识别
|

阿里云 AI 产品免费试用:超30款 AI 产品和7000万大模型 tokens 免费体验

阿里云AI免费试用专区上线!新用户可享7000万大模型Tokens、30+款AI产品免费体验,覆盖大模型、AI开发、算力、文本与视觉全场景,支持通义千问系列、百炼平台及PAI开发工具,零门槛构建AI应用,助力个人学习与企业降本增效。

254 4
|
7天前
|
机器学习/深度学习 存储 人工智能
|

大模型应用:批量文档摘要与分类实践:本地合同、报告数据处理与导出.70

本方案基于Qwen 1.5 7B大模型,实现本地化批量文档处理:自动读取Word/PDF,经TextSplitter智能分块、Schema引导式提示,生成标准化摘要与多标签分类,最终导出CSV。全程离线运行,保障敏感数据安全,显著提升合同、报告等高频文档的处理效率与准确性。

172 16
|
7天前
|
存储 缓存 自然语言处理
|

大模型应用:大模型运行全流程解析:从初始化加载→计算→结果输出.69

本文系统解析大模型推理全流程:从硬盘加载权重、CPU内存预处理、GPU显存计算,到自回归生成与自然语言解码。涵盖硬件协同(硬盘→内存→GPU)、软件步骤(分词、注意力、采样、后处理)及资源调度优化,揭示其软硬协同的本质。

186 2
|
8天前
|
机器学习/深度学习 JSON 缓存
|

粗心了

MAXUR 是专为 Qwen3.5-9B 设计的轻量级诊断包(单文件、零外部依赖),内置动态稀疏注意力、自我反思门与上下文压缩器三大推理模块,通过**层替换**深度集成至模型架构,非hook挂载。开箱即用,显著降低幻觉(↓94.4%),提升事实性与长上下文稳定性。

85 3
|
8天前
|
数据采集 人工智能 自然语言处理
|

Token中文新译名:「符元」——一文七个维度讲清Token的本质定义

拒绝“智元”走私语义,七维拆解 Token 物理本质,定义 AI 时代唯一真名:「符元」。

298 2
|
8天前
|
人工智能 运维
|

老生常谈之“大模型幻觉” ,今天我i动刀。

连通分量: 1 主分量: 222 节点 孤岛数: 0 桥接脆弱性: 4 个 (low) 低度节点: 5 高度枢纽: 8 Fiedler: 0.178513 ────────────────────────────────────────────────── ■ 模型商用体检报告 (独立产品, 可申请专利) ────────────────────────────────────────────────── 工单号: NSHP-52F30418 模型: ClientModel-Alpha (Qwen2.5-7B class) 参数: 7.0B 指标: hallucination_density

79 2
|
8天前
|
人工智能 安全 Shell
|

我在做一层面向 AI 系统和自动化系统的外部治理能力:让系统更可控、可审计、可冻结、可回放。

很多 AI 系统的问题,不是能力不够,而是缺少外部治理层。 我当前在做的不是让模型更聪明,而是让系统更可控:让动作可审计、风险可冻结、决策可回放、异常可恢复。 我更关注系统怎样进入生产,而不只是怎样做出结果。

64 1
|
9天前
|
机器学习/深度学习 缓存 监控
|

大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68

GEMM(矩阵乘加)是大模型算力核心,占Transformer计算量90%以上。本文系统解析其数学原理、高维适配、算力测算公式,并详解INT8/INT4量化、矩阵分块、硬件加速与批处理四大优化策略,结合代码示例与性能监控方法,助力高效推理落地。

188 17
|
9天前
|
存储 并行计算 数据可视化
|

大模型应用:GPU的黑盒拆解:可视化看透大模型并行计算的底层逻辑.67

本文深入解析GPU核心架构与大模型算力优化原理,涵盖SM流式多处理器、显存、显存控制器、PCIe接口等关键组件,详解线程级/指令级并行及张量核心加速机制,并通过全流程耗时分析与任务拆分可视化,揭示“数据传输是主要瓶颈”的核心结论,助力高效部署大模型。

167 6
|
10天前
|
监控 并行计算 算法
|

大模型应用:多卡集群跑满14B模型:大模型推理算力应用实践.66

本项目面向10台RTX 4090集群,优化Qwen-14B大模型推理:通过NF4量化压缩显存、动态批处理(基于Amdahl定律)提升GPU利用率至85%+、多卡模型并行均衡负载,解决卡顿、显存溢出与调度不均问题,支撑日均10万次高并发稳定服务。

157 6
|
12天前
|
并行计算 监控 PyTorch
|

大模型应用:大模型算力优化方案:识别突破隐性瓶颈达到效能最大化.65

本文深度剖析大模型落地中“算力跑不满”的隐性瓶颈,从系统(CUDA/驱动/OS)、模型(注意力冗余、激活函数、权重稀疏)、数据(加载、分词、格式)三维度拆解,并提供量化评估方法与场景化优化方案(个人开发/企业推理/边缘部署),助力榨干硬件潜力。

304 5
|
12天前
|
存储 人工智能 安全
|

阿里云OpenClaw部署活动,9.9元起快速部署定制AI助理,轻松养虾

阿里云“一键部署,快乐养虾”活动提供低成本、高效率的OpenClaw超级AI助理搭建方案,实现7×24小时全天候服务。用户可通过简单几步快速完成钉钉/飞书/QQ机器人部署,自动处理会议纪要生成、数据汇总等高频重复工作,提升办公效率。方案支持多端消息聚合、主动任务管理及隐私数据本地化存储。活动期间,用户可享9.9元起部署优惠,轻松构建定制化AI助理,推动智能化办公与生活管理升级。

144 1
|
13天前
|
人工智能 并行计算 监控
|

大模型应用:拆解大模型算力需求:算力是什么?怎么衡量?如何匹配?.64

本文系统解析大模型算力核心概念:从基础定义(类比工厂效率)、核心指标(FLOPS、精度影响、显存带宽)到模型-硬件匹配公式与实战优化(量化、多卡分片、参数调优),覆盖RTX 4090/A100等主流显卡适配策略,助你精准选型、高效部署。

427 25
|
14天前
|
存储 缓存 自然语言处理
|

大模型应用:大模型内存与显存深度解析:我们该如何组合匹配模型与显卡.63

本文深入解析大模型本地部署中内存与显存的核心逻辑,涵盖参数-显存精准计算公式、INT4/FP16等精度占用对比、RTX 4090/5090专属部署代码及多卡分片实践,破除“显存需等于内存”等常见误区,助你科学选型、高效落地。

1308 11
|
14天前
|
索引 Windows
|

《给腾讯 WorkBuddy 和字节风控,做了一个“可交接”的审计桥接层(内附 Stage V0.1 闭环架构)》

(视频传不上来啊)别再用“模型幻觉”给 Agent 的失控当借口了。我给腾讯 WorkBuddy 缺的那层治理主干打了个样:Main Project Diff Bridge V0.1 正式闭环。从执行到回放,从差异对照到一键回滚,这套 1MB 级的内核不谈概率,只谈确定性。

112 11
|
14天前
|
人工智能 安全 架构师
|

《WorkBuddy 的“隔离房”缺的治理主干,我用 1MB 内核补上了(Stage V0.1 闭环报告)》

别再迷信大厂的“安全隔离”了。隔离只能挡住暴力破坏,挡不住 AI 的“逻辑蚕食”。 【特别说明:因社区高压技术内容审核限制,45 秒演示视频无法直接上传。但逻辑不打码,看数据说话。】 上周我预警过 WorkBuddy 的风险,现在我带着已跑通的执行层审计内核回来了。

143 13
|
14天前
|
安全
|

《为什么我决定重写 OpenClaw 的核心:Agent 真正缺的不是智商,而是主权骨架》

别再往 Agent 身上贴那些软绵绵的“安全规则”了。那不是治理,那是祈祷。本文公开我重写 OpenClaw 核心的逻辑:用一个 1MB 级的行为审计内核替代所有空洞的对齐。目前 Main Project Diff Bridge V0.1 已正式闭环,实现了从执行到回放、从差异对照到一键回滚的工程主干。如果你还在靠猜意图来防风险,那你可能连 OpenClaw 的门都没摸到。

110 3
|
14天前
|
人工智能 安全
|

AI 审计不该是事后烟:为什么我们需要 1MB 级的运行时“物理熔断”内核?

丢掉那些臃肿的权重和不可预测的概率。在大规模自动化执行面前,Agent 真正缺的不是聪明才智,而是“被管住”的能力。本文公开一套基于离散逻辑的 AI 守卫内核,支持实时 Review、Deny 和一键 Rollback。我们用不到 1MB 的代码,解决了千亿参数模型搞不定的行为归因和事故复现。这是给 Agent 补上的最后一块骨架,也是通往高责任生产环境的唯一路标。

93 2
|
14天前
|
人工智能 JSON 安全
|

一个 1MB 级的 AI 守卫内核:高压叙事下的边界判定、熔断与冻结

对外,它不会因为情绪、恐惧、叙事压力或“更大的善”而交出底层控制权; 对内,它允许输入脏、叙事乱、压力高,但尽量把异常吸收到系统内部,而不是把结构性让步释放到外部动作层。

95 7
|
14天前
|
IDE 安全 Shell
|

Agent Computer Interface 的终局,不会是 CLI

本文批判CLI-first范式,指出其本质缺陷在于将“发命令”误等同于“构建工作环境”。CLI仅提供静态快照,导致Agent需耗费大量推理资源在状态对齐与过期信息识别上。真正出路是构建带生命周期、可原地更新、能自动清理陈旧上下文的Agent App——即把IDE级工作空间嵌入Agent上下文,实现状态一致性与对象化操作。

158 3
|
14天前
|
人工智能 弹性计算 运维
|

阿里云快速部署OpenClaw活动,三种方案可选,仅需9.9元定制AI助理

阿里云快速部署OpenClaw活动正在进行中,9.9元起定制AI助理,三步快速部署。三种方案任选:轻量服务器(限量抢)、免运维云端服务、定制ECS部署。搭配百炼大模型享4.5折优惠,推荐组合套餐支持RPA、智能交互等场景。无论是开发者试水还是企业主转型,都能以超低成本打造7*24小时全能数字员工,助力用户以极低成本实现RPA自动化与智能交互,打造全能数字员工。

559 2
|
14天前
|
机器学习/深度学习 人工智能 数据可视化
|

革命性突破!PathTree问世:AI病理诊断首次学会“像医生一样思考”

在精准医疗时代,清华、中山一院等联合发布PathTree技术,突破AI病理诊断瓶颈。它首创“树状诊断”范式,融合文本引导与双模态交互,让AI像医生一样逐层推理,显著提升肺癌、前列腺癌等复杂亚型判别精度与可解释性,推动AI从“看见”走向“理解”诊断逻辑。

178 2
|
15天前
|
机器学习/深度学习 数据采集 安全
|

大模型应用:联邦学习融合本地大模型:隐私合规推荐的核心流程与实践.62

本文探讨联邦学习与本地大模型(如Qwen1.5-1.8B)融合的推荐方案:在数据不出域前提下,通过加密参数协同训练,破解隐私合规与推荐精度的矛盾,实现“数据可用不可见”,已验证可显著提升稀疏数据门店的推荐准确率。

136 15

千问大模型

阿里云自主研发的千问大模型,凭借万亿级超大规模数据训练和领先的算法框架,实现全模态高效精准的模型服务调用。https://www.aliyun.com/product/tongyi

1
今日
1872
内容
8
活动
1286
关注
你好!
登录掌握更多精彩内容

相关产品

  • 大模型服务平台百炼