别再被误导了!一文讲透 MCP 与 Function Calling 的真实关系
AI圈热议MCP能否取代Function Calling?实则二者定位迥异:Function Calling是大模型的“决策层”,负责选工具、生成参数;MCP是后端与工具间的“执行协议”,统一调用标准。二者分属不同链路环节,非替代关系,而是协同互补的“黄金搭档”。
MCP 从入门到实战:让大模型真正「动手」
本文系统讲解MCP(模型上下文协议)原理与实战,厘清Host、Server、Tool角色分工,解析AI如何基于描述与Schema智能选工具,并提供可直连Cherry Studio的Python监控服务示例,助你让大模型真正“动手”。
变电设备故障远程专家指导:重构电力运维的价值体系
电力系统是国民经济“大动脉”,变电站安全关乎国计民生。传统故障处理依赖专家现场支援,存在响应慢、风险高、成本大、知识难传承等痛点。5G+AR+物联网驱动的远程专家指导系统,实现分钟级响应、实时AR标注、多端协同,大幅提升供电可靠性与作业安全性,降低运维成本30%-50%,并构建可沉淀、可复用的知识传承体系,推动电力运维迈向主动预防、集中管控、智能协同新阶段。(239字)
变电设备故障远程专家指导:重构电力运维的效率与安全边界
变电设备是电网“心脏”,其稳定关乎民生与经济。传统故障处理依赖专家现场支援,响应慢、风险高、资源缺。5G+AR+数字孪生赋能远程专家指导体系,实现分钟级响应、跨域协同、全程留痕。如广东电网2023年应用该系统,将山区变电站故障平均处理时长从7.8小时压缩至1.5小时;江苏某换流站台风抢修中,专家远程指导避险操作,零事故完成带电消缺。效率跃升、安全倍增、知识沉淀——智慧运维已来!(239字)
跨领域语义漂移的双视角量化框架:基于知识图谱邻居的Jaccard方法与跨域对齐的Word2Vec方法的系统比较与联合诊断
本文提供了轻量级、可解释的Jaccard方法与捕获细粒度语义的 Word2Vec对齐方法的系统对比,并通过结构 语义联合诊断框架将“是否漂移”提升到“如何漂移”。该框架无需大规模语料、可直接迁移至其他医学或跨学科研究领域,为实现“可计算元认知”提供了数据驱动的语义桥接工具。 关键词:语义漂移;跨学科对齐;Jaccard 相似度;Word2Vec;可计算元认知;知识图谱
AR 巡检:重塑工业运维的数字革命
2026年,AR巡检加速规模化落地,通过SLAM定位、AI识别与5G协同,实现“所见即所得”智能运维。显著提升电力、化工、制造等行业的安全性(事故率降60%–80%)、巡检效率(时间缩短50%–70%)及预测性维护能力,推动运维向数字化、知识化、服务化转型。(239字)
CHI-Bench 开源:75 个美国医疗长程工作流压测 30 个前沿 Agent,最强 Claude Code 仅过 28%,端到端医院–保险工司协作直接归零
actAVA.ai联合约翰霍普金斯等20余家顶尖机构发布CHI-Bench——全球首个面向医疗长程工作流的Agent评测基准。覆盖处方授权、服务管理、护理管理三大领域75个真实任务,含21个医疗应用、200+工具及1279份运营手册。30个主流Agent在严苛指标下最高仅完成28%任务,端到端协作通过率为0%,凸显当前医疗AI能力瓶颈。
AgentScope 2.0 发布:从"跑通 Demo"到"稳定落地",构建可靠智能体的工程底座
AgentScope 2.0 聚焦智能体真实场景落地,以“稳定运行、安全控制、灵活接入”为核心,升级模型容错、事件流式响应、细粒度权限管理、结构化上下文、Middleware扩展机制、Workspace环境抽象及服务化部署能力,打造可观察、可干预、可信赖的智能体工程底座。
Claude Code 在大型代码库里的工程实践
Anthropic 发布Claude Code大型代码库最佳实践:强调“代码库需适配AI”,而非仅依赖模型。核心在于通过CLAUDE.md分层文档、LSP符号导航、hooks自动维护、skills按需加载、MCP接入内部系统等工程化配置,让Claude高效理解复杂项目(含C/C++/Java等)。配置即能力,治理与负责人机制同样关键。
AR 巡检技术重塑教育培训:从理论灌输到沉浸式技能养成
在工业4.0与数字经济深度融合背景下,AR巡检培训正破解传统巡检“重理论轻实操、高危场景难实训、成本高、评估粗放”等痛点。通过AR眼镜叠加三维数字孪生模型与智能引导,实现虚实融合的沉浸式教学。如国家电网AR高压巡检系统、中石化炼化装置AR故障模拟平台已落地应用,培训效率提升40%,事故率下降65%。(239字)
AR 巡检:能源行业数字化转型的核心引擎 | 瑞丰宝丽XR云平台
2026年,AR巡检技术已成能源行业标配:通过AR眼镜实时叠加设备数据、故障预警与三维指引,实现高危区域远程巡检、漏检率降至1%以下、单次作业提速50%,并破解经验断层难题。安全提效、降本增智,驱动能源运维迈向预测性维护新时代。(239字)
【重磅】SceneEngine V3.5 场景驱动的AI编程范式
本文揭秘OODER A2UI提出的场景驱动AI编程范式:通过三层闭环架构(对话层记忆场景、知识层分层路由、Agent层协作编排),解决传统AI“失忆”、知识混淆与误路由三大断层,推动AI从问答机器跃升为具备场景感知、专业认知与协同能力的“架构师”。
Is Grep All You Need?Agent 搜索里,Harness 比检索方法更重要
本文解读PwC AI团队论文《Is Grep All You Need?》,聚焦Agent搜索中grep与向量检索的实效对比。研究发现:在长对话检索任务中,grep常优于向量检索,但效果高度依赖Agent Harness(运行环境)及工具返回方式(inline/file-based)。论文揭示——Agent搜索是系统工程,非单点技术问题。
OpenAI 工程师使用 Codex 的 7 个场景
OpenAI内部深度应用Codex提升工程效能:用于代码理解、重构迁移、性能优化、补全测试、加速开发、专注提效及方案探索七大场景,并总结出Ask先行、环境配置、结构化提示等最佳实践,赋能工程师高效完成可验证、可评审的工程任务。
周一上线|Claude Code 有了避坑指南,GitHub 内部仓库遭未授权访问
本周AI/开发者圈“工具与玩具齐飞”:Cursor、Warp、Codex、Qwen等密集升级;Google开源Agent Runtime,Perplexity发布安全扫描器;老式钻床变游戏手柄、耳机成陀螺发射器、3D猫追鼠标等创意玩出花。
AR+AI 融合技术在工业行业的价值与技术体系 | 瑞丰宝丽XR云平台
AR+AI工业融合技术是工业4.0迈向5.0的核心引擎,通过空间计算与人工智能深度耦合,实现物理与数字世界实时交互。2026年已规模化落地于电力、石化、轨交等领域,具备智能巡检、远程协作、技能培训等六大功能,显著提升效率、安全与知识传承能力。(239字)
增强现实技术重塑电力行业 | 瑞丰宝丽XR云平台
2026年,AR技术在电力行业规模化落地,深度赋能“源网荷储”一体化。覆盖巡检、培训、应急、建设全场景,运维效率提升45%+,事故率下降72%,缺陷识别准确率达98%。轻便AR眼镜实现“问题找人”、专家远程指导、数字孪生协同,正加速电力智能化与无人化演进。(239字)
做共享目录实时同步,踩过这些坑
本文详解使用 Java WatchService 实现共享目录实时同步的完整方案,对比轮询弊端,解决递归监听、事件漏报、重复触发、重启丢事件等核心问题,通过事件防抖、目录兜底扫描、快照比对补偿机制,实现稳定的 RAG 知识库文件自动同步,梳理生产落地全程踩坑细节与最佳实践。
保密检查在本项目中的总体链路:从按钮到任务清单:免费开源的文档编审软件WPS AI插件.察元AI 文档助手
本文详解保密检查功能在项目中的完整链路:从Ribbon按钮触发(id=analysis.security-check),到结构化JSON提示、上下文敏感研判(含高/中/低风险分级规则),再到Markdown摘要解析与命中片段精准抽取,全程聚焦技术实现,不替代法定密级鉴定。
在 AMD ROCm DSW 上部署 Qwen3.6-27B-FP8:vLLM、MTP 解码加速与小并发压测
本文记录一次在 ModelScope DSW AMD GPU 实例上完成的 Qwen3.6-27B-FP8 推理实践。实验重点不是单纯证明模型可以启动,而是围绕 vLLM ROCm 服务、Qwen MTP 投机解码、near-8K 长上下文正确性验证、FP8 KV cache 和小并发 serving 压测,整理一套可复现、可复查、可继续扩展的 AMD GPU 大模型推理 baseline。
Claw-Eval开源:300个真实任务,端到端评测AI智能体的完成度、安全性与鲁棒性
Claw-Eval是面向自主Agent的端到端评测框架,突破“只看结果”局限,聚焦任务执行全过程——可追溯、合规、容错。基于300个人工验证的真实任务,从完成度、安全性、鲁棒性三维度评估14个前沿模型,开源数据集、排行榜及代码。
AR 巡检在工业中的应用 | AR巡检运维
AR工业巡检融合增强现实、AI与物联网技术,将设备信息、操作指引、风险提示虚实叠加于现场,实现“所见即所得”。相比传统人工巡检,显著提升效率(提速30%-50%)、降低误检率(↓70%+)、减少停机损失(↓70%)、保障高危作业安全。已广泛应用于电力、石化、轨交、数据中心及冶金矿业等领域,是工业4.0时代智能运维的关键基础设施。(239字)
在 AMD ROCm DSW 上跑通 DeepSeek-V4-Flash:vLLM 兼容部署、长上下文验证与 8K 性能扫参
本文记录一次在 ModelScope DSW AMD GPU/ROCm 环境中部署 DeepSeek-V4-Flash 的工程实践:通过 vLLM、ROCm/AITER/PyTorch fallback 与兼容补丁建立可复现 baseline,并用短问答、2K/8K/32K needle retrieval 和 8K top-k 扫参验证正确性与性能边界。
蚂蚁百宝箱正式发布AI构建能力:自然语言一键生成企业级智能体,助力业务创新提效
5月21日,蚂蚁百宝箱上线全新AI构建能力,支持自然语言一键生成智能体、营销活动与场景化Skill,深度融合行业资产与工程化能力,零代码、高可用、可交付。新用户注册即赠海量tokens,速体验!
理解 KV Cache:LLM 推理为什么能越写越快
LLM生成时首token慢、后续快,源于推理的两阶段:Prefill(全量计算prompt,建KV Cache)耗算力;Decode(逐token生成)复用缓存的Key/Value,仅需轻量计算。KV Cache以显存换速度,是实现流式输出的核心机制。
Open Code的部署以及API调用教程
OpenCode AI 是一款开源AI开发工具,支持快速集成各类大模型。只需三步:1)全局安装 `npm install -g opencode-ai`;2)配置 `opencode.json`(含Canopy Wave等API密钥);3)运行 `opencode` 命令,通过 `/connect` 连接模型,即刻开始智能编码。
AR 工业巡检技术详解与企业推荐
AR工业巡检融合增强现实与物联网技术,通过空间定位、虚实叠加、远程协同,实现设备巡检可视化、标准化、智能化。显著提升效率30%-50%,降低误检率与培训成本,已广泛应用于电力、石化、轨交等领域。(239字)
做一个 review-first 的企业 AI 项目,想征集真实业务场景
Helm 是聚焦企业AI落地的开源项目,打造企业经营控制单:将企业内部会议/邮件/CRM等信号、生成建议,但所有关键动作(审批、外发、写回)必须人工确认。现诚邀20位伙伴贡献真实场景,共建边界清晰、安全可控的企业AI实践。
HiDream-O1开源:8B参数像素级统一Transformer
HiDream-O1-Image是HiDream.ai开源的8B参数像素级统一生成模型,摒弃VAE与分离文本编码器,首创UiT架构实现文本、图像、任务条件在共享token空间端到端联合建模。支持2048×2048高清生成、多镜头/多语言渲染、指令编辑与主体个性化,在GenEval等基准刷新SOTA。含50步未蒸馏版与28步Dev加速版,并集成推理驱动提示代理。
可计算元认知文本分析:癌症社会科学研究语义基线的构建与边界信号检测
本研究首次为癌症社会科学提供了可计算的语义基线,揭示该领域以不平等、社会决定因素与健康素养为核心的政策导向特征,并量化了不平等、歧视、健康素养等边界信号的学术覆盖率。相较于传统综述,本工作从“学科如何说话”的元认知视角提供结构化、可复现、跨学科对齐的计量基准,为健康公平监测、政策评估与跨领域协同提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症社会科学;健康不平等;文本分析
Google 的 IDE 演进小史
本文回顾Google IDE演进史:从工程师各用所爱(Vim/Emacs/IntelliJ/VS Code),到因超大规模代码库(google3)催生云端IDE Cider,再升级为融合VS Code前端的Cider V。其核心不是统一工具,而是以云化语言服务重构开发体验,将IDE升维为连接代码库、构建、审查与AI的工程杠杆。
LLM 训练能不能少跑一点?Nous Research 的 TST 方法
Nous Research提出Token-Superposition Training(TST),一种不改模型架构、分词器、优化器或推理形式的预训练加速方法:训练前期将连续token平均为“叠加token”并预测下一组token,提升单位算力的数据吞吐;后期切回标准自回归训练。实验显示,在10B-A1B模型上可达2.5倍训练加速,显著降低GPU小时消耗。
终端里跑 3D 老鼠,桌面窗口成摆锤;AI 大佬新公司估值百亿起
上周技术圈的信息挺杂,但有几条线索值得放在一起看。 一边,AI 产品继续往具体工作流里走:Claude Code 开始支持 Agent View,OpenAI 把 Codex 带到移动端;另一边,开发者社区继续整活:有人给 Claude Code 做实体旋钮,有人做 Claude 用量桌面仪表盘,还有人把终端做成能显示 3D 老鼠的玩具。
用好 Codex Goal,关键就这三步
Codex 新增 /goal 命令,支持目标驱动的Agent式循环:设定可量化目标(如“运行时间降20%且测试全通过”)、构建短反馈闭环、用PLAN/EXPERIMENTS等Markdown文件持久化记忆。三要素缺一不可,方能真正释放长任务自动化潜力。
书尖 AI 借力阿里云云端算力,打造全新智慧阅读学习模式
书尖AI是依托阿里云算力、搭载自研大模型的智慧阅读平台,整合1.2亿+正版学习资源,支持智能精读、双人有声共读、个性化文稿创作与语音配音,数分钟提炼全书精华,兼顾碎片化学习与深度研读,操作简洁、安全可靠。(239字)
实战分享:生产级AI Agents 7天内上线完成网站主页/域名/Agent Workflow/ 部署和出海打榜
实战分享: 从0到1的一周时间上线生产级AI Agent:Craftsman-Agent(一句话生成3D组装方案,支持乐高/Minecraft/特斯拉车衣设计)和CoachOwl(AI协同日程编排工具,支持目标管理、多Agent协作与自动任务调度),打榜均上线Product Hunt,技术栈涵盖Gemini/Qwen、FastAPI、3D渲染API及DeepNLP OneKey Gateway,部署于AI Agent A2Z 平台*.aiagenta2z.com,获得部署托管网站和子域名。
日抛型软件的双链路设计——从"日抛"到"认知进化"的范式革命
本文提出AI时代“日抛型软件”新范式:日抛非终点,而是进化起点。基于AISTUDIO双线架构(Build链即时生成+Designer链持久沉淀),实现“双遗产”——参数权重持续优化(越用越懂用户)与领域知识动态沉淀(生成越来越专业),推动软件从消耗品跃升为认知引擎。(239字)
WeaveFox,个人创作者的 AI 应用助手
WeaveFox 是一款免费的 AI 驱动应用创作平台,2个月全新重构升级。无需代码,用自然语言即可生成可运行、可部署的全栈应用。支持灵感澄清、AI建站、技能扩展、云服务集成与团队协作,助力个人、OPC及非技术人员快速实现创意变现。
Ring-2.6-1T 正式开源:为真实复杂任务打造的万亿级思考模型
蚂蚁百灵开源万亿级思考模型Ring-2.6-1T,专注真实复杂任务场景。具备强Agent执行能力、可调high/xhigh推理强度、异步强化学习训练三大突破,已在代码生成、科研分析、企业自动化等长链路任务中验证稳定表现。
可计算元认知文本分析:癌症经济学语义基线的构建与边界信号检测
本研究首次为癌症经济学建立了可计算的语义基线,揭示该学科围绕费用 保险 财务负担的政策导向核心特征,并量化了自付费用、财务毒性、保险缺口等关键边界信号。相较于传统综述,本工作从“学科如何说话”的元认知视角提供了 结构化、可复现、跨学科对齐的计量基准,为卫生政策评价、资源配置决策以及跨领域对话提供了实证工具。 关键词:可计算元认知;语义基线;边界信号;癌症经济学;卫生政策;文本分析
一次 OOM 线上排查实录
老项目线上 OOM 踩坑实录!Druid 连接池 SQL 缓存泄漏 + 业务 SQL 拼接双重叠加导致内存溢出,通过堆 dump 定位问题,优化 Druid 配置 + 批量插入预防 OOM。