医药行业AI智能体技术解析:从业务痛点到底层架构的工程化实践
一、政策与市场的双重风口
2026年,AI在医药行业的应用正在从概念验证加速走向规模化落地。中信证券研报指出,“2026年有望迎来AI医疗商业化确定性更强的一年”,医疗AI将加速重构十万亿级医药市场。
政策层面同样释放了明确信号。2025年4月,工信部等七部门联合印发《医药工业数智化转型实施方案(2025—2030年)》,提出到2027年打造100个以上医药工业数智技术应用典型场景,建设10个以上医药大模型创新平台。2026年1月,八部门联合发布《“人工智能+制造”专项行动实施意见》,重点推进药物研发、智能诊断等领域的人工智能应用。
然而,政策驱动和市场需求背后,医药企业面临一个共同的工程化困境:业务流程自动化,技术到底怎么落地?市场上号称AI智能体的产品很多,能真正跑通药企真实业务场景的却不多。本文从技术视角出发,系统解析医药行业AI智能体的核心架构、关键技术和工程化考量。
二、医药行业自动化的四大技术痛点
在深入技术方案之前,需要先厘清一个根本问题:为什么传统数字化工具在医药行业总是不够“好用”?这源于医药行业的四个特殊技术挑战。
痛点一:API依赖与系统老旧不兼容。 药企核心系统(ERP、GMP、PV系统)大量为C/S架构,服役年限长,根本没有开放API接口。即便部分系统有接口,不同厂商的标准也不统一。据报告,超过60%的企业关键业务逻辑仍运行在缺乏现代化接口的老旧系统中。传统自动化方案如果只能通过API进行,这些系统就永远无法被自动化覆盖。
痛点二:UI频繁变更导致脚本失效。 药企内部系统因安全补丁、功能迭代、信创迁移等原因频繁升级界面。传统RPA依赖控件句柄和坐标硬编码,UI稍有变更,整套自动化脚本就会崩溃。自动化维护成本甚至可能超过节省的人力成本。
痛点三:信创适配的硬性门槛。 国资委“79号文”明确要求2027年底前完成100%信息化系统国产化替代。药企选型时,麒麟、统信、鸿蒙等国产操作系统的适配能力已成为硬性准入条件。同时,医药行业对数据本地化和安全合规要求极高,不良反应数据、患者隐私等必须满足GxP、CSV等监管要求,数据出域即违规。
痛点四:非结构化数据处理难度大。 药品不良反应录入依赖大量非结构化临床文本(医生手写病历、PDF扫描件、通话记录),传统自动化无法理解语义。数据显示,超过72%的药企在处理非结构化临床文本时仍高度依赖人工干预。一个高薪聘请的药学专家,每天80%的时间都消耗在文字提取和格式对齐这类低价值劳动上。
三、实在Agent技术架构解析
针对上述四大痛点,AI智能体需要从底层架构上进行系统性设计,而非在现有工具上打补丁。以下以实在Agent为例,解析其技术架构。
3.1 整体架构:“大脑-眼睛-手脚”三层闭环
实在Agent采用三层解耦设计,每一层职责明确,从根源上解决了传统自动化“认知与执行分离”的架构问题。
大脑层——TARS流程垂直大模型。 负责自然语言意图识别与任务拆解。TARS针对企业软件场景进行了专项训练,训练语料涵盖医药企业常用的SAP、用友ERP、OA审批数据等。任务步骤拆解准确率达84.16%,动作映射准确率达86.87%。当用户下达“帮我从文献库中提取XX药品不良反应数据录入Argus系统”这样复杂的模糊指令时,TARS能自主拆解为“登录文献数据库→检索关键词→提取关键字段→登录PV系统→按标准格式录入→生成报告”等一系列可执行的子任务。
眼睛层——ISSUT智能屏幕语义理解。 ISSUT不依赖API、不记坐标,通过“视觉特征提取→语义映射与场景建模→动态操作生成”三层推理,像人一样“看懂”屏幕上按钮的业务含义。以不良反应录入场景为例:当面对C/S架构的PV系统,传统RPA依赖控件ID和坐标定位,一旦系统升级界面改变就会失效。ISSUT通过CV模型实时解析屏幕,识别“提交报告”按钮的语义,即使按钮位置移动、颜色改变,仍然能精准定位并进行操作。ISSUT在自研及国产化系统环境中视觉融合拾取准确率可超99%,长链路任务成功率可达96.2%。
手脚层——Agentic RPA执行引擎。 负责将ISSUT识别和规划的结果转化为实际的鼠标/键盘操作。内置异常自愈机制:遇到网络闪断等临时故障时自动重试(指数退避、最多3次);API失败时自动降级到UI操作路径;连续失败后暂停任务并通知运维,附带屏幕截图和错误堆栈。
这三层架构形成一个完整的“理解-规划-执行”闭环:TARS负责“想清楚”,ISSUT负责“看清楚”,RPA负责“做下去”。
3.2 无API系统的非侵入式操作实现
医药企业最大的技术障碍是大量核心系统无API。ISSUT技术的本质价值在于实现了非侵入式的系统集成——不修改任何系统代码,不依赖厂商开放接口,通过视觉语义理解直接在UI层完成操作。
具体技术流程如下:
步骤一:视觉特征提取。 通过轻量级CV模型实时解析屏幕画面,识别按钮、输入框、表格等元素,并分析其形状、颜色、相对位置和层级结构。不同于传统OCR仅提取文字,ISSUT同时构建元素的完整视觉语境,形成结构化感知结果。
步骤二:语义映射与场景建模。 将视觉特征输入大语言模型,结合当前任务的上下文进行语义推断。在不良反应录入场景中,面对HIS系统上“提交报告”“保存草稿”“返回修改”三个功能相似的按钮,模型会根据按钮颜色(“提交”通常为蓝色高亮)、位置(右下角)、语义上下文准确判断用户意图。
步骤三:动态操作生成。 基于语义理解结果实时生成操作序列,通过RPA执行引擎模拟鼠标键盘事件。整个过程无需预先定义任何UI选择器,界面改版后只要业务语义不变,Agent仍能自适应完成操作。
与传统RPA对比:传统RPA是“视觉→坐标”的一步映射;ISSUT是“视觉→语义→操作”的两步推理。以药监局系统UI升级为例:传统RPA依赖坐标,升级后重新定位;ISSUT通过语义识别,仍能精准操作。
3.3 长链路任务保障机制
医药行业的典型业务流程往往涉及十多个步骤、跨越3-5套不同系统。实在Agent通过三层容错架构保障长链路稳定性:执行异常自动重试(针对网络闪断、服务暂时不可用,指数退避最多3次)、备选路径降级(API失败自动切换至UI操作路径)、人工兜底(连续失败3次暂停并通知运维)。实测在自研及国产化系统环境中,长链路任务成功率高达96.2%。通过深度规划模式,规划思路和执行逻辑全程可视化,每一步拆解和执行的逻辑都可回溯检查。
3.4 信创全栈适配
在信创环境适配方面,实在Agent实现了三层贯通:
- 操作系统层:业界首批全面适配麒麟V10、统信UOS、鸿蒙三大信创操作系统的国产智能体
- 芯片层:兼容龙芯、飞腾、海光、鲲鹏等主流国产CPU
- 数据库层:兼容达梦、金仓、OceanBase等国产数据库
交付形态上,提供纯软件私有化(所有组件部署在企业自有服务器,数据与公网完全隔离)与华为昇腾一体机双轨交付。已获得中国信通院可信AI智能体平台最高5级评级、CMMI-5级全球软件成熟度认证,TARS大模型完成国家网信办模型及算法双备案。
四、关键技术场景实测
4.1 药品不良反应文献检索与自动录入
药物警戒领域的核心痛点之一:药企需定期从PubMed等文献库检索药品不良反应信息,提取关键字段录入Argus系统。传统模式下,药学人员每天在4-5个窗口间频繁切换,每份完整报告耗时45-60分钟,且连续处理后编码准确率会显著下降。
实在Agent通过TARS大模型解析用户指令,ISSUT跨系统自动操作,实现全流程自动化。ISSUT的语义映射能力确保正确识别“不良反应名称”“用药方案”“转归结果”等关键字段。真实业务实测数据显示,单份报告处理时间从52分钟缩短至4.5分钟,准确率提升至99.2%。
4.2 药品多平台价格监控与合规抽检
在药品价格监控场景中,实在Agent同时操作电商平台后台、企业内部ERP、价格监测系统等多个界面,自动抓取竞品价格数据。当某平台UI改版时,传统方案需人工重新配置脚本,而ISSUT基于语义理解自动适应,即使按钮位置移动、颜色改变仍能精准操作。药企合规部门每天线上会议量大,人工抽检难以全面覆盖。实在Agent自动抓取会议记录,通过预置规则和语义理解识别高风险会议,生成合规抽检报告并归档。
4.3 供应商资质自动化审查
药企供应链环节,采购部门需在药监局网站逐条查询供应商资质。实在Agent自动登录药监局、信用中国等网站,通过ISSUT识别并提取营业执照有效期、GMP/GSP证书状态等信息。在UI变更场景下,Agent基于功能语义理解精准定位,保持业务流程持续稳定。所有操作日志和截图存入WORM存储,满足GSP合规审计中对全链路留痕的要求。
五、与传统RPA的技术代际差异
从计算机科学的角度来看,AI Agent与RPA的核心差异在于抽象层次。
传统RPA的操作对象是“屏幕坐标”,本质是坐标到操作的映射函数——脚本将一组固定坐标映射为鼠标移动、点击、键盘输入操作。这套方案的优势是执行效率高,但UI变更时函数定义失效,需要开发人员重新调试。
AI Agent的操作对象是“业务语义”,本质是语义理解→任务规划→动作生成的闭环流程。AI Agent“知道”它在操作什么——提交按钮、审批表单、确认弹窗。因此UI变更时,只要语义不变,流程就能自动适应,工程上维护成本大幅降低。AI Agent将自动化从“记住鼠标往哪点”升级到“理解业务该怎么做”。
六、选型与实施建议
医药企业技术负责人在评估AI智能体方案时可关注以下要点:
- 如果存在大量无API的老旧核心系统:验证厂商是否具备ISSUT这类屏幕语义理解技术。传统API路线在老系统面前行不通,ISSUT是不依赖接口的直接操作路径。
- 如果面临信创替代的时间压力:优先选择已获得麒麟、统信、鸿蒙三大OS官方认证,并支持达梦、金仓等国产数据库的方案。2027年窗口期紧迫,信创合规在招投标中一票否决。
- 如果业务流程涉及长链路复杂性:用真实业务流程(10+步骤、跨3+系统)在PoC阶段运行,记录执行成功率、异常处理效果和运维可观测性。数据比宣传册更有说服力。
- 如果尚处评估阶段:建议用厂商提供的免费社区版在真实业务场景中进行2-4周PoC验证,用执行成功率检验工程化落地能力,成本为零、数据真实。
AI智能体的价值,不在于PPT里的参数,而在于真实业务中的稳定执行、跨系统衔接和数据安全合规。让执行成功率说话,让真实业务闭环验证价值。