在碎片化工业场景中,有没有包打天下的AI模型?

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 一台风力发电机的叶片上刚刚出现了一处沿展向 0.5 米左右的雷击开裂,风电机组的预测性维护系统马上给风场运维人员发出了损伤和维修警报……

风机叶片是由复合材料制造而成,其结构比其他金属类机械部件更复杂。作为风机最重要的部件之一,它占了总成本的近 20% 左右。叶片雷击损伤开裂,是风机最常见的失效模式之一,在硕大的风机叶片上,一道不足 1 米的浅裂痕可能对风机叶片承载能力和机组安全造成严重的威胁。 这种昂贵设备的故障,在实际运行中虽然并不频繁,但风电叶片在运行过程中会遭遇多种复杂的物理环境,如风、雨、冰、雷电、高低温等。这些复杂的多重的物理环境,与复合材料材料自身的属性的特异性叠加,会产生不同物理效应,以致于很难简单识别(或者判断成本太高)故障是形成的过程,何时会发生显著的损伤,以及如何通过运维策略降低故障率。

微信图片_20211206114733.jpg


传统的工业生产,基于物理或化学的硬机理模型,经过几十甚至百年的生产验证,形成工业规程。在很多工业领域,工人可以根据过往经验人为判断何时需要检修和维护。而在新型工业场景中,数据驱动的工业 AI 模型可以在短时间通过机理融合数据驱动分析,迅速挖掘出导致故障的分析洞察,并且在运行过程中有效地把专家经验固化下来,优化原有模型或者形成新的模型。 风电场大多地处偏远地区,一些风场甚至建在一望无际的大海之中,每次运维都要带着备品备件翻山跨海。且不说出现停机、设备损坏的损失,风场为了保护设备、保证正常运行做的定期维修、维护,就要耗费巨大的人力、交通等成本,相应的设备 Know-How 知识沉淀就变得极有价值。 设备昂贵、损坏无规律、难预测、维护频率低但损坏影响大、维护成本高,是预测性维护的典型应用场景,风电设备可以说完全符合这些特点。 作为工业 AI 在现阶段的头号应用,基于 AI 分析的预测性维护,可以在工业生产流程中实现精准管控,最小化停机、停产时间,大幅减少资源、产能浪费。 

微信图片_20211206114736.jpg


然而不同工业场景对数据采集、AI 模型和行业 Know-How 的需求大不相同。在很多场景的维修过程中,只有那些常年奔赴在一线运维现场的老师傅,才能依靠自己的经验找到原因。空有传感器、数据平台和 AI 算法做不出真正落地的工业 AI。


有 Know-How 才有智能


据麦肯锡数据显示中国工业市场体量约有 106 万亿元,人工智能在工业领域的应用可以为工业节省 1% 以上的成本,以 AI 单个项目能为企业创造三倍的价值来计算,人工智能在工业领域的市场也至少有千亿之多。 Markets 的预测报告认为,2025 年人工智能制造市场规模将达 172 亿美元,预测期(2018-2025 年)内的年复合增长率为 49.5%。Automation Technology 则预测到 2035 年,人工智能对制造业增值占比可达 2.2%,排名社会 16 个主要行业之首。 在千亿市场蛋糕的诱惑下,工业智能市场一片繁荣,大大小小的工业技术、AI 技术、IT 技术供应商挤满了这条赛道。截止目前,中国工业互联网产业联盟已有的会员单位超过 1600 家,国内工业智能平台和应用数量在全球范围均占比颇高。 很多企业认为 IoT、大数据、人工智能这些背后的逻辑就是数据分析,To C 也好,To B 也好,工业也好,消费品也好,都是数据驱动技术,只要把数据采集和分析做好,就能得到放之四海皆准的「技术公式」。然而,工业智能与互联网的智能有着本质的区别。 在工业场景中 IT 与 OT,机械与电器、工艺之间,存在很深的鸿沟。例如,工业数据与商业 AI 的大数据不同,大多是模拟信号,并非数字信号,每个信号都有其背后的机理含义,收集数据以后要对数据进行处理才能应用。 「我曾经接触过一个企业,他的核心设备是一个 0.5 秒每次的往复机构,但企业最初建立的大数据系统收集的数据都是以 1 秒为单位的,这样的数据对于工业智能来说很难起到实际作用。」天泽智云 CEO 孙昕说,工业中要做精确的故障诊断往往要用到高频数据,包括声学信号、振动加速度等。通常采样频率足够高了以后,尤其针对旋转类机械部件,才能识别到故障早期的细微变化。而如果故障的早期没有细微变化表现,通常是无法诊断的。这样的场景,只用通用的 AI 分析思路和数据采集方法很难给客户创造实际价值。此外,对于工业 AI 来说大数据并非需要绝对的「大」。无论是预测性维护还是缺陷检测,只有出现「不正常」情况时的数据才是有效数据,因此工业界应用的大数据常被称为「Big Small Data」。风机发电机轴承的温度传感器显示温度过高时,工程师不能马上拆机检查;核电设备的主泵、管路振动故障,也很难实现停机深入探查。这意味着,算法建立之初拿到的训练数据,很难有准确而高质量的故障标签。在这些有效数据有限的场景中,就需要更多蕴含机理的数据。「强机理弱标签,弱机理多标签」,工业 AI 训练的过程中,更需要的是结合场景 Know-How,根据目标要识别的故障模式,采集与这些目标故障相关的数据。这些数据可能是高频振动、声音,也可能需要结合工况数据如转速、温度等针对实际问题的多维数据。为了给风机叶片做一套可行的、可规模化应用的预测性维护系统,作为工业智能公司老板的孙昕就专门招募了一群专注风电领域的产品经理、流体力学博士和叶片设计与运维专家。在风电专家和算法工程师的共同努力下,天泽智云推出了针对风电行业的智能化健康管理解决方案,并自主研发了融合智能算法的软硬一体化产品「叶片卫士™」。通过外加传感器监测叶片扫风声噪、本体振动、与结构应力数据,经过融合机理特征增强的 AI 分析判断结构开裂、前缘腐蚀、螺栓断裂等风险因子,利用专家知识融合各个因子判断不同故障类型,并及时进行预警。

微信图片_20211206114741.jpg


把风电叶片运维从依靠工人经验去「定性」分析转变成了依靠数据的「定量」分析,包括故障模式、故障等级、设备损耗风险程度等,为用户决策维修时机、制定维修策略提供量化依据,真正打通数据与决策之间的鸿沟,帮助用户降低运维成本。 


工艺经验沉淀与智能化升级


优化能源管理是工业人工智能的另一个重点应用领域。据不完全统计,大型工业系统正消耗着全球能源的 54%。冶炼企业是能源消耗大户,也是 AI 能源管理见效最快速的行业。 钢铁联合企业构成非常复杂,能效提升的推动过程会遇到各种困难。典型问题之一是煤气产用不平衡,而且每个工序的突发异常,都将影响整个管网压力的波动。 产用的不均衡可能影响正常的生产运营乃至不必要的浪费。比如说,煤气波动过大时造成燃烧效率降低,即使已投用自动燃烧系统的炉窑也很难达到经济区间。而煤气管网压力过高则导致煤气放散白白浪费,煤气压力过低会造成末端工序因生产条件无法满足而临时停产。这样不仅会造成巨大的经济损失,也会造成环境污染。 为解决这些问题,需要有效地协调煤气跨工序的协同调度,构建煤气智能平衡系统,为管理者提供数字化管理的抓手,为动力调度和一线操作员提供操作辅助决策建议从而提高工作效率。 山东某钢铁企业在工业 AI 技术的实践中,将高炉煤气智能平衡系统部署在各个分厂的集控室中,与生产密切配合。系统可以实时监测管网压力和各设备产用气波动,并通过智能模型的预测和计算,为一线操作员提供实时用气建议,使得各工序煤气的使用既能满足本工序的工艺要求,又能实现跨工序间的用气协同。 当发生异常情况时,系统也可以实时通知动力调度员和管网各工序操作员,实现更敏捷的调度响应。最后,系统也提供了对煤气波动的归因分析,帮助相关部门分析问题原因,持续改善。 煤气管网的智能调度系统利用机器学习算法建立高炉煤气产生的预测模型,可以对未来 4 小时煤气产生量曲线进行预测,同时对减休风(由于炉况异常造成的煤气发生量剧烈下降现象)事件进行预警。

微信图片_20211206114744.jpg


结合对煤气产生量和煤气总管压力的预测,首先保障关键用气工序的生产节拍稳定,如多个热风炉换炉节拍,避免由于生产节拍紊乱造成的管网压力波动。同时对异常的用气情况进行检测,将不按照规范使用煤气的操作在各个操作工序间进行广播,既对此类现象进行了有效地监督,还可以提醒各个工序对此类现象可能对自身生产带来的影响进行评估和预防。 最后,结合管网的压力趋势预测和异常事件的影响分析,对发电锅炉的用气调度指令进行决策建议,最终达到稳定压力的作用。 据估计,高炉煤气智能平衡系统预计将为该企业带来年化经济收益 2300 万元。与此同时,系统的标准化操作建议和异常问题追溯也为能效精细化管理提供了新的抓手,促进了系统与运营能力的持续成长。


「包打天下」的工业 AI 模型


上边讲述的这两个案例,只是工业领域「百业百态,千厂千面」的缩影。 「工业」二字包罗万象,其中包含的分支领域难以计数。每个分支都有各自不同的子场景,这些高度碎片化的场景中蕴含着各种各样完全不同的业务逻辑,每个逻辑又对应企业各自的痛点,不同工业领域之间需求的差异化完美地诠释了「隔行如隔山」。 行业的差异化需求给大量专业领域的小微企业创造了生存空间,但也使得今天的工业互联网行业出现了「平台林立,应用丛生」的景象。 即便是同行业,在不同的生产阶段,不同的工业设备也很难实现智能化平台的统一。以工业大厂的智能制造平台为例,西门子的 MindSphere 更擅长通过数字孪生对工业 PLC 进行优化管理;施耐德的 EcoStruxure 在电气化领域实现了基于主动控制的无人值守和可靠运维管理;ABB 的 Ability 则更擅长自动化设备、边缘端的一体化数字化能力。 每家工业大厂都希望能打造跨行业、跨领域的通用平台,从而扩大自己的客群和市占率。但在用户端,则更关注智能化应用的行业经验及与自身业务的契合度。 辛辛那提大学讲席教授李杰教授主导的美国 NSF 智能维护系统中心(IMS),针对工业人工智能的预测性分析维护提出,在传统的基于专家的规则和机理模型的基础之上,通过数据中蕴含的洞察建立工业 AI 模型。 基于不断累积新的知识,形成可以持续传承、迭代的模型和行业模板,并逐步构建成体系化的工业人工智能系统。利用大量的数据和自动化控制相结合,搭建可以从数据到知识再到执行的闭环。由此,工业智能开发者们正在差异化的行业和设备之间,寻找 AI 模型跨行业复用的可能性。 2020 年疫情期间,天泽智云的几个工程师带着叶片卫士背后声音识别的模型,做了个实验:参加了科大讯飞组织的 AI 开发者大赛。他们用判断风电叶片故障的声音算法中的可迁移模块,改造出了一款能够通过哭声判断婴儿情绪的 AI 模型,并赢得了声音识别算法比赛的第二名。 风电叶片和婴儿啼哭明显是两个天差地别的碎片化场景,虽然工业 AI 应用目前不存在包打天下的产品,但 AI 的算法模型可以通过参数修改和共性组件的迁移在相似的算法学习任务中实现复用。 从风电叶片到婴儿啼哭,其背后的 AI 模型迁移能力来自「模力工场」的 ModelOps 敏捷开发模式,工程师和行业专家可以在同一平台、同一套语言下工作。从了解需求、定义需求出发,构建跨领域、跨部门、跨阶段、跨环境的工业人工智能体系,从数据的采集与管理,到算法的设计、探索、验证,以及部署和监控,形成以模型为驱动的工业人工智能平台。 孙昕认为,「工业 AI 中,还没有出现放之四海皆准的模型,但可以通过大量实践经验抽炼出最高通用性的模型,从而实现跨场景跨行业的适用性。」 AI 模型复用,是结合行业经验,提取不同场景中的相似问题,通过优化调参实现场景间的迁移。就像汽车根据不同地形更换轮胎,切换驾驶模式一样。 这种复用和场景迁移也需要大量的行业知识积累,跨行业应用只是基础,在此之上,工业智能还要具备冷启动的能力。「在切换场景、切换设备、切换位置之后,不需要再去搜集大量的故障数据,算法工程师也不用再重头做模型训练,这样的 AI 才能满足工业应用的落地需求。」孙昕如是说。


生产「工业智能组件」的流水线


 工业领域最重要的是懂背景、懂机理,单纯地做采集数据、分析数据是没有意义的,工业应用的研发和实施过程中最大的痛苦是工业和工程的技术整合的过程。 工业应用要结合行业经验,但 IT 工程师和行业专家之间「语言不通」。孙昕认为,「让这些不同领域的团队融合到一起需要经历漫长的化学反应,因此工业智能需要由工业 + 工程双基因驱动的平台实现。」 让专注智能应用的 IT 技术公司把「千厂千面」的工业知识学个遍,这显然不切实际,因此把智能化技术赋能到应用企业中才是最佳方案。 「授人以鱼不如授人以渔,交付产品不是赋能的终点,而是起点。」孙昕认为,工业客户对人工智能的需求不只限于一款应用产品,而是应用 AI 的能力。「我们希望打造一套工业 AI 的基础设施。客户需要 AI,我们可以直接提供成型的 AI,但我们更希望把造 AI 的技术、生产线交给客户,让客户在遇到新的痛点时能自己去造 AI 模型,自己去解决问题。」 上文介绍的高炉煤气智能平衡系统是钢铁行业应用工业 AI 的典型项目,项目上线后的一年中,该山东钢铁企业持续对 AI 技术模型进行研究,采用与煤气平衡系统建设类似的方法论,深入挖掘生产部门需求,在系统上不断丰富功能,开发了更多环保指标监测、加热工艺分析的可视化工具,为各工序主操提供全方位的用气决策辅助。以煤气平衡系统为代表,数字化智能化生产的理念在该企业逐渐生根发芽。 工业智能平台的优势就是随着项目的增多,平台上积累的模型就会逐渐丰富,而这些模型就是工业智能应用中最宝贵的知识资产。随着针对通用设备的模型和算法不断积累,在每个碎片化场景中都能找到可以迁移复用的模型,平台也就更加通用,适应于更广泛的场景,最终根本性的解决碎片化问题,「今天看到的碎片化问题,将来一定没有这么多碎片化。」

微信图片_20211206114750.jpg



目前,天泽智云的大多数工业智能项目,一期工程只需要 4-6 个人的小团队,在 4 个月的时间内就能把一个从零开始的工业智能项目完全落地到企业中。 「虽然我们现在每天都会面对新的场景,但只要结合行业经验,把对的数据采集好,用我们沉淀的行业经验和算法模型去落地,很快就能看到效果。」孙昕说,与用户合作过程中,优先制定清晰的合作框架,确定要解决的问题。通常 AI 项目上线一年创造的价值,就能帮客户收回一期投入的成本。 工业 AI 虽然不像传统 C 端业务那样高速增长,但贵在稳定,且随着技术的逐渐成熟,应用的不断推广,市场将会越来越大。风电行业的后运维市场规模就超过了 300 亿,目前的年复合增长率是 25%,钢铁行业的能耗每年有 600 亿市场,化工也是几百亿。 「我认为坚定走工业 AI 这条路是没有错的。」自 2017 年以来,天泽智云的年平均增长接近 100%,对于工业 AI 市场的未来,孙昕很乐观。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
22天前
|
机器学习/深度学习 人工智能 并行计算
"震撼!CLIP模型:OpenAI的跨模态奇迹,让图像与文字共舞,解锁AI理解新纪元!"
【10月更文挑战第14天】CLIP是由OpenAI在2021年推出的一种图像和文本联合表示学习模型,通过对比学习方法预训练,能有效理解图像与文本的关系。该模型由图像编码器和文本编码器组成,分别处理图像和文本数据,通过共享向量空间实现信息融合。CLIP利用大规模图像-文本对数据集进行训练,能够实现zero-shot图像分类、文本-图像检索等多种任务,展现出强大的跨模态理解能力。
66 2
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
当语言遇见智慧火花:GPT家族历代模型大起底,带你见证从平凡到卓越的AI进化奇迹!
【10月更文挑战第6天】随着自然语言处理技术的进步,GPT系列模型(Generative Pre-trained Transformers)成为该领域的明星。从GPT-1的开创性工作,到GPT-2在规模与性能上的突破,再到拥有1750亿参数的GPT-3及其无需微调即可执行多种NLP任务的能力,以及社区驱动的GPT-NeoX,这些模型不断进化。虽然它们展现出强大的语言理解和生成能力,但也存在如生成错误信息或偏见等问题。本文将对比分析各代GPT模型的特点,并通过示例代码展示其部分功能。
101 2
|
14天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
35 4
|
23天前
|
人工智能 自然语言处理
从迷茫到精通:揭秘模型微调如何助你轻松驾驭AI新热点,解锁预训练模型的无限潜能!
【10月更文挑战第13天】本文通过简单的问题解答形式,结合示例代码,详细介绍了模型微调的全流程。从选择预训练模型、准备新任务数据集、设置微调参数,到进行微调训练和评估调优,帮助读者全面理解模型微调的技术细节和应用场景。
61 6
|
23天前
|
人工智能 自然语言处理 IDE
|
1月前
|
人工智能 自然语言处理 安全
【通义】AI视界|Adobe推出文生视频AI模型,迎战OpenAI和Meta
本文精选了过去24小时内的重要科技新闻,包括微软人工智能副总裁跳槽至OpenAI、Adobe推出文本生成视频的AI模型、Meta取消高端头显转而开发超轻量设备、谷歌与核能公司合作为数据中心供电,以及英伟达股价创下新高,市值接近3.4万亿美元。这些动态展示了科技行业的快速发展和激烈竞争。点击链接或扫描二维码获取更多资讯。
|
29天前
|
机器学习/深度学习 人工智能 TensorFlow
解锁AI潜力:让开源模型在私有环境绽放——手把手教你搭建专属智能服务,保障数据安全与性能优化的秘密攻略
【10月更文挑战第8天】本文介绍了如何将开源的机器学习模型(如TensorFlow下的MobileNet)进行私有化部署,包括环境准备、模型获取与转换、启动TensorFlow Serving服务及验证部署效果等步骤,适用于希望保护用户数据并优化服务性能的企业。
48 4
|
1月前
|
存储 数据采集 人工智能
数据湖面向AI场景的进化
对象存储OSS作为云上数据湖,被广泛应用在商业智能、数据决策、广告推荐等大数据分析的场景上。随着AI workload的不断增长,OSS数据湖也在随着workload的变化不断演进。
115 5
|
29天前
|
机器学习/深度学习 人工智能 自然语言处理
揭开模型微调Fine-Tuning的神秘面纱:如何在预训练基础上巧妙调整,解锁定制AI解决方案的秘密武器
【10月更文挑战第8天】模型微调是在预训练模型基础上,利用特定领域数据进一步训练,以优化模型在特定任务上的表现。此方法广泛应用于自然语言处理和计算机视觉等领域,通过调整预训练模型的部分或全部参数,结合适当的正则化手段,有效提升模型性能。例如,使用Hugging Face的Transformers库对BERT模型进行微调,以改善文本匹配任务的准确率。
53 1

热门文章

最新文章

下一篇
无影云桌面