大咖丨昆仑数据陈晨:工业大数据真正要做的是智能分析和智能决策

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

“真正的大数据不是有了数据,把这些数据接入之后存起来就可以了,真正要做的事情是智能分析和智能决策,通过在两化融合的基础上构建的智能分析优化系统“工业大脑”,进行相应的智能决策。”

近年来,工业大数据逐渐从概念走向落地阶段,数据基础较好的一些细分工业领域,已经在利用新兴的大数据等技术创造价值。昆仑数据科技公司首席运营官陈晨阐述了大数据如何推动中国工业转型升级、产业变革,以及工业大数据的特点难点,行业中面临的挑战和实施路径。

4a7f229082911c757639bc1700759e81bb79e026

图:12月26日,清数大数据产业联盟与清华校友总会AI大数据专委会(筹)共同主办的清数思享会系列活动首次在天津武清举办。陈晨在会上做了相关分享。

大数据文摘对本次分享的精彩内容进行了整理,在不改变原意的前提下有删改:

工业革命的关键技术要素是工业大数据。各个产业大国都面临着从传统制造业向制造服务业转型的压力。美国的应对方法是工业互联网革命,德国提出实施工业4.0战略,我们国家提出“中国制造2025”战略规划。美国的工业互联网侧重于用互联网激活传统工业带动产业变革,关键是通过大数据的分析能力实现智能决策。德国4.0的本质是基于“信息物理系统”实现“智能工厂”标准化,”中国制造2025”战略将工业互联网和智能制造两者进行有机的结合。

面对新一轮的工业革命,要以信息化和工业化的深度融合为基础进行智能化升级。真正的大数据不是有了数据,把这些数据接入之后存起来就可以了,真正要做的事情是智能分析和智能决策,通过在两化融合的基础上构建的智能分析优化系统“工业大脑”进行相应的智能决策。这些智能分析与决策离不开原有的信息化系统和自动化系统的支撑,更离不开产生这些数据的实体设备与装备。工业大数据的来源其中一部分是生产经营领域的数据,另外很大一部分则是生产设备和生产出来的高端产品与装备在运营过程中产生的机器数据。基于这些数据集成实体运行所在环境数据,在信息管理系统和自动化系统基础之上,构建具备智能分析优化能的大数据系统 ,达成提质、增效、降耗和控险的目的。

工业大数据可以分为三类,一部分是工业物联网数据,比如生产设备、智能产品、复杂装备24小时不断产生的数据。一部分企业信息化数据,同时还有很重要的一部分数据是外部跨产业链的数据,包括设备在运行过程中所处的环境数据,比如气象数据、地理数据、相应的环境数据,这三种数据合计才能称之为工业大数据。

工业大数据的挖掘就是把工业物联网数据与跨产业链数据以及企业信息化数据相结合,把分散在企业各个角落里的数据进行整合,挖掘这些数据融合所能产生的价值。

工业大数据的特点:多模态、高通量以及强关联

多模态。

在工业系统里数据种类、数据格式以及数据结构非常多,结构关系复杂。一个汽轮机里面会有上万个零部件,一个复杂装备的制造企业,它的数据种类多达三百余种,所以在工业领域里会存在数据多模态特征。

高通量。

即无论是生产设备还是智能装备有可能是24小时不间断产生数据的,我们以分、秒的频率采集数据,在很多应用场合甚至是毫秒级的数据。这些数据的数据量非常大,海量的设备与测点,数据采集频度高、数据吞吐总量大、数据的实时性要求高,呈现出工业大数据的“高通量”特征。

强关联。

真正做一个产品设计的时候,它涉及到学科与专业是非常多的,比如设计复杂装备的时候,不仅仅是涉及到结构分析,流体力学、声学、动力学、电磁辐射等等各个学科的数据都要进行关联。数据之间的“强关联”反映的就是工业的系统性及其复杂的动态关系。

基于工业大数据的特点,工业大数据的数据分析与消费互联网领域里的数据分析是有相当大的差别的。消费互联网大数据的分析对象更多的是以互联网为支撑的交互,工业大数据实际上是以物理实体和物理实体所处的环境为分析对象,物理实体就是我们的生产设备以及生产出来的智能装备及复杂装备。在商业数据里面关注数据的相关性关系,但是在工业领域里面一定要强调数据因果性,以及模型的可靠性,一定要提升分析结果的准确率才能把分析结果反馈到真正的工业控制过程中。

工业大数据面临的挑战

企业应用工业大数据面临的技术挑战。企业普遍面临数据基础薄弱的境况,企业收集的数据不够,甚至没有数据。企业真的要在数据转型有战略上的调整,它才会有较大的投入,如果它没有这种战略规划的时候,很难负担得起专业数据人才的成本。市场上也缺乏工业大数据所需的复合型人才。另外每个工业领域里都有独特的知识领域和机理形成的行业门槛,没有一个普适性的解决方案可以在工业领域里通用。行业解决方案,只会对某一个行业才能发挥相应的价值。

企业应用工业大数据面临的管理挑战。很多合作伙伴或者客户初期并不知道数据和业务问题之间怎么关联,怎么和业务结合都不清楚,不知道数据到底能不能解决业务问题。有的企业有应用工业大数据的愿景,但是业务与工业大数据的实施路径都没有统一。

大数据不仅仅是物联网数据采集与存储,包括数据的管理、分析与反馈,需要在数据生命周期内构建一个闭环系统,构建这个闭环需要一个过程,不可能一蹴而就。同时,大数据的应用会涉及到企业内部管理流程和经营理念的变革,工业大数据是把工业领域内三类数据进行融合应用,真正发挥大数据的价值的场景不仅是智能制造,同时也包括产业互联网里业务模式创新,所以相应的经营理念和管理机制都要发生变革。这是企业在管理方面面临的最大的挑战。所以有时候大家会看到,工业企业的大数据应用甚至都不仅是一个企业的CIO所能牵引的,这需要整个企业在战略层面去推动,要有明确的数据驱动的业务战略规划。

工业大数据的业务落地

通常来讲,在与企业规划工业大数据业务落地可以从两个维度与企业一同进行思考。一方面是从业务驱动角度来看,要思考企业的整体业务目标是什么,为了实现这个业务目标要做什么样的转型以及哪方面的能力提升,具体的业务提升和转型方向是什么;为了实现业务目标,理想的业务流程是什么,如何让这个流程跟数据流进行相应的结合和映射。这是一个由上而下的思考过程,是企业的高层管理者、战略管理者进行思考并牵引,通过中间管理层完善与丰富,最后落地实施的过程。很多时候大数据应用确实可以解决业务问题,但也可能解决不了所有的业务问题。大数据应用真正帮助企业的不仅仅是在于具体业务问题的解决层面,它是要让企业构建对数据驾驭的能力,当企业具备了这种能力后,才能够真正让企业在内部的生产管理、对外的经营模式上产生变化,真正形成持续的创新与应用的能力。

如何利用数据进行驱动。第一是去看现在手里有什么样的数据,这些数据从哪儿来,如果没有这些数据要怎么收集,以及这些数据的特点到底是什么,是时序数据、时空数据、智能产品产生的数据、生产设备产生的数据,数据量到底有多大;第二是对这些数据有了了解以后,这些数据怎么保存、管理、使用,另一个比较重要的则是数据质量怎么保证。第三是用什么样的系统、什么样的工具保证数据存储、数据管理、数据处理?同时这些数据到底如何进行集成、关联,不仅仅要把设备产生的数据拿来进行分析管理,还要在分析过程中关联周边的环境数据、地理数据等跨界数据。工业大数据价值实现的场景

工业大数据应用场景主要可以归纳为两个场景,一个是围绕制造全生命周期的业务创新即先进制造,通过大数据驱动的创新产品设计、智能制造、智能服务,实现“提质、增效、降耗、控险”,达到提升企业在行业内竞争力的目的;另一个是产业互联网新业务创新(制造+互联网):以智能联网的工业产品为载体承载服务产品周边生态系统的产业互联网业务,达到开创新兴市场和业务模式的目的。

工业大数据应用案例

工业大数据在工程机械领域应用案例。

工程机械设备大都在野外作业,作业环境恶劣,作业工况复杂。基于工程机械大数据解决方案实时监测设备状况,实现对设备的预防性维修及服务,在设备发送故障前,主动预警并触发维保方案, 基于设备运行状况大数据分析,为企业带来新的决策创新-助力企业准确判断市场热度、实现产品精准营销、产品改进和企业风险管控。

工业大数据在风电领域应用也体现出巨大的价值。基于工业大数据分析平台,从故障预警、运营优化等方面着手挖掘大数据价值,取得明显成效。风机的设计/仿真数据、运维档案、风机状态监测数据、测风塔观测数据、气象数据、地理信息等风电数据资源池统一整合到工业大数据分析平台,通过装备智能化、供应链协同、跨生态整合三条路径,逐步实践风电装备制造的数字化升级。在既有业务提质增效的基础上,进一步驱动产业互联新业务。


原文发布时间为:2018-01-08

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
436 7
|
2月前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
59 2
|
2月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
143 2
|
1天前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
10天前
|
存储 人工智能 数据管理
|
15天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
100 15
|
3天前
|
存储 人工智能 数据管理
媒体声音|专访阿里云数据库周文超博士:AI就绪的智能数据平台设计思路
在生成式AI的浪潮中,数据的重要性日益凸显。大模型在实际业务场景的落地过程中,必须有海量数据的支撑:经过训练、推理和分析等一系列复杂的数据处理过程,才能最终产生业务价值。事实上,大模型本身就是数据处理后的产物,以数据驱动的决策与创新需要通过更智能的平台解决数据多模处理、实时分析等问题,这正是以阿里云为代表的企业推动 “Data+AI”融合战略的核心动因。
|
21天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
20天前
|
分布式计算 DataWorks 搜索推荐
用户画像分析(MaxCompute简化版)
通过本教程,您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析,并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。
|
1月前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####