工业大数据的特征

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 简要描述工业领域的大数据特征。

定义:工业大数据即工业数据的总和,分成三类,即企业信息化数据、工业物联网数据,以及外部跨界数据。
空间分布:不仅存在于企业内部,还存在于产业链和跨产业链的经营主体中,如SCM、CRM。
产生主体:人和机器。人产生的数据如:设计数据、业务数据、产品数据。机器数据有生产设备(生产调度、质量控制与绩效数据)和工业产品(智能服务)

从数据流动的视角来看,数字化解决了“有数据”的问题,网络化解决了“能流动”的问题,智能化要解决数据“自动流动”的问题,即能够把正确的数据在正确的时间以正确的方式传递给正确的人和机器,能够把海量的工业数据转化为信息,信息转化为知识,知识转化为科学决策,以应对和解决制造过程的复杂性和不确定性等问题。

1、本质特征:具有复杂动态系统特性。确定性是工业系统本身有效运行的基础。应对不确定性的前提是感知信息、消除不确定性。
2、4V特征:大规模(Volumn)、速度快(Velocity)、类型杂(Variety)、低质量(Veracity)
所谓“大规模”,就是指数据规模大,而且面临着大规模增长。
所谓“速度快”,不仅是采集速度快,而且要求处理速度快。
所谓“类型杂”,就是复杂性,主要是指各种类型的碎片化、多维度工程数据,包括设计制造阶段的概念设计、详细设计、制造工艺、包装运输等各类业务数据,以及服务保障阶段的运行状态、维修计划、服务评价等类型数据。
所谓“低质量”,就是真实性(Veracity),相对于分析结果的高可靠性要求,工业大数据的真实性和质量比较低。

3、工业大数据新特征归纳为多模态、强关联、高通量等。
“多模态”:工业大数据是工业系统在赛博空间的映像,必须反映工业系统的系统化特征,必须要反映工业系统的各方面要素。数据记录必须追求完整。
“强关联”:工业数据之间的关联并不是数据字段的关联,其本质是物理对象之间和过程的语义关联。1)产品部件之间的关联。2)生产过程的数据关联。3)产品生命周期不同环节的数据之间的关联。4)不同学科不同专业的数据关联。
“高通量”:嵌入了传感器的智能互联产品已成为工业互联网时代的重要标志。物联网数据已成为工业大数据的主体。

4、应用特征归纳为跨尺度、协同性、多因素、因果性、强机理等几个方面。(“跨尺度”、“协同性”主要体现在大数据支撑工业企业的在线业务活动、推进业务智能化的过程中)
“跨尺度”:工业4.0 强调的横向、纵向、端到端集成,就是把不同空间、时间尺度的信息集成到一起。为此,需要综合利用云计算、物联网、边缘计算等技术。
“协同性”:工业系统强调系统的动态协同,工业大数据就要支持这个业务需求。我们进行信息集成的目的,是促成信息和数据的自动流动,加强信息感知能力、减少了决策者所面临的不确定性,进而提升决策的科学性。
“多因素”是工业对象的特性(复杂的动态系统)所决定的。
“因果性”源于工业系统对确定性的高度追求。为了把数据分析结果用于指导和优化工业过程,其本身就要高度的可靠性。
“强机理”是获得高可靠分析结果的保证。分析结果的可靠性体现在因果和可重复性,需要排除来自各方面的干扰。在数据维度较高的前提下,人们往往没有足够的数据用于甄别现象的真假。这时,领域中的机理知识实质上就起到了数据降维的作用,分析的结果必须能够被领域的机理所解释。

注:文章内容是学习《中国工业大数据技术与应用白皮书》过程中提炼。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
人工智能 分布式计算 大数据
大数据≠大样本:基于Spark的特征降维实战(提升10倍训练效率)
本文探讨了大数据场景下降维的核心问题与解决方案,重点分析了“维度灾难”对模型性能的影响及特征冗余的陷阱。通过数学证明与实际案例,揭示高维空间中样本稀疏性问题,并提出基于Spark的分布式降维技术选型与优化策略。文章详细展示了PCA在亿级用户画像中的应用,包括数据准备、核心实现与效果评估,同时深入探讨了协方差矩阵计算与特征值分解的并行优化方法。此外,还介绍了动态维度调整、非线性特征处理及降维与其他AI技术的协同效应,为生产环境提供了最佳实践指南。最终总结出降维的本质与工程实践原则,展望未来发展方向。
306 0
|
传感器 大数据 物联网
大数据类型与特征
【4月更文挑战第9天】大数据包含交易、人为、移动及机器传感器数据,特征表现为大量、高速、多样、可变、真实、复杂和有价值。它影响商业决策、市场分析和科学研究,展现巨大潜力。
526 3
|
NoSQL 物联网 大数据
【补充】助力工业物联网,工业大数据之AirFlow安装
【补充】助力工业物联网,工业大数据之AirFlow安装
182 1
|
Prometheus 数据可视化 Cloud Native
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
助力工业物联网,工业大数据之服务域:可视化工具Grafana介绍【三十八】
346 1
|
存储 SQL Oracle
助力工业物联网,工业大数据之服务域:项目总结【三十九】
助力工业物联网,工业大数据之服务域:项目总结【三十九】
235 1
|
SQL Prometheus 监控
助力工业物联网,工业大数据之服务域:node_exporter插件【三十七】
助力工业物联网,工业大数据之服务域:node_exporter插件【三十七】
187 1
|
存储 Prometheus Cloud Native
助力工业物联网,工业大数据之服务域:Prometheus的介绍【三十六】
助力工业物联网,工业大数据之服务域:Prometheus的介绍【三十六】
291 1
|
Prometheus 监控 Cloud Native
助力工业物联网,工业大数据之服务域:服务器性能监控Prometheus及项目总结【三十五】
助力工业物联网,工业大数据之服务域:服务器性能监控Prometheus及项目总结【三十五】
168 1
|
分布式计算 资源调度 物联网
助力工业物联网,工业大数据之服务域:定时调度使用【三十四】
助力工业物联网,工业大数据之服务域:定时调度使用【三十四】
174 1
|
Oracle 关系型数据库 大数据
助力工业物联网,工业大数据之服务域:Shell调度测试【三十三】
助力工业物联网,工业大数据之服务域:Shell调度测试【三十三】
138 1

热门文章

最新文章