工业大数据是中国制造的伪命题丨无知识不数据 精益数据时代

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

工业大数据在中国是伪命题

大数据本来有更加学术化的名称:数据密集型(Data-Intensive)计算研究。微软在2009年组织撰写《第四范式:数据密集型科学发现》一书,给与这种方法以“范式里程碑”的待遇。而对于大众而言,这些不过是野地径自升起的炊烟,无人知晓也无可关注。

后来随着Big Data这个简洁明了的概念一炮打响,各种大数据这才迎风而上。

工业大数据不过是其中一种BigBang。工业4.0轻松地接过这一闪亮的火把,搅动了人们对于大数据无穷的想象力和不着边际的信心。数字设计、数字工厂、数字制造等一时间喧嚣而上,难免给人造成一种温暖的假象:到处都是工业大数据。有些舆论甚至断言,中国拥有全世界最大的工业大数据——大概理由是因为中国有最多的设备和工厂现场。

然而,且慢,数据现场,远非工业大数据之地。

中国真的有工业大数据吗?

贵阳大数据中心,以政府主导型的数据为基础,基本是城市数据、政务数据、物流数据等;阿里云是以消费者数据为基础,十多年淘宝历程,沉淀了大量的用户行为数据。

但是,对于那些不分昼夜轰鸣的设备,工业数据仍然是暗无天日的黑油、黑煤炭。对中国制造业而言,些许的光亮或闪烁,远没有到大规模发光发热的时代。更为重要的事情,还需要工业领域去优先解决。

不是煤炭创造了工业革命

对于第一次工业革命的发源地,煤炭在英国发挥了巨大的作用。1700年,英国煤产量是世界其他地区的5倍;1800年,是欧洲其他地区的5倍。

然而,谜团犹在,英国拥有煤炭,好像是该国逃离农耕陷阱的根本要素。但与此同时,德法日和清朝,都有大面积煤田,却未得到大规模的开采。煤炭与工业革命的关系值得明辨。

实际上,这不是一个煤炭创造了工业革命的问题,而是工业革命创造了煤炭需求的问题。

换言之,英国煤炭工业的飞速发展,只是财富和技术已经到达高水平的一个征兆。

煤炭对于英国第一次工业革命的战略意义,此刻正如工业大数据之于中国制造2025。由于蒸汽机的驱动,煤炭犹如脱缰之野马,成为工业革命源源不断的动力。正如一把复杂钥匙吻合一把锁,这种类似的模式,第一次将人力一劳永逸地解脱出农耕时代。工业根基肇始。一段时间后,这个开锁程序被世界模仿,并且换成石化燃料和内燃机。

这一模式,影响了随后二百多年的工业史。

图1 煤炭与工业大数据的对比

随着智能制造的发轫,看上去这个模式,马上就要交给了工业大数据。而此刻,我们必须意识到,数据对于新工业革命的意义,尤其是对于中国制造2025的意义,是一种全新的密码锁模式——中国工业化还并不太熟悉的一种模式。

无数据 不知识

数据、信息和知识的关系,有时候容易混淆。大致而言,数据最开始都是未经组织的,大量存在却价值极低;底层的数据需要通过信息化和工业化,才能转化为知识体系。

从数据到信息,本身就是一种过滤机制——这需要一种提炼,然后可执行、可传递的信息形成知识。知识分为隐性和显性,隐性知识往往存在于人本身之中,传递性很差。

图2 数据、信息和知识的模型

可惜的是,传统知识管理的DIK模型(Data-Information-Knowledge)关系,是一个单线程关系。它只解决了知识的提炼,没有解决回馈问题。

就工业大数据而言,最重要的就是对它进行密集型的分析——工业知识断不能缺位。GE在谈及工业互联网的时候,给与了“专业知识”以高度的重视。工业大数据不是传统的数据统计分析,而是基于专业知识的引导,才能挖掘出数据真正的价值。

显然,知识体系必须重新作用于数据本身,才能形成工业大数据的价值。在工业领域,“无知识,不数据”。没有工业经验的线性化指引,数据就不会高速转化,工业大数据的价值,就不会产生。

对于数据而言,信息化作了第一次提升,使得数据归类、文本化和沉淀;但必须通过工业化才能进行第二次提升,才能将数据提升到知识的高度,形成真正的Know-how、经验、最佳实践、直觉;在此基础上,挖掘形成大数据的新产业价值。

图3 工业大数据与知识的关系

如果数据是石油,设备是藏宝地图,那么知识是唯一的钻探工具。

中国工业技术体系没有形成线性化,尚无法形成驱动力。那些数据深藏在设备里,深锁在系统中,它们只在规定的范围局部流动,一如地表下的熔岩。它们有着澎湃的能量,却无法驾驭。

就此而言。中国就没有工业大数据。甚至连显性化的工业数据都没有。我们工业化短短的行程,使得我们习惯于硬件思维和设备思维,还没来得及形成珍惜工业数据的意识。对那些有着厚重的工业技术体系和知识转化的GE、西门子而言,当他们在说工业大数据的时候,他们有着一个我们很多企业没有的隐含条件。

这是我们需要有的清醒意识:不要将无数的现场数据等同于工业大数据。

就中国制造业而言,知识才是最大的拦路虎。工厂中各种数据,如果没有领域知识和业务建模的前提,不过满工厂堆砌起来的一座座数据垃圾山。

对于企业而言,必须静下心来想一想:数据何在?知识何在?这是一种全新的范式,我们并不熟悉它:工业大数据模式,需要先看懂密码锁规格,再去找钥匙。

精益数据观 斩除数据浪费

两化融合走了十年之路,给中国制造业培养了一批工厂级的IT人才。就中国整体而言,许多企业的信息化水平并不低;但知识化和工业数据,则处于非常低的价值链。受各种信息孤岛的影响,数据被捆绑了,犹如被深嵌在花岗石上的钻石,数据处于高度不流动性。不流动的数据,不太可能发挥工业大数据的价值。

过去几十年,中国制造市场不知疲倦地耗资引进各种设备自动化——一种自由购买的商品,一种吞噬数据的黑洞机器;中国工厂也略知皮毛地、半推半就地引进了精益思想,它的烙印还没来得及成为我们血液中的自由元素。

而此刻,全新的数字化技术却已经来到身边,成为我们必须面对、必须应答的时代拷问。

新的浪费,正在形成。

中国的工厂必须用知识来解放数据。中国制造者们,此刻必须开始意识到,我们最熟视无睹的“数据浪费”, 已经成为一种新的触目惊心的挥霍。这是一种可怕的工业无知。它如一只令人生厌的乌鸦,站在设备的控制板上,嘲笑着我们在设备上所做的大把大把的投资。

图4 工业大数据的价值观

就设备的效率而言,我们需要设备自动化;

就资源的浪费而言,我们需要精益生产观;

就数据的效率而言,我们需要知识自动化;

就数据的浪费而言,我们需要精益数据观。

从工业大数据的角度,中国制造业尚处于数据的黑金时代。

在当下,工业大数据还是中国制造业的伪命题。

正是此刻,数据与知识的关系,更加耐人寻味。在这样一个i额时代,所有企业都将逐渐意识到数据的重要性。但如何能够完成数据的解放,将数据释放出来,仍然需要穿过“无视知识”的认知障碍,仍然需要借助大量的专业化知识。这是中国两化深度融合过程中,工业化必须单独回答的命题。

如果我们忽略管理者深浅不一的见识和技术上互相标榜的流派,那么工业4.0时代的所有命题,其实只有两个:数据和用户。所有的障眼法都由此而来。

而工业知识的显性化、模型化和固化,则是破解数据障眼法的唯一之道。


本文作者:佚名

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6天前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
51 7
|
6天前
|
存储 分布式计算 大数据
大数据 优化数据读取
【11月更文挑战第4天】
17 2
|
19天前
|
数据采集 监控 数据管理
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第26天】随着信息技术的发展,数据成为企业核心资源。本文探讨大数据平台的搭建与数据质量管理,包括选择合适架构、数据处理与分析能力、数据质量标准与监控机制、数据清洗与校验及元数据管理,为企业数据治理提供参考。
64 1
|
13天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
34 3
|
13天前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
46 2
|
16天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
51 2
|
18天前
|
数据采集 分布式计算 大数据
数据治理之道:大数据平台的搭建与数据质量管理
【10月更文挑战第27天】在数字化时代,数据治理对于确保数据资产的保值增值至关重要。本文探讨了大数据平台的搭建和数据质量管理的重要性及实践方法。大数据平台应包括数据存储、处理、分析和展示等功能,常用工具如Hadoop、Apache Spark和Flink。数据质量管理则涉及数据的准确性、一致性和完整性,通过建立数据质量评估和监控体系,确保数据分析结果的可靠性。企业应设立数据治理委员会,投资相关工具和技术,提升数据治理的效率和效果。
49 2
|
20天前
|
存储 安全 大数据
大数据隐私保护:用户数据的安全之道
【10月更文挑战第31天】在大数据时代,数据的价值日益凸显,但用户隐私保护问题也愈发严峻。本文探讨了大数据隐私保护的重要性、面临的挑战及有效解决方案,旨在为企业和社会提供用户数据安全的指导。通过加强透明度、采用加密技术、实施数据最小化原则、加强访问控制、采用隐私保护技术和提升用户意识,共同推动大数据隐私保护的发展。
|
24天前
|
SQL 存储 大数据
大数据中数据提取
【10月更文挑战第19天】
49 2
|
1月前
|
NoSQL 大数据 测试技术
想从事大数据方向职场小白看过来, 数据方面的一些英文解释
想从事大数据方向职场小白看过来, 数据方面的一些英文解释
37 0