工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

工业大数据在中国是伪命题

大数据本来有更加学术化的名称:数据密集型(Data-Intensive)计算研究。微软在2009年组织撰写《第四范式:数据密集型科学发现》一书,给与这种方法以“范式里程碑”的待遇。而对于大众而言,这些不过是野地径自升起的炊烟,无人知晓也无可关注。

后来随着Big Data这个简洁明了的概念一炮打响,各种大数据这才迎风而上。

工业大数据不过是其中一种BigBang。工业4.0轻松地接过这一闪亮的火把,搅动了人们对于大数据无穷的想象力和不着边际的信心。数字设计、数字工厂、数字制造等一时间喧嚣而上,难免给人造成一种温暖的假象:到处都是工业大数据。有些舆论甚至断言,中国拥有全世界最大的工业大数据——大概理由是因为中国有最多的设备和工厂现场。

然而,且慢,数据现场,远非工业大数据之地。

中国真的有工业大数据吗?

贵阳大数据中心,以政府主导型的数据为基础,基本是城市数据、政务数据、物流数据等;阿里云是以消费者数据为基础,十多年淘宝历程,沉淀了大量的用户行为数据。

但是,对于那些不分昼夜轰鸣的设备,工业数据仍然是暗无天日的黑油、黑煤炭。对中国制造业而言,些许的光亮或闪烁,远没有到大规模发光发热的时代。更为重要的事情,还需要工业领域去优先解决。

不是煤炭创造了工业革命

对于第一次工业革命的发源地,煤炭在英国发挥了巨大的作用。1700年,英国煤产量是世界其他地区的5倍;1800年,是欧洲其他地区的5倍。

然而,谜团犹在,英国拥有煤炭,好像是该国逃离农耕陷阱的根本要素。但与此同时,德法日和清朝,都有大面积煤田,却未得到大规模的开采。煤炭与工业革命的关系值得明辨。

实际上,这不是一个煤炭创造了工业革命的问题,而是工业革命创造了煤炭需求的问题。

换言之,英国煤炭工业的飞速发展,只是财富和技术已经到达高水平的一个征兆。

煤炭对于英国第一次工业革命的战略意义,此刻正如工业大数据之于中国制造2025。由于蒸汽机的驱动,煤炭犹如脱缰之野马,成为工业革命源源不断的动力。正如一把复杂钥匙吻合一把锁,这种类似的模式,第一次将人力一劳永逸地解脱出农耕时代。工业根基肇始。一段时间后,这个开锁程序被世界模仿,并且换成石化燃料和内燃机。

这一模式,影响了随后二百多年的工业史。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图1 煤炭与工业大数据的对比

随着智能制造的发轫,看上去这个模式,马上就要交给了工业大数据。而此刻,我们必须意识到,数据对于新工业革命的意义,尤其是对于中国制造2025的意义,是一种全新的密码锁模式——中国工业化还并不太熟悉的一种模式。

无数据 不知识

数据、信息和知识的关系,有时候容易混淆。大致而言,数据最开始都是未经组织的,大量存在却价值极低;底层的数据需要通过信息化和工业化,才能转化为知识体系。

从数据到信息,本身就是一种过滤机制——这需要一种提炼,然后可执行、可传递的信息形成知识。知识分为隐性和显性,隐性知识往往存在于人本身之中,传递性很差。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图2 数据、信息和知识的模型

可惜的是,传统知识管理的DIK模型(Data-Information-Knowledge)关系,是一个单线程关系。它只解决了知识的提炼,没有解决回馈问题。

就工业大数据而言,最重要的就是对它进行密集型的分析——工业知识断不能缺位。GE在谈及工业互联网的时候,给与了“专业知识”以高度的重视。工业大数据不是传统的数据统计分析,而是基于专业知识的引导,才能挖掘出数据真正的价值。

显然,知识体系必须重新作用于数据本身,才能形成工业大数据的价值。在工业领域,“无知识,不数据”。没有工业经验的线性化指引,数据就不会高速转化,工业大数据的价值,就不会产生。

对于数据而言,信息化作了第一次提升,使得数据归类、文本化和沉淀;但必须通过工业化才能进行第二次提升,才能将数据提升到知识的高度,形成真正的Know-how、经验、最佳实践、直觉;在此基础上,挖掘形成大数据的新产业价值。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图3 工业大数据与知识的关系

如果数据是石油,设备是藏宝地图,那么知识是唯一的钻探工具。

中国工业技术体系没有形成线性化,尚无法形成驱动力。那些数据深藏在设备里,深锁在系统中,它们只在规定的范围局部流动,一如地表下的熔岩。它们有着澎湃的能量,却无法驾驭。

就此而言。中国就没有工业大数据。甚至连显性化的工业数据都没有。我们工业化短短的行程,使得我们习惯于硬件思维和设备思维,还没来得及形成珍惜工业数据的意识。对那些有着厚重的工业技术体系和知识转化的GE、西门子而言,当他们在说工业大数据的时候,他们有着一个我们很多企业没有的隐含条件。

这是我们需要有的清醒意识:不要将无数的现场数据等同于工业大数据。

就中国制造业而言,知识才是最大的拦路虎。工厂中各种数据,如果没有领域知识和业务建模的前提,不过满工厂堆砌起来的一座座数据垃圾山。

对于企业而言,必须静下心来想一想:数据何在?知识何在?这是一种全新的范式,我们并不熟悉它:工业大数据模式,需要先看懂密码锁规格,再去找钥匙。

精益数据观 斩除数据浪费

两化融合走了十年之路,给中国制造业培养了一批工厂级的IT人才。就中国整体而言,许多企业的信息化水平并不低;但知识化和工业数据,则处于非常低的价值链。受各种信息孤岛的影响,数据被捆绑了,犹如被深嵌在花岗石上的钻石,数据处于高度不流动性。不流动的数据,不太可能发挥工业大数据的价值。

过去几十年,中国制造市场不知疲倦地耗资引进各种设备自动化——一种自由购买的商品,一种吞噬数据的黑洞机器;中国工厂也略知皮毛地、半推半就地引进了精益思想,它的烙印还没来得及成为我们血液中的自由元素。

而此刻,全新的数字化技术却已经来到身边,成为我们必须面对、必须应答的时代拷问。

新的浪费,正在形成。

中国的工厂必须用知识来解放数据。中国制造者们,此刻必须开始意识到,我们最熟视无睹的“数据浪费”, 已经成为一种新的触目惊心的挥霍。这是一种可怕的工业无知。它如一只令人生厌的乌鸦,站在设备的控制板上,嘲笑着我们在设备上所做的大把大把的投资。

工业大数据是中国制造的伪命题 | 无知识不数据 精益数据时代

  图4 工业大数据的价值观

就设备的效率而言,我们需要设备自动化;

就资源的浪费而言,我们需要精益生产观;

就数据的效率而言,我们需要知识自动化;

就数据的浪费而言,我们需要精益数据观。

从工业大数据的角度,中国制造业尚处于数据的黑金时代。

在当下,工业大数据还是中国制造业的伪命题。

正是此刻,数据与知识的关系,更加耐人寻味。在这样一个i额时代,所有企业都将逐渐意识到数据的重要性。但如何能够完成数据的解放,将数据释放出来,仍然需要穿过“无视知识”的认知障碍,仍然需要借助大量的专业化知识。这是中国两化深度融合过程中,工业化必须单独回答的命题。

如果我们忽略管理者深浅不一的见识和技术上互相标榜的流派,那么工业4.0时代的所有命题,其实只有两个:数据和用户。所有的障眼法都由此而来。

而工业知识的显性化、模型化和固化,则是破解数据障眼法的唯一之道。

本文转自d1net(转载)

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2天前
|
存储 大数据 数据挖掘
【数据新纪元】Apache Doris:重塑实时分析性能,解锁大数据处理新速度,引爆数据价值潜能!
【9月更文挑战第5天】Apache Doris以其卓越的性能、灵活的架构和高效的数据处理能力,正在重塑实时分析的性能极限,解锁大数据处理的新速度,引爆数据价值的无限潜能。在未来的发展中,我们有理由相信Apache Doris将继续引领数据处理的潮流,为企业提供更快速、更准确、更智能的数据洞察和决策支持。让我们携手并进,共同探索数据新纪元的无限可能!
33 11
|
7天前
|
存储 分布式计算 大数据
MaxCompute 数据分区与生命周期管理
【8月更文第31天】随着大数据分析需求的增长,如何高效地管理和组织数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个专为海量数据设计的计算服务,它提供了丰富的功能来帮助用户管理和优化数据。本文将重点讨论 MaxCompute 中的数据分区策略和生命周期管理方法,并通过具体的代码示例来展示如何实施这些策略。
31 1
|
13天前
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段
数据平台问题之在数据影响决策的过程中,如何实现“决策/行动”阶段
|
16天前
|
存储 监控 安全
大数据架构设计原则:构建高效、可扩展与安全的数据生态系统
【8月更文挑战第23天】大数据架构设计是一个复杂而系统的工程,需要综合考虑业务需求、技术选型、安全合规等多个方面。遵循上述设计原则,可以帮助企业构建出既高效又安全的大数据生态系统,为业务创新和决策支持提供强有力的支撑。随着技术的不断发展和业务需求的不断变化,持续优化和调整大数据架构也将成为一项持续的工作。
|
19天前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
25天前
|
消息中间件 数据采集 JSON
大数据 - DWD&DIM 行为数据
大数据 - DWD&DIM 行为数据
32 1
|
7天前
|
分布式计算 安全 大数据
MaxCompute 的安全性和数据隐私保护
【8月更文第31天】在当今数字化转型的时代背景下,企业越来越依赖于大数据分析来推动业务增长。与此同时,数据安全和隐私保护成为了不容忽视的关键问题。作为阿里巴巴集团推出的大数据处理平台,MaxCompute(原名 ODPS)致力于为企业提供高效、安全的数据处理解决方案。本文将探讨 MaxCompute 在数据安全方面的实践,包括数据加密、访问控制及合规性考虑等方面。
24 0
|
1月前
|
机器学习/深度学习 人工智能 分布式计算
理解并利用大数据的力量:解锁数据背后的价值
【8月更文挑战第7天】大数据已成为推动社会进步和经济发展的重要力量。通过理解并利用大数据的力量,企业可以解锁数据背后的价值,优化业务流程、提升决策效率和创新能力。然而,大数据应用也面临着诸多挑战和风险,需要企业不断学习和实践以应对。相信在未来的发展中,大数据将为我们带来更多的惊喜和机遇。
|
18天前
|
SQL 分布式计算 大数据
"揭秘MaxCompute大数据秘术:如何用切片技术在数据海洋中精准打捞?"
【8月更文挑战第20天】在大数据领域,MaxCompute(曾名ODPS)作为阿里集团自主研发的服务,提供强大、可靠且易用的大数据处理平台。数据切片是其提升处理效率的关键技术之一,它通过将数据集分割为小块来优化处理流程。使用MaxCompute进行切片可显著提高查询性能、支持并行处理、简化数据管理并增强灵活性。例如,可通过SQL按时间或其他维度对数据进行切片。此外,MaxCompute还支持高级切片技术如分区表和分桶表等,进一步加速数据处理速度。掌握这些技术有助于高效应对大数据挑战。
32 0
|
24天前
|
消息中间件 大数据 Kafka
大数据 - DWD&DIM 业务数据
大数据 - DWD&DIM 业务数据
30 0

热门文章

最新文章

下一篇
DDNS