嘉宾介绍:
王建民,数据科学研究院副院长、清华大学软件学院党委书记兼副院长。国家支撑计划制造业信息化科技工程专家组成员;国家863计划先进制造技术领域专家组成员;国家重大科技专项“核高基”基础软件方向实施专家组成员;中国计算机学会大数据专委会委员、数据库专委会委员。
演讲全文:
中国的第一本大数据书有一句话:“除了上帝,都要用数据说话”。后来我琢磨为什么说用数据说话,而没有说用大数据说话?恐怕用大数据说话您就听不懂了。所以大数据未必是好事。其实大数据不是我们追求的一个目标,我们是要治理它、利用它。所以可能用数据更好。
在今天,大数据更多意味着是一种数据思维,是用数据来理解问题,而不追求它的大或者小。另外大数据又应用在各行各业,所以韩院长给了我这个题目之后我又加上了“工业”,在第二产业当中我们怎么用数据。
这个源起是我个人参加了中国《中国制造2025》操作系统与工业软件的起草,去年的9月29号,我们又发布了绿皮书,把“云端”+“终端”工业大数据平台作为操作系统及工业软件方向未来两年发展的重点发展产品。12月7日清华大学牵头在中国工程院召开了工业大数据实施路径的研讨会。
今天我们讲的工业大数据和原来做的信息化怎么区别?今天有没有从汽车制造厂来的?制造企业对数据并不陌生,我们一直在收集数据、处理数据、应用数据,企业的信息化经过了三次浪潮,韩院长讲到大数据有一个观点,他会推演到托夫勒的第三次浪潮,信息化和大数据也是第三次浪潮,怎么划分?
上世纪的九十年代往前做的大部分都是企业内的信息化,所以那是第一次浪潮。九十年代以后,互联网在美国甚至席卷全球以后,其实先进企业已经开始讲了互联网化,我们今天讲的“互联网+”是国际龙头企业十年前做的事情,今天大家讲的工业变革、工业革命,第三次、第四次,可以统称为新一次工业变革,我非常同意刚才李院长的观点,其实也是美国哈佛大学的观点,就是以智能互联的产品为核心载体,而不仅仅是大家讲的通过互联网增值。
在这个过程当中,其实是IT到DT到了互联网时代,其实我们今天讲的是机器数据,基于变革之后的CT,其实是IT、DT的一个融合,是今天工业数据的一个特点。
所以这个和我们前面的很多技术都是一脉相承的,而不是横空出世的。同时在机器当中,大家做控制的,特别是流程行业的人一点都不陌生,叫有监控的控制和数据的采集(SCADA)。但是今天又有什么新的变化?变化就在于连接。
工业4.0、工业互联网,如果用一个词来概括,就是连接。把原来孤立的机器连接起来,把人和机器连接起来,把原来的企业连接起来,甚至把不同的行业连接起来,这就是跨界和连接的概念。
这个就是苦笑曲线与剪刀曲线,这个剪刀曲线就是生产性服务业的快速发展。这个横轴是一个国家的收入水平,这个在前面的报告当中也提过。为什么说大数据是新工业革命的一个驱动力?这个也不讲了,现在有很多的分享。
12月26号的时候,清华发起召开了一个“长城工程科技论坛”,想打造一个工程科技领域和香山论坛相媲美的平台。其中工程院周济院长做了主题演讲,特别针对智能制造讲了三个方面:智能产品、智能生产、智能服务。
其实智能产品就像刚才克强主任讲的一个,产品才是制造的核心。第二产业之所以成为第二产业,是因为有工业产品作为载体。否则就成了第三产业了。所以在刚才的剪刀曲线里,第二产业分化出来的产业是2.5产业,这个产业和第三产业不同之处就在于,它是以产品作为载体的一个新的增值服务、创造价值的产业,所以没有产品就没有真正的2.5产业或者真正智能制造转型的产业。
为了价值创造,中国要要在供给方面做出改革,大数据是转换动力的媒介。这个媒介是什么?左边是先进制造,右边是“互联网+”,怎么能加起来?核心是要有数据。要在数据空间里实现交互和融合。
这个微笑曲线和我刚才讲的苦笑曲线和剪刀曲线是不一样的,这个横轴是复杂装备的生命周期,前端是创造、研发,中期是使用。这个曲线是在传统制造业里的情况,加工制造环节非常非常能够产生利润,尽管今天仍然产生利润,但是没有那么丰厚了。真正的创造要在创造新的产品上,另外要探索新的业态。
这里我们要注意,中国是一个制造大国,更是一个使用大国,在使用过程当中抓过来的机遇,积累的知识,能不能使我们产品得到创造、创新?这给我们提出了一个大的问题。
讲我们中国企业的一个例子。三一重工现在的大数据平台已经聚集了八千家的全球供应商,一百多个全球分支机构,四百多家的全球代理,有十二万个全球客户。他们是怎么用这个数据来产生价值的?
第一个方面是通过采集机器的数据,帮助上游的配件供应商实现精准生产,帮助他们搞清楚什么时候需要配件供应。第二件事情就是发展新的模式,即租赁。这里面要解决跑路的问题,恶意的借贷、购买的问题。
怎么样来创新他的产品开发?日本福岛核电站用的就是三一工的装备,能够实现遥控五公里之外的遥控装备,在这个过程当中用了装备操作数据来改进它遥控器的质量和稳定性。
在金风科技怎么样利用矫正风机偏航呢?风机上有一个测风仪,这个是解决风机对风的准确与否,因为长时间运行之后,这个测风仪会有偏差,这个偏差每天爬到塔上校正是很难的,因此就要通过数据的在线分析应用。
优化风机偏航,每台风机每年可以多发三万多元的电,现在有1.5万台风机,如果三分之一的风机存在误差,每年就是1.5亿的收益。还有像陕鼓动力,其用大数据延伸他的客户服务,大家也看到取得了很好的效果。上个月在工信部,全国智能制造的参会人员在陕鼓参观了一天,其实最后其工业大数据还是解决产品的问题。
我们团队是做软件的,要做工业大数据的平台,还是要给我们这些产业提供装备,提供武器的办法多种多样。对工业大数据来讲最重要的是什么?是解决工业的问题,同时要降低成本。我们说今天大数据的浪潮谁是主角?谁领风骚?是开源的代码、开源的软件。
去年九月份我到硅谷做了一次分享,有六千人参会,我们分享了两个案例。主办单位就是一个开源的社区,去的都是IBM、微软、思科这些大佬,因为这些开源的软件更接地气、更解决问题。
第一个问题其实就是在工业领域怎么把小数据和大数据融合起来,也就是说怎么样把汽车传感器的数据利用好,不仅仅是为了开车、打车,还要看怎么样和产品的制造、设计结合起来。
经过五年的努力,我们牵头撰写一个国家的标准正式颁布,其核心就是以产品结构为核心的跨产品生命初期和中期的数据集成框架。再一个就是大数据系统和小数据系统的融合问题,即怎么样把工业数据、产业数据再返回到原来的ERP、PLM、SCM系统当中的一个过程。
第二件事情,机器采集的数据某些时候是一个灾难,不要想我们采集的数据一定是有用的,很多数据不发生价值就是一堆垃圾、负担。重要的就是要给你的数据画像,一定要把你采集下来的数据是什么搞清楚。
最后分享一下工业大数据分析的挑战。刚才克强主任讲,从汽车人的角度来看智能汽车、自动驾驶汽车和“互联网+”看汽车是不一样的。其实互联网的消费大数据和产业大数据也不一样。我这里分享一点。
工业大数据分析结果的可靠性是一个最核心的问题,广告推荐能达到千分之二十的可靠性就是Google的最好水平,如果在工业领域千分之二十的可靠性你敢用吗?完全不敢用。所以在这个过程当中,还需要做数据和做产业的人结合起来,把我们的工业大数据、新能源交通大数据用好。
谢谢大家!
原文发布时间为:2017-03-15
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号