【干货】王建民:大数据与智能制造

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

嘉宾介绍:


王建民,数据科学研究院副院长、清华大学软件学院党委书记兼副院长。国家支撑计划制造业信息化科技工程专家组成员;国家863计划先进制造技术领域专家组成员;国家重大科技专项“核高基”基础软件方向实施专家组成员;中国计算机学会大数据专委会委员、数据库专委会委员。


演讲全文:


中国的第一本大数据书有一句话:“除了上帝,都要用数据说话”。后来我琢磨为什么说用数据说话,而没有说用大数据说话?恐怕用大数据说话您就听不懂了。所以大数据未必是好事。其实大数据不是我们追求的一个目标,我们是要治理它、利用它。所以可能用数据更好。


在今天,大数据更多意味着是一种数据思维,是用数据来理解问题,而不追求它的大或者小。另外大数据又应用在各行各业,所以韩院长给了我这个题目之后我又加上了“工业”,在第二产业当中我们怎么用数据。




这个源起是我个人参加了中国《中国制造2025》操作系统与工业软件的起草,去年的9月29号,我们又发布了绿皮书,把“云端”+“终端”工业大数据平台作为操作系统及工业软件方向未来两年发展的重点发展产品。12月7日清华大学牵头在中国工程院召开了工业大数据实施路径的研讨会。


今天我们讲的工业大数据和原来做的信息化怎么区别?今天有没有从汽车制造厂来的?制造企业对数据并不陌生,我们一直在收集数据、处理数据、应用数据,企业的信息化经过了三次浪潮,韩院长讲到大数据有一个观点,他会推演到托夫勒的第三次浪潮,信息化和大数据也是第三次浪潮,怎么划分?


上世纪的九十年代往前做的大部分都是企业内的信息化,所以那是第一次浪潮。九十年代以后,互联网在美国甚至席卷全球以后,其实先进企业已经开始讲了互联网化,我们今天讲的“互联网+”是国际龙头企业十年前做的事情,今天大家讲的工业变革、工业革命,第三次、第四次,可以统称为新一次工业变革,我非常同意刚才李院长的观点,其实也是美国哈佛大学的观点,就是以智能互联的产品为核心载体,而不仅仅是大家讲的通过互联网增值。




在这个过程当中,其实是IT到DT到了互联网时代,其实我们今天讲的是机器数据,基于变革之后的CT,其实是IT、DT的一个融合,是今天工业数据的一个特点。


所以这个和我们前面的很多技术都是一脉相承的,而不是横空出世的。同时在机器当中,大家做控制的,特别是流程行业的人一点都不陌生,叫有监控的控制和数据的采集(SCADA)。但是今天又有什么新的变化?变化就在于连接。


工业4.0、工业互联网,如果用一个词来概括,就是连接。把原来孤立的机器连接起来,把人和机器连接起来,把原来的企业连接起来,甚至把不同的行业连接起来,这就是跨界和连接的概念。




这个就是苦笑曲线与剪刀曲线,这个剪刀曲线就是生产性服务业的快速发展。这个横轴是一个国家的收入水平,这个在前面的报告当中也提过。为什么说大数据是新工业革命的一个驱动力?这个也不讲了,现在有很多的分享。




12月26号的时候,清华发起召开了一个“长城工程科技论坛”,想打造一个工程科技领域和香山论坛相媲美的平台。其中工程院周济院长做了主题演讲,特别针对智能制造讲了三个方面:智能产品、智能生产、智能服务。


其实智能产品就像刚才克强主任讲的一个,产品才是制造的核心。第二产业之所以成为第二产业,是因为有工业产品作为载体。否则就成了第三产业了。所以在刚才的剪刀曲线里,第二产业分化出来的产业是2.5产业,这个产业和第三产业不同之处就在于,它是以产品作为载体的一个新的增值服务、创造价值的产业,所以没有产品就没有真正的2.5产业或者真正智能制造转型的产业。



为了价值创造,中国要要在供给方面做出改革,大数据是转换动力的媒介。这个媒介是什么?左边是先进制造,右边是“互联网+”,怎么能加起来?核心是要有数据。要在数据空间里实现交互和融合。


这个微笑曲线和我刚才讲的苦笑曲线和剪刀曲线是不一样的,这个横轴是复杂装备的生命周期,前端是创造、研发,中期是使用。这个曲线是在传统制造业里的情况,加工制造环节非常非常能够产生利润,尽管今天仍然产生利润,但是没有那么丰厚了。真正的创造要在创造新的产品上,另外要探索新的业态。


这里我们要注意,中国是一个制造大国,更是一个使用大国,在使用过程当中抓过来的机遇,积累的知识,能不能使我们产品得到创造、创新?这给我们提出了一个大的问题。


讲我们中国企业的一个例子。三一重工现在的大数据平台已经聚集了八千家的全球供应商,一百多个全球分支机构,四百多家的全球代理,有十二万个全球客户。他们是怎么用这个数据来产生价值的?


第一个方面是通过采集机器的数据,帮助上游的配件供应商实现精准生产,帮助他们搞清楚什么时候需要配件供应。第二件事情就是发展新的模式,即租赁。这里面要解决跑路的问题,恶意的借贷、购买的问题。


怎么样来创新他的产品开发?日本福岛核电站用的就是三一工的装备,能够实现遥控五公里之外的遥控装备,在这个过程当中用了装备操作数据来改进它遥控器的质量和稳定性。


在金风科技怎么样利用矫正风机偏航呢?风机上有一个测风仪,这个是解决风机对风的准确与否,因为长时间运行之后,这个测风仪会有偏差,这个偏差每天爬到塔上校正是很难的,因此就要通过数据的在线分析应用。


优化风机偏航,每台风机每年可以多发三万多元的电,现在有1.5万台风机,如果三分之一的风机存在误差,每年就是1.5亿的收益。还有像陕鼓动力,其用大数据延伸他的客户服务,大家也看到取得了很好的效果。上个月在工信部,全国智能制造的参会人员在陕鼓参观了一天,其实最后其工业大数据还是解决产品的问题。


我们团队是做软件的,要做工业大数据的平台,还是要给我们这些产业提供装备,提供武器的办法多种多样。对工业大数据来讲最重要的是什么?是解决工业的问题,同时要降低成本。我们说今天大数据的浪潮谁是主角?谁领风骚?是开源的代码、开源的软件。



去年九月份我到硅谷做了一次分享,有六千人参会,我们分享了两个案例。主办单位就是一个开源的社区,去的都是IBM、微软、思科这些大佬,因为这些开源的软件更接地气、更解决问题。


第一个问题其实就是在工业领域怎么把小数据和大数据融合起来,也就是说怎么样把汽车传感器的数据利用好,不仅仅是为了开车、打车,还要看怎么样和产品的制造、设计结合起来。


经过五年的努力,我们牵头撰写一个国家的标准正式颁布,其核心就是以产品结构为核心的跨产品生命初期和中期的数据集成框架。再一个就是大数据系统和小数据系统的融合问题,即怎么样把工业数据、产业数据再返回到原来的ERP、PLM、SCM系统当中的一个过程。



第二件事情,机器采集的数据某些时候是一个灾难,不要想我们采集的数据一定是有用的,很多数据不发生价值就是一堆垃圾、负担。重要的就是要给你的数据画像,一定要把你采集下来的数据是什么搞清楚。



最后分享一下工业大数据分析的挑战。刚才克强主任讲,从汽车人的角度来看智能汽车、自动驾驶汽车和“互联网+”看汽车是不一样的。其实互联网的消费大数据和产业大数据也不一样。我这里分享一点。


工业大数据分析结果的可靠性是一个最核心的问题,广告推荐能达到千分之二十的可靠性就是Google的最好水平,如果在工业领域千分之二十的可靠性你敢用吗?完全不敢用。所以在这个过程当中,还需要做数据和做产业的人结合起来,把我们的工业大数据、新能源交通大数据用好。


谢谢大家!


原文发布时间为:2017-03-15 

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2月前
|
存储 数据采集 监控
大数据技术:开启智能决策与创新服务的新纪元
【10月更文挑战第5天】大数据技术:开启智能决策与创新服务的新纪元
|
5天前
|
机器学习/深度学习 数据可视化 大数据
机器学习与大数据分析的结合:智能决策的新引擎
机器学习与大数据分析的结合:智能决策的新引擎
64 15
|
22天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
24天前
|
DataWorks 搜索推荐 大数据
聊聊DataWorks——这个一站式智能大数据开发治理平台
聊聊DataWorks——这个一站式智能大数据开发治理平台
50 2
|
4月前
|
运维 算法 数据可视化
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】2 方案设计与实现-Python
文章详细介绍了参加2021高校大数据挑战赛中智能运维异常检测与趋势预测任务的方案设计与Python实现,包括问题一的异常点和异常周期检测、问题二的异常预测多变量分类问题,以及问题三的多变量KPI指标预测问题的算法过程描述和代码实现。
80 0
|
2月前
|
机器学习/深度学习 人工智能 运维
智能运维:大数据与AI的融合之道###
【10月更文挑战第20天】 运维领域正经历一场静悄悄的变革,大数据与人工智能的深度融合正重塑着传统的运维模式。本文探讨了智能运维如何借助大数据分析和机器学习算法,实现从被动响应到主动预防的转变,提升系统稳定性和效率的同时,降低了运维成本。通过实例解析,揭示智能运维在现代IT架构中的核心价值,为读者提供一份关于未来运维趋势的深刻洞察。 ###
121 10
|
2月前
|
存储 数据采集 分布式计算
大数据技术:开启智能时代的新引擎
【10月更文挑战第5天】大数据技术:开启智能时代的新引擎
|
4月前
|
存储 人工智能 分布式计算
阿里云智能大数据演进
本文根据7月24日飞天发布时刻产品发布会、7月5日DataFunCon2024·北京站:大数据·大模型.双核时代实录整理而成
|
4月前
|
机器学习/深度学习 运维 算法
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】1 赛后总结与分析
对2021高校大数据挑战赛中智能运维异常检测与趋势预测赛题的赛后总结与分析,涉及赛题解析、不足与改进,并提供了异常检测、异常预测和趋势预测的方法和模型选择的讨论。
129 0
【2021 高校大数据挑战赛-智能运维中的异常检测与趋势预测】1 赛后总结与分析
|
5月前
|
存储 分布式计算 数据可视化
ERP系统中的大数据分析与处理:驱动企业智能决策
【7月更文挑战第29天】 ERP系统中的大数据分析与处理:驱动企业智能决策
452 0