【干货】王建民:工业大数据应用实践

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

演讲全文:


尊敬的杨部长、樊会文院长,各位朋友,今天在这儿做这个报告,确实诚惶诚恐,因为这个话题很大,刚才杨部长和樊会文院长都对这个工业大数据做了非常深入的探讨,我想就从实践的方面跟大家分享一些成果。



最近走了很多企业,包括现在应该说下行压力非常大的工程装备、工程机械的这些企业,还走访了一些在江苏昆山做机器人的新兴的产业,但是有一个共同的感觉就是大家都面临着一种困惑,甚至焦虑。那么这个焦虑就是工业未来的走势是什么?我们未来的发展空间是什么?我想分享三个方面的内容。




第一就是工业大数据。那么刚才杨部长也讲了,工业大数据核心词是工业。那我们看看现在工业4.0也好、美国的工业互联网也好、中国制造2025,大家为什么不约而同在谈转型的问题、升级的问题。




那么我们最近在探索一个曲线,这个曲线叫做苦笑曲线,但是不是一般意义上的苦笑曲线,这是一个经济体从低等收入到中等收入到高等收入过程中制造业在GDP中占比的一个苦笑曲线。


在低收入的时候,一个国家的制造业在GDP的占比是比较低的,但是随着整个国家的国民收入水平的提高,注意这是它的发展的过程,制造业在GDP当中的占比在往上升,到了一定程度到了中等收入国家的时候,制造业在GDP当中的占比达到了顶峰。


当它走向高收入国家的时候,制造业在GDP当中的占比就在下降。这是统计了两百年工业发展过程的一个总结,也是一种大数据。


它是通过数据分析得出来的。那么也就是说制造业随着经济体从不发达经济体到发达经济体当中必定要走过这么一个艰辛的历程。


我们今天为什么和美国、德国同时提出这个问题呢?就是中国制造业发展的太快了,我们用30年的时间做了人家一百年、甚至两百年的事情,所以现在我们和人家面临着同一个问题。


本来很多的工业问题我们就等着德国和美国解决好我们跟随就行,但是现在不一样了,我们也要面临这个苦笑曲线给我们提出的挑战。就是从中等收入水平向高等收入水平发展的过程中,我们怎么解决制造业的苦笑曲线,制造业在国民经济当中的下降问题。刚才杨部长也讲了,就是制造业里面要升级和转型。


也就是说在它下降的过程当中,势必一些资源要从制造业释放出来,要从第二产业转向成第三产业,或者说第二产业转化为2.5产业,我觉得这个2.5还是挺好的,就是介于制造业和服务业之间的产业,所以我们现在叫生产型服务业。


第二件事情是什么呢?我们到企业去,咱们国家的企业--中国的企业不怕需求量大,我们是有足够的产能的,我们的企业最怕的是什么?——没有市场。


现在我们看到很多企业已经是从三班倒到现在只能干一班,甚至一班还不饱和。这是我们的大问题:不是我们造不出来了,是我们造出来卖不出去。我们看到很多的企业,特别是装备企业,原来的厂区很空旷,现在看到很多产品非常漂亮放在厂区里——说明产品在积压。


我们很多的装备企业原来给流程装备提供服务的企业说:王老师,我的装备在用户企业当中,原来每天大概运行18个小时,现在每天运行不到6个小时。我怎么办?


所以,在这个时候,可能今天到场的各位朋友都希望在这样一个经济压力下行特别严峻的时刻,我们找到一些破解这个困局的难题——就是说我们能不能通过现在的互联网+、通过大数据、通过中国制造2025来找到解决现在这个问题的钥匙。这个叫理想很丰满,现实还是很骨感。


当我看到这些企业,非常好的企业,甚至是我们的标杆企业,遇到这个问题,自己也往往觉得很无能为力,技术在这个经济发展过程当中有时显得很苍白。所以我非常赞成杨部长提到的,工业大数据的发展,一定以工业为主体来看待这个问题。




这个图形我经常用,换了两个标志:就是把这传统的苦笑曲线两端加上了大数据的推力。是在产品装备的生命周期的设计制造阶段和回收再利用阶段,原来我们是靠制造获益,现在我们要在产品创新上获利、要在产品的服务阶段增加我们的利润。这就是回答刚才的苦笑曲线,如何转型、如何升级。


那么通过大数据我们看看能不能解决企业的产品创新问题,能不能解决企业的售后服务问题?




这张图是我比较喜欢的,就是哈佛大学在去年11月份在哈佛商业评论上有一篇文章,这篇文章的题目叫《智慧的互联产品》。


那么美国人的想法是什么?它认为未来的工业产品应该是这样的,我把前面的三个阶段忽略了,我就留了它的四阶段和五阶段。


大家会看到在第四阶段的时候,装备、产品会进入到一个产品的系统阶段。也就是说机器和机器之间可以对话,机器和机器之间可以合作。那么它举了一个美国的农业机械的例子,这张图后边我们还会用到,也就是说它的播种器械、收获器械会联合起来到一个农场去作业,这个阶段还只是四阶段。


未来的工业产品是什么阶段?


我们看到这个时候以农业机械为例,它的农业机器的集群和天气的数据,会和种子的数据、灌溉系统的数据联合起来。今年九月份我去加州,那里不仅是高科技产业的发源地,同时也是农业节水灌溉系统十分发达的一个地区,在那里我们看到它是怎么样通过这样的系统来解决农业生产当中的绿色、节能、节约资源这些问题。




那么刚才大家也都提到了德国工业4.0、美国的工业互联网。那么这里面大数据是一个什么作用? IBM认为工业4.0是大数据驱动的智能制造,没有数据谈不上智能。德国人说大数据是工业4.0的核心。


GE是工业互联网的鼓吹者,这里最重要的就是数据分析。还有樊会文院长讲的未来的工业装备一定是有软件的。是不是做软件定义的机器,现在不好说,但是软件一定是机器的一部分,有了软件必然会有数据。





关于中国制造2025,我也有幸参加了规划的工作,在这里面专门规划了操作系统和工业软件,我们的互联网+也离不开大数据,这些就不多讲了。我想跟大家分享一下,怎么从系统的角度来看这个工业大数据的问题。


刚才杨部长也在提,找它的边界。工业大数据是以工业为主体,以工业产品为主体,这是大数据的根、也是它的源。在这里我们看到了咱们国家从六五可能就开始了,好多人是亲身经历的,就是我们做的IT---信息化的工作。




那个时候的信息化应该是美国人最早从数控开始的。我们看看,它最早是做加工,后来做CAD,后来做ERP。其实中国我了解应该是从管理开始的,是从发工资开始的,是从库存开始的,然后做CAD,做CIMS一步一步走过来的。那么这个道路走的是什么?就是全生命周期的信息化。


我们看到产品生命初期定义在什么地方?定义在装备离厂的分离点,装备交给用户了才刚刚出生,我们国家用了十几年甚至二十几年的时间来做厂内的信息化的问题。当然,CAX、PDM、ERP、MES都在这个里面。


第二件事情是到了2000年以后,大家认为装备交到用户之后不能不管,不能让它成为孤儿,所以大家才重视售后、重视服务,像海尔这样的。我们说到了生命中期的时候就是MRO,当时的想法还是信息管理、信息化的问题。最后生命末期阶段,主要是绿色回收再利用,还是信息化的问题。


那么为什么GE2012年提出来工业互联网?它从另外一个角度来诠释这个信息化?甚至它觉得已经超出了信息化,所以它就提出一个OT的概念。它不叫IT了,它叫OT了。所以大家今天可以看到很多关于OT的说法。


提出了OT对整个工业的价值贡献,大家看到如果一个行业在运行阶段节省1%的话,效益就是几百亿美金,会是多么显著的贡献,所以这个时候就走到了OT。OT主要就是在生命中期阶段,不仅是维修、维护,还有运营的优化。


那么今天来讲,做工业大数据第三个就是我们说的DT。也有人说IT、OT到DT,也有人说OT+IT等于DT,那么在DT这个阶段我们又把互联网的数据融合进来。


所以在这里面我个人的观点就是在工业大数据里头是三流合一:就是原来的信息系统的数据(信息化的数据)、在OT当中的机器为主体的数据(机器数据),再加上现在我们的网络环境下的(“互联网+”环境下的)互联网数据。




那么我们做大数据是服务于工业产业的,那么这个大数据怎么用?有什么用?这个跟大家再分享一下价值创造的问题。





这个我们关注它很多年,2008年的时候我们就关注它。有一个公司做了一款车,做这个车的公司是一个网站,这个网站公司是非常小的一个公司,大概有面包房那么大的一个工作间,但是它造出来一个搭载6.2公升的V8引擎的超豪华的车。


这么一个小的公司能做这么大的一个产品靠什么?


靠的是来自全球大约三万多个研发人员提供的一万多个设计方案,它从一万多个设计方案找到最优的、用户最满意的。其实这个故事它的起源比现在的小米做的产品更大,当然没有咱们小米做得更成功。但它做的是真正的重工业——是一个大的、真正的装备,这个当年的马云把它称之为叫CtoB模式。


那么这样的一个小作坊,大家想想它调动的是谁呢?调动的不是中小企业,而调动的是大企业,通用、大众、本田给它打工。所以这个时候我们大家看到的改变“互联网+”的力量、看到了数据的力量。


它现在把这样的产品制造的工艺、包括它的设计完全公布在互联网上,大家可以到网上查。咱们在座的同志们,你只要花15天的时间,只要有相应的钱就可以造出这样的一辆汽车。当然在中国可能咱们不能上路。





在生产方面,刚才大家讲到了,很多的工艺,真正的我们制造的核心环节,后面的演讲者还会和大家分享,我这里就不多讲了。




第三个在采购的环节。其实大家说现在的制造,特别是大型装备的制造,是供应链体系的竞争,而不是一个企业的竞争。昨天我刚从重庆回来,咱们的长安汽车,据说前九个月他们已经变成中国的前三了。


那么它们对于采购环节真正是货比三家、不仅仅是听供应商自己的评价,要在网上去找,在微博、微信上去找,用户是不是给你好的评价?是不是真的评价?在这里面打造它的可靠可信的供应链。靠的是什么?靠的是数据。它有强大的云计算平台操作控件(“Component Mfg”)。




那么维修,这个呢是GE的故事。我想大家听了很多,也许李杰老师还会讲,我就不讲了。GE实事求是的说,现在的效益不,比如说2014年GE对1500台燃气轮机进行的监控服务为用户节省约七千万美元,这个七千万美元是净利润。





再一个例子,大家看运行大数据的例子。在工业里面,原来我们基本上不区分维修和运行这两件事。但是这里跟大家讲,运行是运行,维修是维修。


维修是当你这个产品的性能下降的时候,你要把它弄好,恢复它产品的性能,运行是如何通过使用这个机器让它产生价值。这是澳大利亚力拓集团利用运行大数据,每年为一个矿井可以带来一百万美元以上的年收益。





最后一个例子是美国的爱科(农业装备),就是在解决跨界的这个装备使用的问题。







时间关系,我这里讲一件事情,就是三一如何把它的大数据平台切换成我们自主可控平台。这里不是在三一当中所有的数据库都用自主平台,而是在服务运维应用中替换了Oracle系统。



那么,这件事情就是得益于现在的大数据技术。大数据的核心我觉得对工业企业的贡献就是什么呢?就是低成本、高性价比。如果不是低成本的话,我觉得目前在工业企业中这些大数据的处理,现有的技术都能做,只要你说有足够的钱。


那么在这个过程当中,我们看在三一这个工程,真正的生产系统当中去O,要解决一个什么问题呢?是要解决它和其他业务系统的关联问题——最核心的问题是要能把其他的业务系统都能够平滑的切换过来。


这是十分挑战的任务,我们是和三一共同的努力下,做到了。今天有将近二十万台的设备接入、每天大概活跃六万台的设备,现在这些监控数据都传到我们的国产平台上来了。



上面这些PPT是具体的应用案例,谢谢大家。


原文发布时间为:2017-03-13 

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
3月前
|
SQL 分布式计算 运维
如何对付一个耗时6h+的ODPS任务:慢节点优化实践
本文描述了大数据处理任务(特别是涉及大量JOIN操作的任务)中遇到的性能瓶颈问题及其优化过程。
|
2月前
|
机器学习/深度学习 算法 搜索推荐
从理论到实践,Python算法复杂度分析一站式教程,助你轻松驾驭大数据挑战!
【10月更文挑战第4天】在大数据时代,算法效率至关重要。本文从理论入手,介绍时间复杂度和空间复杂度两个核心概念,并通过冒泡排序和快速排序的Python实现详细分析其复杂度。冒泡排序的时间复杂度为O(n^2),空间复杂度为O(1);快速排序平均时间复杂度为O(n log n),空间复杂度为O(log n)。文章还介绍了算法选择、分而治之及空间换时间等优化策略,帮助你在大数据挑战中游刃有余。
92 4
|
2月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
167 1
|
27天前
|
存储 消息中间件 分布式计算
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
Cisco WebEx 早期数据平台采用了多系统架构(包括 Trino、Pinot、Iceberg 、 Kyuubi 等),面临架构复杂、数据冗余存储、运维困难、资源利用率低、数据时效性差等问题。因此,引入 Apache Doris 替换了 Trino、Pinot 、 Iceberg 及 Kyuubi 技术栈,依赖于 Doris 的实时数据湖能力及高性能 OLAP 分析能力,统一数据湖仓及查询分析引擎,显著提升了查询性能及系统稳定性,同时实现资源成本降低 30%。
Cisco WebEx 数据平台:统一 Trino、Pinot、Iceberg 及 Kyuubi,探索 Apache Doris 在 Cisco 的改造实践
|
22天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
1月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
1月前
|
边缘计算 人工智能 搜索推荐
大数据与零售业:精准营销的实践
【10月更文挑战第31天】在信息化社会,大数据技术正成为推动零售业革新的重要驱动力。本文探讨了大数据在零售业中的应用,包括客户细分、个性化推荐、动态定价、营销自动化、预测性分析、忠诚度管理和社交网络洞察等方面,通过实际案例展示了大数据如何帮助商家洞悉消费者行为,优化决策,实现精准营销。同时,文章也讨论了大数据面临的挑战和未来展望。
|
2月前
|
存储 分布式计算 druid
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
74 1
大数据-149 Apache Druid 基本介绍 技术特点 应用场景
ly~
|
2月前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
206 2
ly~
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据在智慧金融中的应用
在智能算法交易中,深度学习揭示价格波动的复杂动力学,强化学习依据市场反馈优化策略,助力投资者获取阿尔法收益。智能监管合规利用自然语言处理精准解读法规,实时追踪监管变化,确保机构紧跟政策。大数据分析监控交易,预警潜在违规行为,变被动防御为主动预防。数智化营销通过多维度数据分析,构建细致客户画像,提供个性化产品推荐。智慧客服借助 AI 技术提升服务质量,增强客户满意度。
ly~
161 3