中国工程院院士谭建荣:工业大数据与定制化设计—关键技术与典型应用

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

5月5日,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。中国工程院院士、浙江大学教授谭建荣,以“工业大数据与定制化设计:关键技术与典型应用“为题探讨了自己的看法。

 中国工程院院士谭建荣:工业大数据与定制化设计—关键技术与典型应用

以下为嘉宾演讲实录:

各位领导,各位专家,大家上午好!十分高兴来到萧山区这么好的地方研究讨论中国工业大数据的峰会。前面有几位专家讲了大数据讲得非常精彩,都讲到要点上。对我最后一个人来讲,就增加了难度,因为许多话都讲过了。从我本人研究的角度,讲讲对工业大数据大批量定制。前面两位专家都讲了大批量定制的问题,其实大数据和大批量定制关联紧密,所以我就以这个为题目和各位做交流。

我来自浙江大学,主要从事数据建模与虚拟现实,数字设计与智能制造方面的研究,我最后也是浙江大学数字博士毕业,有是首届国家接触青年科学基金获得者,也是中国工程院院士机械运载学部专业,这三个专业有比较有利于大数据的专业。

一、从大数据到工业大数据

首先看看大数据怎么提出来的。讲互联网,讲智能制造和大数据的时候,首先回顾一下上世纪90年代美国国家自然科学基金委员会和美国学者提出的观点,也是语言,叫四大技术会聚引领21世纪。哪四大技术呢?就是生命科学技术、纳米技术、信息技术和认知科学技术。这四大技术的发展应用,特别是他们的交叉、融合、会聚将引领21世纪科技的发展、经济的发展、社会的发展。

现在新世纪过去了十六年,回过头看看美国学者的观点、预言对不对?我个人认为这个观点基本上还是对的。为什么呢?因为这四大技术确实是自然科学技术的前沿领域,他们的发展和应用必将给人类社会带来深刻的变化,甚至是颠覆性的变化。但这个预言也有不足,主要是两方面不足:

第一,对生命科学技术、那块技术和认知科学技术的发展的应用,和对经济的牵引作用估计过高,期望过大。前面徐院士反复强调不要对大数据给予过高的期望。十几年前,我们将对这项技术期望过大,十几年前浙江省科技厅、萧山科技局的领导都在推广纳米技术,现在许多地方不推纳米技术了,纳米技术降温了。有些地方不推纳米技术,有些地方降温了。不是说纳米技术不好,也不是说纳米技术不重要,纳米技术仍然非常好,仍然非常重要,但它的发展,尤其是它对经济社会牵引作用的发挥还需要很长的过程。

第二,对信息技术的牵引作用估计过低。十六年前,谁也没有想到大家对信息技术的运用如此广泛,如此深刻。这四大的技术的会聚,信息技术对人类社会的带动作用,第一个人认识的人就是美国华盛顿大学的托夫勒教授。托夫勒教授在三十多年前,四十年前就写了一本《第三次浪潮》就预见到互联网将对人类社会产生重大影响。

特别可贵的是现在都讲大数据,谁第一次提出大数据呢?就是托夫勒教授,他在1980年《第三次浪潮》里就提到“奏响华彩乐章的将是大数据”。什么是大数据?公说公有理,婆说婆有理,至今对大数据还没有统一的定义。但我们可以描述它的四大特点:容量大、种类多管、价值密度低、增长速度快。

大数据没有统一的定义,以前做计算机的人都知道以前是“海量数据”,现在是大数据,1980年就已经提出了,不是现在才提出来的。大数据比较公认的是用常规技术、常规方法、常规手段难以处理的数据,用一般的方法处理不了的数据。其实,这个定义等于没有定义,就是没办法处理的数据。徐院士也是做数学的,但从数学的角度上看,数学上有点像数学上的无穷大。有位数学家说过“无穷大的概念是人类无能的表现”,但后来通过牛顿和莱布尼提出了微积分的思想,无穷小的分析方法就把无穷大的问题解决了。无穷大还有接收问题,大数据也是一样,虽然现在都叫大数据,但大到什么程度还是不一样。现在只知道不一样,不一样在什么地方,应该用什么方法处理,现在技术还在发展中。

1、工业大数据背景、现状和趋势。前面两位专家都谈了工业大数据。工业大数据就是2012年GE公司率先提出了工业大数据的概念。工业大数据主要是制造业在产品创新、制造技术创新和产业模式创新过程中数字化、网络化、智能化为主线,形成的大数据,它需要大数据的技术、平台与应用支撑。

工业大数据的来源主要是四方面:一是数据化设计;二是智能化制造;三是网络化监测;四是物联化管理。只要贯穿全生命周期的都有工业大数据的应用,包括设计、制造、使用、维修、回收,都包括数据的获取、数据的处理、数据的应用等等。我个人研究认为工业大数据的大数据和其他领域的大数据不一样,严格来说,不能说其他领域的大数据就很容易,因为每个行业都有每个行业的特点,每个行业都有每个行业的难处,每家都有一本难念的经。但工业大数据确实有四个特点:一是语义性比较强,因为每个工程都有一定的数据,工程代表了一定的含义和语义;二是时效性比较强,GE的发动机上每小时传回来的数据是天文数字,它有一定的时效性,这些数据在一定时间内就不起作用了;三是异构性,它的结构比较多,有图片、有文字、有视频等等;四是多域性,它是多学科的数据,既物理、化学、力学交织在一起的工业数据。

工业大数据发展趋势用四大趋势:一是从低价值分析发展到智能化挖掘,是智能化,现在最典型的代表是深度学习算法;二是从批量化处理发展到实时化计算,以前做不到实时化计算,前面专家也讲到了GE的发动机,有很多不同的部件,要在异地实时计算每个分厂的生产进度,现在可以做到实时化;三是大规模推送发展到个性化追踪,就是个性化;四是从结构化数据发展到异构化信息,就是异构化。

2、大数据定义和概念和内涵。前面徐院士说工业大数据的概念还在研发过程中,但应用始终是驱动创新的引擎。GE在每一台引擎上安装了二十多类传感器,飞行1小时就能产生20TB的数据,每个月收集360万次飞行记录,监视25000个引擎,其开发引擎大数据分析算法能够提前一个月预测其维护需求,准确率达到了70%。以前航空晚点、飞机晚点都怪飞机不好,以前都说是机械原因,现在都是航空管制,因为机械没有问题。无论是波音还是空客的机械问题非常好,其中一个原因就是采用了大数据监测,备件可以提前运到某个机场。当然备件也不能太多,太多运行成本就高了,也不能太少,太少就耽误时间。现在可以精确进行备件准备。

美国微软公司与德国公司共同推出工业大数据,可以提前准备安装备件。西门子安贝格数字化工厂75%生产过程是由机器自动完成,实现生产过自动化数据采集与管理的,通过对工业大数据进行智能分析,可以提前准备备件。

二、从工业大数据到大批量定制

大数据是由托夫勒在《第三次浪潮》中提出的,他还写了一本书《未来的冲击》,他是华盛顿大学教授,也是未来学大师,他写了三本书,1970年写了《未来的冲击》,1980年《第三次浪潮》,1990年是《权力的转移》,每十年一本书,都非常有影响力。

在《未来的冲击》一书中,托夫勒提出了一种全新的生产方式的设想,以类似于标准化或大批量生产的成本和时间,提供满足客户特定需求的产品和服务。1998年,华盛顿大学由45位著名未来学家和技术专家组成的新兴技术预测委员会,预测未来大批量定制被列为2001到2030年的主要技术将被应用。

大批量生产是福特提出的,前提条件就是有互换性,有了互换性就有了专业化生产,有了专业化生产就有了大批量定制、大批量生产,大批量生产的技术应用还是了不得,世界汽车制造的中心就由欧洲转移到了美国,美国由此成为汽车制造大国,进而又成为世界制造大国,进而又成为世界制造第一强国。美国为什么强大?除了政治、军事的原因以外,从技术角度说,美国强大的原因就是制造业强大。它的制造业强大就在于它不断推出应用新的生产模式、新的高新技术。

大批量生产有很多优点:一是成本低;二是高效率;三是质量稳定。而定制化生产也有优点,它的优点:一是满足个性化需求,人最重要的是个性化需求,人存在于社会,是个体的人,所以个性化需求的满足程度与否决定了市场占有率;二是由于个性化生产,创新性就比较强,批量生产的工人基本上没有创新性,创新性比较弱,因为要重复的生产每件产品。而定制化生产为每个客户提供定制需求,创新性比较强;三是价值高,因为创新性比较强价格就卖得高。

托夫勒这个人提出能不能以大批量生产的方式进行定制化生产,就把两种生产优点都发挥出来。严格来说,没有一种生产方式只有优点没有缺点,都有缺点,怎么避免缺点,把优势发挥出来。由此我们可以看出从互联网到大数据,到大批量定制,这将是制造业运用信息化技术的一条主线。过去的BPM和ERP都很好,但这是解决批量化生产。现在要智能制造,就要用大数据分析,运用大数据的目的是要实现大批量定制生产。

可以说我的团队在国内是最早开展大批量定制技术研究,当时的863教授许国宁(音)老师和我最早开展了国内的大批量定制研究,2004年我们就利用这个技术获得了一个国家科技进步奖。我们的第一个应用产品是汽轮机产品,因为当时每台汽轮机有4000多个零件,有近10000个物号,后来运用大批量定制技术,使杭汽的设计制造能力大幅度提高,汽轮机厂杭汽的规模在国内排第四,前面还有三大动力集团,分别哈汽、东汽和上海汽轮机厂,但杭汽是生产工业汽轮机。杭汽的工业汽轮机小超过三大汽轮机厂加起来的总和,其中一个原因也是杭汽是国内最早应用大批量定制生产技术。

还有一个应用是除尘器,现在环保电厂要除尘。当时我们和浙江飞达联合研究进行大批量定制,这个项目也成为浙江省信息化的示范项目。

第三个应用面最广,前面的汽轮机和除尘器专业性比较强,而电梯是大众化产品。电梯行业如何实现大批量定制,不做不知道,一做就知道台的电梯情况不一样,随着建筑的不同,电梯要实现不同的定制生产。最近,我老家湖州有个巨轮电梯,他的老板和我关系很好。最近他给打电话,他说“谭老师,你的大批量定制技术使我们在电梯行业领先了十五年,现在我们要进行第二次着手,就是智能化生产。”十五年前,我从德国回来进修回来就想做大批量定制,非常遗憾的是找应用企业非常困难。巨轮电梯也是国产电梯首屈一指,当时和我的关系比较好,我就找他,他说“我们就试试大批量定制”,我们给他设计了这个定制系统,在周围产生了巨大的影响。在江苏有个康宁电梯厂知道巨轮电梯的技术之后,说“我们一定要上这个技术,否则要落后”。我们被浙江省列为科技示范项目,当时巨轮电梯召开了大批量定制技术推广会,科技厅的厅长现场到场进行电梯行业的批量定制。

大批量定制要注意两个问题:一是大批量定制是客户参与的设计,设计人员不能关起门来做设计,一定要和客户沟通;二是快速响应客户需求。

工业大数据与定制化设计技术关键其他,如何高效利用已有的数夸父逐定制设计,如何处理工业物联化管理产生的海量数据,如何罚钱满足客户潜在的设计需求,如何整合产业外大量分散的、异构的设计资源?我们将要这四个问题转化为技术问题:智能化数据挖掘;实时化数据计算,个性化的数据预测,异构化的数据集成。工业企业要用到大数据就要解决这四个问题;我们提出了几项关键技术,成功的推进了这四个问题的解决,分别是是:工业思维大数据形式化表达技术;定制知识大数据智能化挖掘技术;工业高速流式数据实时处理技术,工业数控装备实时鼓掌诊断技术,模糊个性化需求的大数据分析技术,定制化设计资源大数据集成技术。

三、大数据驱动的高档电梯个性化定制

适应企业发展需求,主要是客户个性化需求日益增强,及时掌控全球市场发展动向,降低产品成本,加快运转效率,产品运行状态智能化预测分析。通过对电梯大数据驱动高端电梯的个性化定制设计,电梯异构大数据挖掘,以及电梯故障预测规律,我们大规模的推动了电梯大规模定制的界面。后面还有很多技术,由于时间关系就不展开了。

四、数控机床大数据设计资源共享平台及应用

在这方面,我们开发了数控机床大数据设计资源的共享平台,就把数控机床的知识会聚到一起,主要是根据云计算的原理,把大数据设计资源虚拟化,把大数据设计能力服务化,这也是我们开发的系统。这个系统包含了现在数控机床设计的所有零件、样本和知识导航,在茫茫的数据海洋中帮你导航;二是提供设计工具;三是提供设计规范,这就是数据共享。这也讨论了现在常规机床设计手册、机械设计组织、ER设计手册等1万多页手册,也包括一些基础件、连接件等。这个设计系统已经在一些企业得到成功的应用。

由于时间关系就讲到这里,欢迎各位专家、各位领导到浙江大学来,到机械学院进行技术交流、项目合作和人才培养培训。谢谢大家!

原文发布时间为:2017年5月8日

本文作者:孙博 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
3天前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
19 2
|
22天前
|
存储 分布式计算 数据可视化
大数据常用技术与工具
【10月更文挑战第16天】
80 4
|
5天前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
|
1月前
|
SQL 存储 分布式计算
ODPS技术架构深度剖析与实战指南——从零开始掌握阿里巴巴大数据处理平台的核心要义与应用技巧
【10月更文挑战第9天】ODPS是阿里巴巴推出的大数据处理平台,支持海量数据的存储与计算,适用于数据仓库、数据挖掘等场景。其核心组件涵盖数据存储、计算引擎、任务调度、资源管理和用户界面,确保数据处理的稳定、安全与高效。通过创建项目、上传数据、编写SQL或MapReduce程序,用户可轻松完成复杂的数据处理任务。示例展示了如何使用ODPS SQL查询每个用户的最早登录时间。
88 1
|
5天前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
8天前
|
存储 大数据 定位技术
大数据 数据索引技术
【10月更文挑战第26天】
20 3
|
8天前
|
存储 大数据 OLAP
大数据数据分区技术
【10月更文挑战第26天】
30 2
|
11天前
|
消息中间件 分布式计算 大数据
数据为王:大数据处理与分析技术在企业决策中的力量
【10月更文挑战第29天】在信息爆炸的时代,大数据处理与分析技术为企业提供了前所未有的洞察力和决策支持。本文探讨了大数据技术在企业决策中的重要性和实际应用,包括数据的力量、实时分析、数据驱动的决策以及数据安全与隐私保护。通过这些技术,企业能够从海量数据中提取有价值的信息,预测市场趋势,优化业务流程,从而在竞争中占据优势。
41 2
|
13天前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第27天】在大数据时代,数据湖技术凭借其灵活性和成本效益成为企业存储和分析大规模异构数据的首选。Hadoop和Spark作为数据湖技术的核心组件,通过HDFS存储数据和Spark进行高效计算,实现了数据处理的优化。本文探讨了Hadoop与Spark的最佳实践,包括数据存储、处理、安全和可视化等方面,展示了它们在实际应用中的协同效应。
53 2
|
14天前
|
存储 分布式计算 Hadoop
数据湖技术:Hadoop与Spark在大数据处理中的协同作用
【10月更文挑战第26天】本文详细探讨了Hadoop与Spark在大数据处理中的协同作用,通过具体案例展示了两者的最佳实践。Hadoop的HDFS和MapReduce负责数据存储和预处理,确保高可靠性和容错性;Spark则凭借其高性能和丰富的API,进行深度分析和机器学习,实现高效的批处理和实时处理。
53 1