中国工程院院士谭建荣:工业大数据与定制化设计—关键技术与典型应用

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

5月5日,“2017中国工业大数据大会·钱塘峰会”在杭州国际博览中心举办。本届峰会以“数据驱动创新 融合引领变革”为主题,围绕工业大数据展开分享与交流。中国工程院院士、浙江大学教授谭建荣,以“工业大数据与定制化设计:关键技术与典型应用“为题探讨了自己的看法。

 中国工程院院士谭建荣:工业大数据与定制化设计—关键技术与典型应用

以下为嘉宾演讲实录:

各位领导,各位专家,大家上午好!十分高兴来到萧山区这么好的地方研究讨论中国工业大数据的峰会。前面有几位专家讲了大数据讲得非常精彩,都讲到要点上。对我最后一个人来讲,就增加了难度,因为许多话都讲过了。从我本人研究的角度,讲讲对工业大数据大批量定制。前面两位专家都讲了大批量定制的问题,其实大数据和大批量定制关联紧密,所以我就以这个为题目和各位做交流。

我来自浙江大学,主要从事数据建模与虚拟现实,数字设计与智能制造方面的研究,我最后也是浙江大学数字博士毕业,有是首届国家接触青年科学基金获得者,也是中国工程院院士机械运载学部专业,这三个专业有比较有利于大数据的专业。

一、从大数据到工业大数据

首先看看大数据怎么提出来的。讲互联网,讲智能制造和大数据的时候,首先回顾一下上世纪90年代美国国家自然科学基金委员会和美国学者提出的观点,也是语言,叫四大技术会聚引领21世纪。哪四大技术呢?就是生命科学技术、纳米技术、信息技术和认知科学技术。这四大技术的发展应用,特别是他们的交叉、融合、会聚将引领21世纪科技的发展、经济的发展、社会的发展。

现在新世纪过去了十六年,回过头看看美国学者的观点、预言对不对?我个人认为这个观点基本上还是对的。为什么呢?因为这四大技术确实是自然科学技术的前沿领域,他们的发展和应用必将给人类社会带来深刻的变化,甚至是颠覆性的变化。但这个预言也有不足,主要是两方面不足:

第一,对生命科学技术、那块技术和认知科学技术的发展的应用,和对经济的牵引作用估计过高,期望过大。前面徐院士反复强调不要对大数据给予过高的期望。十几年前,我们将对这项技术期望过大,十几年前浙江省科技厅、萧山科技局的领导都在推广纳米技术,现在许多地方不推纳米技术了,纳米技术降温了。有些地方不推纳米技术,有些地方降温了。不是说纳米技术不好,也不是说纳米技术不重要,纳米技术仍然非常好,仍然非常重要,但它的发展,尤其是它对经济社会牵引作用的发挥还需要很长的过程。

第二,对信息技术的牵引作用估计过低。十六年前,谁也没有想到大家对信息技术的运用如此广泛,如此深刻。这四大的技术的会聚,信息技术对人类社会的带动作用,第一个人认识的人就是美国华盛顿大学的托夫勒教授。托夫勒教授在三十多年前,四十年前就写了一本《第三次浪潮》就预见到互联网将对人类社会产生重大影响。

特别可贵的是现在都讲大数据,谁第一次提出大数据呢?就是托夫勒教授,他在1980年《第三次浪潮》里就提到“奏响华彩乐章的将是大数据”。什么是大数据?公说公有理,婆说婆有理,至今对大数据还没有统一的定义。但我们可以描述它的四大特点:容量大、种类多管、价值密度低、增长速度快。

大数据没有统一的定义,以前做计算机的人都知道以前是“海量数据”,现在是大数据,1980年就已经提出了,不是现在才提出来的。大数据比较公认的是用常规技术、常规方法、常规手段难以处理的数据,用一般的方法处理不了的数据。其实,这个定义等于没有定义,就是没办法处理的数据。徐院士也是做数学的,但从数学的角度上看,数学上有点像数学上的无穷大。有位数学家说过“无穷大的概念是人类无能的表现”,但后来通过牛顿和莱布尼提出了微积分的思想,无穷小的分析方法就把无穷大的问题解决了。无穷大还有接收问题,大数据也是一样,虽然现在都叫大数据,但大到什么程度还是不一样。现在只知道不一样,不一样在什么地方,应该用什么方法处理,现在技术还在发展中。

1、工业大数据背景、现状和趋势。前面两位专家都谈了工业大数据。工业大数据就是2012年GE公司率先提出了工业大数据的概念。工业大数据主要是制造业在产品创新、制造技术创新和产业模式创新过程中数字化、网络化、智能化为主线,形成的大数据,它需要大数据的技术、平台与应用支撑。

工业大数据的来源主要是四方面:一是数据化设计;二是智能化制造;三是网络化监测;四是物联化管理。只要贯穿全生命周期的都有工业大数据的应用,包括设计、制造、使用、维修、回收,都包括数据的获取、数据的处理、数据的应用等等。我个人研究认为工业大数据的大数据和其他领域的大数据不一样,严格来说,不能说其他领域的大数据就很容易,因为每个行业都有每个行业的特点,每个行业都有每个行业的难处,每家都有一本难念的经。但工业大数据确实有四个特点:一是语义性比较强,因为每个工程都有一定的数据,工程代表了一定的含义和语义;二是时效性比较强,GE的发动机上每小时传回来的数据是天文数字,它有一定的时效性,这些数据在一定时间内就不起作用了;三是异构性,它的结构比较多,有图片、有文字、有视频等等;四是多域性,它是多学科的数据,既物理、化学、力学交织在一起的工业数据。

工业大数据发展趋势用四大趋势:一是从低价值分析发展到智能化挖掘,是智能化,现在最典型的代表是深度学习算法;二是从批量化处理发展到实时化计算,以前做不到实时化计算,前面专家也讲到了GE的发动机,有很多不同的部件,要在异地实时计算每个分厂的生产进度,现在可以做到实时化;三是大规模推送发展到个性化追踪,就是个性化;四是从结构化数据发展到异构化信息,就是异构化。

2、大数据定义和概念和内涵。前面徐院士说工业大数据的概念还在研发过程中,但应用始终是驱动创新的引擎。GE在每一台引擎上安装了二十多类传感器,飞行1小时就能产生20TB的数据,每个月收集360万次飞行记录,监视25000个引擎,其开发引擎大数据分析算法能够提前一个月预测其维护需求,准确率达到了70%。以前航空晚点、飞机晚点都怪飞机不好,以前都说是机械原因,现在都是航空管制,因为机械没有问题。无论是波音还是空客的机械问题非常好,其中一个原因就是采用了大数据监测,备件可以提前运到某个机场。当然备件也不能太多,太多运行成本就高了,也不能太少,太少就耽误时间。现在可以精确进行备件准备。

美国微软公司与德国公司共同推出工业大数据,可以提前准备安装备件。西门子安贝格数字化工厂75%生产过程是由机器自动完成,实现生产过自动化数据采集与管理的,通过对工业大数据进行智能分析,可以提前准备备件。

二、从工业大数据到大批量定制

大数据是由托夫勒在《第三次浪潮》中提出的,他还写了一本书《未来的冲击》,他是华盛顿大学教授,也是未来学大师,他写了三本书,1970年写了《未来的冲击》,1980年《第三次浪潮》,1990年是《权力的转移》,每十年一本书,都非常有影响力。

在《未来的冲击》一书中,托夫勒提出了一种全新的生产方式的设想,以类似于标准化或大批量生产的成本和时间,提供满足客户特定需求的产品和服务。1998年,华盛顿大学由45位著名未来学家和技术专家组成的新兴技术预测委员会,预测未来大批量定制被列为2001到2030年的主要技术将被应用。

大批量生产是福特提出的,前提条件就是有互换性,有了互换性就有了专业化生产,有了专业化生产就有了大批量定制、大批量生产,大批量生产的技术应用还是了不得,世界汽车制造的中心就由欧洲转移到了美国,美国由此成为汽车制造大国,进而又成为世界制造大国,进而又成为世界制造第一强国。美国为什么强大?除了政治、军事的原因以外,从技术角度说,美国强大的原因就是制造业强大。它的制造业强大就在于它不断推出应用新的生产模式、新的高新技术。

大批量生产有很多优点:一是成本低;二是高效率;三是质量稳定。而定制化生产也有优点,它的优点:一是满足个性化需求,人最重要的是个性化需求,人存在于社会,是个体的人,所以个性化需求的满足程度与否决定了市场占有率;二是由于个性化生产,创新性就比较强,批量生产的工人基本上没有创新性,创新性比较弱,因为要重复的生产每件产品。而定制化生产为每个客户提供定制需求,创新性比较强;三是价值高,因为创新性比较强价格就卖得高。

托夫勒这个人提出能不能以大批量生产的方式进行定制化生产,就把两种生产优点都发挥出来。严格来说,没有一种生产方式只有优点没有缺点,都有缺点,怎么避免缺点,把优势发挥出来。由此我们可以看出从互联网到大数据,到大批量定制,这将是制造业运用信息化技术的一条主线。过去的BPM和ERP都很好,但这是解决批量化生产。现在要智能制造,就要用大数据分析,运用大数据的目的是要实现大批量定制生产。

可以说我的团队在国内是最早开展大批量定制技术研究,当时的863教授许国宁(音)老师和我最早开展了国内的大批量定制研究,2004年我们就利用这个技术获得了一个国家科技进步奖。我们的第一个应用产品是汽轮机产品,因为当时每台汽轮机有4000多个零件,有近10000个物号,后来运用大批量定制技术,使杭汽的设计制造能力大幅度提高,汽轮机厂杭汽的规模在国内排第四,前面还有三大动力集团,分别哈汽、东汽和上海汽轮机厂,但杭汽是生产工业汽轮机。杭汽的工业汽轮机小超过三大汽轮机厂加起来的总和,其中一个原因也是杭汽是国内最早应用大批量定制生产技术。

还有一个应用是除尘器,现在环保电厂要除尘。当时我们和浙江飞达联合研究进行大批量定制,这个项目也成为浙江省信息化的示范项目。

第三个应用面最广,前面的汽轮机和除尘器专业性比较强,而电梯是大众化产品。电梯行业如何实现大批量定制,不做不知道,一做就知道台的电梯情况不一样,随着建筑的不同,电梯要实现不同的定制生产。最近,我老家湖州有个巨轮电梯,他的老板和我关系很好。最近他给打电话,他说“谭老师,你的大批量定制技术使我们在电梯行业领先了十五年,现在我们要进行第二次着手,就是智能化生产。”十五年前,我从德国回来进修回来就想做大批量定制,非常遗憾的是找应用企业非常困难。巨轮电梯也是国产电梯首屈一指,当时和我的关系比较好,我就找他,他说“我们就试试大批量定制”,我们给他设计了这个定制系统,在周围产生了巨大的影响。在江苏有个康宁电梯厂知道巨轮电梯的技术之后,说“我们一定要上这个技术,否则要落后”。我们被浙江省列为科技示范项目,当时巨轮电梯召开了大批量定制技术推广会,科技厅的厅长现场到场进行电梯行业的批量定制。

大批量定制要注意两个问题:一是大批量定制是客户参与的设计,设计人员不能关起门来做设计,一定要和客户沟通;二是快速响应客户需求。

工业大数据与定制化设计技术关键其他,如何高效利用已有的数夸父逐定制设计,如何处理工业物联化管理产生的海量数据,如何罚钱满足客户潜在的设计需求,如何整合产业外大量分散的、异构的设计资源?我们将要这四个问题转化为技术问题:智能化数据挖掘;实时化数据计算,个性化的数据预测,异构化的数据集成。工业企业要用到大数据就要解决这四个问题;我们提出了几项关键技术,成功的推进了这四个问题的解决,分别是是:工业思维大数据形式化表达技术;定制知识大数据智能化挖掘技术;工业高速流式数据实时处理技术,工业数控装备实时鼓掌诊断技术,模糊个性化需求的大数据分析技术,定制化设计资源大数据集成技术。

三、大数据驱动的高档电梯个性化定制

适应企业发展需求,主要是客户个性化需求日益增强,及时掌控全球市场发展动向,降低产品成本,加快运转效率,产品运行状态智能化预测分析。通过对电梯大数据驱动高端电梯的个性化定制设计,电梯异构大数据挖掘,以及电梯故障预测规律,我们大规模的推动了电梯大规模定制的界面。后面还有很多技术,由于时间关系就不展开了。

四、数控机床大数据设计资源共享平台及应用

在这方面,我们开发了数控机床大数据设计资源的共享平台,就把数控机床的知识会聚到一起,主要是根据云计算的原理,把大数据设计资源虚拟化,把大数据设计能力服务化,这也是我们开发的系统。这个系统包含了现在数控机床设计的所有零件、样本和知识导航,在茫茫的数据海洋中帮你导航;二是提供设计工具;三是提供设计规范,这就是数据共享。这也讨论了现在常规机床设计手册、机械设计组织、ER设计手册等1万多页手册,也包括一些基础件、连接件等。这个设计系统已经在一些企业得到成功的应用。

由于时间关系就讲到这里,欢迎各位专家、各位领导到浙江大学来,到机械学院进行技术交流、项目合作和人才培养培训。谢谢大家!

原文发布时间为:2017年5月8日

本文作者:孙博 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
1月前
|
存储 机器学习/深度学习 SQL
大数据处理与分析技术
大数据处理与分析技术
102 2
|
1月前
|
存储 分布式计算 NoSQL
【赵渝强老师】大数据技术的理论基础
本文介绍了大数据平台的核心思想,包括Google的三篇重要论文:Google文件系统(GFS)、MapReduce分布式计算模型和BigTable大表。这些论文奠定了大数据生态圈的技术基础,进而发展出了Hadoop、Spark和Flink等生态系统。文章详细解释了GFS的架构、MapReduce的计算过程以及BigTable的思想和HBase的实现。
|
1天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
13 2
|
16天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
15天前
|
SQL 运维 大数据
轻量级的大数据处理技术
现代大数据应用架构中,数据中心作为核心,连接数据源与应用,承担着数据处理与服务的重要角色。然而,随着数据量的激增,数据中心面临运维复杂、体系封闭及应用间耦合性高等挑战。为缓解这些问题,一种轻量级的解决方案——esProc SPL应运而生。esProc SPL通过集成性、开放性、高性能、数据路由和敏捷性等特性,有效解决了现有架构的不足,实现了灵活高效的数据处理,特别适用于应用端的前置计算,降低了整体成本和复杂度。
|
23天前
|
机器学习/深度学习 存储 大数据
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系
在大数据时代,高维数据处理成为难题,主成分分析(PCA)作为一种有效的数据降维技术,通过线性变换将数据投影到新的坐标系,保留最大方差信息,实现数据压缩、去噪及可视化。本文详解PCA原理、步骤及其Python实现,探讨其在图像压缩、特征提取等领域的应用,并指出使用时的注意事项,旨在帮助读者掌握这一强大工具。
58 4
|
1月前
|
机器学习/深度学习 存储 大数据
云计算与大数据技术的融合应用
云计算与大数据技术的融合应用
|
1月前
|
SQL 存储 大数据
单机顶集群的大数据技术来了
大数据时代,分布式数仓如MPP成为热门技术,但其高昂的成本让人望而却步。对于多数任务,数据量并未达到PB级,单体数据库即可胜任。然而,由于SQL语法的局限性和计算任务的复杂性,分布式解决方案显得更为必要。esProc SPL作为一种开源轻量级计算引擎,通过高效的算法和存储机制,实现了单机性能超越集群的效果,为低成本、高效能的数据处理提供了新选择。
|
1月前
|
SQL 存储 算法
比 SQL 快出数量级的大数据计算技术
SQL 是大数据计算中最常用的工具,但在实际应用中,SQL 经常跑得很慢,浪费大量硬件资源。例如,某银行的反洗钱计算在 11 节点的 Vertica 集群上跑了 1.5 小时,而用 SPL 重写后,单机只需 26 秒。类似地,电商漏斗运算和时空碰撞任务在使用 SPL 后,性能也大幅提升。这是因为 SQL 无法写出低复杂度的算法,而 SPL 提供了更强大的数据类型和基础运算,能够实现高效计算。
|
1月前
|
存储 分布式计算 数据挖掘
数据架构 ODPS 是什么?
数据架构 ODPS 是什么?
287 7