当纺织遇上阿里云,数学博士钻进车间要让企业更高效-阿里云开发者社区

开发者社区> 技术小能手> 正文

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

简介:
+关注继续查看

从数学博士到阿里云工程师,夏分一直学以致用。加入阿里云接手的第一个ET工业大脑项目,因为数据传输问题丢失大量数据,导致机器误判拉响警报,这让他意识到自己不能只坐在电脑前做“码农”,也要下到车间做实地考察。

然而,之后夏分参与的项目是一家有32年历史的毛纺企业,从订单到配色、染毛、混毛,到纺线、织布和成衣,没有一套完整的数据采集系统。车间主任“迷信”人工智能和机器算法,在没有数据的情况下提出一系列“无解”要求,夏分利用数学思维将其一一解决。

虚惊一场的教训

从本科到博士,夏分在浙江大学研究了10年数学,毕业后一度从事人工智能辅助医疗方面的研究,却因为缺乏结构化数据陷入瓶颈。刚好,有人推荐他去阿里云,抱着“医疗是民生,工业是战略”的想法,夏分于2017年7月加入阿里云,成为一名算法工程师,也是第一代车间程序员。

入职后的第4个月,夏分接手了第一个项目,用ET工业大脑帮一家风电企业提前预测风电机组故障。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

夏分

由于无法实时掌握工作状态,传统风电机组维护,通常都是在故障发生后亡羊补牢,维修费用高,维修周期长,还会影响生产的连续性。

一个5万千瓦的风电场,平均每年维护费用高达300万元,还会以平均3%的速率逐年递增。而这家风电企业拥有10个风电场、500多台风电机组,维护成本带来的压力可想而知。

就像一个人生病,病情发展有迹可循,如果能提早发现,提前干预,就能阻止病情恶化,节省医疗成本。而对风电机组来说,一个核心健康指标是温度,长期高速运转下,部件老化导致摩擦碰撞,就会产生不必要的热能,但有些时候,没有机械故障也会引起部件发热,怎么样才能在不放过故障的同时,做到不误报、减少风电场工程师工作量?

工程师爬上几十层楼高的风电机,为两台验证机组装上数十组温度传感器,在运转中源源不断地采集温度数据,夏分则在杭州的办公室里,实时监控并分析着数千里之外的数据。积累到上亿条温度数据后,夏分建立机器学习模型,希望能提前识别风电机组运行异常并预警。

一次,机器检测出的温度数值与模型预估的相差20多度,这让夏分有点不知所措,“温度过高将导致风电机组无法正常运作,这可不是个小问题。”远在新疆吐鲁番的工程师接到警报后,赶紧查看了“异常”风电机组测点的温度数据,却发现完全正常。那么,是网络传输不稳定?还是传感器故障或老化影响了数据的采集?夏分在脑海中推理着各种原因,不相信自己的算法会出错。

“怎么会只有1%的数据?”紧张排查几个小时,原因找到了,风电场出现严重的数据缺失,大量数据未同步上传,导致机器学习的并不是完整数据。

最终,ET工业大脑做到能提前2周识别风电机组潜在故障,大修变小修,单次重大事件维护成本降低20-40万元。夏分却意识到,要将前沿科技真正带入工厂,光靠在电脑前码出一套算法还不够,必须去实地考察真实情况。

毛纺企业的配色难

今年四月,夏分接到又一个项目需求——一家国内毛纺行业的龙头企业,希望借助ET工业大脑,来提高配色的效率。毛纺行业,染色质量是衡量呢绒产品质量的金标准,而染色的关键,在于染料配方的准确程度。

夏分一头扎进毛纺企业的混合羊毛车间。车间里闷热潮湿,羊毛和化学溶剂的味道混在一起,钻进鼻子令人犯呕,轰隆作响的混毛机器旁,放着一个个一米多高的白色塑料桶,里面塞着不同颜色的羊毛。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

纺织车间

这一次,客户来样是蓝色。试验台前坐着二三十名工艺员,他们从一缸染好颜色的羊毛中,撕取一小撮大概15厘米长、5厘米直径的羊毛小样,人工梳毛后,拿着小样去称量,然后通过美国进口的datacolor测色仪,检测染色结果是否与客户要求一致。

验色结果不尽人意,颜色严重偏紫,红色太多。第二次配色,又偏绿了,黄色太多。工艺员把第一缸和第二缸的羊毛倒入混毛机,充分混匀后,再撕取一撮上机器测色,若不正确,就再重复一次。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

成检车间

“还是很原始的方式。”夏分从老师傅口中得知,从拿到订单指令到完成配色,至少要一周时间,老师傅一般5次左右便可配色成功,而新人7次8次都未必能成功。染料配方频繁调整,生产周期随之拉长,库存积压还是小事,倘若色光不符合客户来样,能不能顺利交货都是问题。

夏分琢磨着,建立模型导入数据,让机器学习染料配方,再将老师傅总结出的经验,通过机器算法来学习,几次推荐出符合来样的染料配方易如反掌。夏分正想得出神,车间主任突然来了一句“我们没有数据”……

想要数据得先洗脑

数据,其实是有一些的。比如每次配色成功,工艺员都会详细记录染料配方和混色数据,只是没有数字量化最终配出的颜色,而是保存了实物样本。每次拿到客户来样,工艺员就拿出以前做过的实物样本对比,找出色光最接近的方案,不断调整测试。

可是经验丰富的工艺员都知道,哪怕配的是之前配过的同一种颜色,按照历史记录配出的颜色,也会因为车间环境温度湿度的变化而发生细微偏差,而染料员稍偷点懒,30分钟的染色时间缩短到26分钟,就会直接影响染料在羊毛上的附着力。而这些有可能导致配色失败的因素,都没有以数据的方式留存下来。

企业的IT员工,其实早就认识到数据生成和数据采集的短板,一直在向车间主任推荐数据的功效,可是对方的回答永远是“大家都那么忙,哪有空做这个?”

对于ET工业大脑,车间主任倒是寄予厚望,见到夏分就说,“人工智能嘛,你们阿里云就是很厉害,没有数据你们也应该能做出来。”

“没有数据不行?那你们就估计一个数据出来。”车间主任甚至提出,希望通过算法,自动填补缺失的空白数据。

“这根本就是悖论嘛。”夏分抿了抿嘴,车间主任“神化”了人工智能和机器算法,给他提出一个大难题。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

两次见面沟通,一次电话会议,夏分只要逮到机会,就给车间主任灌输“要采集数据”的观念。到了5月底,IT人员发来了专门采集的数据,夏分如释重负。

目标节省两成人力

从车间回到办公室,夏分坐在电脑前,在网上搜索起契合业务背景的论文。

《基于共轭梯度法的纱线染色配方预测优化算法》,外行人读个题目都费劲的论文,夏分抱起来就啃。从中午吃完饭到零点睡觉前,从一开始的三四篇论文再到引申出的10余篇参考文献,夏分一边仔细研读,一边做笔记标注,仿佛回到读研读博的时光。

既然目前车间工作流的操作无碍,就把不稳定的因素暂放一旁,只要减少配色的尝试次数,在一定程度上就是节省工作量,夏分理清了思路,“我们要做的就是找到一个平衡点,提高算法的准确率,从而减少他们的工作流和人力。”

“收集历史配方数据,列出用了哪个工厂的染料,哪几种颜色,比例分别是多少,染色出来的颜色是什么……”夏分给车间主任开出了数据采集要求,在配色染色的每一个步骤都加上了使用数值化记录的环节。

毛纺企业目前有几十类配方,而机器学习一类配方大概需要上百条数据,只要拥有数据,夏分很快就能完成数据清洗,特征构造,特征筛选,模型筛选,参数调优等建模步骤。

结合前期试验和算法模型,夏分设想,首次推荐配方的成功率只有60%,二次推荐的成功率是84%,三次推荐的成功率则在90%以上,可以节省20%的人力,现在就只差实践验证。

“分析、比较、判断,其实都是数学中的逻辑思维。”夏分笑着说,自己跟数学早已难舍难分。


原文发布时间为:2018-08-30

本文作者:王安忆

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
百度大脑5.0发布,宣布与华为重要合作,全新AI芯片「鸿鹄」面世
7 月 3 日,百度 AI 开发者大会在北京开幕。在大会上李彦宏展示的百度 AI 语音识别能力之外,最为引人注目的就是新任 CTO 王海峰向我们揭幕的,最新升级的百度大脑 5.0。新一代大脑在算法和算力上都有了重大突破。
3 0
腾讯广告,一个庞大的 AI「练兵场」
手握腾讯全系广告资源位,百亿级的日均曝光,腾讯广告可谓是一个被忽视的大规模 AI 技术「练兵场」。
6 0
3D重建传统算法对比深度学习,SFU谭平:更需要的是二者的融合
近年来,深度学习在计算机视觉的重要领域——三维重建中取得了一系列成果。然而,最近有论文指出,深度学习的 3D 重建表现甚至不如某些基线模型。而 CVPR 2019 最佳论文使用的是传统的三维重建方法,并不依赖深度学习模型。
3 0
历时两年,马斯克终发布「脑后插管」黑科技,革新脑机接口
成立两年,马斯克著名的脑机接口研究公司 Neuralink 终于在刚刚发布了其首款产品。与人们的想象相同,第一款产品果然是「脑后插管」的新技术。
6 0
Facebook全球崩溃11小时,暴露了科技巨头们用AI为你打的标签
美国东部时间 7 月 3 日早上 8 点,Facebook 服务器遭遇了大面积停电,这一事件使得全球 Facebook、Instgram 和 WhatsApp 受到影响——除了很难登录,全球范围内很多用户在超过 11 个小时的时间里都无法上传图片和分享故事。
6 0
红楼梦、法律,BERT 已有如此多的神奇应用
2019 年 5 月 ACM 图灵大会上,朱松纯教授(加州大学洛杉矶分校)与沈向洋博士(微软全球执行副总裁)在谈到「人工智能时代的道路选择」这个话题时,沈向洋博士认为人工智能发展在工业界将会迎来黄金十年,而朱松纯教授也表示人工智能的发展趋势将会走向大一统,从小任务走向大任务,从 AI 六大学科走向统一。
5 0
解禁在即:美国公司对华为供货两周后重启
据路透社报道:一名美国高级官员称,美国政府即将批准科技公司在两周内重启对华为的销售许可。此举预示着美国政府对华为的解禁即将出现实质性内容。
9 0
AI应该用来解决大问题,Jeff Dean:谷歌绝不使用AI算法专利牟利
「我们希望让人工智能技术为所有人造福,」Jeff Dean 说道。「谷歌认为,AI 应该对社会有益,并避免创造或加剧所有不公平现象。」
4 0
怎样扩充大数据?你需要了解的第一个联邦学习开源框架FATE
随着机器学习模型应用到生活生产中,如何获得更多的数据训练更好的模型成为了关键,而有助于解决该问题的联邦学习也就受到越来越多的关注。在本文中,我们将一同了解联邦学习,概览第一个联邦学习开源框架 FATE。
6 0
HashMap,难的不在Map,而在Hash
HashMap,难的不在Map,而在Hash
5 0
+关注
技术小能手
云栖运营小编~
5946
文章
9
问答
来源圈子
更多
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载