研究室秒变后厨,TensorFlow被馋哭!日本团队用深度学习识别炸鸡,救急便当工厂

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 研究室秒变后厨,TensorFlow被馋哭!日本团队用深度学习识别炸鸡,救急便当工厂

在韩国最受欢迎的外卖食品是什么?
答案毋庸置疑,一定是炸鸡
根据韩国外卖订购软件公布的的统计数据显示,炸鸡今年再次当选韩国“最受欢迎的外卖食品”从2014年起就一直霸占着冠军宝座,简直是小食界难以逾越的高峰。
无独有偶,在美国,炸鸡文化也长盛不衰,肯德基双层炸鸡堡唯一不限供应的地区就是美国。根据前德州监狱后厨Brian D.Price回忆,“70%的囚犯最后一餐都会要求吃油炸食品”。
那么,炸鸡和TensorFlow两者结合,你又能想到什么?
最近,日本一个机器人公司RT CORPORATION开发了一个叫Foodly的机器人,机器人上配置的图像识别系统就是用的TensorFlow,Foodly不仅能准确识别单块和多块炸鸡,还能将刚出锅随意摆放的炸鸡块规整地放在便当盒内
为了完成这个识别功能,研究团队也很拼,每天在实验室现炸鸡块,炸累了点炸鸡外卖,简直就是变成了炸鸡加盟店Foodly的开发也很好地贴合了疫情当下便当工厂不能大范围复工的现状,从下图中可以看到,Foodly的大小和与成人类似,能在便当工厂的生产线上与人并排工作

能看不能吃,TensorFlow都要馋哭了
说到这,掐指算算,已经有多久没吃过炸鸡了?不妨咽下口水,先和文摘菌一起就着这篇文章“画饼充饥”一下,中午就去激情下单炸鸡外卖吧!

为了研发Foodly,他们活生生把公司搞成了炸鸡加盟店
虽然好吃又馋人,但是炸鸡块在图像识别界可没那么招人待见
炸鸡爱好者们都知道,你徒手拿起的每块炸鸡形状是何其相似,更别说要在炸鸡堆中准确区分每块炸鸡的边界,这些都是图像识别研究者们内心拒绝炸鸡的原因。
据闻,坊间流传着这么一个说法:炸鸡块是图像识别最难逾越的高峰
但是现在有了Foodly,再难的炸鸡识别都是小菜一碟!识别效果如下图所示

据研究者透露,之前尝试过其他的机器学习框架,但看到有人利用TensorFlow成功对猫的照片进行分类后,就按捺不住内心的躁动了。
光想不做可不行,紧接着,研究团队对CNN的相关论文进行了阅读和学习,并进行了进一步的物体检测。那时正好是初代Foodly发布初期,在对系统前期表现相当满意的情况下,研究者们拿出究极武器——炸鸡,可以看到,初代系统能够将图像的一部分切成矩形,然后以矩形为单位对炸鸡块进行识别

虽然初代系统的表现就已经很不错了,但是研究团队表示还存在很多不足,比如识别时间太慢,识别一块炸鸡要一分钟左右,一分钟炸鸡骨头都被吸干了还识别个啥!再比如,初代系统还只能识别单块炸鸡,成堆的炸鸡识别还有待进一步地改进。
同时,为了养活这么一个系统,可真是“难哭”了研究团队,那个时期他们在公司现炸鸡块,炸累了点炸鸡外卖,简直就是把公司当成了炸鸡加盟店
当然这都不是最难的,最难的是要在下嘴之前先把图像数据存储下来。这么下来,他们最终收集到了大概400~500张规范的炸鸡照片,700多张不那么规范的照片
在那些不规范的照片中,有一些还故意拍到了人手,这也是有研究考量的。因为人手和炸鸡成色很像,形状也像,如果系统错误地对人手进行识别的话那可就大事不妙了。

Foodly进化史:从R-CNN起家,炸鸡块表面的凹凸纹路也不能放过


可以想见,开发Foodly可不是这么简单的事。
其实Foodly的前身还不叫Foodly,而是NEKONOTE,由一个扶手和安装在顶部的照相机组成,虽然看上去像是工业用机器人的形状,但是即使加上照相机用的框架,大小也能控制在一个人的样子。2016年6月,NEKONOTE在“TensorFlow学习会”上发表,在德国CEBIT 2017上公开亮相。出道舞台虽然足够有分量,但还是出师不利,当场就有不少人对NEKONOTE提出质疑,有人认为NEKONOTE只使用一只手,太可怕了,有人认为在食材正上方放置摄像头,可能会污染食物,还有人针对NEKONOTE的照相机和手臂的位置关系,指出手臂的摆动可能会影响到视线和识别效果综合了这些提议之后,研究者认为,或许应该把它设计成人型,于是NEKONOTE就摇身一变,变成了现在的Foodly。
当然这个过程可不只是外观的变化,升级归来的Foodly不仅能识别单块炸鸡,还能从堆积的炸鸡中检测出每一块炸鸡。识别效果的提高也是多方面促成的,首先识别标准从矩形识别变成了轮廓识别,这其中主要用到的就是从R-CNN发展而来的Mask R-CNN技术,其次,Foodly使用了可以识别炸鸡纹路的深度摄像机炸鸡块表面的凹凸纹路也作为特征被引入了深度学习,提高了识别精度。

几代系统迭代发展下来,研究者总结了用TensorFlow进行炸鸡识别的心得,汇总成了下面这张从理论学习到推论的流程图:

首先是制作监督数据集的阶段。用位于Foodly头部的深浅相机拍摄颜色和深浅的图像(RGB-D图像),然后将其放入个人电脑进行标注,指定炸鸡块的位置。在标注上,团队也制作了专门的工具使其尽可能的自动化。
在接下来的学习阶段,以既有的公开训练成果模型为基础,通过TensorFlow进行转移学习,制作食材检测用的模型。转移学习的引入也让几百张的图像工作量锐减到了几十张。
但是,既有的训练成果的模型只能输入RGB的3个通道,为了能够对应RGB-D图像,需要将输入层变更为4个通道才能进行再学习。
最后,把做好的模型转移到机器人上,就可以检测出炸鸡块。在搭载压缩GPU的边缘的AI板Jetson TX2上执行推理过程。
顺便一提,Foodly的目标是可以直接拿到便当工厂的生产线上使用。因此,根据工厂的不同,照明的程度也不同,增加了识别的难度。常见的对策通常是准备专用的光源,不过,Foodly在训练阶段就适用了多样的光度,因此即使没有专用的光源也能能稳定的进行识别。以上就是关于识别炸鸡块的整个流程,以实用的速度检测炸鸡块,然后将其放入便当盒的操作现在已经很稳定了。公司现在也把目光对准了其他的食物,比如番茄,相比于炸鸡,要让机器人把番茄放入便当盒而不让其碎掉,还必须调整机器人的力度,这就是另一个需要解决的问题了。

RT公司:机器人是未来社会的引路者
可别再说Foodly是日本人民的脑洞发明了。Foodly可是瞄准了当下便当工厂人手不足的现状,尤其是疫情之下,为了降低感染风险,Foodly可以代替人加入生产线,而且,表现不比人差。

考虑到大多数便当工厂的工作场所都是在60~90cm的空间内,目前工业机器人还有几方面问题需要重点考虑:硬件上希望即使有人不可避免地碰撞到Foodly也不造成擦伤,软件上,即使在没有预设的情况下,也能正常识别,除此之外,便当工厂流水线的菜单每小时会改变2~3次便当盒尺寸存在差异,流动速度也有不同等等。
这些不确定因素在Foodly面前全都迎刃而解,而且,Foodly操作也十分简单,不需要专家进行任何复杂的安装和调整,马上就能上工,可以说是工厂福音了。
好奇之下,文摘菌还去查了查开发Foodly的公司到底是什么来头,结果发现,这家叫做RT CORPORATION的公司完全就是一个机器人迷公司嘛!
先不说公司的理念是“life with robot”,公司名字RT是Robot Technology的缩写,公司的兔子logo来源参考了《爱丽丝梦游仙境》,官网介绍道,在小说中,兔子是爱丽丝抵达仙境的引路人,与此相对应的,在现实中,机器人就是未来生活的引导者
官网链接:

https://www.rt-net.jp/
除了实用机器人如Foodly的开发,RT公司也对机器人工程的教育事业十分关注。
公司认为,在现在和未来,培养优秀的机器人工程师都将是重要的社会使命。RT公司从硬件和软件等多个角度提供产品和服务,为培养实用型机器人工程师做足了功课。
作为教育工作的一部分,公司将提供自主研发装配的机器人用于学习和参考,同时,在这些机器人的帮助下,公司有能力举办研讨会等学习活动,为更多的人提供学习机会。

如今,机器人在社会生活中扮演着越来越重要的角色,工厂流水线上运行的大型工业机器人不断发展,家用小型机器人同样不断演变着,机器人已经到了能够与人合作、并肩作战的阶段
相信机器人引领我们前往的未来不会太遥远。
相关报道:

https://developers-jp.googleblog.com/2020/04/tensorflow-foodly.html



相关文章
|
22天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
228 55
|
3月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
深度学习之格式转换笔记(三):keras(.hdf5)模型转TensorFlow(.pb) 转TensorRT(.uff)格式
将Keras训练好的.hdf5模型转换为TensorFlow的.pb模型,然后再转换为TensorRT支持的.uff格式,并提供了转换代码和测试步骤。
113 3
深度学习之格式转换笔记(三):keras(.hdf5)模型转TensorFlow(.pb) 转TensorRT(.uff)格式
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
165 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤
本文介绍了 TensorFlow,一款由谷歌开发的开源深度学习框架,详细讲解了使用 TensorFlow 构建深度学习模型的步骤,包括数据准备、模型定义、损失函数与优化器选择、模型训练与评估、模型保存与部署,并展示了构建全连接神经网络的具体示例。此外,还探讨了 TensorFlow 的高级特性,如自动微分、模型可视化和分布式训练,以及其在未来的发展前景。
124 5
|
2月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
94 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
2月前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
108 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
107 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
基于TensorFlow的深度学习模型训练与优化实战
基于TensorFlow的深度学习模型训练与优化实战
107 0
|
2月前
|
机器学习/深度学习 人工智能 算法
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
102 0
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型
|
4月前
|
机器学习/深度学习 人工智能 算法
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别
鸟类识别系统。本系统采用Python作为主要开发语言,通过使用加利福利亚大学开源的200种鸟类图像作为数据集。使用TensorFlow搭建ResNet50卷积神经网络算法模型,然后进行模型的迭代训练,得到一个识别精度较高的模型,然后在保存为本地的H5格式文件。在使用Django开发Web网页端操作界面,实现用户上传一张鸟类图像,识别其名称。
133 12
鸟类识别系统Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+ResNet50算法模型+图像识别