云上视觉智能的挑战与实践

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 人工智能技术已经迎来了第三次高峰,并且势不可挡,但与此同时,人工智能的商业化之路却面临着诸多挑战。在2019杭州云栖大会开发者峰会上,阿里巴巴副总裁、达摩院人工智能中心负责人华先胜就为大家分享了作为开发者应该如何跟随人工智能的浪潮,创造真正的价值。

摘要:人工智能技术已经迎来了第三次高峰,并且势不可挡,但与此同时,人工智能的商业化之路却面临着诸多挑战。在2019杭州云栖大会开发者峰会上,阿里巴巴副总裁、达摩院人工智能中心负责人华先胜就为大家分享了作为开发者应该如何跟随人工智能的浪潮,创造真正的价值。

如今,人工智能技术非常火爆,而视觉智能技术更是火爆中的火爆,以至于融资比盈利的速度还快,这表明了市场对AI的信心,也说明AI产生的价值和大众期望还存在一定距离。未来,开发者将会对人工智能技术在产业中的落地发挥巨大作用。一方面,人工智能的落地需要开发者一行行代码写出来。另一方面,开发者对于人工智能在产业中的优势和劣势都有很深入的了解,需要开发者为人工智能的落地实践出谋划策。

人工智能在前几十年经历了三次高峰,前两次都只是梦想,而如今的第三次高峰与前两次有什么不同呢?第一,基于深度学习解决了过去的很多问题。第二,具有强大的算力。第三,在各行各业中都积累了海量数据,为人工智能技术以及从数据中挖掘价值创造了条件。第四,已经出现了很多成功案例,如刷脸支付、搜索引擎以及城市大脑等。

人工智能产业的确在快速增长,2000年到2016年世界上出现了8千多家人工智能公司,2000年到2017年世界上活跃的AI创业公司增加了14倍,2017年167家中国公司获得总计50亿美元的融资,如今各大公司都有了自己的人工智能实验室,各大高校也有了人工智能学院。可以说,人工智能已经进入了各行各业,并且势不可当。

image.png

那么,AI领域是否就是一片繁荣呢?其实AI面临诸多困境,其中第一个困境就是营收。今天超过90%的AI公司都在亏损。一些公司做AI项目,投入的人力成本非常大。另外一些公司做公共API,但门槛又非常低,都快成“白菜”了。

image.png

AI面临的第二个困境就是实验室与真实世界存在很大差异。在实验室中,可以将模型和算法刷到非常高的准确率,以至于怀疑机器要超过人类了,而当到了真实世界中,AI从业者的信心遭受打击,人类的信心才又重新拾回来了。

image.png

AI面临的第三个困境是用户和客户对AI的期望非常高,曾经有某个客户向阿里提出了120条需求,可是由于技术问题、数据问题或者计算问题,最终只能实现二三十个需求。

image.png

这也促使阿里巴巴去思考AI技术和应用成功的关键因素是什么。公开测试排名很高,估值很高,融资很好,这些都是成功的因素,但是成功关键却是能否为用户创造价值。价值也分为三种,从低到高分别为锦上添花、雪中送炭和无中生有。如果AI技术和应用能够带来价值,那么为商业成功买单的就不再是风险投资,也不再是大公司,而是客户和用户。

阿里巴巴在数据上的布局有很多,不仅仅在电商行业,还包括电商周边和阿里云以及各行各业都进行了深入探究。而且很多AI算法需要在场景中不断地打磨和迭代,才能真正地解决问题。

image.png

这里列举四个视觉智能技术和应用案例。第一个案例是视觉搜索。最早在上世纪末和本世纪初就有人在做通用视觉搜索了,但是当时的数据样本量远不如今天。拿拍立淘举例,它会用到三种技术,第一种是特征学习,需要用特征来描述一个商品的图象。第二种是大规模搜索,需要把大量数据放到索引里面去,方便快速查找。第三种是高性能搜索,需要能够快速响应大量用户的搜索需求,提供毫秒级反馈。

image.png

拍立淘是阿里巴巴第一个视觉搜索技术的应用,并且每天有千万级用户在使用这个功能。为什么今天拍立淘能够成功,而上个世纪末的视觉搜索没有办法成功呢?其背后的原因就是刚需。对于电商而言,商品的图像搜索是刚需,很多场景下用户只能通过拍照的方式才能搜索到所需要的东西,而通用图像搜索目前来看并不是一个刚需。既然是刚需,那么即便做的不够好,也会有很多用户会尝试使用,随着用户尝试的不断增多,搜索系统就能够收集大量的反馈信息来改善自身的算法,否则根本不知道改善方向是什么。因此,最重要的一点就是关注刚需。

image.png

第二个案例是视觉制造,它不是识别也不是搜索,而是产生视觉产品或者视觉信号,如图像、视频等,夸张一点讲就是“所想即所得”。这里举一个例子,商品页面秒变视频,输入包含图、文字以及声音的商品页面,AlibabaWood系统即会自动地下载这些信息,分析图片并自动地合成视频,这样的视频对于商品的推介作用就会明显高于页面,点击率、转化率都会明显提升。

image.png

第二个例子视频广告植入,通过对于视频内容的分析,将广告无缝地嵌进去。这项技术会检测视频里面的水、竖直面以及整体空间,并将目标商品的广告嵌入进去,既不会影响用户体验,也能够对用户产生影响。

image.png

此外,阿里的鹿班系统可以自动生成平面设计。它可以将素材自动合成设计稿以及广告图片,去年的双11一共有7亿多个Banner,其中4.1亿个是由算法自动生成的。经过测试,基本上相当于一个UED本科生的水平,并且一秒钟可以完成8千个Banner设计。

image.png

之前没有这项技术的时候,Banner需要设计师逐个设计,而如今借助于鹿班的力量,Banner图已经成了大型促销活动的标配,这种需求是创造出来的。

image.png

第三个案例是视觉诊断,这里只谈机器视觉诊断。大家从生产线上拿到的很多产品都是需要经过人工多次检测才能拿到的,而这会耗费很多人力。而很多检测非常繁杂,并且只能做抽样检测,比如太阳能电池板瑕疵检测。如今,借助算法的力量可以准确地进行全量检测,不仅能够提升检测准确率和检测速度,还能够节省一半的人力。除此之外,视觉诊断还可以应用于智能养猪等领域。

image.png

其实,人工智能在很多方面都可以发挥很大的作用,各行各业都有它的用武之地。不要把目光局限在像人脸、安防这样的红海中,作为开发者要知道各个行业存在大量的机会,通过AI技术可以帮助其提高效率、降低成本。当然,做到这一点必须深入行业,因为没有一种人工智能技术是通用的。

image.png

第四个案例是城市大脑,城市大脑是要解决城市大量数据价值挖掘的问题,通过AI算法和算力挖掘城市数据大量的价值。首先要做感知,要了解城市正在发生着什么,对于车、人、事、物都要非常清楚的了解。之后做优化,然后就是搜索和挖掘。再进一步就是预测,预测个体行为比较难,但可以预测群体行为,比如预测车流量。有了预测之后,才可以进行精准管控和提前干预。

image.png

阿里城市大脑经过3年多的实战,沉淀出了一系列人工智能的产品,比如天鹰视频图像搜索、天曜异常事件识别、天机城市推演以及天谱城市建模等。以天谱为例,它是把城市三维的重建和城市二维视频的分析有机地融合在一起,这样不仅能对视频的局部进行分析,而且可以把分析结果还原到三维场景中,进而得到一个全局的信息。天谱使得对视频的分析从二维走向三维,对视频图象的推理从三维走向了四维。城市大脑慢慢地演变成了部署、研发和创新的平台。

image.png

所以,一定要为产业创造不可替代的价值,只有这样才能在商业上取得成功。

image.png

谈到人工智能的未来,技术走向往往很难预测,但是可以总结几点内容:

  • 今天的人工智能的方法论虽然有局限,但仍有很大的发展空间。
  • 对于传统产业和数字产业都适用:Embrace AI or Lose。
  • 对于人工智能从业者:Dive into Applications or Lose。
  • 对于人工智能商业化:Create Irreplaceable Value or Lose。
  • 对于每一个人来说:Intelligence Everywhere Embrace It or Lose。
相关文章
|
10天前
|
机器学习/深度学习 人工智能 测试技术
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术,尤其是卷积神经网络(CNN)在图像识别任务中的最新进展和面临的主要挑战。通过分析不同的网络架构、训练技巧以及优化策略,文章旨在提供一个全面的概览,帮助研究人员和实践者更好地理解和应用这些技术。
43 9
|
6天前
|
机器学习/深度学习 人工智能 算法
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,重点分析了卷积神经网络(CNN)的工作原理及其在处理图像数据方面的优势。通过案例研究,展示了深度学习如何提高图像识别的准确性和效率。同时,文章也讨论了当前面临的主要挑战,包括数据不足、过拟合问题以及计算资源的需求,并提出了相应的解决策略。
|
9天前
|
机器学习/深度学习 人工智能 计算机视觉
探索深度学习在图像识别中的突破与挑战##
本文深入探讨了深度学习技术在图像识别领域的最新进展,重点分析了卷积神经网络(CNN)作为核心技术的演变历程,从LeNet到AlexNet,再到VGG、ResNet等先进架构的创新点。不同于传统摘要形式,本文摘要旨在通过一系列关键里程碑事件,勾勒出深度学习推动图像识别技术飞跃的轨迹,同时指出当前面临的主要挑战,如模型泛化能力、计算资源依赖性及数据偏见问题,为读者提供一个宏观且具体的发展脉络概览。 ##
38 7
|
8天前
|
机器学习/深度学习 分布式计算 并行计算
深度学习在图像识别中的应用与挑战
本文深入探讨了深度学习技术在图像识别领域的应用,分析了当前主流的卷积神经网络(CNN)架构,并讨论了在实际应用中遇到的挑战和可能的解决方案。通过对比研究,揭示了不同网络结构对识别准确率的影响,并提出了优化策略。此外,文章还探讨了深度学习模型在处理大规模数据集时的性能瓶颈,以及如何通过硬件加速和算法改进来提升效率。
|
8天前
|
机器学习/深度学习 人工智能 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第38天】本文将深入探讨深度学习如何在图像识别领域大放异彩,并揭示其背后的技术细节和面临的挑战。我们将通过实际案例,了解深度学习如何改变图像处理的方式,以及它在实际应用中遇到的困难和限制。