CV+圆桌对话:算法不是唯一考量,创业公司的商业闭环才是最大难点 | CCF-GAIR 2017

简介:

CV+圆桌对话:算法不是唯一考量,创业公司的商业闭环才是最大难点 | CCF-GAIR 2017

7 月 9 日下午,由中国计算机学会(CCF)主办,雷锋网与香港中文大学(深圳)承办的第二届CCF-GAIR全球人工智能与机器人峰会,进行到最后一天,CV+专场的圆桌论坛作为本次大会的最后一个议程顺利进行。圆桌讨论的主题是,计算机视觉渗透生活。本次圆桌由微软亚洲研究院资深研究员梅涛博士担任主持人,他幽默但犀利的主持风格博得现场阵阵掌声。

参与本次圆桌的五位圆桌嘉宾包括:中科院计算所研究员、中科视拓董事长兼 CTO 山世光、阅面科技 CEO 赵京雷、图麟科技 CEO 魏京京、瑞为智能 CEO 詹东晖以及臻识科技 CEO 任鹏。

虽然大会已经接近尾声,但现场依然座无虚席,观众们也幸运地看到了六位大牛时而轻松愉快、时而严肃认真的讨论。

雷锋网(公众号:雷锋网)整理了本次圆桌的讨论全文。

梅涛:今天我们圆桌的主题是「计算机视觉渗透生活」。为什么今天选择这个主题?因为我们觉得计算机视觉已经渗透到我们生活无处不在的地方,渗透这个词英文是「permeate」。计算机视觉已经在改变我们生活的方方面面,我们有必要探讨一下计算机视觉到底在我们生活中能够产生什么样的影响以及怎么落地。

今天我们会邀请到五位嘉宾,刚才我用好奇心给每个人起了一个外号,如果不当请原谅。因为做科研,总是喜欢做一些很创新的事情。

第一个嘉宾,刚才山老师说公司最小,所以请他第一个上台,给山老师起名字叫「X man」,因为山老师刚才讲了很多「X」(雷锋网 AI 科技评论按:山世光博士的演讲题目为《X 数据驱动的 Seeta 平台与技术》)。有请山老师。第二位嘉宾我起了个名字叫「忧郁的男子」,欢迎赵京雷赵总。赵总是毕业于上海交通大学的人工智能博士,现在是阅面科技的 CEO。第三位嘉宾我起的名字叫「Cool Man」,有请图麟科技 CEO 魏京京,他是我的师弟。第四位嘉宾我给他起的名字叫「风一样的男子」,因为他穿着黑衣服,像个黑衣人一样,他就是瑞为智能的 CEO 詹东晖。詹东晖博士是瑞为智能的创始人兼总经理,十一年在华为的经历,创立了瑞为智能。最后一位嘉宾我们叫「Cooler Man」,因为他看起来比我师弟更酷,有请臻识科技的 CEO 任鹏。(现场笑声+掌声)

今天有几个话题给各位嘉宾准备,在座来听课的各位老师和朋友也可以提出你们的问题,通过雷锋网的同事给我传达一下。

第一个话题比较简单一点,大家觉得计算机视觉对我们生活产生了什么影响?大家可以结合自己的生活讲一讲你们的体会,我们从最小的公司开始吧,山总。(现场笑声)

山世光:我最近经常在演讲的时候问大家一个问题,你今年刷了几次脸?我相信在今年也许你会刷三五次,明年搞不好得三十到五十次了。为什么这么说呢?因为人脸识别,就像刚才说的,在过去几年时间里面是计算机视觉里面最快落地的一个技术。我自己做人脸识别,我就不说「之一」了,这个技术确实在不断渗透到我们日常生活里,大家可以看到出行方面,比如说坐高铁、飞机,机场需要刷身份证,验证你这个技术是不是能应用。包括接下来几年,我们有大量公司采用人脸识别的技术做员工的考勤和门禁。这一代考勤门禁跟上一代不一样,三四年前我们家旁边的门禁考勤都是人过去,还是要看着屏幕做考勤,未来将会是无感的考勤,我相信人脸识别会越来越多的渗透到日常生活中去。人脸识别就像门和锁的关系一样,你需要进入到某一种状态,有这个权限就可以验证你是你,这是几乎无处不在的场景。我就说一下人脸识别,后面还有很多空间可以说。

梅涛:谢谢山老师,山老师认为人脸有很多因素。

赵京雷:「忧郁的男子」这个名字特别贴切,因为我这一年马上要开始驾照年审了,我已经被抓拍三次了,马上要开始去学习了。

对我而言,计算机视觉对我而言不能说是好的改变,但是对车牌的识别(很重要),每天我们开进去停车场,这种技术很成熟,已经潜移默化了,我们已经意识不到这种技术的存在了,包括臻识科技也在做这种技术。我们生活中类似车牌识别的技术大量存在了。跟车牌识别相关的 OCR 技术,包括手机里面各种各样的贴图、美颜。说到美颜,好像在座的女生不是很多,只要是女生,我觉得这已经是必备的。很多技术我们每天意识不到它的存在,我觉得这更是标准的这些技术的成熟。

反过来,我们思考一个问题,比如说山老师刚才谈到的人脸识别,包括马云,包括很多公司,每天都在讲刷脸,为什么把它叫做一种技术呢?从这个角度考虑,我认为这个技术反而是不成熟的。过几年以后,我们再也不讲刷脸,每天很正常,我上街买一个东西,不需要站在那里一刷,付一下款就可以了,这个时候技术会真正走向成熟。

CV+圆桌对话:算法不是唯一考量,创业公司的商业闭环才是最大难点 | CCF-GAIR 2017

梅涛:谢谢赵总,人工智能带来很多便利,但是需要人们更加的自律,希望赵总以后不要再忧郁了。接下来请魏总谈一谈计算机视觉给你生活带来什么改变。

魏京京:人工智能给我带来很多借鉴,我们平常感受到人工智能的点非常少,比如说我们用 FaceU 这种产品,还是比较简单化的产品。其实 2C 和 2B 我们看了很多,但是真正 2C 落地非常难,大部分公司都在做 2B 的业务,2B 是做我们正在做我们用到的东西。如果说视觉改变生活,现在这个阶段是非常隐藏的,你是看不到的,在每一个商品的背后是大量的服务和技术在里面,只是你感觉不到。后续的发展会从后端延展到前端,我们用的东西会慢慢感觉到有视觉的东西在里面,这个时间还很长。现在 2B 的业务我们做不过来,还有很多需要挖掘,2B 的爆发点还在后面,我非常看好后续三五年视觉在我们生活中显现出来,大的关键的应用机会非常多,我们创业公司先做 2B 的事情,慢慢技术、场景、用户行为习惯和付费习惯成熟之后慢慢会到前端。

梅涛:魏总的意思是你认为人工智能先从 2B 业务开始,然后慢慢渗透到生活。

魏京京:对,先从 2B 渗透到产品,慢慢渗透到前端,包括 2C 的产品和应用会越来越多,这是创业公司和产业发展的大的机会。

梅涛:下面请詹总讲一下人工智能的变化。

詹东晖:我觉得如果从人工智能对生活的影响,最直观的还是臻识科技他们做的车牌识别,以后每次进出停车场不用取卡。我们四位都做人脸识别,大家感受很多的还是刷卡,未来很多机场会增加人脸识别的登机,包括厦门码头,你去鼓浪屿必须做人脸识别,包括未来做长途汽车,这些领域都会通过人脸识别技术的引入,让整个生活变得更安全。

开始我们也做了刚才魏总讲的 2B 的场景,这两年我们开始在家电领域引入人工智能的技术,比如我们跟美的合作开发了智能空调的产品,现在已经开始在卖场做销售。你可以通过手势、语音可以让空调更智能的感知人的喜好,这是潜移默化的对生活的影响。我们瑞为智能做的更重的是 AI+零售的应用,现在在很多门店,特别是在北上广深很多门店逛街的时候,我们摄像头已经在分析你的喜好,包括分众的媒体已经有我们的一些摄像头,这些已经在间接的潜移默化的改变我们的生活方式。这是我做的一点补充。

梅涛:谢谢詹总,基本上你们会让我们购物非常方便,也方便了商家。最后是任总,谈一谈你的看法。

任鹏:刚才两位老总还介绍了我们公司。我们做的确实对大家当前的出行带来很多方便,现在停车场的进出就已经很方便了。其实还有一些很简单的,大家已经感觉不到的其实对生活改变更大。我想问大家每天会扫几次码?这是非常简单的计算机视觉技术的应用,里面的关键在于它的准确度,如果人脸识别真的像山老师讲的那样,准确度达到百万分之一的时候,对大家的改变就完全不一样了。一个技术要改变生活,还是在于这个技术的成熟度。如果不是走这个方向,可能会在娱乐方面,比如说在游戏方面改变生活。我们走的是工业化的路线,比如说安防的应用、工业自动化的应用,对算法的准确度要求是非常高的。现在随着技术的发展,我相信我们技术的改变对大家生活的影响,可能不知不觉中大家的习惯就改变了,还不知道这是因为计算机视觉的改变。

梅涛:谢谢任总,谢谢五位嘉宾的讲解。我自己感觉刚才问的问题比较简单,我是比较喜欢提一些难的问题的,我对刚才问题的解答不够满意,因为他们在变相做广告(现场笑),所以我接下来的问题稍微难一点。问题没有变,我想问大家,你觉得计算机视觉能够改变生活的哪个方面呢?但是得是除了你们业务以外的方面。把这个问题先提给詹总。

詹东晖:您的意思是在我们业务范围之外。

梅涛:对,这才是真心话。

詹东晖:我觉得人工智能对生活的影响,这个趋势肯定是必然的,只不过我们看它是在五年之内、十年之内能够多深地改变我们的生活。我可能偏悲观一些,在我们能看到的眼前三到五年时间,我觉得还不会给我们带来很大的变化,比如说机器人,虽然现在机器人很火,但之前看起来很傻萌的机器人有没有用处?好像没有什么用处。

梅涛:大家可以看到,我第二个问题把他真心话问出来了。(笑声+掌声)

詹东晖:对,我认为还需要蛮长的一条路,在技术上面做更多突破和革新。刚才任总说到,对人脸识别来讲,客观来讲,我们不吹牛的话,它还是能够达到非常高的精准度,能不能把人脸识别作为唯一的取款方式,未来三到五年是不可能的。我们讲阳光大道的同时,其实还是有很多挑战存在的。

梅涛:这一点我深为赞同,谢谢詹总。谁自告奋勇第二个来讲一讲你的真心话。

赵京雷:这个问题非常有挑战。对大部分视觉公司来说是有需求,然后卖技术。我觉得这是我们要思考的问题,我们成立一个公司,80% 是不做得,10% 或者 20% 要专注做这个才可以,首先要看我们专注的点是什么,我们在视觉上面,但是不代表我们不具备其他的能力,比如说 FDDB、LFW 技术我们公司目前排第一,我们也可以解决很多安防问题、金融问题等等,和人相关的东西我们都可以解决,但是有所为、有所不为,我们目前主要关注怎么思考山老师讲的刷脸。

刷脸讲了这么多年,在消费级范围内怎么能够成为现实,有没有具备创新性的产品出来,所以我们更多是基于对这个核心技术自己去做一些创新性的产品,希望能够做一些能够改变行业的产品,而不是做大家都能解决了的问题,解决不了的问题是大家没有好思路,我们希望从自己意愿而言寻找这些思路和寻找方法,不是喊两三年,大家针对这个问题一直停留在这个状态,这是我们去做的。反过来,某种意义上讲,如果大部分人都能解决的问题我们不太会去做。如果问题很强,比如说在识别里面,怎么能够在未来普及,怎么样成为人人可用的技术,不只是掌握在政府、只是掌握在少数人手里的技术,我们希望更多的做这样一些事情。

梅涛:谢谢。魏总,你有什么高见?

魏京京:刚才都说了一些虚话,现在说实在话。说心里话,从一开始我们做这个行业,从三年前到现在为止,我们对人工智能和这项技术的理解并没有像外面媒体宣传的那么酷、那么炫、那么反人类,它只是对软件技术的爆发而已,对我们生活或者行业的改变,我觉得是润物细无声的改变。上一个潮流是在讲互联网和移动互联网,互联网和移动互联网的特点是爆发力度非常强,爆发出来的时间点非常短,比如说共享单车等等互联网的产品。在人工智能这个产品,你希望在一年两年或者三年五年有更新换代变革的东西不太可能,不管在产业过程还是在我们生活过程中,它只是一个辅助手段,只不过把我们原来认为比较难被智能化的东西逐步开始智能化,但是这个过程也是非常缓慢或者非常逐步的。

我们给客户做产品,一开始不是把所有东西都颠覆掉,只是在某一个环节能够帮你节省人力、金钱或者时间效率,说实在话,这个东西没有那么高大上,也没有那么反人类,只是这个时间点出来一个很好的技术,给它插上一个翅膀,在每个行业慢慢显现出它的价值。所以,这个行业的周期应该比互联网和移动互联网长非常长的时间,我看好十年、二十年之后可以在技术革新和产业进步方面发挥更大的作用。

梅涛:魏总说了很多真心话,至少是有希望的。任总呢?

任鹏:我讲一个改变生活的场景,我们也想做,但是技术还达不到。比如今天这个会场,如果安防领域的技术能识别出在场的每一位是谁,这会儿在讲什么话,我觉得这个场景会对大家的生活有非常大的改变。

梅涛:你想干嘛?(现场笑)

任鹏:我们想做,但是这个比较有难度、比较有挑战,受限于当前的技术。

梅涛:比如你知道各位的知识文化水平、受众面,可能今天讲得会不一样。

任鹏:简单一点,有点像上帝。做技术的可能会有这样的想法和追求,但是实际上他对生活的改变可能是负面的,没有隐私了,也有可能有的人的工作会失去,但是这种发展是挡不住的。

CV+圆桌对话:算法不是唯一考量,创业公司的商业闭环才是最大难点 | CCF-GAIR 2017

梅涛:谢谢任总,最后有请我们最小的公司的山总。(现场笑)

山世光:我想跳出来计算机视觉讲整个 AI 领域。这次大家注意到搜狗同传这件事情,还是蛮有意思的,中文不太好,但是对英文,包括同传比较好,包括今天听医疗那边讲的,不用听英语,看中文基本上能理解是什么意思。像这样一个技术不是说多么成熟,但是如果不去用,更加不能走向我们的日常生活。对计算机视觉来说,需要比语音识别还要更晚一点,这是一个必然的现象,因为语音识别的好处是识别完以后变成文本,变成文本就有语义,直接可以跟互联网挂钩,这对计算机视觉来说,大多数场景里面我们看到图像里面精确的语义比较少,我们希望把图像里面尽可能多的语义尽可能精确地提取出来。当尽可能多的语义被提取出来以后,后面是有很多空间可以做的,但是相比语音识别我觉得会晚蛮久。如果不是人脸识别,还有很多,计算机视觉一定是润物细无声的作用。

如果非要说计算机视觉,最广泛的应用就是在鼠标领域。大家知道光学鼠标的原理,就知道光学鼠标在移动过程中是通过图像匹配做移动位置的检测的,大家天天都在用计算机视觉的产品,但是大家不觉得它是计算机视觉的产品。很多时候计算机视觉产品往往是锦上添花,润物细无声,你没有感觉的时候让你体会到技术给你带来的好处。在医疗方面我非常看好,我觉得未来自动这件事情很快会超过中国平均以上医生的水平,对医疗的改变会非常大,当然政策上的原因,如果政策能够突破,这是非常大的改变。

梅涛:刚才问这个问题我是希望大家能够发散思维想一想,也许十年、二十年后大家可以去那个方向创业。

接下来的问题,请允许我作为主持人再问最后一个问题,待会儿大家可以准备一些非常难的问题。下一个问题很简单,我想问大家,因为大家创业好几年,踩过很多坑,我们在微软做产品、做研发的时候也遇到好多坑,我想问大家,你觉得人工智能技术在落地过程中最大的难点是什么?希望大家简洁明了的告诉我们你遇到的难点是什么,你觉得这个难点应该朝哪个方向解决?

任鹏:我觉得最大的难点是闭环。这个闭环是指什么呢?市场的需求和当前的技术能达到的水平的闭环。做这个产品的时候,作为一个创业公司,你能把握的影响产业链的闭环,比如说取得数据,以数据来驱动,当前产品的结果和客户市场的需求还有差距,你反过来怎么迭代?所以这个闭环是非常关键的。

举个例子,安防行业,08 年我们刚刚开始创业的时候,客户提了这样一个需求,你们的算法能不能把场景里面的人、车都识别出来?过了九年,当前的技术是可以解决了,但是要批量化成本很高,客户会不接受这个东西,他想的是,你们能不能把这个东西识别出来,又很便宜。所以,这个闭环是很难的,做产品的时候就有很多需要取舍和平衡的东西,要去平衡你的功能、性能,满足客户的指标、期望,最后在产品设计和成本相关的这些方面,其实一个核心就是闭环。

梅涛:任总认为闭环是一个难点。詹总呢?

詹东晖:我也同意任总的说法,闭环是一个难点,对商业场景来说,对人工智能的需求是存在的,但是为什么这么多年没有什么应用?最根本的原因是技术,这两年比较火,因为深度学习的引入让技术的性能上达到一个跳跃,我们发现很多场景似乎具备了可应用的基础,这距离人工智能要达到的目标是有差距的,但是不意味着不可用。如何让这个技术和用户需求达到一个平衡,这是一个难点。

另外,刚才提到深度学习,深度学习是一个很消耗处理资源的技术,很多时候一个问题是如何在一种低成本、高性价比的方案里面去实现。你可能做出一个很牛的识别相机,但是成本要 2 万块钱,这个相机可能就基本上没有办法销售和商用。

举个例子,我们在做 AI 放到零售的时候,做了快四年才推出第一代产品。从算法上来看,我们并没有做太大的革新,这三四年都在做它的落地。从最开始很复杂的系统,要前端相机、后端服务器,那时候成本要大几千块钱、一两万块钱,做到现在可以很低的成本,一两个很小的摄像头,可以完全不依赖网络和云端,可以做复杂的智能学习的算法的实现,我们花了四年时间。因为这四年时间的投入,达到这样一个落地化的产品,才使它具备开始规模的在商业应用的情况。我觉得这里面很大的挑战在于,算法本身已经不是一个最主要的维度了,而是看怎么做落地化。

梅涛:关于落地化我自己感触很深,因为我经常遇到客户,客户经常提出无理的要求,客户说你能不能识别人脸做到 5 个 9、6 个 9?我说我可以识别出来黄晓明,但是识别不出来梅涛,这是两个不一样的场景。

魏京京:观点基本类似,我们创业过程中最大的一个难点是怎么从飘在天上落到地下,因为视觉这个领域基本上是很高的技术壁垒或者带着技术光环创业,否则做不了这个事情。通常是以我为主,客户围绕我来转,我们也犯了这个错误,我们产品设计的时候以我为主,这是技术背景的公司很容易犯的问题。

我们慢慢从飘在天上到接受现实落到地下,跟之前两位的理解是差不多的意思,最关键的不是你有什么技术,而是你把已有的技术跟他的痛点结合,这个问题不是技术的问题,基本上就是商业问题。你要做商业闭环,同时要跟已有的环节有合适的商业产品的设计,这个需要付出的努力不是做技术的来做的,而是你要接地气,围着客户做讨论、设计和服务,让他慢慢接受你,这是很痛苦的,也是我们做技术创业需要转换的地方。我原来也做过投资,看过很多以技术为背景的创业公司,这是很容易犯的一个问题。

梅涛:谢谢魏总,魏总说出很重要的一点,要服务客户,要理解他的需求,要整天围着客户转。(现场笑)

赵京雷:非常同意前面几位嘉宾的观点,这确实反映了技术创业遇到的比较大的难点或者痛点。从我们自身而言也是这样,可以归纳为两点:第一点,怎么样管理客户的期望,不一定是用户的期望,因为大部分是 2B 的。可能受很多媒体或者各方面的宣传,如果不是做技术这个行业的,总是对 AI 能做的事期望太高了,不管是普通的小机器人或者对视觉技术期望太高,经常有各种各样的公司找过来说,我有这样的需求,你能不能做。

第二点,计算机视觉不是万能的,比如说我们一般说的视觉是 RGB,计算机视觉这两年进步很大,在 RGB 普通镜头下,光线、角度各方面都有了比较大的进步,但是现在的技术发展的情况还不是所有问题都能解决。跟客户解决的问题可能依赖计算平台,依赖整个体系的联合优化,比如说有很多场景的客户找到我们说,能不能帮我们做一件事,我们会问他,这个事情晚上要不要做?晚上要做。他是拿普通摄像头,补光的时候,这是消费级的,你又不能拿灯去补光,这种情况怎么去管理,和客户一起去梳理行业碰到的这样一些需求,然后把它抽象出来,怎么样用最好的芯片、最好的后台系统结合算法一起去做,其实算法一定不是孤立的。

梅涛:谢谢赵总,其实我也很赞同,因为我发现用户需求和期望有两种,一种是用户没有期望到你算法能做到这一步,另外是用户觉得这么低的要求算法做不到,其实用户需要引导。

山世光:其实我特别不想同意他们几位的观点,但是在是没有办法不同意。(现场笑)我就不重复了,但是我的观点是,最大的障碍还是技术不完美。我们所谓的技术完美,当然我们希望「快、准、稳」。快是随便找一个很烂的芯片就可以做;准是什么情况下都能工作;稳是不会出现差错,这样落地和闭环就不会出现难题了,但是我们现在真的做不到。比如刚才说的万分之一,很多时候是达不到的,比如变换场景,晚上你非要用普通的摄像头就是做不到,没有办法。我觉得真的还是技术上不完美,这也是这个领域并没有到非常非常完美的马上可以四处用的阶段,在这个阶段最难的是怎么去找到客户的需求和技术的边界能够结合的应用,再配合上其他的一些条件,能够满足用户的需求。刚才几位说得都对,技术不完美还是一个很大的障碍。

梅涛:其实我觉得不完美有时候也是一种完美,正因为不完美所以我们有很多机会。

山世光:对,上帝也不完美。

梅涛:谢谢大家。接下来把时间留给在座到场的听众,不知道有没有非常难的问题?

听众:我想问一个很具体的问题,关于图像识别领域的竞争差异化的问题。现在有一种说法,在人脸识别、医疗读图领域,行业里面这两个领域主要的公司用的技术都非常像,有人就说现在这些领域的发展变成不是拼技术,而是拼市场,去跑马圈地,去融资和烧钱,不知道对这种情况台上各位老总怎么看?

魏京京:你刚才提到图像识别视觉差异化的问题。每家从图像识别本身来说,从技术到落地中间的环节非常多,并不代表有图像识别技术就既能在医疗领域做,又能在营销领域做,又能在工业领域做,差的十万八千里,这中间是显现每家公司技术核心竞争力的。你要有技术落地,需要找数据源、找他的痛点,同时把商业闭环做好,不代表我直接说一个故事就有人给你钱,你就把这个事做成,中间的过程还是非常复杂的。我们做很多细分领域,每个细分领域少则半年,多则一年到一年半,中间需要打磨的东西非常多。

图像识别虽然是有技术的通用性,但是到细分行业需要做的事情非常多,这个事情不仅仅是技术问题,技术只占 1/10 甚至更少的环节,因为机器学习的原理逻辑带来技术壁垒本身不是特别高,很多时候需要你把商业的东西完备的提供给客户,这是商业要做的事情,也是我们公司创业要做的事情。我们不是做学术,是真正做一个人家愿意买单的东西,要把这个价值链条梳理的更加清晰一点。

詹东晖:我简单补充一下,我很同意,我的观点是不会有所谓纯粹的 AI 公司,AI 只是一个技术,对于我们在座的几位来说也只是 AI 的创业者,每个人可能会选择不同的落地行业、落地跑道。未来可能有人做安防,说谁是在安防领域做的最好的 AI 公司、谁是零售领域做的最好的 AI 公司。单纯的计算机视觉技术的壁垒,对做得好的公司来讲,这个壁垒越来越没有差异化,做得好的就是看谁跑得更快,能够更快让技术和产品落到行业里面去,更深的铺到这个行业,构建一个更完整的行业壁垒,这可能会是一个更重要的地方。

赵京雷:我觉得这是一个蛮重要的问题,所以我补充两句。其实大部分人都会问到这个问题,这家也在做、那家也在做,为什么还要做这一块?我觉得这个事情分两个阶段,一个阶段是人工智能技术底层还不是非常成熟,我们在做 AI 底层基础设施铺垫的阶段,这个阶段不像大家想象的那样,比如说我们有开源的框架,把不同算法写上去,大家跑出来的东西是一样的。如果是这样,Facebook 和 Google 这样的大公司就不用收购这种基础性的公司了。像刚才魏总谈到了,每一个单项技术成熟在不同领域、某一个点成熟,在这个结点需要至少一年半到两年的时间,比如说一家公司从无到有的模型上做,第一个是在云端能不能部署,在前端能不能部署,肯定需要一年半到两年的优化过程。

我觉得在这个阶段,人工智能基础设施快速落地的阶段,不同公司的技术差异非常大,但是如果过了这个阶段,我非常同意刚才谈到的,这些技术不是绝对的壁垒,一年能算什么呢?未来人工智能的场合里面一年可能就是一瞬间,所以这里面技术肯定不是壁垒。那什么是壁垒?刚才各位已经谈到应用领域,我觉得主要就是产品。像移动互联网早期那样,基础设施和运营商很早出现,最终是什么样的东西把不同的做这一块的公司区分开来?一定是产品。比如说苹果是爆品,iPhone 出来了。其实人工智能现在缺少爆品。有一些公司,不管做什么领域,能从这个领域里面把自己的爆品打造出来,我觉得这就是未来 AI 公司本质的差异化所在的点。

梅涛:谢谢赵总。由于时间关系,可以再来一个问题。

听众:这个问题想请问一下山老师,刚才讲到表情识别,识别表情到底干什么?我们是做行业应用的,在行业里面的服务人员的微笑有一定的要求,微笑是比较简单的事情,我的想法是通过这个表情我们在后台再进行一些深度的应用挖掘,比如说他的绩效,企业可以根据这个做员工的关怀,这种劳动强度可能比较高,在后端进行进一步的挖掘,我想请教您的看法。

山世光:这是蛮好的问题。我觉得对 AI 感知人本身,除了认出他,还要了解他的意图和情感,这一点是非常非常重要的。我们能够想到有很多可以落地的应用,比如说风控,当然我不能做测谎,但是可以做情绪的感知。我可以做教育上的评估,比如说小孩在上学过程中的专注度、接受度等等这些方面,都是可以去做的。当然其实大家已经看到笑脸快门这些非常普遍的锦上添花的应用。另外一种是跟疾病、健康相关的,其实是泛情绪、泛情感的这部分,通过估计心率,不知道未来是不是存在这样的可能性,可以测血糖、血压,以前觉得技术上难度太大,现在看来其实都有可能,不是不能做。一旦当非接触式的通过视频方式可以做,我相信可以带来非常非常多的应用。

梅涛:谢谢山老师。最后一个问题,我代表雷锋网来提问,请各位嘉宾展望一下未来五年计算机视觉的发展方向,以及未来五年你觉得哪个方面可以更加深入我们的生活,哪些计算机视觉技术可以更加渗透我们的生活,给我们带来更多便利?

任鹏:未来五年,我觉得传感器技术会变,深度的传感器可能会普及。多种数据源的融合,不只是视觉,多种数据源融合结合成产品解决问题,这种情况会越来越多。这是技术层面的。

当然,算法也好,芯片、计算资源也好,肯定要符合摩尔定律,五年以后我觉得不会是瓶颈。因为十年前我做的是增强现实 AR,我觉得下一个五年增强现实会越来越普及。

梅涛:你认为是增强现实。

詹东晖:我觉得未来五年工业视觉这一块会有比较大的突破,因为目前这一块不仅问题很多,而且市场刚需很大。另外,山老师提到 AI+医疗,医疗领域引入 AI 可以很大改变医疗的现状。

魏京京:我们也是做工业设计的,非常同意詹总的观点。我觉得分两方面,第一方面是未来五年会有一大波机器替代人的过程,包括工业视觉的制造环节和服务环节,很多 AI 算法会集成到产品里面把人的工作替代掉,这是不可逆转、必然要形成的。另外一个,现在 AI 算法比较重,后面有大批量服务器支撑,所以后面的趋势是轻量化,轻量化到我们家庭和身边,让更多能够触碰到的功能带到我们面前。一方面是我们后面看不见的很多人会被替代,另外是我们中间会出来很多大家比较惊讶的智能化产品。

赵京雷:我觉得未来几年对人类生活影响非常大的计算机视觉的应用,一定来自于受众最广的领域。哪个领域最广?一定是手机。未来五年什么样的视觉产品会成为爆品?大家只要看苹果一代一代的会加什么样的视觉功能就可以了。如果加刷脸,那刷脸就是爆品,人人都会刷脸,所有硬件都会通过刷脸去登录。所以未来很简单,看苹果这样一些产品行业的大师怎么去思考视觉,在对人类生活影响最广的领域的构思。

山世光:我觉得是医疗,因为医疗真的非常非常重要,每个人都会涉及到去医院做检查的问题,所以我觉得医疗肯定是非常大的一个市场。另外一个就是自动驾驶,我不知道大家看不看好,我自己还是觉得未来五年里面,至少辅助的驾驶系统会逐渐进入到几乎所有的车上去,这会给大家带来生活态度、生活方式的变化,我相信一定会带来。当然,五年之后是不是真的全自动驾驶不好说,全自动驾驶在一些封闭的环境下面、可以拿到高精地图的场景下面,我相信也是有非常大可能性的,所以我还是非常看好这种。而且我相信自动驾驶领域里面,视觉 Camera 这种方式应该会超越雷达的方式,使得它能够更快或者更有可能普及。

梅涛:谢谢世光,世光认为自动驾驶是下一个五年的热点。我们的圆桌讨论非常成功,再次感谢五位嘉宾的参与。其实人工智能离我们很近,计算机视觉离我们也很近,未来离我们并不遥远,将来我们可以想象将来身边围绕各种各样的机器人,医疗机器人、无人驾驶机器人、看护机器人、情感机器人,我们人类会变得更加聪明还是更加懒惰,我不知道,但是不管未来怎么发展,我们人还是会来到这个会场,面对面的具有感情色彩的深入交流。感谢雷锋网,感谢 CCF。

本文作者:奕欣

本文转自雷锋网禁止二次转载,原文链接

相关实践学习
基于函数计算实现AI推理
本场景基于函数计算建立一个TensorFlow Serverless AI推理平台。
相关文章
|
5月前
|
算法 测试技术 计算机视觉
2023年秋招算法面经:Tp-link cv图像算法面经
2023年秋招算法面经:Tp-link cv图像算法面经
38 0
|
8月前
|
机器学习/深度学习 传感器 人工智能
CV面试题目总结(二) - 深度学习算法
CV面试题目总结(二) - 深度学习算法
188 0
|
8月前
|
机器学习/深度学习 编解码 算法
CV面试题目总结(一)- 深度学习算法
CV面试题目总结(一)- 深度学习算法
116 0
|
5月前
|
算法 测试技术 图形学
2023秋招算法提前批:小红书CV图像渲染算法岗面经
2023秋招算法提前批:小红书CV图像渲染算法岗面经
49 0
|
11月前
|
机器学习/深度学习 存储 编解码
CV全新范式 | LSTM在CV领域杀出一条血路,完美超越Swin与ConvNeXt等前沿算法
CV全新范式 | LSTM在CV领域杀出一条血路,完美超越Swin与ConvNeXt等前沿算法
177 0
|
C++ 计算机视觉
CV之FC:人脸识别之判断相似度极高的国内外明星根据人工智能算法(AP云)预测判别是否为同一个人
CV之FC:人脸识别之判断相似度极高的国内外明星根据人工智能算法(AP云)预测判别是否为同一个人
CV之FC:人脸识别之判断相似度极高的国内外明星根据人工智能算法(AP云)预测判别是否为同一个人
|
算法 TensorFlow 算法框架/工具
CV之YOLOv3:基于Tensorflow框架利用YOLOv3算法对热播新剧《庆余年》实现目标检测
CV之YOLOv3:基于Tensorflow框架利用YOLOv3算法对热播新剧《庆余年》实现目标检测
CV之YOLOv3:基于Tensorflow框架利用YOLOv3算法对热播新剧《庆余年》实现目标检测
|
算法 算法框架/工具 计算机视觉
CV:基于keras利用算法MobilenetV2实现局部相似域的多人二维姿态实时估计(詹姆斯扣篮+美女跳舞)
CV:基于keras利用算法MobilenetV2实现局部相似域的多人二维姿态实时估计(詹姆斯扣篮+美女跳舞)
CV:基于keras利用算法MobilenetV2实现局部相似域的多人二维姿态实时估计(詹姆斯扣篮+美女跳舞)
|
算法 计算机视觉
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
|
计算机视觉 Python
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)
CV:利用人工智能算法让古代皇帝画像以及古代四大美女画像动起来(模仿偶像胡歌剧中角色表情动作)