微信网友对话极视角CTO黄缨宁,畅谈计算机视觉与人工智能

简介:

本期硬创公开课,我们邀请到了极视角CTO黄缨宁,和我们分享了如何从青年科学家变成首席科学家(or CTO)。课后,直播群反响热烈,网友们纷纷在提问互动环节中向嘉宾砸来了各自感兴趣的问题,从CV热点到AI动态,从学习经验到学术建议,各种问题脑洞大开,黄总也是使出了洪荒之力,非常给力地一一作出了解答。错过直播的小伙伴们不用担心,雷锋网(公众号:雷锋网)贴心地为大家整理了网友提问环节实录,干货满满哦~

微信网友对话极视角CTO黄缨宁,畅谈计算机视觉与人工智能

黄缨宁, 毕业于北京大学机器感知与智能实验室,师从长江学者特聘教授查红彬教授。曾作为主要成员参与多个计算机视觉领域的国家自然科学基金项目并发表论文,获得相关专利。曾在百度进行数据挖掘工作并与大数据部共同发布电影票房预测系统,后获谷歌总部无人驾驶录取。现为极视角CTO,致力于打造中国第一个计算机视觉的PAAS云平台,推动计算机视觉技术在生产环境中的落地。

网友提问环节实录

网友zz朝:现在CV业界比较火的方向有哪几个?

黄缨宁:大家应该都知道基于cookie可以对人的上网行为进行tracking,然后提炼出一些信息可以有助于商业变现,比如amazon中一半以上的单是基于推荐转化的。现在有一个有意思的刚需,主要针对线下,我能不能把消费者用视觉的方法做一个cookie串起来,然后分析他的行为,辅助线下的销售和变现呢?上面那一块就可以用计算机视觉来做,个人觉得是非常大的商机。但这个还没火,要说火的,比如人脸识别的各种应用是比较火的。

 

网友Chole:AI在生产供应链的应用以后会有哪些?

黄缨宁:中国目前的情况是生育率走低,老龄化严重,年轻人不足,人工只会越来越贵。而我们习惯了现如今的生活,必然需要大量的劳动力来维持和发展。所以AI以后肯定会逐步的解放一些高重复性、低复杂度的工作。比如现在工业中,我们就做过一些吊版识别,残次品检测,危险区域越界报警,工件计数等,都是属于生产中的一些应用,也确实节省了大家的人工时间。

  

网友Chole:这些是否都要嵌入到机器人里面去实现呢?请问做机器人视觉和计算机视觉,是一样的吗?

黄缨宁:可以嵌入也可以不嵌入,这是个形式,我可以把视觉分析的结果再传回机器人的行动控制中做出相应的反应。就是视觉的大脑和行动的大脑要互联就对了。另外,机器人中很多的处理能力不如云端强大,毕竟云端需要多少资源就可以申请多少资源。

 

网友HL:您觉得CV跟机器人相结合的应用中,哪些应用场景是您比较看好的呢?

黄缨宁:主要是安防。监控摄像头是固定的,有机器人的话可以主动巡检。昨天极视角就和大疆无人机合作推出了一款巡检火情的解决方案。

  

网友kailasTT:我大概了解了一下极视角,目前还并没有硬件,请问你们会涉足“软件+硬件”这种商业模式吗?如果纯软件,和格林深瞳的差异竞争体现在?

黄缨宁:我们制定的策略是做paas云平台,目前不会碰硬件,这会触碰很多我们合作伙伴的利益。毕竟我们的一个重要目标就是帮助传统硬件厂商进行产业升级。 格林深瞳做的比较像是抓住一个点,就做一个点的解决方案,这样打法,渠道和变现推广,找市场什么的都是比较艰难的。 我们做的是计算机是觉得app store,上面会有我们自研的算法,也会有开发者的算法,也会有其他专注于cv领域的解决方案的友商的算法,把这些算法通过硬件摄像头分发下去,让cv产生价值


网友韩天啸:当时您读博如何选择cv这个方向的?

黄缨宁: 从本科开始就喜欢做计算机视觉,之后毕业了这块火了,算是天赐的礼物吧。


网友HL:能麻烦您给一些初涉计算机视觉的学习方面的经验和忠告吗?

黄缨宁:方法论和coding两手抓。话说读书千遍,其义自现,在CV也是这样,把基础打牢多实现,之后就能融会贯通。


网友Jason:我是会计学博士在读,目前研究方向是会计文本信息的增量价值研究。一个人探索一个未知的方向很孤独。不知道您当时是怎么克服困难,做出很棒的研究成果的。因为是跨学科,我必须对会计金融和自然语言都有所了解,有时候感觉做论文的速度比别人慢很多。请问您能给点建议吗?

黄缨宁:读博本来就是一个人探索世界边界的过程,孤独是难免的,但孤独是你的财富。见过跑步的人吗?教练会教的重要一课就是不要跟着别人的脚步走。你有你的速度,别人或许快,但你在此刻积累。Ted中有一课就是,影响你的不是你的情绪,而是你面对这种情绪的态度。不急,慢慢来。

微信网友对话极视角CTO黄缨宁,畅谈计算机视觉与人工智能


本文作者:陈杨英杰


本文转自雷锋网禁止二次转载,原文链接

相关文章
|
机器学习/深度学习 人工智能 监控
人工智能计算机视觉
人工智能计算机视觉
234 1
|
机器学习/深度学习 人工智能 自然语言处理
人工智能(AI)之计算机视觉和自然语言训练文件
人工智能(AI)之计算机视觉和自然语言训练文件
163 0
|
机器学习/深度学习 人工智能 自动驾驶
【人工智能】图像识别:计算机视觉领域的识别与处理资源概览
在快速发展的科技时代,计算机视觉(Computer Vision, CV)作为人工智能的一个重要分支,正深刻改变着我们的生活与工作方式。图像识别作为计算机视觉的核心任务之一,旨在让机器能够理解和解释数字图像或视频中的内容,进而执行诸如目标检测、图像分类、场景理解等复杂任务。本文将深入探讨图像识别领域的关键技术、常用数据集、开源框架及工具资源,为从事或关注该领域的专业人士提供一份全面的指南。
549 2
|
机器学习/深度学习 人工智能 监控
探索人工智能在计算机视觉领域的应用与挑战
探索人工智能在计算机视觉领域的应用与挑战
319 0
|
机器学习/深度学习 人工智能 监控
计算机视觉:开启新一代人工智能应用
计算机视觉作为人工智能的重要分支,为人们创造了许多惊人的应用。通过模拟人类的视觉感知能力,计算机能够从图像和视频中获取有价值的信息,实现智能决策。物体检测、人脸识别等应用展示了计算机视觉的强大潜力。随着技术的不断进步,计算机视觉将会开启新一代人工智能应用的时代,为社会带来更多的创新和改变。
334 1
|
人工智能 测试技术
软件测试/人工智能|教你如何更高效地使用AI对话工具
软件测试/人工智能|教你如何更高效地使用AI对话工具
|
机器学习/深度学习 人工智能 自然语言处理
《花雕学AI》17:关注提示工程—本世纪最重要的技能可能就是与AI人工智能对话
人工智能(AI)是本世纪最具影响力和变革力的技术之一,它正在改变我们的生活、工作和社会。在人工智能领域,语言模型(LM)是一种可以理解和生成自然语言(如中文、英文等)的模型,它可以用于各种应用和研究主题,如聊天机器人、文本摘要、机器翻译、知识图谱等。随着计算能力和数据量的增加,语言模型也越来越强大和智能,如ChatGPT、百度文心一言等大型语言模型(LLM),它们可以根据用户提供的输入(prompt)生成各种类型和风格的内容(response)。
273 0
《花雕学AI》17:关注提示工程—本世纪最重要的技能可能就是与AI人工智能对话
|
机器学习/深度学习 人工智能 监控
人工智能在计算机视觉中的应用与挑战
人工智能在计算机视觉中的应用与挑战
619 0
|
机器学习/深度学习 人工智能 移动开发
人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)
人工智能领域:面试常见问题超全(深度学习基础、卷积模型、对抗神经网络、预训练模型、计算机视觉、自然语言处理、推荐系统、模型压缩、强化学习、元学习)
|
机器学习/深度学习 人工智能 计算机视觉
《视频云+人工智能计算机视觉和机器学习在消费级视频中的应用》电子版地址
视频云+人工智能计算机视觉和机器学习在消费级视频中的应用
155 0
《视频云+人工智能计算机视觉和机器学习在消费级视频中的应用》电子版地址