打造四大AI平台:腾讯优图的视觉AI To B打法

简介: 腾讯的 AI 与产业互联网已进入全新发展阶段,优图实验室的视觉智能在其中将发挥怎样的作用?


「人工智能本身就是一场跨国跨学科的探索,正在将人类的认知推向更快更高更强,也势必带给我们一场前所未见的科技和产业革命,」在近日在上海举行的世界人工智能大会 WAIC 2020 上,马化腾对人工智能的未来发出了这样的预测。

今天,AI 技术正变得无所不在,新基建和产业互联网将为各行各业的发展带来新增量。面对新的发展机遇,腾讯提出了全新的战略,而腾讯优图实验室在其中正扮演着重要角色。


「我们可以看到,视觉 AI 相关应用业务正在飞速增长,这反映了企业端的人工智能技术需求正在释放,」腾讯优图实验室副总经理黄飞跃表示。


四大 AI 平台齐亮相


在 7 月 10 日的 WAIC 大会上,腾讯提出的「双引擎 + 双轮」驱动人工智能发展新形式再次引来人们的关注。与此同时,腾讯优图一口气发布了应用 视觉 AI 能力的四大平台:AI 泛娱乐平台、广电传媒 AI 中台、内容审核平台和工业 AI 平台,成为了大会的亮点。


微信图片_20211204003506.jpg

在 WAIC 2020 上,腾讯优图实验室总经理吴运声进行了「新基建新生态下的计算机视觉」的主题演讲。


首先是泛娱乐平台,依托腾讯在社交娱乐产品上的丰富实践,优图在人脸融合、人像分割、人像变化、美颜美妆等方面积累了丰富的泛娱乐基础能力,打造了泛娱乐全栈工具箱,其中包括 AI 互动体验展解决方案、AI 创意营销解决方案、美颜特效 SDK 三大解决方案。


微信图片_20211204003515.png


在广电传媒行业,通过引入 AI 技术,腾讯可以将视频处理效率提升至 1:1(花费 1 小时处理剪辑 1 小时长度的视频),实现符合标准的结果输出。在智能审核场景中,AI 能帮助媒体内容管控效率提升并降低漏检率。


广电媒体 AI 中台支持多维度的视频理解和智能处理,为视频运营侧提供结构化的数据结果,建立了多模态搜索的基础,提升了素材再利用效率(如帮助视频再生产,打造内容专栏)。另外,能够通过视频理解结果进行内容运营,打造千人千面的媒体应用。



腾讯优图内容审核平台可提供审核一站式服务。在常规审核系统基础能力之上还包含 ACG 场景识别、儿童色情识别、低俗场景识别等功能。在识别效果上,鉴黄、监控、鉴证的准召率超过 99%。客户接入后,三天即可完成定制化模型训练,两小时内完成客户定向策略运营。这一技术可以更好地满足用户的实时定制需求,目前已在电商、文创、广电等行业解决方案中广泛应用。


微信图片_20211204003521.png


面向传统行业的工业 AI 平台则可以快速满足工业领域的缺陷检测、备件拍照识别、工厂工效优化等客户需求。并提供数据管理、在线训练、效果评估、业务编排等全过程个性化训练服务,满足上述场景的差异化需求。平台支持私有化及公有云部署,提供业界领先的加速、调度与容器服务,以更少的硬件资源支持更复杂的业务。


微信图片_20211204003524.png


腾讯表示,这些平台具备灵活权限及可拓展能力,合作伙伴可直接使用平台进行工业 AI 项目交付,还可基于平台进行上层业务开发,实现 AI 技术与行业能力的能力互补,合作共建各领域的工业 AI 解决方案。


八年如一日,聚焦视觉 AI


在人工智能领域里,感知智能的发展速度更快。根据清华大学的数据显示,计算机视觉、语音技术及自然语言处理技术的市场规模占比分别为 34.9%、24.8% 和 21%,视觉几乎是落地最顺利、商业化程度最高的领域,这也是腾讯优图一直以来的主要研究方向。


「在腾讯 930 业务组织调整之后,云与智慧产业事业群 CSIG 成为腾讯 to B 的战略窗口,而优图是 CSIG 的主要实验室。对于优图来说,我们的定位已更加清晰——专注于视觉 AI 的技术研发,」黄飞跃告诉我们。


2008 年,从清华博士毕业的黄飞跃加入当时的腾讯研究院,带领 5 人小组投身开发一款名为「QQ 影像」的桌面处理软件,他们是国内大规模应用计算机视觉先进技术的最早一批从业者。今天这个团队已经发展成为几百人规模,算法人员比例超过 60% 的大型研究机构,成为了腾讯旗下,乃至计算机视觉领域鼎鼎有名的优图实验室。


优图从 2012 年成立至今,在技术从探索到落地的过程中,核心思路一直在发生转变。「在优图团队刚刚成立时,我们主要想的是怎样把技术本身做好,」黄飞跃说道。「我们花费大量时间深入理解了技术产生价值的方式,只有如此,才能够把技术价值放大到最大。」


优图团队最初的任务是把其开发的压缩算法应用到 QQ 空间里。在这里,技术产生了一定的价值,但主要是业务成本降低和体验优化,仍没有带来最直接的用户体验提升。


在 2015 年,优图把视觉 AI 技术应用到微众银行的远程开户,实现了业务的对外输出。很快,优图实验室与腾讯云开始了整合,技术落地走上了快速轨道。


迄今为止,优图已打造了超过 15 种行业解决方案,为腾讯公司内部如 QQ、QQ 空间、微信、微视、腾讯云等超过 90 余个产品业务提供计算机视觉 AI 算法支持,并联合腾讯云、微信等腾讯内外部合作伙伴,向工业、教育、交通、文旅等领域共同输出行业解决方案。


腾讯优图在发展新技术时,一直以技术的应用价值为导向。「我们在进行新技术研发时都会思考这个维度,这意味着它们必然是有业务基础的。这也是和团队基因有关系,初始团队成员很多都具有相关的业务背景。」黄飞跃介绍道。


在业务落地后,优图会持续关注技术的实际价值和用户体验,根据反馈需求和发现的问题,不断迭代优化技术成果。随着工具不断升级,技术会越来越好,适用场景越来越多,更多用户也会为此买单,实现良性循环的正反馈过程。


在探索方向上,腾讯优图团队的技术研发非常聚焦——不倾向于发散放大技术,而是不断积累技术,将一些方向做深做透。优图倾向于在成功技术的基础上不断拓展范围,从而保证自己在一定方向上保持最好。


目前,优图旗下最热门的技术之一人脸核身,支持了北京、上海等全国多地的健康码,以及一些银行大额转账的过程中的核身过程,这项技术在市场占有率上保持了绝对领先。


优图核身技术的领先,正是不断迭代优化的结果。「我们自 2014 年就开始了身份识别技术的研发,从微众银行、腾讯云慧眼,再到微信小程序。我们接触到了大量客户和场景,在这个过程中不断提升了技术能力。」黄飞跃表示。

核身技术中,除了识别人脸之外,活体检测是重中之重:黑产会不断尝试在各个方面进行攻击。据介绍,从 2014 年至今,优图已经迭代了 5 个不同的解决方案,从最开始的动作唇语,到交互检测,到腾讯独创的光线核体方案,再到现在更加先进的解决方案,通过海量用户触达,不断更新的技术,优图把身份检测这件事做到了极致。


微信图片_20211204003527.png

目前优图人脸核身技术的流程。


「今年优图上线的全新人脸安全技术对于物理攻击、模型合成攻击、深度学习对抗样本都有很强的防御能力。我们的多模态活体检测技术已经通过了国家银行卡检测中心 BCTC 的人脸识别技术检测,达到了金融支付级安全标准。」黄飞跃说道。


不仅如此,优图也在不断探索前沿技术。优图公开发表的论文涵盖 ICCV,CVPR,AAAI 等各类顶级会议,仅 2020 年即被国际计算机视觉顶级会议 CVPR 接收了 17 篇论文。此外,优图与中科院软件所、中科院自动化所、上海交通大学、厦门大学、密西根州立大学、中山大学等国内外高校开展高校合作项目,在人脸人体基础技术、神经网络模型压缩、视觉内容检索、智能硬件平台、视频内容分析等研究方向上进行合作研究。


转向 B 端,成为新生产力


2017 年,腾讯正式提出 AI in All 战略,并逐渐搭建了以人工智能实验室、前沿科技实验室为双引擎,消费互联网和产业互联网为双轮的 AI 战略布局。在 930 组织结构变革之后,优图成为了腾讯云与智慧产业事业群(CSIG)旗下的成员,该事业群成为腾讯 To B 的战略窗口,是腾讯 20 余年历史上首次出现完全面向企业客户的大业务单元。


目前,腾讯为工业制造、医疗、政务、文旅、金融等行业提供了 90 余种互联网解决方案,其中 80% 应用到了人工智能技术。


黄飞跃认为,产业互联网最终的目的还是服务好 C 端用户:「C to B 是腾讯产业互联网的优势,腾讯拥有超过 10 亿用户,也有长期积累的洞察和经验。我们会把对于 C 端的服务经验输出给合作伙伴,帮助企业更好地触达用户。」


从面向消费者转为面向企业,是否会影响未来技术创新的思路?其实在优图内部,人们对此也有疑问。「在转型的过程中,我们有很多人都在思考这个问题,研究团队承担的角色不仅是业务落地的支持——这对于优图来说缺少持续发展的动力,」黄飞跃说道。「我们不仅要支持业务发展,另一方面也要不断探索,寻找业界、学术界的技术趋势,能够产生更大价值的技术。我们会花费更多精力进行研发。」


在 WAIC 大会上,腾讯公司副总裁、腾讯研究院院长司晓正式发布了《腾讯人工智能白皮书:泛在智能》,作为腾讯第一份全面介绍 AI、阐述腾讯 AI 布局和思考的白皮书,该书从宏观环境、技术研究、落地应用、创新经济、制度保障五个维度,描绘了泛在智能的全景。计算机视觉是白皮书的重要内容:随着 5G 等技术的发展,工业视觉正在成为新的生产力,而人们对于视频内容的需求将催生更为广泛的市场。


微信图片_20211204003531.png


腾讯在白皮书中指出,疫情之后的近未来将是全球经济重建的重要时期,也是社会转型的重要时期。这为人工智能的发展打开了新的窗口期,并将提供丰富的实践场,一个「泛在智能」的世界正在加速成为现实。


5 月 26 日,腾讯宣布未来五年将投入 5000 亿,用于新基建项目的进一步布局,人工智能是重点投入的领域。现在,腾讯希望让人工智能发挥产业互联网「中央处理器」的作用。


文为机器之心报道,转载请联系本公众号获得授权

相关文章
|
4天前
|
人工智能 编解码 安全
[译][AI OpenAI-doc] 视觉
学习如何使用 GPT-4 来理解图像。具有视觉功能的 GPT-4 Turbo 允许模型接收图像并回答与之相关的问题。了解图像上传、处理、成本计算、模型限制等详细信息。
|
2月前
|
人工智能 JSON 数据格式
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
GEE、PIE和AI Earth平台进行案例评测:NDVI计算,结果差异蛮大
54 0
|
2月前
|
人工智能 自然语言处理 安全
国产算力平台的磨砺与革新:助力国内AI走向更高更远
近几年技术圈由人工智能的快速发展,引起来了变革和创新,虽然国外的算力一直是走在最前沿,但是国产算力平台在推动我国AI产业中发挥着重要作用,扮演着重要角色,但要助力国内AI走得更高更远,国产算力平台还需要经历磨砺和革新。那么本文就来分享和讨论一下国产算力平台所需的磨砺和革新,以及这样的平台在国产算力土壤之上能孕育出的AI创新之花。
102 1
国产算力平台的磨砺与革新:助力国内AI走向更高更远
|
1月前
|
人工智能 搜索推荐 机器人
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
【2月更文挑战第24天】Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
33 2
Rasa: 帮助企业更快搭建“AI对话助手”的低代码平台
|
2月前
|
人工智能 自然语言处理 搜索推荐
魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
【2月更文挑战第9天】魔搭ModelScope社区作为一个AI模型开源平台,提供了丰富的模型资源和便捷的服务
160 3
|
3天前
|
人工智能 监控 数据处理
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】1. 快速上手数据集与测试评估过程
18 0
|
3天前
|
人工智能 监控 数据可视化
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
【AI大模型应用开发】【LangSmith: 生产级AI应用维护平台】0. 一文全览Tracing功能,让你的程序运行过程一目了然
8 0
|
12天前
|
人工智能 编解码 安全
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
【4月更文挑战第14天】清华大学与新加坡国立大学团队针对大型多模态模型(LMMs)在处理高分辨率图像时的局限,提出新模型LLaVA-UHD。该模型通过图像模块化、压缩和空间模式组织策略,有效提升了处理任意比例和高分辨率图像的能力。实验显示,LLaVA-UHD在9个基准测试中超越现有模型,且在TextVQA任务上准确率提升6.4%,同时训练时间更短。然而,模型训练成本高、泛化能力待优化是未来需解决的问题。
26 8
揭秘AI幻觉:GPT-4V存在视觉编码漏洞,清华联合NUS提出LLaVA-UHD
|
1月前
|
人工智能 自然语言处理 安全
推荐一款 AI 资源集合平台,助你通往AGI之路。
推荐一款 AI 资源集合平台,助你通往AGI之路。
|
1月前
|
人工智能 JavaScript API
一个接口白嫖四个AI平台, 五个翻译平台
薅夷长技以制夷, 要大薅,快薅,多薅,苦薅,实薅,加油薅,没有了薅字,薅仔就不配当薅仔。薅字当头,薅就完了,就薅
68 3