打造四大AI平台：腾讯优图的视觉AI To B打法-阿里云开发者社区

打造四大AI平台：腾讯优图的视觉AI To B打法

2021-12-04 249

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 腾讯的 AI 与产业互联网已进入全新发展阶段，优图实验室的视觉智能在其中将发挥怎样的作用？

「人工智能本身就是一场跨国跨学科的探索，正在将人类的认知推向更快更高更强，也势必带给我们一场前所未见的科技和产业革命，」在近日在上海举行的世界人工智能大会 WAIC 2020 上，马化腾对人工智能的未来发出了这样的预测。

今天，AI 技术正变得无所不在，新基建和产业互联网将为各行各业的发展带来新增量。面对新的发展机遇，腾讯提出了全新的战略，而腾讯优图实验室在其中正扮演着重要角色。

「我们可以看到，视觉 AI 相关应用业务正在飞速增长，这反映了企业端的人工智能技术需求正在释放，」腾讯优图实验室副总经理黄飞跃表示。

四大 AI 平台齐亮相

在 7 月 10 日的 WAIC 大会上，腾讯提出的「双引擎 + 双轮」驱动人工智能发展新形式再次引来人们的关注。与此同时，腾讯优图一口气发布了应用视觉 AI 能力的四大平台：AI 泛娱乐平台、广电传媒 AI 中台、内容审核平台和工业 AI 平台，成为了大会的亮点。

微信图片_20211204003506.jpg

在 WAIC 2020 上，腾讯优图实验室总经理吴运声进行了「新基建新生态下的计算机视觉」的主题演讲。

首先是泛娱乐平台，依托腾讯在社交娱乐产品上的丰富实践，优图在人脸融合、人像分割、人像变化、美颜美妆等方面积累了丰富的泛娱乐基础能力，打造了泛娱乐全栈工具箱，其中包括 AI 互动体验展解决方案、AI 创意营销解决方案、美颜特效 SDK 三大解决方案。

微信图片_20211204003515.png

在广电传媒行业，通过引入 AI 技术，腾讯可以将视频处理效率提升至 1:1（花费 1 小时处理剪辑 1 小时长度的视频），实现符合标准的结果输出。在智能审核场景中，AI 能帮助媒体内容管控效率提升并降低漏检率。

广电媒体 AI 中台支持多维度的视频理解和智能处理，为视频运营侧提供结构化的数据结果，建立了多模态搜索的基础，提升了素材再利用效率（如帮助视频再生产，打造内容专栏）。另外，能够通过视频理解结果进行内容运营，打造千人千面的媒体应用。

腾讯优图内容审核平台可提供审核一站式服务。在常规审核系统基础能力之上还包含 ACG 场景识别、儿童色情识别、低俗场景识别等功能。在识别效果上，鉴黄、监控、鉴证的准召率超过 99%。客户接入后，三天即可完成定制化模型训练，两小时内完成客户定向策略运营。这一技术可以更好地满足用户的实时定制需求，目前已在电商、文创、广电等行业解决方案中广泛应用。

微信图片_20211204003521.png

面向传统行业的工业 AI 平台则可以快速满足工业领域的缺陷检测、备件拍照识别、工厂工效优化等客户需求。并提供数据管理、在线训练、效果评估、业务编排等全过程个性化训练服务，满足上述场景的差异化需求。平台支持私有化及公有云部署，提供业界领先的加速、调度与容器服务，以更少的硬件资源支持更复杂的业务。

微信图片_20211204003524.png

腾讯表示，这些平台具备灵活权限及可拓展能力，合作伙伴可直接使用平台进行工业 AI 项目交付，还可基于平台进行上层业务开发，实现 AI 技术与行业能力的能力互补，合作共建各领域的工业 AI 解决方案。

八年如一日，聚焦视觉 AI

在人工智能领域里，感知智能的发展速度更快。根据清华大学的数据显示，计算机视觉、语音技术及自然语言处理技术的市场规模占比分别为 34.9%、24.8% 和 21%，视觉几乎是落地最顺利、商业化程度最高的领域，这也是腾讯优图一直以来的主要研究方向。

「在腾讯 930 业务组织调整之后，云与智慧产业事业群 CSIG 成为腾讯 to B 的战略窗口，而优图是 CSIG 的主要实验室。对于优图来说，我们的定位已更加清晰——专注于视觉 AI 的技术研发，」黄飞跃告诉我们。

2008 年，从清华博士毕业的黄飞跃加入当时的腾讯研究院，带领 5 人小组投身开发一款名为「QQ 影像」的桌面处理软件，他们是国内大规模应用计算机视觉先进技术的最早一批从业者。今天这个团队已经发展成为几百人规模，算法人员比例超过 60% 的大型研究机构，成为了腾讯旗下，乃至计算机视觉领域鼎鼎有名的优图实验室。

优图从 2012 年成立至今，在技术从探索到落地的过程中，核心思路一直在发生转变。「在优图团队刚刚成立时，我们主要想的是怎样把技术本身做好，」黄飞跃说道。「我们花费大量时间深入理解了技术产生价值的方式，只有如此，才能够把技术价值放大到最大。」

优图团队最初的任务是把其开发的压缩算法应用到 QQ 空间里。在这里，技术产生了一定的价值，但主要是业务成本降低和体验优化，仍没有带来最直接的用户体验提升。

在 2015 年，优图把视觉 AI 技术应用到微众银行的远程开户，实现了业务的对外输出。很快，优图实验室与腾讯云开始了整合，技术落地走上了快速轨道。

迄今为止，优图已打造了超过 15 种行业解决方案，为腾讯公司内部如 QQ、QQ 空间、微信、微视、腾讯云等超过 90 余个产品业务提供计算机视觉 AI 算法支持，并联合腾讯云、微信等腾讯内外部合作伙伴，向工业、教育、交通、文旅等领域共同输出行业解决方案。

腾讯优图在发展新技术时，一直以技术的应用价值为导向。「我们在进行新技术研发时都会思考这个维度，这意味着它们必然是有业务基础的。这也是和团队基因有关系，初始团队成员很多都具有相关的业务背景。」黄飞跃介绍道。

在业务落地后，优图会持续关注技术的实际价值和用户体验，根据反馈需求和发现的问题，不断迭代优化技术成果。随着工具不断升级，技术会越来越好，适用场景越来越多，更多用户也会为此买单，实现良性循环的正反馈过程。

在探索方向上，腾讯优图团队的技术研发非常聚焦——不倾向于发散放大技术，而是不断积累技术，将一些方向做深做透。优图倾向于在成功技术的基础上不断拓展范围，从而保证自己在一定方向上保持最好。

目前，优图旗下最热门的技术之一人脸核身，支持了北京、上海等全国多地的健康码，以及一些银行大额转账的过程中的核身过程，这项技术在市场占有率上保持了绝对领先。

优图核身技术的领先，正是不断迭代优化的结果。「我们自 2014 年就开始了身份识别技术的研发，从微众银行、腾讯云慧眼，再到微信小程序。我们接触到了大量客户和场景，在这个过程中不断提升了技术能力。」黄飞跃表示。

核身技术中，除了识别人脸之外，活体检测是重中之重：黑产会不断尝试在各个方面进行攻击。据介绍，从 2014 年至今，优图已经迭代了 5 个不同的解决方案，从最开始的动作唇语，到交互检测，到腾讯独创的光线核体方案，再到现在更加先进的解决方案，通过海量用户触达，不断更新的技术，优图把身份检测这件事做到了极致。

微信图片_20211204003527.png

目前优图人脸核身技术的流程。

「今年优图上线的全新人脸安全技术对于物理攻击、模型合成攻击、深度学习对抗样本都有很强的防御能力。我们的多模态活体检测技术已经通过了国家银行卡检测中心 BCTC 的人脸识别技术检测，达到了金融支付级安全标准。」黄飞跃说道。

不仅如此，优图也在不断探索前沿技术。优图公开发表的论文涵盖 ICCV，CVPR，AAAI 等各类顶级会议，仅 2020 年即被国际计算机视觉顶级会议 CVPR 接收了 17 篇论文。此外，优图与中科院软件所、中科院自动化所、上海交通大学、厦门大学、密西根州立大学、中山大学等国内外高校开展高校合作项目，在人脸人体基础技术、神经网络模型压缩、视觉内容检索、智能硬件平台、视频内容分析等研究方向上进行合作研究。

转向 B 端，成为新生产力

2017 年，腾讯正式提出 AI in All 战略，并逐渐搭建了以人工智能实验室、前沿科技实验室为双引擎，消费互联网和产业互联网为双轮的 AI 战略布局。在 930 组织结构变革之后，优图成为了腾讯云与智慧产业事业群（CSIG）旗下的成员，该事业群成为腾讯 To B 的战略窗口，是腾讯 20 余年历史上首次出现完全面向企业客户的大业务单元。

目前，腾讯为工业制造、医疗、政务、文旅、金融等行业提供了 90 余种互联网解决方案，其中 80% 应用到了人工智能技术。

黄飞跃认为，产业互联网最终的目的还是服务好 C 端用户：「C to B 是腾讯产业互联网的优势，腾讯拥有超过 10 亿用户，也有长期积累的洞察和经验。我们会把对于 C 端的服务经验输出给合作伙伴，帮助企业更好地触达用户。」

从面向消费者转为面向企业，是否会影响未来技术创新的思路？其实在优图内部，人们对此也有疑问。「在转型的过程中，我们有很多人都在思考这个问题，研究团队承担的角色不仅是业务落地的支持——这对于优图来说缺少持续发展的动力，」黄飞跃说道。「我们不仅要支持业务发展，另一方面也要不断探索，寻找业界、学术界的技术趋势，能够产生更大价值的技术。我们会花费更多精力进行研发。」

在 WAIC 大会上，腾讯公司副总裁、腾讯研究院院长司晓正式发布了《腾讯人工智能白皮书：泛在智能》，作为腾讯第一份全面介绍 AI、阐述腾讯 AI 布局和思考的白皮书，该书从宏观环境、技术研究、落地应用、创新经济、制度保障五个维度，描绘了泛在智能的全景。计算机视觉是白皮书的重要内容：随着 5G 等技术的发展，工业视觉正在成为新的生产力，而人们对于视频内容的需求将催生更为广泛的市场。

微信图片_20211204003531.png