数学和编程能力,马维英说这是字节跳动AI Lab招人的首要准则

简介: 字节跳动 AI Lab 近日组织了 AI 开放日,他们展示了各种视觉和语言方面的炫酷应用,这些应用很多都已经嵌入了字节跳动的产品中,例如今日头条、抖音和西瓜视频等。此外,字节跳动 AI Lab 主任马维英还重点分享了实验室的招人准则,跃跃欲试的小伙伴们,你们准备好了么。

在开放日上,现场 Demo 展现了很多熟悉而又炫酷的应用。你知道怎样利用聚类算法和 CNN 从短视频从抽取最好看的小姐姐么?你知道怎样用单摄手机拍出柔顺的背景虚化图么?这些可能用耳熟能详的算法就能完成,只不过实验室会将它们做到极致并嵌入到 APP 中。


逛完 Demo 展示后,马维英介绍了很多实验室的具体信息,包括实验室的目标、发展情况和突出成果等。马维英表示 AI Lab 的目标是为今日头条和抖音等产品提供核心技术支持,并满足现在到未来 2-5 年的产品和业务发展需要。


有这么优秀的科学家和资源,你想不想来场面试?马维英随后就介绍了 AI 实验室的招人经验,所以你的数学和代码都准备好了么?


数学足够好是做 AI 研究的基础


从微软到今日头条,马维英的「看人」技能非常纯熟,他会比较特别地观察应聘者的各项素质。在开放日上,他也分享了 AI Lab 及个人面试的择人准则。马维英表示首先会考虑应聘者的数学基础是不是非常好,是不是能深入了解问题的本质。因此应聘者的数学功底要好,对数学模型有比较好的直觉和理解。也就是说应聘者不能只是会简简单单地应用,把模型或算法当作一个黑箱进行调参,而不了解具体过程。如果有比较好的数学基础,那么模型的理论过程、最优化方法、损失函数调优等都可以结合实际问题进行修正,从而获得更好的性能。


其次马维英会比较看重工程实践能力,所以 AI Lab 这边也会考虑应聘者的编程能力。马维英表示我们常常会有非常好的想法,但很可能没有实践能力,这是不够的。最后,马维英还会考察应聘者的态度,比如说团队合作、人际沟通和表达能力等,这是一些和软素质比较相关的东西。


而从个人角度来看,马维英说:「其实我这么多年招了这么多人,在面试中会非常重视眼神的交流。在面试过程中,我大概通过十多分钟就能判断面试者的思维是不是比较敏捷、回答过程中是不是比较坦诚等。因为有大量的经验,我通过对话可以看到面试者不太容易看到的一面。」


炫酷的算法应用


有数学还不够,你需要把它做成产品,所以你可以先看看 AI Lab 做出来的 Demo。其实它们很多都已经应用到实际产品中,例如 2018 年世界杯期间接入了今日头条直播间的视频分析、接入抖音的视频内容审核、嵌入西瓜视频的封面生成等,不过这里只重点介绍了视频理解与背景虚化两种应用。


曾经背景虚化只是单反的专利,通过大光圈获得像奶油般柔滑的背景。当然现在手机也可以借助双摄像头完成背景虚化,但如果只有单摄像头或单张图片,又如何借助算法实现背景虚化呢。字节跳动 AI 实验室展示了这样一种算法,它可以预测高清图像的「深度信息」,也就是从近到远区分前景与背景。有了这种深度信息,我们就能很自然地生成对应的背景虚化图像。


如下所示,直观而言模型首先会将高清图压缩为低清输入图,然后使用深度残差网络抽取到深度图,这里先压缩为低清图再做卷积运算可以大大降低计算力。然后我们可以根据深度图和低清输入图渲染低清背景虚化图,并在最后利用高清原图、低清输入图、深度图和低清背景虚化图构建高清背景虚化图。这里在训练过程中起到监督作用的是深度图,模型会尽可能正确预测整张图的深度信息,后面根据深度信息和原图生成背景虚化图就只是合成过程了。


微信图片_20211130151630.jpg


其实预测深度图有点类似于图像分割任务,只不过这种逐像素的分类问题预测的是所有像素离镜头的距离。具体而言如上图绿色的 Depth Prediction 模块所示,模型不仅会使用全连接网络直接预测深度,同时还会使用额外的前景分割任务获得更准确的分割边界线。字节跳动 AI 实验室在现场展示了这一方法的实际效果,虽然不能说完美,但一般人是看不出问题的。


除了图像,视频处理也有非常有意思的应用。一般在上传视频到抖音或西瓜视频后,我们希望能有一张好看的封面,因为漂亮的事物总是能吸引别人点开视频。但是机器学习系统能帮我们挑选出最漂亮的封面吗?答案是可以的,字节跳动实验室展示的这个应用甚至可以从视频中选出最好看的视频帧,并裁剪为合适的大小。


下图展示了挑选封面的主要做法,当我们上传一段视频后,模型首先会对不同的视频帧做一个聚类处理。因为视频是连续的图像,聚类过程能将类似的视频帧都聚在一起,因此从不同的集群采样一些视频帧就能挑选出有代表性的图像。然后把这些图像馈送到深度卷积神经网络并度量每一张图像的质量,这样就能挑选出最「漂亮」的图像。最后只要进行适当地裁剪就行了,当然这样的裁剪也会尽可能保留主体。


微信图片_20211130151702.jpg


在现场 Demo 展示中,应用可以快速推断出短视频中质量最高的图像,它会给出评分前三的视频帧。除此之外,字节跳动 AI 实验室还能利用深度卷积神经网络抽取关键视频片段,并总结为更精简的短视频。


现场 Demo 展示还有很多炫酷的应用与方法,例如在足球直播中,实验室构建的系统能追踪球员与足球,并估计相机所在的位置及拍摄的球场区域。这一系统在 2018 年世界杯期间接入了今日头条客户端的直播间,它还能检测精彩片段,并为 Xiaoming Bot 写作机器人提供图像素材。


其实 Demo 中的很多应用都需要部署到移动端,例如给人脸加各种特效的激萌或抖音等。为此,实验室展示了一种快速轻量级的人脸识别方法。他们会使用经量化的修正版 MobileNet V2,并采用知识蒸馏方法从预训练的大模型中学习更优秀的精炼模型。因此在实际应用中能以毫秒级的延迟完成人脸识别任务,而对人脸再加特效也就非常迅速了。

相关文章
|
13天前
|
机器学习/深度学习 人工智能 自然语言处理
构建智能化编程环境:AI 与代码编辑器的融合
在人工智能的推动下,未来的代码编辑器将转变为智能化编程环境,具备智能代码补全、自动化错误检测与修复、个性化学习支持及自动化代码审查等功能。本文探讨了其核心功能、技术实现(包括机器学习、自然语言处理、深度学习及知识图谱)及应用场景,如辅助新手开发者、提升高级开发者效率和优化团队协作。随着AI技术进步,智能化编程环境将成为软件开发的重要趋势,变革开发者工作方式,提升效率,降低编程门槛,并推动行业创新。
|
2月前
|
人工智能 缓存 Cloud Native
用 Higress AI 网关降低 AI 调用成本 - 阿里云天池云原生编程挑战赛参赛攻略
《Higress AI 网关挑战赛》正在火热进行中,Higress 社区邀请了目前位于排行榜 top5 的选手杨贝宁同学分享他的心得。本文是他整理的参赛攻略。
523 69
|
2月前
|
人工智能 监控 算法
智能时代的伦理困境:AI技术的道德边界探索人工智能在教育领域的革新之路未来编程:人工智能与代码共生的新篇章
【8月更文挑战第21天】在人工智能(AI)技术飞速发展的今天,我们正处在一个前所未有的科技变革时期。随着AI技术的深入人类生活的方方面面,它不仅带来了便利和效率的提升,同时也引发了关于道德和伦理的深刻讨论。本文将探讨AI技术发展中遇到的伦理挑战,以及如何建立合理的道德框架来指导AI的未来应用,确保技术进步与人类社会价值观的和谐共存。
229 61
|
17天前
|
人工智能 算法 自动驾驶
用AI自动设计智能体,数学提分25.9%,远超手工设计
【9月更文挑战第18天】《智能体自动设计(ADAS)》是由不列颠哥伦比亚大学等机构的研究者们发布的一篇关于自动化设计智能体系统的最新论文。研究中提出了一种创新算法——“Meta Agent Search”,此算法通过迭代生成并优化智能体设计,从而实现更高效的智能体系统构建。实验表明,相比人工设计的智能体,Meta Agent Search生成的智能体在多个领域均有显著的性能提升。然而,该方法也面临着实际应用中的有效性与鲁棒性等挑战。论文详细内容及实验结果可于以下链接查阅:https://arxiv.org/pdf/2408.08435。
61 12
|
20天前
|
人工智能
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【9月更文挑战第15天】近年来,人工智能领域取得了显著进展,但智能体系统的设计仍需大量人力与专业知识。为解决这一问题,UBC研究人员提出了“自动智能体系统设计(ADAS)”新方法,通过基于代码的元智能体实现智能体系统的自动化设计与优化。实验结果表明,ADAS设计的智能体在多个领域中表现优异,尤其在阅读理解和数学任务上取得了显著提升。尽管如此,ADAS仍面临安全性、可扩展性和效率等挑战,需进一步研究解决。论文详情见链接:https://arxiv.org/pdf/2408.08435。
27 4
|
2月前
|
机器学习/深度学习 人工智能 Android开发
揭秘AI编程:从零开始构建你的第一个机器学习模型移动应用开发之旅:从新手到专家
【8月更文挑战第29天】本文将带你走进人工智能的奇妙世界,一起探索如何从零开始构建一个机器学习模型。我们将一步步解析整个过程,包括数据收集、预处理、模型选择、训练和测试等步骤,让你对AI编程有一个全面而深入的理解。无论你是AI初学者,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这段激动人心的AI编程之旅吧! 【8月更文挑战第29天】在这篇文章中,我们将探索移动应用开发的奇妙世界。无论你是刚刚踏入这个领域的新手,还是已经有一定经验的开发者,这篇文章都将为你提供有价值的信息和指导。我们将从基础开始,逐步深入到更复杂的主题,包括移动操作系统的选择、开发工具的使用、
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
PHP编程中的面向对象基础利用AI技术提升文本分类效率
【8月更文挑战第28天】在PHP的编程世界中,面向对象编程(OOP)是一块基石,它不仅塑造了代码的结构,也影响了开发者的思考方式。本文将深入探讨PHP中面向对象的基础概念,通过浅显易懂的语言和生动的比喻,带领初学者步入这个充满魅力的世界。我们将一起探索类与对象的秘密,理解构造函数和析构函数的重要性,以及继承和多态性的魔法。准备好了吗?让我们开始这段激动人心的旅程!
|
20天前
|
机器学习/深度学习 人工智能 自然语言处理
构建智能化编程助手:AI 在软件开发中的新角色
随着AI技术的发展,智能化编程助手正逐渐改变软件开发方式。本文介绍其核心功能,如代码自动补全、智能错误检测等,并探讨如何利用机器学习、自然语言处理及知识图谱等技术构建高效、易用的编程助手,提升开发效率与代码质量,同时讨论面临的技术挑战与未来前景。
|
2月前
|
人工智能 算法
AI 0基础学习,数学名词解析
AI 0基础学习,数学名词解析
14 2
|
2月前
|
机器学习/深度学习 人工智能 算法
揭秘AI编程:从零开始的机器学习之旅
本文将带你走进人工智能的奇妙世界,一起探索机器学习的奥秘。我们将从最基础的概念入手,逐步深入到实际应用中,让你在轻松愉快的阅读过程中,对AI编程有一个全面而深刻的理解。无论你是编程新手,还是有一定基础的开发者,都能在这篇文章中找到你需要的信息和启示。让我们一起开启这场充满智慧和乐趣的旅程吧!
53 1

热门文章

最新文章

下一篇
无影云桌面