阿里巴巴的AI算法程序媛是怎样的一种存在?

本文涉及的产品
手机号三要素核验简版,10000次流量包 3个月
金融级实人认证,500次流量包 6个月
身份二要素核验,500次流量包 3个月
简介: 一个专注人脸识别技术长达11年的程序媛。

程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?

在见到于鲲之前,我的脑子里是各种的想象,萌妹纸?御姐?还是?尽管于鲲说话语速有点快,但干脆利落,逻辑清楚,所以“干练”是她留给我的最深的印象。
IMG_0742
阿里安全图灵实验室的AI算法程序媛于鲲

在阿里巴巴这几年的锤炼,于鲲已经成长为国内人脸核心算法领域的顶级专家。作为阿里安全图灵实验室的核心成员,研发了业界顶级水准的人脸识别技术和算法,无论是1:1人脸比对还是1:N人脸搜索的算法,效果都在业内处于优势地位。目前,线上的人脸比对核心算法模型,就是于鲲和小伙伴们一起训练和开发的。

不仅如此,于鲲还出色地紧贴业务场景,将技术成果完美落地。她主导了新零售(如未来美家、银泰百货、盒马等)和其他1:N线下业务(包括园区门禁,菜鸟快递取件柜等)的人脸比对算法;同时,还协同了1:1实人认证(手淘扫脸登录等)和1:N敏感人脸检测(内部和绿网)等重要业务算法的研发。

与用户直接互动“很刺激”

2014年,于鲲接触到阿里巴巴,然后被深深地吸引。

“我觉得实人认证和内容管控是非常有前景的,而且可以和终端用户直接互动。”于鲲说,“这对于做技术的人来说,是非常有吸引力的,也挺有成就感的。”

于鲲认为,像是实人认证这种,如果技术层面没有做好,就会导致体验下降。但不管是技术原因还是业务原因,导致客户的流程没有走下去,用户就会给到最为直接的反馈。比如扫脸登录,用户的反应是最为直观的,用户所能接受的极限时间为2秒钟,这对技术提出了极高的要求。

“对于技术人员来说,来自于用户的直接反馈是一种最为难得的体验。“于鲲强调。

由于算法是偏后端的,所以和前台用户的互动,让于鲲觉得是一种“很刺激“的体验。

在于鲲眼中,阿里巴巴这种大平台确实很吸引人。比如实人认证,规模很大,有数亿人在使用。对于绝大多数技术人员来说,这并不是一个很容易得到的机会。

在阿里巴巴是一种全新的体验

从2007年到现在,于鲲一直在做人脸识别技术的研究和开发。

从技术层面来看,于鲲算是轻车熟路,但这并不意味着前面是一片坦途。“对我来说,其实还是蛮挑战的,因为需要角色有巨大的转变。”于鲲说。

于鲲介绍,她之前一直在传统企业做人脸技术的研发,但是到了阿里巴巴这种头部互联网公司后,需要对自己进行革新。包括企业的文化、工作的流程等,这些对于鲲都是全新的体验。

“总体感觉是阿里的节奏非常快,开始还有些不太适应。”于鲲说。她觉得自己每天都是在小跑着前进,面对的业务比较复杂,对接的团队也很多。每天多数时间都在开会中度过,基本上晚饭后的时间才是属于自己的,此时才会坐下来做一些事情。“基本上,白天不是在开会就是在去开会的路上。“于鲲笑称。

万事开头难。但通过不断的交流和磨合,于鲲和小伙伴们越来越有默契,沟通越来越顺畅,对业务也越来越了解,项目推动起来也就“得心应手”了。两年之后,于鲲完全适应了这里,适应了快节奏,适应了新环境。心里也就自然而然地认为,“本来就应该是这样的。”

“现在,如果是慢节奏,我反而不习惯了,会觉得是在浪费时间,浪费生命。”于鲲说,“工作就应该是这样的。”

于鲲告诉我,她觉得到了阿里巴巴就是打开了新的一页,体会到了不同的人生。

程序媛并不是一种独特的存在

阿里安全图灵实验的研究方向非常稳定,就是专注于计算机视觉、自然语言处理、机器学习和深度学习;其聚焦的业务也非常稳定,就是为手淘、天猫、支付宝、闲鱼、优酷土豆、UC、阿里妈妈等核心业务线提供技术支撑,并对外输出AI能力。因此,整个团队也非常稳定。
IMG_0184
阿里安全图灵实验室的部分技术同学

这几年,于鲲一直在阿里安全图灵实验室。据她介绍,整个团队有5个程序媛,3个Base杭州,2个Base北京。“我们团队的氛围特别好,大家在一起就是‘哥们儿’,会互相分享好的idea,像一家人似的。”于鲲说,“所有人同心协力,朝着同一个方向,同一个目标发力。”

于鲲认为,大家在团队大目标之下,只有分工的不同,小伙伴们更多的是相互补位和背靠背的方式进行协作。“这个事情交给你,这个事情到此为止。就是这么简单的逻辑。”于鲲说。

于鲲笑着说,她之所以留着长发只是想保留自己女生的特征,但干活儿从来没有把自己当成一个特殊的存在,要享受特殊待遇。相反地,她认为自己从业的时间比较长,所以应该更多地去承担一些事情。

有想法就尽情去发挥

团队稳定与否,Leader很重要。这是于鲲的观点。

在她眼中,阿里安全图灵实验室的负责人奥创是一个很有想法,有大局观的人。正因为如此,整个团队的氛围很和谐,也没有什么职级之分。

于鲲还记得,某年的中秋节,奥创拎着大闸蟹来到公司,然后分给团队的小伙伴们。“Leader有什么事情,都会想到团队成员,这非常棒!”于鲲说。

对比传统企业和互联网公司,于鲲也谈了自己对于技术团队的一些理解。她认为,团队好不好,要看Leader有没有远见,有没有前瞻性。传统企业的技术团队,Leader把任务拿来,然后给到团队成员去落实,这是一种自上而下研发模式。但是在阿里巴巴不一样,这里是一种自下而上的模式,也就是说,组织的目标就在那里,每个团队成员都能看到,每个人能为这个目标做什么?团队成员是自发的,也就是阿里巴巴一直强调的自组织、自驱动,每个人都内心驱动。

“整个团队都是这样的,整个阿里也是这样的。”于鲲说,“虽然有KPI的考核,但每个团队都在思考还可以做些什么?每个人也在想我可以做些什么?这个力量是无穷的。”

于鲲认为,自上而下的指令,很多时候只是Leader一个人的思考,所以具体落地的时候可能结果并不好;但如果是自下而上,那么每个人的想法都能得到充分发挥,每个人都会贡献自己的智慧去为大目标做有益的工作,这是一种积少成多的力量。

“阿里巴巴的工作模式就是,有想法就尽情去发挥。”于鲲说。

算法人靠“数字”说话

在阿里巴巴西溪园区,刷脸设备已经替代了传统的刷卡门禁,这就是于鲲和团队小伙伴们的杰作。实际上,这是经过了内部激烈的技术PK之后,最终被阿里安全图灵实验室拿下的。
DINGTALK_IM_664966376
于鲲和小伙伴研发的人脸识别技术应用于阿里巴巴门禁系统

“算法人是要靠数字说话的,谁的准确率高,谁就上。”于鲲告诉我,阿里安全图灵实验室研发的人脸识别系统在准确率方面拔得头筹,因此才拿下了园区的门禁刷脸项目。

不仅在内部取得不俗的成绩,在与外部友商的竞争中,阿里安全图灵实验室也顺利拿下了某机场的安检项目,而实验室还通过阿里云上的“实人认证”和“内容安全”两大产品,服务了数万家企业客户。

“我们的业务都依托于我们的技术,因此,我们的技术并不是为了在某个竞赛得奖而进行研发的,而是为了充分保障业务的顺畅应用,为用户提供极致的体验。”于鲲告诉我,阿里安全图灵实验室实际上也经常会在一些大赛上斩获殊荣,但通常情况下,这些都不过是技术小伙伴们做好业务项目之余的“副业”而已。

于鲲告诉我,阿里安全图灵实验室的目标是要做最顶尖的算法团队,并保持领先的地位。

用技术改变生活

于鲲向我普及了一下人脸识别技术的发展简史。

90年代初,手机还未普及,关于人脸识别的应用还非常初级,通常都是简单的特征分类,比如几何或者灰度特征。

2003年到2004年的时候,人脸识别技术开始转向图像领域的传统特征,那时,更多的是需要看工程师对图像的理解,是非常挑战的。不过,已经有一些比较初级的商业应用,比如一些考勤机。

到了2012年,深度学习进入到爆发期。随着这一波的大发展,人脸识别也是获益最为典型的应用之一。那个时候,不管是数据还是算法,人脸识别都已经准备好了,可以随时“起飞”。

最近的两三年,人脸识别主要是在做用户习惯的培养,毕竟还是有很多人不太能够接受,但这个现状正在发生着巨变。比如扫脸支付、扫脸转账等,它们具备的便捷性是以往任何一种技术都无法比拟的。

于鲲告诉我,在人脸识别技术方面,中国是非常领先的,在用户习惯的培养方面也是领先的。每年,国家在这一领域的科研投入,比如论文数量或专利数量在全球来看都是处于前列。

事实上,于鲲从事人脸识别技术的研究与开发已经11年,因此很多人都会奇怪她会不会厌烦了?或者说是否需要换一个方向?她并没有这样的想法。她认为,人脸识别并不是一个单点的技术,而是一整套的解决方案,除了方案本身,它底层的技术也是复合型的。

“人脸一直会在持续的变化,比如化妆、比如美容、比如衰老,比如光照等,这些都会导致人脸的变化。这些变化,远比其他模型要复杂得多。这对于机器来说,是极大的挑战。”于鲲说,“正因为人脸识别所具备的复杂性,所以才会有这么长时间,这么多人去研究。”

于鲲觉得,人脸识别是一个非常好的点,应用场景非常多,商业的可能性也很多,所以它能够成为当前的热点。

“这几年人脸的应用越来越广,其实并不是我们站在这个风口,而是说整个行业站在了这个风口。资本疯狂追逐,各大公司也巨额投入,这些都说明其市场前景巨大。”于鲲表示。

“我想能够用技术服务大众,真正的用技术改变生活,用技术去除恶扬善,这是我的梦想,相信也是每个技术人的梦想。”于鲲说。

目录
相关文章
|
2月前
|
传感器 人工智能 监控
智慧工地 AI 算法方案
智慧工地AI算法方案通过集成多种AI算法,实现对工地现场的全方位安全监控、精准质量检测和智能进度管理。该方案涵盖平台层、展现层与应用层、基础层,利用AI技术提升工地管理的效率和安全性,减少人工巡检成本,提高施工质量和进度管理的准确性。方案具备算法精准高效、系统集成度高、可扩展性强和成本效益显著等优势,适用于人员安全管理、施工质量监控和施工进度管理等多个场景。
|
2月前
|
传感器 人工智能 监控
智慧电厂AI算法方案
智慧电厂AI算法方案通过深度学习和机器学习技术,实现设备故障预测、发电运行优化、安全监控和环保管理。方案涵盖平台层、展现层、应用层和基础层,具备精准诊断、智能优化、全方位监控等优势,助力电厂提升效率、降低成本、保障安全和环保合规。
智慧电厂AI算法方案
|
7天前
|
机器学习/深度学习 人工智能 算法
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
Enhance-A-Video 是由上海人工智能实验室、新加坡国立大学和德克萨斯大学奥斯汀分校联合推出的视频生成质量增强算法,能够显著提升视频的对比度、清晰度和细节真实性。
36 8
Enhance-A-Video:上海 AI Lab 推出视频生成质量增强算法,显著提升 AI 视频生成的真实度和细节表现
|
11天前
|
人工智能
国家电网与阿里巴巴达成AI合作!
国家电网与阿里巴巴达成AI合作!
54 17
|
30天前
|
机器学习/深度学习 缓存 人工智能
【AI系统】QNNPack 算法
QNNPACK是Marat Dukhan开发的量化神经网络计算加速库,专为移动端优化,性能卓越。本文介绍QNNPACK的实现,包括间接卷积算法、内存重排和间接缓冲区等关键技术,有效解决了传统Im2Col+GEMM方法存在的空间消耗大、缓存效率低等问题,显著提升了量化神经网络的计算效率。
40 6
【AI系统】QNNPack 算法
|
30天前
|
存储 人工智能 缓存
【AI系统】Im2Col 算法
Caffe 作为早期的 AI 框架,采用 Im2Col 方法优化卷积计算。Im2Col 将卷积操作转换为矩阵乘法,通过将输入数据重排为连续内存中的矩阵,减少内存访问次数,提高计算效率。该方法首先将输入图像转换为矩阵,然后利用 GEMM 库加速计算,最后将结果转换回原格式。这种方式显著提升了卷积计算的速度,尤其适用于通道数较多的卷积层。
51 5
【AI系统】Im2Col 算法
|
30天前
|
存储 机器学习/深度学习 人工智能
【AI系统】Winograd 算法
本文详细介绍Winograd优化算法,该算法通过增加加法操作来减少乘法操作,从而加速卷积计算。文章首先回顾Im2Col技术和空间组合优化,然后深入讲解Winograd算法原理及其在一维和二维卷积中的应用,最后讨论算法的局限性和实现步骤。Winograd算法在特定卷积参数下表现优异,但其应用范围受限。
36 2
【AI系统】Winograd 算法
|
18天前
|
人工智能 算法
AI+脱口秀,笑点能靠算法创造吗
脱口秀是一种通过幽默诙谐的语言、夸张的表情与动作引发观众笑声的表演艺术。每位演员独具风格,内容涵盖个人情感、家庭琐事及社会热点。尽管我尝试用AI生成脱口秀段子,但AI缺乏真实的情感共鸣和即兴创作能力,生成的内容显得不够自然生动,难以触及人心深处的笑点。例如,AI生成的段子虽然流畅,却少了那份不期而遇的惊喜和激情,无法真正打动观众。 简介:脱口秀是通过幽默语言和夸张表演引发笑声的艺术形式,AI生成的段子虽流畅但缺乏情感共鸣和即兴创作力,难以达到真人表演的效果。
|
2月前
|
机器学习/深度学习 传感器 人工智能
智慧无人机AI算法方案
智慧无人机AI算法方案通过集成先进的AI技术和多传感器融合,实现了无人机的自主飞行、智能避障、高效数据处理及多机协同作业,显著提升了无人机在复杂环境下的作业能力和安全性。该方案广泛应用于航拍测绘、巡检监测、应急救援和物流配送等领域,能够有效降低人工成本,提高任务执行效率和数据处理速度。
智慧无人机AI算法方案
|
1月前
|
存储 人工智能 缓存
【AI系统】布局转换原理与算法
数据布局转换技术通过优化内存中数据的排布,提升程序执行效率,特别是对于缓存性能的影响显著。本文介绍了数据在内存中的排布方式,包括内存对齐、大小端存储等概念,并详细探讨了张量数据在内存中的排布,如行优先与列优先排布,以及在深度学习中常见的NCHW与NHWC两种数据布局方式。这些布局方式的选择直接影响到程序的性能,尤其是在GPU和CPU上的表现。此外,还讨论了连续与非连续张量的概念及其对性能的影响。
52 3

热门文章

最新文章