阿里巴巴的AI算法程序媛是怎样的一种存在?

本文涉及的产品
身份二要素核验,500次流量包 3个月
手机号三要素核验简版,10000次流量包 3个月
金融级实人认证,500次流量包 6个月
简介: 一个专注人脸识别技术长达11年的程序媛。

程序媛、AI、算法、人脸识别、阿里安全图灵实验室……这些标签任何一个都极具话题性,但如果一个女子同时拥有这些标签,那会是怎样的存在?

在见到于鲲之前,我的脑子里是各种的想象,萌妹纸?御姐?还是?尽管于鲲说话语速有点快,但干脆利落,逻辑清楚,所以“干练”是她留给我的最深的印象。
IMG_0742
阿里安全图灵实验室的AI算法程序媛于鲲

在阿里巴巴这几年的锤炼,于鲲已经成长为国内人脸核心算法领域的顶级专家。作为阿里安全图灵实验室的核心成员,研发了业界顶级水准的人脸识别技术和算法,无论是1:1人脸比对还是1:N人脸搜索的算法,效果都在业内处于优势地位。目前,线上的人脸比对核心算法模型,就是于鲲和小伙伴们一起训练和开发的。

不仅如此,于鲲还出色地紧贴业务场景,将技术成果完美落地。她主导了新零售(如未来美家、银泰百货、盒马等)和其他1:N线下业务(包括园区门禁,菜鸟快递取件柜等)的人脸比对算法;同时,还协同了1:1实人认证(手淘扫脸登录等)和1:N敏感人脸检测(内部和绿网)等重要业务算法的研发。

与用户直接互动“很刺激”

2014年,于鲲接触到阿里巴巴,然后被深深地吸引。

“我觉得实人认证和内容管控是非常有前景的,而且可以和终端用户直接互动。”于鲲说,“这对于做技术的人来说,是非常有吸引力的,也挺有成就感的。”

于鲲认为,像是实人认证这种,如果技术层面没有做好,就会导致体验下降。但不管是技术原因还是业务原因,导致客户的流程没有走下去,用户就会给到最为直接的反馈。比如扫脸登录,用户的反应是最为直观的,用户所能接受的极限时间为2秒钟,这对技术提出了极高的要求。

“对于技术人员来说,来自于用户的直接反馈是一种最为难得的体验。“于鲲强调。

由于算法是偏后端的,所以和前台用户的互动,让于鲲觉得是一种“很刺激“的体验。

在于鲲眼中,阿里巴巴这种大平台确实很吸引人。比如实人认证,规模很大,有数亿人在使用。对于绝大多数技术人员来说,这并不是一个很容易得到的机会。

在阿里巴巴是一种全新的体验

从2007年到现在,于鲲一直在做人脸识别技术的研究和开发。

从技术层面来看,于鲲算是轻车熟路,但这并不意味着前面是一片坦途。“对我来说,其实还是蛮挑战的,因为需要角色有巨大的转变。”于鲲说。

于鲲介绍,她之前一直在传统企业做人脸技术的研发,但是到了阿里巴巴这种头部互联网公司后,需要对自己进行革新。包括企业的文化、工作的流程等,这些对于鲲都是全新的体验。

“总体感觉是阿里的节奏非常快,开始还有些不太适应。”于鲲说。她觉得自己每天都是在小跑着前进,面对的业务比较复杂,对接的团队也很多。每天多数时间都在开会中度过,基本上晚饭后的时间才是属于自己的,此时才会坐下来做一些事情。“基本上,白天不是在开会就是在去开会的路上。“于鲲笑称。

万事开头难。但通过不断的交流和磨合,于鲲和小伙伴们越来越有默契,沟通越来越顺畅,对业务也越来越了解,项目推动起来也就“得心应手”了。两年之后,于鲲完全适应了这里,适应了快节奏,适应了新环境。心里也就自然而然地认为,“本来就应该是这样的。”

“现在,如果是慢节奏,我反而不习惯了,会觉得是在浪费时间,浪费生命。”于鲲说,“工作就应该是这样的。”

于鲲告诉我,她觉得到了阿里巴巴就是打开了新的一页,体会到了不同的人生。

程序媛并不是一种独特的存在

阿里安全图灵实验的研究方向非常稳定,就是专注于计算机视觉、自然语言处理、机器学习和深度学习;其聚焦的业务也非常稳定,就是为手淘、天猫、支付宝、闲鱼、优酷土豆、UC、阿里妈妈等核心业务线提供技术支撑,并对外输出AI能力。因此,整个团队也非常稳定。
IMG_0184
阿里安全图灵实验室的部分技术同学

这几年,于鲲一直在阿里安全图灵实验室。据她介绍,整个团队有5个程序媛,3个Base杭州,2个Base北京。“我们团队的氛围特别好,大家在一起就是‘哥们儿’,会互相分享好的idea,像一家人似的。”于鲲说,“所有人同心协力,朝着同一个方向,同一个目标发力。”

于鲲认为,大家在团队大目标之下,只有分工的不同,小伙伴们更多的是相互补位和背靠背的方式进行协作。“这个事情交给你,这个事情到此为止。就是这么简单的逻辑。”于鲲说。

于鲲笑着说,她之所以留着长发只是想保留自己女生的特征,但干活儿从来没有把自己当成一个特殊的存在,要享受特殊待遇。相反地,她认为自己从业的时间比较长,所以应该更多地去承担一些事情。

有想法就尽情去发挥

团队稳定与否,Leader很重要。这是于鲲的观点。

在她眼中,阿里安全图灵实验室的负责人奥创是一个很有想法,有大局观的人。正因为如此,整个团队的氛围很和谐,也没有什么职级之分。

于鲲还记得,某年的中秋节,奥创拎着大闸蟹来到公司,然后分给团队的小伙伴们。“Leader有什么事情,都会想到团队成员,这非常棒!”于鲲说。

对比传统企业和互联网公司,于鲲也谈了自己对于技术团队的一些理解。她认为,团队好不好,要看Leader有没有远见,有没有前瞻性。传统企业的技术团队,Leader把任务拿来,然后给到团队成员去落实,这是一种自上而下研发模式。但是在阿里巴巴不一样,这里是一种自下而上的模式,也就是说,组织的目标就在那里,每个团队成员都能看到,每个人能为这个目标做什么?团队成员是自发的,也就是阿里巴巴一直强调的自组织、自驱动,每个人都内心驱动。

“整个团队都是这样的,整个阿里也是这样的。”于鲲说,“虽然有KPI的考核,但每个团队都在思考还可以做些什么?每个人也在想我可以做些什么?这个力量是无穷的。”

于鲲认为,自上而下的指令,很多时候只是Leader一个人的思考,所以具体落地的时候可能结果并不好;但如果是自下而上,那么每个人的想法都能得到充分发挥,每个人都会贡献自己的智慧去为大目标做有益的工作,这是一种积少成多的力量。

“阿里巴巴的工作模式就是,有想法就尽情去发挥。”于鲲说。

算法人靠“数字”说话

在阿里巴巴西溪园区,刷脸设备已经替代了传统的刷卡门禁,这就是于鲲和团队小伙伴们的杰作。实际上,这是经过了内部激烈的技术PK之后,最终被阿里安全图灵实验室拿下的。
DINGTALK_IM_664966376
于鲲和小伙伴研发的人脸识别技术应用于阿里巴巴门禁系统

“算法人是要靠数字说话的,谁的准确率高,谁就上。”于鲲告诉我,阿里安全图灵实验室研发的人脸识别系统在准确率方面拔得头筹,因此才拿下了园区的门禁刷脸项目。

不仅在内部取得不俗的成绩,在与外部友商的竞争中,阿里安全图灵实验室也顺利拿下了某机场的安检项目,而实验室还通过阿里云上的“实人认证”和“内容安全”两大产品,服务了数万家企业客户。

“我们的业务都依托于我们的技术,因此,我们的技术并不是为了在某个竞赛得奖而进行研发的,而是为了充分保障业务的顺畅应用,为用户提供极致的体验。”于鲲告诉我,阿里安全图灵实验室实际上也经常会在一些大赛上斩获殊荣,但通常情况下,这些都不过是技术小伙伴们做好业务项目之余的“副业”而已。

于鲲告诉我,阿里安全图灵实验室的目标是要做最顶尖的算法团队,并保持领先的地位。

用技术改变生活

于鲲向我普及了一下人脸识别技术的发展简史。

90年代初,手机还未普及,关于人脸识别的应用还非常初级,通常都是简单的特征分类,比如几何或者灰度特征。

2003年到2004年的时候,人脸识别技术开始转向图像领域的传统特征,那时,更多的是需要看工程师对图像的理解,是非常挑战的。不过,已经有一些比较初级的商业应用,比如一些考勤机。

到了2012年,深度学习进入到爆发期。随着这一波的大发展,人脸识别也是获益最为典型的应用之一。那个时候,不管是数据还是算法,人脸识别都已经准备好了,可以随时“起飞”。

最近的两三年,人脸识别主要是在做用户习惯的培养,毕竟还是有很多人不太能够接受,但这个现状正在发生着巨变。比如扫脸支付、扫脸转账等,它们具备的便捷性是以往任何一种技术都无法比拟的。

于鲲告诉我,在人脸识别技术方面,中国是非常领先的,在用户习惯的培养方面也是领先的。每年,国家在这一领域的科研投入,比如论文数量或专利数量在全球来看都是处于前列。

事实上,于鲲从事人脸识别技术的研究与开发已经11年,因此很多人都会奇怪她会不会厌烦了?或者说是否需要换一个方向?她并没有这样的想法。她认为,人脸识别并不是一个单点的技术,而是一整套的解决方案,除了方案本身,它底层的技术也是复合型的。

“人脸一直会在持续的变化,比如化妆、比如美容、比如衰老,比如光照等,这些都会导致人脸的变化。这些变化,远比其他模型要复杂得多。这对于机器来说,是极大的挑战。”于鲲说,“正因为人脸识别所具备的复杂性,所以才会有这么长时间,这么多人去研究。”

于鲲觉得,人脸识别是一个非常好的点,应用场景非常多,商业的可能性也很多,所以它能够成为当前的热点。

“这几年人脸的应用越来越广,其实并不是我们站在这个风口,而是说整个行业站在了这个风口。资本疯狂追逐,各大公司也巨额投入,这些都说明其市场前景巨大。”于鲲表示。

“我想能够用技术服务大众,真正的用技术改变生活,用技术去除恶扬善,这是我的梦想,相信也是每个技术人的梦想。”于鲲说。

目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 算法
「AI工程师」算法研发与优化-工作指导
**工作指导书摘要:** 设计与优化算法,提升性能效率;负责模型训练及测试,确保准确稳定;跟踪业界最新技术并应用;提供内部技术支持,解决使用问题。要求扎实的数学和机器学习基础,熟悉深度学习框架,具备良好编程及数据分析能力,注重团队协作。遵循代码、文档和测试规范,持续学习创新,优化算法以支持业务发展。
93 0
「AI工程师」算法研发与优化-工作指导
|
2月前
|
机器学习/深度学习 人工智能 算法
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
本文全面介绍了人工智能(AI)的基础知识、操作教程、算法实现及其在实际项目中的应用。首先,从AI的概念出发,解释了AI如何使机器具备学习、思考、决策和交流的能力,并列举了日常生活中的常见应用场景,如手机助手、推荐系统、自动驾驶等。接着,详细介绍了AI在提高效率、增强用户体验、促进技术创新和解决复杂问题等方面的显著作用,同时展望了AI的未来发展趋势,包括自我学习能力的提升、人机协作的增强、伦理法规的完善以及行业垂直化应用的拓展等...
160 3
AI入门必读:Java实现常见AI算法及实际应用,有两下子!
|
2月前
|
存储 人工智能 算法
AI算法的道德与社会影响:探索技术双刃剑的边界
【8月更文挑战第22天】AI算法作为一把双刃剑,在推动社会进步的同时,也带来了诸多道德与社会挑战。面对这些挑战,我们需要以开放的心态、严谨的态度和创新的思维,不断探索技术发展与伦理规范之间的平衡之道,共同构建一个更加美好、更加公正的AI未来。
|
3月前
|
机器学习/深度学习 数据采集 人工智能
AI技术实践:利用机器学习算法预测房价
人工智能(Artificial Intelligence, AI)已经深刻地影响了我们的生活,从智能助手到自动驾驶,AI的应用无处不在。然而,AI不仅仅是一个理论概念,它的实际应用和技术实现同样重要。本文将通过详细的技术实践,带领读者从理论走向实践,详细介绍AI项目的实现过程,包括数据准备、模型选择、训练和优化等环节。
239 3
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 秒懂 AI - 深度学习五大模型:RNN、CNN、Transformer、BERT、GPT 简介
**RNN**,1986年提出,用于序列数据,如语言模型和语音识别,但原始模型有梯度消失问题。**LSTM**和**GRU**通过门控解决了此问题。 **CNN**,1989年引入,擅长图像处理,卷积层和池化层提取特征,经典应用包括图像分类和物体检测,如LeNet-5。 **Transformer**,2017年由Google推出,自注意力机制实现并行计算,优化了NLP效率,如机器翻译。 **BERT**,2018年Google的双向预训练模型,通过掩码语言模型改进上下文理解,适用于问答和文本分类。
126 9
|
3月前
|
机器学习/深度学习 人工智能 算法
深入了解AI算法及其实现过程
人工智能(AI)已经成为现代技术发展的前沿,广泛应用于多个领域,如图像识别、自然语言处理、智能推荐系统等。本文将深入探讨AI算法的基础知识,并通过一个具体的实现过程来展示如何将AI算法应用于实际问题。
112 0
|
3月前
|
机器学习/深度学习 数据采集 人工智能
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
算法金 | 没有思考过 Embedding,不足以谈 AI
**摘要:** 本文深入探讨了人工智能中的Embedding技术,解释了它是如何将高维数据映射到低维向量空间以简化处理和捕获内在关系的。文章介绍了词向量、图像嵌入和用户嵌入等常见类型的Embedding,并强调了其在自然语言处理、计算机视觉和推荐系统中的应用。此外,还讨论了Embedding的数学基础,如向量空间和线性代数,并提到了Word2Vec、GloVe和BERT等经典模型。最后,文章涵盖了如何选择合适的Embedding技术,以及在资源有限时的考虑因素。通过理解Embedding,读者能够更好地掌握AI的精髓。
44 0
算法金 | 没有思考过 Embedding,不足以谈 AI
|
4月前
|
机器学习/深度学习 人工智能 Dart
AI - 机器学习GBDT算法
梯度提升决策树(Gradient Boosting Decision Tree),是一种集成学习的算法,它通过构建多个决策树来逐步修正之前模型的错误,从而提升模型整体的预测性能。

热门文章

最新文章

下一篇
无影云桌面