4月26日是第22个世界知识产权日,这有三组信息,几乎关乎每个人。 一、2021下半年,国家出台了《个人信息保护法》、《数据安全法》等一系列与数据安全有关的法律。数据安全隐私保护成为国家层面重视且迫切的事。 二、就在不久前,中国青年报·中青校媒发布《新青年就业报告》显示,隐私计算等前沿技术正在成为热门求职岗位。从2020年至2022年中国隐私计算申请专利数据呈指数型的增长趋势可以看出,中国正在加大这一领域的技术投入。 三、国际权威知识产权第三方机构联合发布了2022年全球隐私计算技术发明专利排行榜。前十里,中国企业占了六个席位,蚂蚁集团以1152件专利数连续两年蝉联第一。据统计,蚂蚁今年新增专利412件,相当于每天至少有1个专利在提交。 这三组权威的信息都在指向一个新的贴近每个人生活的问题:单位主体如何实现在实现数据价值的同时保护数据安全和保护个人隐私。隐私计算是解答这一问题的核心技术。 隐私计算是什么?这几年又发生了什么?带着疑问,我们和多位在隐私计算领域探索的同学聊了聊,他们有人提交了上百件专利,有人已在隐私计算领域深耕了十年,希望能从他们身上,对这一前沿领域有不一样的了解。
01
为了新的技术高地,赌上六年
王力是蚂蚁可信隐私计算通用框架 “隐语”的算法负责人,常常需要和行外人、亲朋好友解释这一生词。大数据时代下,我们在享受数据共享带来的个性化的服务时,也容易催生安全和隐私的问题。
“这时问题就来了。我的数据里有我的秘密,比如我今年多大,我住哪里。隐私计算是通过各种技术保护数据里的秘密,把不想被别人知道的数据锁起来,但并不会影响数据的使用和价值。”
王力回忆,在2016年刚入行时,隐私计算更多还是一个“技术人很兴奋,但实际应用场景很难寻“的状态。王力毕业于上海交通大学计算机系,有一定AI技术背景,当时蚂蚁决定孵化隐私计算项目,他没有犹豫太久,就投身进了新的项目中。
那时王力有过不少被骚扰的经历,“车险到期了,各家保险公司都会打电话给我。房产中介不知是从哪里拿到我的电话的。诈骗电话也对我的信息了如指掌。”这都是典型的个人隐私泄露场景。
彼时大数据分析风头正劲,大多公司关注的还是如何用数据盈利,如何存活下去。带有个人隐私的数据满天飞,很少人会重视数据的隐私性。在这个环境下,着手探索应用方案,是逆势而上,在给各方添堵。和合作方聊的时候也会有质疑,别家都是这么做的,怎么到你这里就那么麻烦呢?
如何平衡便利的获取数据和用户的隐私保护之间的关系,是一众隐私计算团队需要考虑的问题。
混沌之初,先不管大家怎么想,团队还是以年为单位,默默地推进着。埋头搞技术研发的同时,也在增加业务交流的频次,希望能找到实际应用中的最优解,这在效率优先的互联网环境中并不多见。看着曾经所在的AI团队,同事们各个忙碌而充实,业务也能快速落地,王力“愁”过一阵子。他用瓶颈、灰暗来形容那段时光。“我自己心里挺着急,会和原部门的同事有对比,但我的主管好像并不是很急。”
技术人员的排解方式独到的硬核,技术为王,层级靠边,就事论事,方法不限。王力和主管王磊常有业务上的摩擦,一言不合就去会议室闭门辩论,经常就是一整天,写一整墙旁人看不懂的板书。聊完了,气也平了,思路也顺了,继续干活了,团队在多次碰撞中形成了特有的协同模式,王磊也成了陪伴王力最久,一起并肩作战的好战友。
团队花了3年时间做技术研发、沉淀,调研论文、实验、设计方案,把公司过成了实验室,终于在十几条可探索路线中,确定了两条技术路线。摸着石头过河,要把每块石头都反复研究透,才知道它稳不稳,能不能踩实。在技术研究的过程中,随手记录和整理也催生多个隐私计算专利的诞生,且有逐年增加之势,先前3年的沉淀积累更能对当下的环境有系统性的认识和判断。开头吸引眼球的专利数不是他们的目标,反而是团队在技术上持续有突破的最好证明。
王力在内部分享隐私计算的工作进展
团队在随后的日子中不断壮大,也多了密码学、数学等多元背景的同学,随着研究逐渐找到突破点,这群工程师,将隐私技术与机器学习融合,和业务应用持续打磨,研发出了一套统一的可信隐私计算通用框架——隐语,这是个融合了MPC、TEE、同态等多种密态计算的虚拟设备,可让隐私计算更广泛地应用到 AI、数据分析等场景中,解决隐私保护和数据孤岛等行业痛点。
02
因为笃定,从而不急
王磊的“不着急”也来自于对行业的预判。2021下半年,随着《个人信息保护法》、《数据安全法》等一系列与数据有关的法律出台,王力看到了行业关注度的呈指数型增长。最直观的感受是,在与合作方沟通中,隐私计算的优先级被排得越来越高。
隐语也在探索医疗场景中的应用。
医保结算中,医院时常会垫付部分费用,也有因对病人病况了解程度不够,导致垫付费用过高,院方亏损的情况发生。这就要求医院对病人情况有一个较为全面的了解,但病人每次不一定在同一家医院就诊,病例数据又是敏感信息,如何安全又高效的和各家医院进行数据共享?隐私计算成了最优解。
王力忘记项目成功后是如何庆祝的,“反正很有成就感,提振了团队士气。”团队随行业成长,参与并推动了行业规范的制定。“走着走着发现同行者越来越多了,大家开始形成共识,数据脱敏、多方安全计算、硬件加密、联邦学习成为主流技术,可行路线也越来越明确。”
王力会形容和同事之间的关系是革命友谊,没有那么多花里胡哨的寒暄,方向定好了,就往前冲,在团队里占少数的女生也从不扭捏。
03
把技术创新当成生活
“可以用你的话通俗的介绍一下隐私计算吗?”
“王力你聊过的,以他说的为准。”
“你会和家人聊你的工作内容吗?”
“不聊的。”
“隐私技术的发展能让隐私泄露的现象完全消失吗?”
“这个问题好难回答。”
方文静的回答,严谨的几乎刀刀见血。这也正是隐私计算的特点:太新了,一句话根本说不清楚。
在那段不确定的日子里,她和王力的生活状态完全不同,她更笃定的认可自己在做的事,活出了另一种生活哲学。
方文静是王力在上海交通大学计算机专业的同系师妹,毕业就加入了蚂蚁,如今有5年。她爱做的事情很多:爱手工,爱运动,爱唱歌。用专利奖金买midi键盘、声卡和话筒,学写歌、学编曲,开了自己的音乐频道,出了5首歌。
本着这种不断找刺激、找乐子的生活哲学,在方文静眼里是可以拓展到工作之中的。
“你需要快速从外界汲取知识,内化为自己的知识,再去解决不同的业务问题,每一步都是成就感的来源。”她常花一整天的时间读新的论文,周末也会继续。
每一个获得专利奖金的人都会拿出部分,分到每周两次的水果会基金里。大家都有共识,专利申报除了本人的贡献,也有团队的支持。而方文静就是团队里的首席水果官CFO——Chief Fruit Officer,连续4年承包水果会。这也是属于团队的欢乐时光,大家会一起边吃边侃家常、聊技术,不论职级、年龄大小,大家以技术论长短。
她认为工作的成就感来源于挑战性,从不觉得女性身份在技术圈里会存在壁垒。她习惯把一切都形容得很轻松,“实习的时候做了一个离线算法的模拟,师兄就说把专利写一下,我说好的。”水到渠成的写了第一篇专利。
但只有她自己知道,“好的”背后意味着什么。要研究透世界范围内该技术领域的详情,吃透一篇篇英文原版论文,这都是基础。在近期的工作中,方文静在国际顶级学术会议CIKM发刊论文,并申请了相关专利。
04
技术学霸的乐趣来自“啃”论文
技术学霸们都很低调。隐私计算产品摩斯的技术团队成员,有九成以上是来自国内外知名院校的研究生、博士、博士后,自主研发专利200多项。要不是同事提醒去检索,摩斯的算法负责人李漓春也不知道自己手握100余个隐私计算相关的专利。
他曾在南洋理工大学做隐私计算研究的博士后, 2012年起深耕隐私计算。经历行业变迁十年,最享受的还是工作中“啃”论文的时光。“简单的论文可能花一、二小时就看明白了,有些困难的需要花上半天看,再想能怎么落地。”有个方案想了大半年,陆续出了六、七种思路。每次都觉得已经差不多了,然后又在某个瞬间灵感迸发,再回去对方案进行优化,打磨好了再顺手记录下来,沉淀成专利和论文。李漓春专注地描绘那段时光,沉浸在技术的世界里。
他并不是一个人在战斗,他把自己称为“学习委员”,每两个星期在算法小组内组织一次学习会,分享和讨论近期看到的前沿论文和最新的算法技术,协同作战。毕竟“每个技术你都要特别的精通,才能去明白到底每个技术的优点和缺点是什么。”
隐私计算、密码学往往需要数学知识的支持,团队成员时常能互相补充。同样高产专利的张祺智博士来自东京大学数学系,常在交流中引入新的数学工具;而来自中科院密码学专业的赵原博士则负责提高性能,并多次参与行业标准制定。不同学科、不同国家的教育背景带来的多方视角分析往往能带来新的灵感,激烈的讨论也成为研究不断深入的动力。
团队对技术的热爱、对性能和安全的极致追求,也获得了一定的回响。
在2019年、2021年国际顶尖隐私计算赛事iDASH中,李漓春带领的摩斯团队在比赛里获得了多方安全计算、同态加密、联邦学习三项冠军,提交方案的各项性能上均优于第二名数倍。摩斯团队也成为该项赛事自创办以来首支夺冠、获冠军数最多的中国队伍。
蚂蚁摩斯团队获得iDASH2021同态加密冠军
隐私计算的基础理论诞生于30多年前,但将理论应用于实践还存在较大的挑战,尤其是在性能、安全、易用性方面。“如果把隐私计算产品比作一架飞机,我们小组的目标就是研发业内领先的隐私计算算法引擎,让隐私计算产品又安全又快又易操纵,促进隐私计算的商业化应用。”
李漓春所在的“班集体”打造的产品“蚂蚁链摩斯”是国内首个大规模商用的隐私计算产品,目前已应用于10多个行业,服务于上百家机构。摩斯目前已发展出专业版、桌面版、一体机版等多种产品形态。其中,“摩斯一体机”于2021年在世界互联网大会“互联网之光”博览会上对外发布,该机器通过隐私计算、可信硬件、区块链等技术的深度整合,在金融、政务、医疗等场景下都可以提供即开即用、隐私保护的数据价值流转服务。
蚂蚁集团摩斯隐私计算一体机在乌镇首发
集合多种自研技术和200多项软硬件专利
在后来的分享会中,李漓春还没开始紧张,就得知自己因防疫原因而没法入场。赵原临危受命,替他做了讲解。这个意外,正好佐证了团队成员之间的高度信赖——而这也是摩斯一体机得以诞生的环境。“我们是互相认同、互相信任的。”李漓春总结,而这才是“一起好好把事情搞下去”的状态。
05
定义技术的可能性
不仅仅在隐私计算领域。
在蚂蚁,技术创新是每个技术团队都在追求的。2017年以来,蚂蚁集团持有的专利数量,在不到五年的时间里增长了37倍,达15000多项。到了2021年,蚂蚁集团在全球新增6600多项授权专利。
计算下来,2021年间蚂蚁每天都增加18项目授权专利。回看这些年积累的专利数,都是一步一个留下的脚印,摸着过河的一块块石头。
很多像王力、李漓春这样的技术人才,在前沿技术领域里摸爬滚打,却并不孤单。他们沿用大学里就养成的习惯,每个人按照自己擅长的方向去做学术研究,一起讨论,协同作战。往往需要高度投入才能够琢磨清楚这一技术背后的优缺点,大家都清楚协作的力量远胜于单打独斗,这里也提供了沉下心做研究的空间。
李漓春在行业会议上进行隐私计算技术布道
当下,隐私保护被提到了国家层面的讨论高度。国内企业正加速入局隐私计算市场,金融、医疗、政务等多场景案例的应用逐步落地,数据价值变革从人类“将来之事”逐渐变成“眼前之事”,但同时,现有的单一技术不能完全解决当下的问题,规范的完善和用户意识培养也不是一蹴而就的事,但这群怀揣科技梦想的技术人,已经在多年的研究里做好了准备。解法如何,是否平衡得当,一切都还需要时间来验证。
技术创新无止境,也正因此,科技改变生活的边界感上变得非常有想象力。今天一个看不见的技术创新,或许就成为明天科技改变生活的核心爆发力。这样的探索是有价值的,这群“没有满足心”的技术人,他们可以创造隐私计算技术的千余项创新,也可以在未来的定义一道新的技术边界。他们正在创造科技生活的另一种可能性。