隐语开源框架 1.0 版本于 2023 年 7 月 7 日在 WAIC 隐私计算与数据要素论坛重磅发布。会上,隐语开源技术指导委员会核心代表:上海交通大学教授 郁昱、浙江大学网络空间安全学院院长 任奎、蚂蚁集团副总裁兼首席安全技术官 韦韬共同见证并开启了隐语新版本迭代序章。蚂蚁集团隐语总经理、隐语框架负责人 王磊也在现场围绕隐语 1.0 版本解读了其备受业界关注的隐私计算任务编排框架 Kuscia ,同时介绍了隐语产品体验工具 MVP 部署包。
隐语 1.0 发布
一、新版本更新总览及现场体验隐语 1.0 版本带来的更新涵盖产品层、资源层、互联互通等板块。其中, Kuscia 隐私计算任务编排框架,聚焦行业底层基础设施差异以及资源管理等技术规模化痛点,并提供屏蔽底层技术细节即实现互联互通的高阶能力。此外 MVP 部署体验包更是将隐语开放平台一年来的用户反馈转化为产品能力,在 WAIC 展区开设线下体验专区,用户可在功能模拟对抗 PK 等互动中切身感受隐私计算易用性。另外,在即将到来的 7 月 22 日隐语一周年活动,也将在现场就隐语 1.0 框架及 MVP 部署包体验和用户 1v1 深入探索,点击了解详情报名参与!
二、Kuscia + 新增开放算法协议:黑盒白盒全栈互联互通
此前,隐语的开源范围主要以算法层、计算层为主,本次 1.0 版本不仅是开源内容更加丰富全面,也通过框架结构的整体调优拓展,表达了对于技术趋势、行业趋势的更多展望。论坛发布中,隐语框架负责人王磊就分享了来自隐语的思考与解决思路。
思考 1:隐私计算在跨机构合作过程中会面临一系列非算法相关的问题
- 如在网络层,多任务并行需要多端口,能否实现多端口合并统一?跨机构合作需要进行 TLS 认证、身份认证等保障安全通讯,能否用统一的方案解决这些问题,而不是每个引擎、每个任务分别去做?
- 如在系统层,不同的机构底层部署系统存在差异,有虚拟机、 K8S等多种情况,这对于引擎开发者、工程人员来说,在开发到实际部署之间还存在巨大的跨度,需要大量的工作填补,并要同时解决资源隔离、故障转移等问题。
- 在数据层,存在多样化数据系统适配、数据管理、数据使用授权等问题。
- 在应用层,存在不同应用在不同机构的应用版本管理和匹配的问题,灰度上线,任务并发等问题。
以上常见问题似乎与常说的安全多方计算、TEE、联邦学习关系甚微,但却是隐私计算落地过程当中普遍面临的重要问题。因此,隐语的思路是能够通过一套普适、通用的方法,将这些问题统一解决。
- 解决方案 :隐私计算任务编排框架 Kuscia
Kuscia 框架的核心理念是希望通过一套隐私计算基础设施屏蔽掉底层的各种差异,将机器、网络、数据等各个层面的问题统一解决。
具体实现的效果即对于算法与应用开发者,只需要满足一定的接口标准要求,就可直接在系统中运行应用,而无需费心于环境和网络状况。并且要强调的是,Kuscia 不局限在“隐语”内,而是只要满足标准,现有其他无论开源抑或是闭源隐私计算引擎都可以在其上运行。
Kuscia 是一个典型的 K8S 架构,并站在巨人肩膀上实现能力延伸。
如图可见 Kuscia 的架构上层为 Master,下层为 Lite。Master 是控制管理面,负责任务调度和控制;Lite 部署在计算资源上,负责机器中的具体工作执行。
方案优势:
- Kuscia 提供简洁轻量的一键部署能力:
实际隐语 1.0 版本提供的是 K3S。基于当前隐私计算行业的发展现状,绝大多数用户还处于 POC 或业务试点的过程中,轻量化部署和轻量化运维是这一阶段的核心诉求。故而隐语 1.0 选择 K3S,不仅因为 K3S 配以控制器是非常通用的架构,可以将部署工作清晰化,也考量了未来数据规模并发变大,还能顺滑切换至 K8S 。
- 基于K8s 提供一套任务编排调度能力:
如基于 DAG 图的任务编排,多任务并发调度,资源隔离等能力。这些能力是基于K8s 二次开发的 Controllers 来提供的,我们称之为 Kuscia Controllers。
- 插件化的互联互通能力:
同时,Master 层还有 Inter Controller 以实现互联互通。不仅使得 Kuscia 能与其他部署了 Kuscia 的框架之间互联互通,也可以和其他互联互通协议互通。
互联互通始终是行业的重点课题,那么插件化模式优势何在?因为,实际的互联互通很难完全收敛到一种协议上,理想的情况也是收敛至几种不同的互联互通协议。我们希望通过插件化模式,帮助 Kuscia 做到更好的扩展性。未来只要提供一个互联互通的协议,就可以通过插件方式和其他框架互通。
当前,主要提供了两种互联互通:
- 一种是 Kuscia alpha,即两个 Kuscia 框架之间通过内部的互联互通协议进行互通;
- 另一种是新增实现的银联互联互通协议。https://mp.weixin.qq.com/s/N0n72VdBdcgipDzLzMdcnQ?token=258644840&lang=zh_CN
- 在 Lite 层,提供了如下几种能力:
- NetworkMesh,主要是解决端口合并、网络安全、路由等问题。
- DataMesh,这一次我们提供的是相对比较弱的 Demo 版本,核心解决数据对接、管理、访问鉴权等能力。
- 此外我们还提供了 Runtime,它不仅可以拉起隐语,这里也可以拉起 Fate。我们希望它可以作为一个通用框架,和不同的引擎都可以结合。Runtime 我们会提供 RunC、RunK、RunP 三种模式。目前我们提供的是 RunC,它是和 K8S 传统模式是一样的:在一个虚拟机上部署后可以使用container把每个 Pod 拉起来。
- 未来我们还会提供 RunK 和 RunP 模式。这里介绍一下RunK模式,RunK 的意思就是 Run K8S 模式。很多机构自己有一套基于K8S的资源部署和管理集群,它并不想把它的资源管理交给 Kuscia 来做,但是它希望和别的客户做隐私计算交互,基于这样的需求我们提供了 RunK 模式。Kuscia可以通过 RunK 可以把资源和任务全部代理给 K8S 集群,这样机构的 K8S 集群就可以做自己的任务调度和管理。最终它会把结果返回给 RunK,由 RunK 进行收集。通过这种方式我们就能很好地去和机构已有的 K8S 集群做结合。
- Kuscia 还提供了当前业界比较流行的两种部署模式:P2P 和 中心化:
P2P 模式适合对等的合作关系。如机构 A 希望部署一套隐私计算系统,并与其他机构合作。在合作中,各机构希望自己都拥有完全的掌控力,这种则是 P2P 模式。在这种情况下,每一个机构只需部署 Master 和 Lite 节点,就可以形成一套完全独立自主的节点。在不同的节点之间,可以通过 Kuscia 内部的 Kuscia alpha 互联互通协议完成协作。中心化模式则指合作关系中的各方角色有所不同,特别适合总部与分支机构、数交所与数商之间的合作模式,角色中可能存在一个中心管理者和协调者,在平台上进行操作。也就是说,当希望对所有数据参与任务都具有一定的掌控力时,可以选择中心化模式。其好处在于,一方面中心有一定的掌控力,但并不会参与数据交互和影响数据安全,另一方面是各个分支机构部署节点也非常轻量化。
中心化模式和 P2P 模式在底层架构设计上几乎完全一致,因此他们也可以通过互联互通的机制进行通信,整体是一张非常完整的数据流通网络。
三、隐语白屏产品
思考 2:隐私计算用户迫切需要更低成本的技术体验与产品研发路径。
对于许多隐私计算潜在用户和初学用户而言,基础需求是快速感知功能、了解完整流程、获得直观效果,以此来进行判断或决策。
第一,希望让用户低成本感受和体验隐私计算。比如新手想去体验隐语产品,或在体验完后觉得这个东西很好想要向自己的领导展示时,通过白屏产品就可以很方便的进行体验、演示和展示。
第二,降低业务产品的研发成本。由于产品和业务是紧耦合关系,很多业务希望自己去做产品研发,在这里我们提供的产品组件,可以让业务方在开发业务产品时把这些组件集成到他们的产品平台中,帮助业务降低平台研发成本,提升平台的研发速度。
解决方案 :MVP(Minimum Viable Product)部署体验包
隐语 1.0 发布 MVP(Minimum Viable Product)部署体验包:一款面向隐私计算初学用户的轻量级功能体验工具,内置节点、数据资源,节点间已相互授权,安装即可体验主要常见功能。相较于更侧重于生产场景的隐语开放平台,隐语 MVP 部署体验包通过多种方式降低使用门槛,为业务投产正式使用铺垫入门操作基础。
方案优势:
- 一键部署
将引擎这些内容打包成一个安装包,并且内置节点和数据,下载之后一键部署,所有准备工作就绪,即刻开始体验。
- 零门槛体验
此前隐语开放平台从社区获得大量反馈,如功能很多但是太复杂,上手成本高。此次 MVP 提供新手引导,一步一步帮助使用。同时,也提供场景化模板能力,且模板内已完成所有算子节点之间的连线,并通过一张图展示。如此,用户只需通过少量修改就可以完成整个链路的串联。未来,我们希望可以在更多行业和场景中沉淀出模板化的方式,将知识沉淀到系统当中,帮助更多行业新人快速上手。
- 标准化接口
为什么白屏产品会有接口?这其实源于隐语自身迭代开发中发现的问题,每当有新算子增加,白屏产品就需要配合进行开发和联调,周期一般较长。所以,隐语提供了一个标准化的自描述算子接口,所有算子,即便不是“隐语”的算子,只要遵循这个接口,上层平台不需要做任何开发,就可以将算子渲染出来,缩短整个开发和联调的周期。
这当中可以看到“隐语”的设计理念,我们并不想把“隐语”做成一块铁板,我们希望每一块东西都是分层的。
四、更多更新与迭代
除 MVP 白屏产品和 Kuscia 框架外,1.0 版本在算法层和计算层也有大量的更新和迭代。简要概括,在传统机器学习算法上提供了大量优化和丰富的算子,最重要的是提供 Benchmark,便于大家根据不同网络、不同带宽、不同计算资源以及不同安全水位情况,更好地进行技术选型。
同时,隐语开源社区 SIG(特别兴趣小组)也在陆续组建中,希望围绕 “隐语” 打造更多周边的生态,可以使得 “隐语” 和隐私计算行业更好发展。一方面,围绕场景持续探索,推动隐语在更多行业与应用中用起来;另一方面,隐语社区也在探索与高校科研间的更多合作,希望帮助高校研究人员实现更低成本的研究,通过隐语就可以起支持起创新的点子,也希望缩短和弥补高校研发与产业界的 gap,使得研发成果的转化可以变得更加顺畅。
隐语开源框架 1.0 的发布只是起点不是终点。隐语一周年专场 Meetup 即将在 7 月 22 日举办,届时会发布各个模块的 Roadmap,把其中的功能独立具体化,并拆解为社区共建任务,核心是希望并推动“隐语”变成真正的社区工作,让更多人参与共建。并配合隐私计算开源生态的持续建设,包括互联互通的协议会持续更新迭代。在下午的论坛,我们也会专门介绍互联互通的内容。(点击阅读原文,立即报名一周年活动)