PPML: 端到端隐私保护机器学习解决方案
项目位置链接
https://github.com/intel-analytics/BigDL
https://github.com/intel-analytics/BigDL/tree/main/ppml
技术自身介绍
领域的问题和挑战
在众多计算应用场景中,大数据分析和人工智能已经成为不可或缺的关键环节。总体而言,数据越多,数据分析的价值越大,ML/DL的模型也会越完善。但囤积和处理海量数据也带来了隐私、安全和监管等风险。隐私保护机器学习(PPML,包含大数据分析和人工智能)有助于化解这些风险,能够在不透露原始数据的前提下,实现数据的有效流动,让使用方利用数据的价值。
对挑战的解决方案BigDL PPML
英特尔至强可扩展处理器为隐私保护机器学习提供了可信硬件执行环境 - 英特尔® SGX和英特尔®TDX。英特
尔基于这些技术打造了端到端的大数据和人工智能隐私计算解决方案BigDL PPML。
BigDL是英特尔开源的统一的人工智能解决方案平台,数据科学家,数据工程师等开发者可以使用BigDL轻
松创建端到端的分布式人工智能应用。BigDL应用英特尔SGX/TDX可信硬件执行环境(Trusted Execution
Environ[1]ment, TEE),并集成了其他软硬件安全措施,构建了一个分布式的隐私保护机器学习(Privacy
Preserving Machine Learning, PPML)平台,能够保护端到端(包括数据输入,数据分析,机器学习,深度
学习等各个阶段)的分布式人工智能应用。
技术介绍
上图是BigDL PPML预制工作流:
1、用户通过BigDL PPML命令行向Kubernetes提交任务,此操作会创建一个驱动节点
2、BigDL PPML客户端认证驱动节点
3、驱动节点创建更多的工作节点
4、驱动节点认证工作节点
5、驱动节点和工作节点从密钥管理服务获取密钥
6、工作节点读取输入数据并解密
7、工作节点分布式运行大数据,机器学习或者深度学习任务
《云原生机密计算最佳实践白皮书》——07解决方案——PPML: 端到端隐私保护机器学习解决方案(下) https://developer.aliyun.com/article/1230703?groupCode=aliyun_linux