联邦学习原理-上篇(上)

本文涉及的产品
密钥管理服务KMS,1000个密钥,100个凭据,1个月
简介: 联邦学习原理-上篇(上)

联邦学习技术特点


  • 数据隔离
数据不泄漏到外部
  • 对等
参与者地位平等
  • 无损
联邦学习效率等同或接近全量数据模型
  • 共同获益
参与者共同获益


联邦学习分类


  • 横向联邦
数据方特征维度相同
  • 纵向联邦
数据方样本ID相同
传统的以表格的方式查看数据看 
纵向的按列对数据分组
每列数据包含的数据indices/ID相同


纵向联邦学习-联合建模需求场景


举例说明

微众与合作企业联合建模,微众有y(业务表现),期望优化本方的Y预测模型

各方数据

  • 合作企业

image.png

image.png

设定

  • 只有微众拥有Y=逾期表现
  • 合作企业无法暴露含有隐私的X

传统建模方法问题

  • 合作企业缺乏Y无法独立建模
  • X数据全量传输到微众不可行

期望结果

  • 保护隐私条件下,建立联合模型
  • 联合模型效果超过单边数据建模


纵向联邦学习


各个参与者拥有的数据ID相同,数据特征不同(有的参与者可能没有标签)
  • 参与者之间需要交换中间结果
  • 支持XGBoost/SecureBoost之类的模型
  • 可通过split learning支持神经网络模型
  • 大规模纵向联邦系统复杂性较高

纵向联邦学习示意图

image.png


1、A和B之间没有数据交换
2、Encrypted entity alignment 指加密数据(使用同态加密技术)对齐即样本融合求取交集的过程
3、模型训练的过程存在一个第三方
a、第三方分别给A和B发送数据加密所用到的公钥
b、A和B之间交换模型训练过程的中间结果
c、A和B分别计算出梯度和损失值(针对树模型)发送给第三方
d、第三方进行汇总并下发给A和B用于更新模型参数


联邦学习的关键技术


保护隐私和安全的方法

  • 同态加密 Hmomorphic Encryption(HE)
  • 多方安全计算 Secure Multi-party Computation(MPC) 例如Secret Sharing
  • 姚式混淆电路 Yao's Garbled Circuit
  • 差分隐私 differential Privacy (DP)


同态加密


包括全同态和半同态
同态加密是指这样一种加密函数,对明文进行加法和乘法运算再加密,与加密后对密文进行相应的运算,结果是等价的
同态加密每次加密的结果是不一样的

基于同态加密的的Model Averaging

image.png

  • Addition:[[u]]+[[v]]=[[u+v]]
  • Scalar multiplication:n*[[u]]=[[n*u]]
纯量乘法是指一个标量r与一个向量V(或矩阵M)相乘,其结果为一个向量(矩阵),该向量(矩阵)的每一个元素为标量r与V(M)中对应


相关文章
|
1月前
|
机器学习/深度学习 分布式计算 安全
联邦学习的简要概述
联邦学习(Federated Learning, FL)是一种分布式机器学习方法,旨在保护数据隐私的同时,利用多方数据进行模型训练。
83 5
|
5月前
|
机器学习/深度学习 算法 Python
【算法】深入浅出爬山算法:原理、实现与应用
【算法】深入浅出爬山算法:原理、实现与应用
159 3
|
机器学习/深度学习 人工智能 算法
这篇科普让你Get所有大模型的基础核心知识点
本文介绍了AI大模型的概念和发展历程。AI大模型是指具有1亿以上参数的机器学习模型,通过在大规模数据集上进行预训练,可以直接支撑各类应用。大模型的发展经历了从萌芽期到AI1.0时期,再到AI2.0时期的飞跃,目前最新发布的大模型参数已经达到了千亿甚至万亿级别。国内外的公司都在积极研发和应用大模型,如OpenAI、Google、Facebook、Microsoft等。国内也有百度、阿里巴巴、万维、商汤科技等公司发布了自己的大模型产品。大模型的建造离不开算力资源、算法人才、数据积累等核心要素。此外,文章还列举了一些与大模型相关的专业名词,如算法、模型参数、训练数据、Token等。
|
存储 网络协议 Linux
【网络篇】第一篇——网络入门基础(一)
【网络篇】第一篇——网络入门基础
【网络篇】第一篇——网络入门基础(一)
|
负载均衡 应用服务中间件 Apache
深入浅出学习透析Nginx服务器的基本原理和配置指南「初级实践篇」
深入浅出学习透析Nginx服务器的基本原理和配置指南「初级实践篇」
245 0
深入浅出学习透析Nginx服务器的基本原理和配置指南「初级实践篇」
|
程序员 编译器 C++
C++(入门、核心、提高三篇)总结及补充
C++(入门、核心、提高三篇)总结及补充
111 0
C++(入门、核心、提高三篇)总结及补充
|
应用服务中间件 nginx Perl
深入浅出学习透析Nginx服务器的基本原理和配置指南「进阶实践篇」
深入浅出学习透析Nginx服务器的基本原理和配置指南「进阶实践篇」
232 0
|
机器学习/深度学习 数据安全/隐私保护
联邦学习原理-上篇(下)
联邦学习原理-上篇(下)
401 0
联邦学习原理-上篇(下)
|
机器学习/深度学习 缓存 JSON
联邦学习原理-中篇(下)
联邦学习原理-中篇(下)
316 0
联邦学习原理-中篇(下)
|
机器学习/深度学习 搜索推荐 算法
联邦学习原理-中篇(上)
联邦学习原理-中篇(上)
262 0
联邦学习原理-中篇(上)