4. Dataphin 隐私计算四大技术应用场景
1) ID 安全匹配
• 功能介绍:
在弱匿名化的前提下进行 ID 安全匹配。用于在不泄漏数据参与多方原始数据的前提下,得出双方共有 ID 集,非共有 ID不会透出。
• 适用场景:
适用于一些数据圈选的场景。例如,某银行期望在某电商平台,对【特定非活跃老客】用户进行老客营销,需要求两边客户交集,但两边客户 ID 不透出此处可用 ID安排匹配功能完成。
2) 隐匿信息查询
• 功能介绍:
也称隐私信息检索,指查询方隐藏被查询对象关键词或客户 ID 信息,数据
服务方提供匹配的查询结果却无法获知具体对应哪个查询对象。
• 适用场景:
适用于一些查询场景,数据查询方不想向数据服务方透露要查询的内容。例如病患想通过医药系统查询其疾病的治疗药物,如以该疾病名为查询条件,医疗系统将会得知该病人可能患有这样的疾病,从而病人的隐私被泄露,通过隐信息查询可以避免此类泄露问题。
3) 联合建模
• 功能介绍:
在原始数据不出域的前提下,通过交换各个参与方的算法训练的中间结果梯度、参数信息,或完全在密文条件下进行计算,从而发挥参与多方数据样本更丰富、更全面的优势,得出更优模型。
联合建模,分为横向联合建模、纵向联合建模。其中,纵向联合建模,联合多个参与者的共同样本的不同数据特征进行联合建模,即各个参与者的训练数据是纵向划分的。横向联合建模,联合多个参与者的具有相同特征的多行样本进行联合建模,即各个参与者的训练数据是横向划分的。
• 适用场景:
纵向联合建模,适用于参与者训练样本 ID 重叠较多,而数据特征重叠较少的情况,例如某银行和某电商平台,分别拥有一部分客户数据,拥有的客户特征不一样,银行拥有客户的金融信用数据,电商拥有客户的电商消费数据,期望联合两方数据训练精准营销模型,则适合使用纵向联合建模。
横向联合建模,适用于参与者的数据特征重叠较多,而样本 ID 重叠较少的情况,例如两家银行,分别拥有一部分客户数据,拥有的客户特征相似,但各自数据偏少,期望联合两方数据训练共同训练评分卡模型,则适合使用横向联合建模。
4) 联合分析
• 功能介绍:
在原始数据不可见前提下,提供 SQL 模式对多方数据进行联合分析。
• 适用场景:
适用于双方数据不共享,但有一些统计分析的需求。例如电商平台在媒体平台进行了营销广告投放,投放结束后,电商平台期望能联合两边的数据,进行全链路的营销活动复盘分析,就可以借助联合分析功能实现。
5) 总结回顾