隐私计算实训营 第1期-第2讲 隐私计算开源如何助力数据要素流通

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 本文探讨了数据要素流通中的三个关键主体——数据提供方、数据消费方和数据平台方的忧虑。数据提供方关注商业秘密、个人隐私、数据使用控制及安全合规;数据消费方则担忧数据授权链和合规使用;数据平台方旨在解决双方疑虑,提供主体审核、授权链路审核、合规评审等服务。技术可信是关键,涉及隐私计算(数据可用不可见)、数据空间与区块链技术(数据可控可计量)以及数据匿名化(数据可算不可识)等。

1、数据要素流通中的关键主体,以及各自的忧虑

关键主体至少有3个:数据提供方、数据消费方、数据平台方。

1.1 数据提供方

最担心的是如下几点:

  • 商业秘密和个人隐私保护;
  • 数据使用权力的控制;
  • 数据安全和合规;


如果数据被数据消费方拷贝走,让数据价值迅速降低;如果用在非合规场景,则要付连带责任;


1.2 数据消费方

最担心的是如下几点:

  • 数据提供方的数据是否有足够的授权链;
  • 数据使用是否合规;


1.3 数据平台方

数据平台方,是为了解决数据提供方和数据消费方的疑虑出现的。

主要提供的核心价值:

  • 主体审核
  • 数据源授权链路审核
  • 场景合规评审
  • 数据使用过程中的商业秘密保护;
  • 在数据交易中不失去对数据的控制;


在第一阶段,数据平台方主要靠【主体可信】,往往是国有企业身份。但这是不够的,要逐渐从【主体可信】向【主体可信+技术可信】发展。


2、技术可信的关键技术

2.1 数据可用不可见

主要是通过数据转为密态计算来实现,隐私计算是解决这一问题的关键技术。

2.2 数据可控可计量

可以通过数据空间技术+区块链技术实现。数据空间技术可以参考IDSA的相关资料。区块链技术主要用于数据使用记录的存证。

2.3 数据可算不可识

主要通过数据匿名化实现,比如手机号通过加盐+sha256等方式转为非明文。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
负载均衡 网络协议 UED
slb健康检查
SLB的健康检查确保后端服务器正常运行,通过定期探测判断服务器状态。支持TCP、HTTP/HTTPS协议,探测路径、间隔、阈值、超时时间和重试次数可配置。当服务器连续失败指定次数时,SLB会将其从负载均衡中移除,成功响应指定次数后重新纳入。健康检查机制保障流量转发至正常服务器,提升服务可用性和用户体验。配置时需结合业务需求和服务器性能。
574 3
|
算法 数据挖掘 调度
隐语实训营-第3讲:详解隐私计算框架的架构和技术要点
主要介绍隐语的隐私计算架构,并对每个模块进行拆解、分析,以期望不同使用者找到适合自己的模块,快速入手。
313 4
|
域名解析 监控 算法
阿里云拨测:主动探测Web应用质量,助力提升用户体验
阿里云拨测是一种针对互联网应用(Web页面、网络链路等)进行应用性能和用户体验监测的服务,无需嵌码即可为云上用户提供开箱即用的企业级主动拨测式应用监测解决方案。
8371 101
阿里云拨测:主动探测Web应用质量,助力提升用户体验
|
安全 区块链 数据安全/隐私保护
第2讲 隐私计算开源如何助力数据要素流通
数据流通涉及关键主体:数据提供方关注商业秘密、个人隐私、数据控制与安全;数据消费方关注授权链与合规性;数据平台方提供主体审核、授权链审查、合规评审及商业秘密保护,初期依赖主体可信,需逐步转向技术可信。关键技术包括隐私计算实现数据可用不可见,数据空间+区块链确保数据可控可计量,以及数据匿名化实现可算不可识。
295 2
|
分布式计算 大数据 数据处理
浅谈几个经典大数据处理框架
【6月更文挑战第15天】本文介绍企业如何在数据洪流中保持竞争力需借助可扩展平台和数据策略。数据管道整合多元数据源,便于分析和流转。Kappa架构专注于实时处理(如通过Kafka、Spark Streaming),适合实时响应场景;Lambda架构结合批处理与实时处理(如Spark、Hadoop与Flink),平衡实时性和批处理,易于开发和维护。Apache Beam提供统一模型,适用于流处理和批处理,提升代码复用和效率。这两种架构满足现代应用对数据一致、性能和灵活性的需求。
1204 3
浅谈几个经典大数据处理框架
|
9月前
|
缓存 数据中心 网络架构
5个减少网络延迟的简单方法
高速互联网对工作与娱乐至关重要,延迟和断线会严重影响效率和体验。本文探讨了导致连接缓慢的三个关键因素:吞吐量、带宽和延迟,并提供了减少延迟的实用方法。包括重启设备、关闭占用带宽的程序、使用有线连接、优化数据中心位置以及添加内容分发网络 (CDN) 等策略。虽然完全消除延迟不可能,但通过这些方法可显著改善网络性能。
2094 7
|
机器学习/深度学习 运维 安全
隐私计算实训营 第1期 【第1讲】
隐私计算实训营 第1期 【第1讲】—— 导论 | 数据可信流通 从运维信任到技术信任
291 3
|
SQL 安全 数据挖掘
隐私计算实训营第7讲:隐语SCQL的架构详细拆解丨隐私计算实训营 第1期
SCQL是安全协作查询语言,让不信任的多方能在保护隐私的前提下进行联合数据分析。它假设参与者半诚实,支持多方(N>=2)合作,且具备SQL语法支持和性能优化。SCQL提供类似SQL的用户界面,通过CCL机制允许数据所有者控制数据使用权限。系统基于SPU的MPC框架运行,适用于多个应用场景。
484 0
|
数据采集 数据挖掘 数据处理
Pandas在Python面试中的应用与实战演练
【4月更文挑战第16天】本文介绍了Python数据分析库Pandas在面试中的常见问题和易错点,包括DataFrame和Series的创建、数据读写、清洗预处理、查询过滤、聚合分组、数据合并与连接。强调了数据类型检查、索引理解、避免过度使用循环、内存管理和正确区分合并与连接操作的重要性。通过掌握这些知识和代码示例,可提升面试者在Pandas方面的专业能力。
675 3
|
存储 SQL 关系型数据库