隐语开源社区【提问解答】第二期

简介: 隐语开源社区【提问解答】第二期



安装部署问题

问题1:bob节点的address,应该如何填写?# The address for other peers.'address': 'alice's ip:8881',# The listen address of this node.# Optional. Address will be used if listen_address is empty.解答:8881是ray的端口,请换一个没有被占用的端口

问题2:Win10系统创建的虚拟环境报错解答:Secretflow 暂不支持 Windows ,你可以用我们的 docker 镜像 来跑。Docker 安装可以看这里https://docs.docker.com/desktop/install/windows-install/

sf使用问题


问题1:请问Federated XGBoost这个函数内部有封装任何Secret Flow的隐私保护的算法吗?解答:目前的版本暂时不支持,后续的版本中会补充安全加强(secure_agg,spu_agg等)模块

问题2:逻辑回归的性能,同样的代码只是换了协议,semi2k需要8s,cheetah需要52s,这是为什么呢?cheetah在什么场景下使用有性能优势?解答:semi2k 是需要额外可信第三方的(如 TEE)去生成 随机数;而 cheetah 是纯两方的;如果部署上能支持 TEE 的话;大部分情况都是 semi2k 的性能更好。后续 Cheetah 的矩阵-乘法(应该)还会优化性能

问题3:secretflow支持边缘计算吗,例如边缘的计算节点,可以部署在边缘节点跟云交互吗?解答:隐语目前还是针对cross-silo场景,暂不支持边缘计算场景。

spu-heu使用问题


问题1:PPU和SPU是什么关系?解答:自2022年7月起,PPU 更名为 SPU, 这是我们品牌战略的一部分。感谢您对 SecretFlow 的关注。

问题2:heu是否有类似spu runtimeconfig的enable_action_trace开关解答:感谢关注 HEU 目前还没有引入编译器层,也没有引入 IR,因此没有 trace 开关,如果你对 HEU 感兴趣的话,可以参考文档https://heu.readthedocs.io/zh_CN/latest/getting_started/quick_start.html ,并结合 HEU 代码 (地址https://github.com/secretflow/heu/blob/beta/heu/library/phe/phe.h

其他问题

问题1:一个secretflow node/服务器是否只能运行一个SPU device party解答:是的,目前SPU仅支持standalone模式(单个party内只有一个进程)

问题2:如何实现:ray网络的生命周期——Head高可用节点解答:需要首先创建ray集群,再执行任务。关于ray head HA,目前我们了解到的是ray有计划在支持HA,参见 https://github.com/ray-project/ray/issues/22833提到的Cluster Fault Tolerance。目前secretflow的主要使用方式是离线式计算任务,对HA的要求有限。

问题3:运行官方手册第三方psi时报错RayActorError              Traceback (most recent call last) Input In [10], in <cell line: 3>()      1 input_path = {alice: '.data/alice.csv', bob: '.data/bob.csv', carol: '.data/carol.csv'}   2 output_path = {alice: '.data/alice_psi.csv', bob: '.data/bob_psi.csv', carol: '.data/carol_psi.csv'} ---->3 spu_3pc.psi_csv(['uid', 'month'], input_path, output_path, protocol='ecdh')解答:1、试着将https://secretflow.readthedocs.io/en/latest/tutorial/PSI_On_SPU.html 第9步替换为:sf.shutdown() sf.init(['alice', 'bob', 'carol'],num_cpus=8, log_to_driver=False) alice, bob,carol = sf.PYU('alice'), sf.PYU('bob'), sf.PYU('carol') spu_3pc = sf.SPU(sf.utils.testing.cluster_def(['alice', 'bob', 'carol']))2、请确保你正在使用最新的代码来build from source。

问题4:有没有纵向联邦回归算法的例子解答:Split Learning示例https://secretflow.readthedocs.io/en/latest/tutorial/Split_Learning_for_bank_marketing.html

问题5:spu是否有协议或者计算相关的日志解答:首先,你需要通过设置spu的config来开启相应的log:

https://github.com/secretflow/secretflow/issues/30#issuecomment-1181263227然后,你需要在secretflow init的时候打开log_to_driver,类似于import secretflow as sf sf.init(['alice', 'bob'], num_cpus=8, log_to_driver=True)

问题6:官方推理的示例解答:目前有离线推理的示例,比如Federate_Learning_for_Image_Classification,Split_Learning_for_bank_marketing中有提供model.evulate的使用示例。在线推理目前还没有。

问题7:SPU是否支持ABY3协议,如何切换SPU device的协议?解答:SPU device支持ABY3协议,只需要在init device的时候设置protocol即可。请参考https://spu.readthedocs.io/en/beta/reference/runtime_config.html#runtimeconfig 另外,请确保SPU device必须由三个节点组成的时候,才可以使用ABY3协议。

问题8:医保drg落地案例使用了什么隐私计算技术路线?解答:医保drg案例,使用了FL技术路线,使用了隐语横向联邦建模能力(数据维度一样,如多家医院有的就诊人、病种名、诊疗费用等特征维度;样本id不同,如多家医院的就诊人不同)隐语提供MPC+FL+TEE多种技术路线选择(MPC、FL已部分开源,TEE计划于22年底开源)

问题9:SS-LR/XGB和HESS-LR/XGB 的区别解答:sslr 使用secret sharing 求解梯度下降方向, ssxgb使用secret sharing 求样本分桶梯度加和。而 hess lr/xgb 使用同态加密进行上述操作。secret sharing对带宽和延迟比较敏感,而同态加密方案会消耗更多的cpu算力。是一种针对不同运算环境的折中:局域网/万兆环境下ss能更快的完成建模,带宽受限且延迟较高的公网环境可以用he提高建模速度 。其他部分运算逻辑和算法的安全设定基本一致。

相关文章
|
7月前
|
安全
隐语实训营笔记 第二讲
隐私计算通过开源促进数据要素安全流通,解决外循环中的信任问题。隐语开源项目旨在实现数据可用不可见、可算不可识、可控可计量的原则,统一产品度量标准,降低接入难度,构建完备的信任链,以推动数据的开放与共享。
69 0
|
1月前
|
消息中间件 数据采集 Cloud Native
iLogtail 开源贡献人物专访:技术之路无坦途,与社区共同成长
在 iLogtail 开源两周年这一里程碑时刻,我们邀请到了两位社区 Committer 进行分享,揭秘这些开发者如何在日常工作中与 iLogtail 结缘,又如何在业余时间里为项目添砖加瓦,推动其不断向前发展~
|
7月前
|
算法 前端开发 语音技术
推荐6款2023年爆火的开源项目,你值得一试!
推荐6款2023年爆火的开源项目,你值得一试!
110 0
推荐6款2023年爆火的开源项目,你值得一试!
|
7月前
|
算法 安全 数据安全/隐私保护
隐语实训营笔记 第三讲
隐私计算框架“隐语”提供全面的隐私保护技术,包括PSI、PIR和联邦学习等算法,层次间低耦合,支持开放合作。产品层包含多样化应用,计算层涉及SPU、HEU、TEEU及密码库YACL,资源层有kuscia管理,强调互联互通和跨域管控,旨在实现安全的数据协作。
67 0
|
7月前
|
存储 运维 安全
隐语实训营笔记 第一讲
构建数据可信流通体系,确保来源确认、范围界定、过程追溯及风险防范。该体系基于密码学和可信计算,包含身份验证(如CA证书和远程验证)、使用权跨域管控、安全分级测评和全链路审计。可信数字应用身份验证和跨域管控保护数据免于滥用,同时维护上下游利益。通过隐私、可信和机密计算技术,实现数据流通的控制面和数据面的平衡,即“不可能三角”。全链路审计形成内外循环的管控体系,密态天空计算作为基础设施,支持密态数据流通,解决数据安全保险中的定责和定损问题。
45 0
|
机器学习/深度学习 算法 安全
隐语开源社区 首期“社区之星” 新鲜出炉!
隐语开源社区 首期“社区之星” 新鲜出炉!
276 1
|
机器学习/深度学习 算法 安全
隐语社区【提问解答】 第1期
隐语社区【提问解答】 第1期
374 1
|
人工智能 Cloud Native 安全
重磅嘉宾畅聊大数据&AI开源话题,零距离感受激荡开源江湖
「开源人说」第四期——大数据& AI专场在今年云栖大会举办,阿里巴巴开源委员会大数据AI领域副主席王峰和阿里云AI开源项目EasyRec负责人施兴现场分享热门开源项目背后的故事。开源中国创始人&CTO红薯,白鲸开源联合创始人代立冬,浙大博导赵俊博,InfoQ总编辑王一鹏、Apache软件基金会成员李钰等嘉宾圆桌共话,对开源热点及痛点问题展开激烈讨论。
195143 36
重磅嘉宾畅聊大数据&AI开源话题,零距离感受激荡开源江湖
|
SQL 机器学习/深度学习 人工智能
隐语开源社区【精选问答】第三期
隐语开源社区【精选问答】第三期
424 0
下一篇
DataWorks