「隐语小课」联邦学习之通信优化-阿里云开发者社区

「隐语小课」联邦学习之通信优化

2023-07-15 545

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 「隐语小课」联邦学习之通信优化

1、引言

联邦学习将传统机器学习中的数据聚合转换成模型聚合，即client和server在联邦训练过程中需要进行模型传输或梯度传输。随着任务复杂性和对模型性能要求的逐渐提升，神经网络的层数呈逐渐加深的趋势，模型参数也相应的越来越多。以人脸识别ResNET-50为例，原始模型拥有超过2000万个参数，模型大小超过100MB。在模型参数较多、通信带宽有限、client较多等联邦学习场景中，服务器接收的数据量非常庞大，造成较大的通信压力，严重影响了整体训练效率。因此，联邦学习中降低传输数据量，并保证整体性能效果和收敛速度成为一个热门的研究方向。

2、优化方法

目前常见联邦学习数据压缩方法分为两大类：client-based（减少参与聚合的client数量）和model-based（减少每个client上传的数据量）。

2.1 client-based methods

（1）异步更新 [1]

传统的FedAVG算法是同步更新算法，即所有client需要同步上传模型/梯度信息更新server模型。因此在每次进行模型聚合时，server端都需要接受大部分或者全部client的模型数据，极大增加了server端的数据通信压力。

异步联邦学习是指client依次上传并更新server端模型。如图1所示，[2]提出一种基于同态加密的异步联邦学习，client之间首先利用第三方服务器设定相同同态加密公钥和私钥，并将公钥上传至联邦训练server中；在client每次进行训练之前，先从server获取最新的加密模型，并利用私钥解密得到明文模型更新client模型；clienti进行本地训练得到梯度，结合学习α和同态加密公钥得到，上传至server；进而更新server模型得到完成一次异步训练过程。

图1异步联邦学习

（2）client采样 [3]

与异步联邦相类似，client采样法通过减少每次聚合过程中client的数量来减少server端接收的数据量。利用Ornstein-Uhlenbeck过程对联邦聚合的client进行采样，从而减少单次聚合时数据上传的总量。

（3）减少联邦聚合频率 [4]

增加FedAVG中client本地的训练次数，从而减少整体的上传频率，达到减少整体通信数据量的目的。本地训练次数不能无限增加，否则会影响整体的收敛速度。

2.2 model-based methods

（1）矩阵分解法 [4]

将原始模型权重矩阵W分解成两个矩阵的乘积，即W=，其中矩阵B的行数小于W的行数，列数等于W的列数，将因子矩阵A作为基矩阵，上传另外一个矩阵B，从而减少模型大小。该方法受限于基矩阵的选择，由于基矩阵不一定是方矩阵，可能不存在相应的逆矩阵，因此无法求得矩阵B；当基矩阵A为列满秩矩阵时，存在相应的左逆矩阵，但矩阵B相比于W的压缩比有限，模型上传的通信压力依然较大。

（2）模型稀疏法

即在进行模型上传时，按照某种方法（例如随机稀疏法[4]、Topk稀疏法[5][6]、模型剪枝[7][8]等方法）选择模型或者梯度中一定比例的元素，仅将训练成员的这些元素上传至服务器中，按照元素的实际位置在服务器端进行安全聚合，进而更新模型。

（3）模型量化法

即对训练成员的上传模型进行量化处理，减少元素的位数，从而减少数据通信量，实现模型压缩的效果。常见的方法主要有：1-bitbinary量化[9]、multi-bit量化[10]。模型量化一般将上传模型的元素位数进行删减，当保留位数较多时，压缩比例有限；当保留位数较少时，模型更新的信息受损，影响模型的收敛速度。

（4）混合法

为了进一步降低上传数据量的大小，可将模型稀疏法和量化法进行结合，即对sparse模型中的元素再进行量化处理。该类方法的paper主要有：[11][12][13]。

3、具体实践

我们基于隐语/fascia框架利用联邦学习在Drgs医疗场景下进行了多方联合训练和业务落地。由于client端上传带宽有限，通信时间较长成为制约整体训练效率的瓶颈。我们基于Tok-Sparse算法设计了联邦学习个性化稀疏算法，降低了模型数据传输的压力，提高了Non-IID下的模型准确性。利用该方法，我们将通信量压缩至原通信量的1/10时，模型的准确性保持不变，极大提高了联邦学习的性能。

4、结语

对联邦学习进行通信压缩有助于降低通信压力，提高训练效率，增加用户数量，对于业务落地具有较为明显的增益。我们将会在目前算法的基础上探索训练速度更快、压缩比更高、鲁棒性更好的优化算法，欢迎大家一起探讨。

Reference

【1】XieC, Koyejo S, Gupta I. Asynchronous federated optimization[J]. arXivpreprint arXiv:1903.03934, 2019.

【2】AonoY, Hayashi T, Wang L, et al. Privacy-preserving deep learning viaadditively homomorphic encryption[J]. IEEE Transactions onInformation Forensics and Security, 2017, 13(5): 1333-1345.

【3】RiberoM, Vikalo H. Communication-efficient federated learning via optimalclient sampling[J]. arXiv preprint arXiv:2007.15197, 2020.

【4】KonečnýJ, McMahan H B, Yu F X, et al. Federated learning: Strategies forimproving communication efficiency[J]. arXiv preprintarXiv:1610.05492, 2016.

【5】AsadM, Moustafa A, Ito T. FedOpt: Towards communication efficiency andprivacy preservation in federated learning[J]. Applied Sciences,2020, 10(8): 2864.

【6】HaddadpourF, Kamani M M, Mokhtari A, et al. Federated learning withcompression: Unified analysis and sharp guarantees[J]. arXiv preprintarXiv:2007.01154, 2020.

【7】LiA, Sun J, Wang B, et al. Lotteryfl: Personalized andcommunication-efficient federated learning with lottery tickethypothesis on non-iid datasets[J]. arXiv preprint arXiv:2008.03371,2020.

【8】LinS, Wang C, Li H, et al. ESMFL: Efficient and Secure Models forFederated Learning[J]. arXiv preprint arXiv:2009.01867, 2020.

【9】BernsteinJ, Wang Y X, Azizzadenesheli K, et al. signSGD: Compressedoptimisation for non-convex problems[C]//International Conference onMachine Learning. PMLR, 2018: 560-569.

【10】MagnssonS, Shokri-Ghadikolaei H, Li N. On maintaining linear convergence ofdistributed learning and optimization under limited communication[J].IEEE Transactions on Signal Processing, 2020, 68: 6101-6116.

【11】BeguierC, Tramel E W. SAFER: Sparse secure Aggregation for FEderatedleaRning[J]. arXiv preprint arXiv:2007.14861, 2020.

【12】SattlerF, Wiedemann S, Müller K R, et al. Robust andcommunication-efficient federated learning from non-iid data[J]. IEEEtransactions on neural networks and learning systems, 2019, 31(9):3400-3413.

【13】SunJ, Chen T, Giannakis G B, et al. Lazily Aggregated Quantized GradientInnovation for Communication-Efficient Federated Learning[J]. IEEETransactions on Pattern Analysis and Machine Intelligence, 2020.

「隐语小课」联邦学习之通信优化

隐语开源社区

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

「隐语小课」联邦学习之通信优化

隐语开源社区

热门文章

最新文章

相关电子书