近年来,在全社会对隐私保护日益重视的背景下,联邦学习的研究和应用得到了长足发展。这一进步很大程度上得益于联邦学习框架及算法库的支持。当前,这类框架对联邦学习中各个参与方的通信、计算图的描述和拆分调度、模型的部署与推理等一般性的基础设施均有完整丰富的支持。但是,现有框架和库对图联邦的支持相对有限,难以基于已有工作去建立联邦图学习的基准。学术界和工业界都对一款功能全面且对实现联邦图学习算法友好的框架有强烈需求。 在最近的 KDD 2022 应用方向最佳论文获奖工作 FederatedScope-GNN 中,阿里巴巴达摩院的研究者针对图学习提供了 DataZoo 和 ModelZoo,为用户提供了丰富多样的联邦图数据集和相应模型与算法。DataZoo 提供的大量数据集涵盖了不同领域、不同任务类型、不同统计异质性的联邦图数据,方便了使用者对所关注算法进行全面评估。ModelZoo 中包含了像 FedSage + 和 GCFL + 等最新联邦图学习算法的实现。得益于底层框架事件驱动的编程范式,参与者间多样的消息交换和丰富的行为得以模块化地进行拆分实现。同时,针对联邦图学习对超参数敏感的现象,FederatedScope-GNN 还实现了模型调优相关的模块。 基于上述功能和特性,该论文建立了全面丰富的联邦图学习基准,包含不同图上任务、不同图神经网络架构、不同的联邦优化算法等,为该领域后续的研究奠定了坚实基础。
8 月 22 日,机器之心最新一期线上分享到了 KDD 2022 最佳论文的作者王桢,为我们详细解读 FederatedScope-GNN 这项工作背后的故事。
王桢
分享主题:KDD 2022 最佳论文解读——阿里巴巴达摩院联邦图学习工作 FederatedScope-GNN
分享摘要:阿里巴巴达摩院实现了针对图学习的库 FederatedScope-GNN,提供了丰富的联邦图数据集和相应模型与算法,且针对联邦图学习对超参数敏感的现象,实现了模型调优模块。该工作建立了全面丰富的联邦图学习基准,为该领域后续研究奠定基础。
分享嘉宾:王桢,2017 年博士毕业于中山大学,读博期间发表知识图谱补全算法 TransH,单篇引用量超 2500 次。毕业后加入阿里巴巴,在达摩院致力于联邦图学习等前沿研究,发表多篇国际顶级会议论文,并作为核心设计与开发人员参与开源 FederatedScope 平台。