今天给大家介绍的是湖南大学信息科学与工程学院全哲教授课题组在IJCAI 2020会议上发表的一篇关于知识图神经网络预测药物与药物相互作用的文章。在本文中,作者提出了一个称为知识图神经网络(KGNN)的端到端框架,以预测药物与药物相互作用(DDI)。KGNN框架可通过在知识图谱(KG)中挖掘与药物关联的实体关系,以有效地获取药物及其潜在的邻居实体信息。为了提取KG中存在的高阶拓扑结构和语义关系,KGNN从KG中每个实体的邻域中学习作为它们的局部感知域,然后将当前实体表示的偏差及其邻域信息进行聚合。这样,可将感知域自然地扩展到多个跃点,以对高阶拓扑信息进行建模并获得潜在的长距离药物相关性。
1
介绍
当一种药物与另一种或多种药物合用时,通常会发生药物相互作用(DDI),这可能导致许多不良药物反应(ADR),甚至造成伤害或导致死亡。因此,为减轻意想不到的药理作用影响,有效地识别潜在的DDI显得至关重要。某种程度上来看,当在治疗某种疾病时,识别DDI可尽可能地减少意想不到的ADR影响,并最大程度地发挥协同效应。
(来源于aidsinfo.nih网站)
当前,大多数DDI预测方法通常采用整合多个数据源的方法以获得更全的药物特征。这些方法都基于一种假设,即具有相似表示的药物将展现出类似的DDI效果。同时,一些计算方法倾向于结合先进的嵌入方法,后者试图自动学习药物表示,然后通过诸如矩阵分解,随机游走和图神经网络之类的特定操作对DDI进行建模。尽管这些方法取得了良好的性能,但不足之处在于,它们将DDI建模为独立的数据样本,并未考虑相关的其他关联性(例如,药物-靶标对)。
另一方面,由于知识图谱(KG)的普遍性,它广泛地推动了对关系推理和推荐系统的研究,特别是最近的研究已将KG用于DDI预测。他们将KG应用于机器学习模型,以使用各种嵌入方法提取药物特征。这些方法直接学习节点的潜在嵌入,但在获取KG中实体的丰富邻域信息方面受到限制。
为解决KG中相关性和邻域信息中存在的上述局限性,本文的目标是自动获取KG中的高阶结构和语义关系。受到图神经网络的启发,试图从邻域信息中学习,本文提出了一种新颖的端到端框架,称为知识图神经网络(KGNN)用于DDI预测。KGNN挖掘KG中每个实体的拓扑结构信息。同时,它从各自的局部感知域中聚合所有的邻域拓扑信息,以获取高阶拓扑结构信息和它们之间的语义关系,以提升DDI预测性能。
2
框架
作者提出的KGNN框架如下图所示:
在第一步中,从数据集中收集以提取包含药物对的DDI数据源,同时从数据集中构建相应的KG。在第二步中,使用KGNN从DDI矩阵和构建的知识图谱中提取药物的特征及其相关实体的邻域结构信息。在第三步中,为预测药物对之间的相互作用,KGNN输出药物的潜在表示及其当前药物对之间的邻域拓扑信息。然后,KGNN计算它们之间的得分函数,并输出相互作用的预测值。
3
实验
3.1对比实验
作者在DrugBank(V5.1.4)和KEGG-drug数据集上进行了广泛的测试,以比较KGNN与其他5类共9种先进的DDI方法(Laplacian,GreRep, DeepWalk,struc2vec,LINE, SDNE,GAE,DeepDDI,KG-ddi)的性能。下表3展示了在两个数据集上所有方法的DDI预测性能。作者提出的KGNN在两个数据集中的表现均明显优于基线。更具体地说,与其他方法相比,KGNN在ACC指标上至少提升2.76%,在AUPR指标上提升4.78%,在AUC-ROC指标上提升2.13%,在F1指标上提升2.34%。
3.2缺失实验
为了研究本文核心思想的有效性,我们对KGNN模型的几种变体进行了测试,称为KGNNx,其中下标x表示不同的聚合操作方法(细节请参阅文章第3.4节)。上表中的最后三列显示了比较结果。从实验结果可看出,KGNNconcat方法在所有指标上均胜过其他变体。
3.3案例分析
为研究几个关键超参数对KGNN性能的影响。当测试其中一个参数时,本文固定了其他参数。其他实验设置与文章第4.1节相同。下图显示了KGNN在KEGG-drug数据集上的预测性能。
4
结论
在这项工作中,作者提出了KGNN,一个新颖的知识图神经网络模型预测药物与药物相互作用。KGNN通过有选择地多次聚合邻域信息,将基于空间的GNN方法扩展到知识图谱,从而能够学习到拓扑结构信息和知识图谱中的语义关系,以及药物和相关实体的邻域信息。本文实现了提出的方法,并在两个广泛使用的数据集上进行对比实验。实验结果表明,KGNN优于经典和先进的DDI预测模型。