Bioinformatics | 预测药物相互作用的多模式深度学习框架

简介: Bioinformatics | 预测药物相互作用的多模式深度学习框架

今天给大家介绍华中农业大学信息学院章文教授课题组发表在Bioinformatics的一篇文章“ A multimodal deep learning framework for predicting drug-drug interaction events ”,作者提出一个多模态深度学习框架,通过结合不同的药物特征来预测药物相互作用事件类型。


image.png

image.png

1


研究背景


药物-药物相互作用 (DDI, Drug-Drug Interaction) 是指病人同时或在一定时间内先后服用两种或两种以上药物后会产生复合效应,既可能使药效加强或副作用减轻,也可能使药效减弱或出现毒副作用。大多数预测药物-药物相互作用的方法只是预测两个药物之间是否有相互作用,但是研究表明,同时服用药物可能会导致意想不到的药品不良事件(ADE),探查药品不良事件背后的隐藏机制更有研究意义。所以,章文教授课题组提出将多种药物特征与深度学习相结合的计算方法DDIMDL来预测药物-药物相互作用事件类型。论文主要贡献在于 (1)标准化DDI事件划分流程,开发了DDI事件划分/抽取工具;(2)提出多模态深度学习框架,整合来自于DrugBank的多种药物特征,预测药物-药物相互作用事件。

image.png

图 1  DDIMDL模型图


2


研究方法


(1)提取不同类型药物特征向量


作者收集与药物相关的四个特征:化学亚结构、靶标、酶和途径。每个特征都对应于一组描述符,用二元特征向量表示,1或0分别表示相应描述符存在或不存在。如:化学亚结构是根据PubChem定义的881种类型的子结构定义的,此时药物表征向量定义为881维向量,值1或者0分别定义为该药物存在或者不存在某种子结构类型。与药物相关的靶标共有1162种,基于靶标定义的药物表征向量定义为1162维向量,1或0分别定义为是否为当前药物靶标,酶和途径药物表征向量与之类似。


使用Jaccard相似性度量572种药物中成对药物的相似性,根据四种不同的药物表征向量生成4个与之对应的572*572的相似矩阵。


(2)多模态深度神经网络预测DDI事件类型


根据4个相似性矩阵,查找DDI对涉及的4对药物表征,拼接药物对表征向量,使用深度神经网络(DNN)基于每种特征构建子模型,将DDI对表征向量送入DNN网络进行训练,针对最终四个子模型训练输出结果采用平均算子组合,得到最后的DDI事件类型预测结果。


3


数据


DDI数据来源于DrugBank数据库5.1.3版本,收集了DDI对以及药物的四种特征:化学亚结构(chemical substructures)、靶标(targets)、途径(pathways)以及酶(enzymes),实验数据包含74528对DDI数据,其中涉及572种药物和65种DDI相关事件类型。


image.png

image.png

图 2  前10个高频率DDI事件

DDI相关事件定义为四元组形式(药物A,药物B,机制,作用),其中“药物A”指疗效受到影响的药物,另一个药物作为“药物B”,“机制”指药物在代谢、血清浓度、治疗效果等方面的作用,“作用”是指增加或降低。

image.png

图 3  DDI事件示例图

DDI相关事件提取使用StanfordNLP工具(Qi et al., 2018)进行依存分析,构建依存分析树。根据依存分析结果构建DDI相关事件四元组作为实验数据。

image.png

表 1  根据依存关系提取DDI事件四元组算法


4


实验


作者主要针对三种不同DDI任务进行评估:第一个任务是预测已知药物对之间未知的相互作用;第二个任务是预测已知药物与新药物之间的相互作用;第三个任务是预测新药物与新药物之间的相互作用。实验是通过把未参与模型训练的药物作为新药物进行模型测试。


作者通过消融实验针对不同特征组合对最终DDI事件预测的影响情况进行评估。作者将化学亚结构、靶标、途径和酶分别进行单个特征、两个特征、三个特征、四个特征组合。根据实验结果显示,在所有单个药物特征中,化学亚结构最为有用,能够达到0.8623的准确度;两个特征的情况下,化学亚结构和靶标拼接的组合也达到了最佳性能(0.8806);三个特征组合中化学亚结构、靶标和途径的组合性能最佳,准确率达到0.8852,甚至超过了四种药物特征组合情况(0.8725)。


image.png

image.png

表 2  特征集性能评估对比


作者将DDIMDL方法与最先进的DDI事件预测方法DeepDDI(Ryu等人,2018),几种流行的分类方法随即森林(RF)、K最近邻算法(KNN)、逻辑回归(LR),以及直接拼接四种特征向量送入DNN的方法,在三种不同任务上进行实验对比。实验结果表明,针对第一个任务,作者的方法DDIMDL在所有指标上都比其他方法有更好的性能。任务二和任务三主要和DeepDDI和DNN方法进行比较,可以发现在没有新药物的先验知识的情况下,这两个任务性能明显降低,特别是任务三,但是DDIMDL在所有评价指标中性能都优于DeepDDI,也再次证实深度学习和多样化的药物特征对DDI事件预测至关重要。

image.png

表 3  Baseline性能评估对比


作者还研究了不同DDI事件类型在不同模型下的预测性能,实验结果表示频率较高的事件可能会获得更好的性能,除了事件39之外,DDMDL对于1-46编号的事件有大于0.5的AUPR分数,一般来说,DDIMDL在大多数类型的事件中能比其他方法产生更高的AUPR和AUC分数。

image.png

图 4  不同方法针对每个事件类型的AUPR和AUC评估


此外,作者还进行了案例研究来验证DDIMDL在实践中的有用性。作者主要关注频率最高的前5个事件类型,提取每个事件预测的前20个DDI对,使用由drugs.com提供的Interactions Checker tool验证预测结果的准确性。如药物Dextroamphetamine和药物Fenfluramine相结合会引起事件2,即当药物A与药物B联合使用时,不良反应的风险或严重程度可能会增加。根据drugs.com的证据显示,Fenfluramine可能会增加Dextroamphetamine的作用,目前已经报道了诸如神经过敏、紧张、焦虑、烦躁不安和思绪奔涌等副作用。

image.png

表 4  确认的DDI对以及相关的事件类型


5总结


本文从DrugBank数据集中获取DDI数据,并使用NLP技术将DDI相关的事件分为65类,收集了572种药物以及74528个DDI对。作者提出DDIMDL多模态深度学习框架,将多种药物特征:化学亚结构、靶标、酶和途径与深度学习相结合对DDI事件类型进行预测,实验证明DDIMDL优于现有的DDI事件预测方法,多样化药物特征与多模态深度学习框架相结合能够明显提高DDI事件预测的性能。


目录
相关文章
|
12天前
|
机器学习/深度学习 API 语音技术
|
12天前
|
机器学习/深度学习 PyTorch API
|
4月前
|
机器学习/深度学习 TensorFlow 算法框架/工具
【深度学习】Tensorflow、MindSpore框架介绍及张量算子操作实战(超详细 附源码)
【深度学习】Tensorflow、MindSpore框架介绍及张量算子操作实战(超详细 附源码)
65 0
|
9月前
|
机器学习/深度学习 移动开发 算法
Python垃圾识别系统,TensorFlow+Django网页框架+深度学习模型+卷积网络【完整代码】
垃圾识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对5种垃圾数据集进行训练,最后得到一个识别精度较高的模型。并基于Django,开发网页端操作平台,实现用户上传一张垃圾图片识别其名称。
163 0
|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
深度学习Pytorch框架Tensor张量
深度学习Pytorch框架Tensor张量
45 0
|
8月前
|
机器学习/深度学习 算法 PyTorch
深度学习框架Pytorch学习笔记
深度学习框架Pytorch学习笔记
|
11月前
|
机器学习/深度学习 缓存 人工智能
深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解
深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解
深度学习进阶篇-预训练模型[3]:XLNet、BERT、GPT,ELMO的区别优缺点,模型框架、一些Trick、Transformer Encoder等原理详解
|
2天前
|
机器学习/深度学习 数据采集 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用
【4月更文挑战第21天】 本文章深入探讨了深度学习技术在自动驾驶车辆图像识别领域的应用。不同于传统的摘要方式,本文将直接点出研究的核心价值和实际应用成果。我们专注于卷积神经网络(CNN)的创新设计,其在复杂道路场景下的行人和障碍物检测中的高效表现,以及这些技术如何整合到自动驾驶系统中以增强安全性和可靠性。通过实验验证,我们的模型在公开数据集上达到了行业领先水平的准确率,并且在真实世界的测试场景中展现了卓越的泛化能力。
|
2天前
|
机器学习/深度学习 算法 云计算
深度学习在图像识别中的应用与挑战
【4月更文挑战第21天】 随着计算机视觉技术的飞速发展,深度学习已经成为图像识别任务的核心动力。本文旨在探讨深度学习技术在图像识别领域的应用进展,分析其面临的主要挑战,并提出可能的解决方案。通过对卷积神经网络(CNN)的深入研究,我们揭示了其在图像分类、目标检测和语义分割中的关键作用。同时,数据不平衡、模型泛化能力和计算资源限制等问题也被详细讨论。文章最终指出了未来研究的方向,包括网络结构的优化、无监督学习的发展以及跨领域知识迁移的可能性。
|
3天前
|
机器学习/深度学习 传感器 自动驾驶
基于深度学习的图像识别技术在自动驾驶系统中的应用研究
【4月更文挑战第20天】 本研究聚焦于深度学习技术在图像识别领域的应用,并探讨其在自动驾驶系统中的实际效用。文章首先回顾了深度学习与图像处理技术的基础知识,随后详细分析了卷积神经网络(CNN)在车辆环境感知中的关键作用。通过实验数据对比分析,本文验证了所提出算法在提高自动驾驶车辆对周围环境的识别准确性和实时性方面的有效性。最后,讨论了目前技术的局限性及未来可能的研究方向,旨在为进一步的技术突破提供参考。