Bioinformatics | 预测药物相互作用的多模式深度学习框架

简介: Bioinformatics | 预测药物相互作用的多模式深度学习框架

今天给大家介绍华中农业大学信息学院章文教授课题组发表在Bioinformatics的一篇文章“ A multimodal deep learning framework for predicting drug-drug interaction events ”,作者提出一个多模态深度学习框架,通过结合不同的药物特征来预测药物相互作用事件类型。


image.png

image.png

1


研究背景


药物-药物相互作用 (DDI, Drug-Drug Interaction) 是指病人同时或在一定时间内先后服用两种或两种以上药物后会产生复合效应,既可能使药效加强或副作用减轻,也可能使药效减弱或出现毒副作用。大多数预测药物-药物相互作用的方法只是预测两个药物之间是否有相互作用,但是研究表明,同时服用药物可能会导致意想不到的药品不良事件(ADE),探查药品不良事件背后的隐藏机制更有研究意义。所以,章文教授课题组提出将多种药物特征与深度学习相结合的计算方法DDIMDL来预测药物-药物相互作用事件类型。论文主要贡献在于 (1)标准化DDI事件划分流程,开发了DDI事件划分/抽取工具;(2)提出多模态深度学习框架,整合来自于DrugBank的多种药物特征,预测药物-药物相互作用事件。

image.png

图 1  DDIMDL模型图


2


研究方法


(1)提取不同类型药物特征向量


作者收集与药物相关的四个特征:化学亚结构、靶标、酶和途径。每个特征都对应于一组描述符,用二元特征向量表示,1或0分别表示相应描述符存在或不存在。如:化学亚结构是根据PubChem定义的881种类型的子结构定义的,此时药物表征向量定义为881维向量,值1或者0分别定义为该药物存在或者不存在某种子结构类型。与药物相关的靶标共有1162种,基于靶标定义的药物表征向量定义为1162维向量,1或0分别定义为是否为当前药物靶标,酶和途径药物表征向量与之类似。


使用Jaccard相似性度量572种药物中成对药物的相似性,根据四种不同的药物表征向量生成4个与之对应的572*572的相似矩阵。


(2)多模态深度神经网络预测DDI事件类型


根据4个相似性矩阵,查找DDI对涉及的4对药物表征,拼接药物对表征向量,使用深度神经网络(DNN)基于每种特征构建子模型,将DDI对表征向量送入DNN网络进行训练,针对最终四个子模型训练输出结果采用平均算子组合,得到最后的DDI事件类型预测结果。


3


数据


DDI数据来源于DrugBank数据库5.1.3版本,收集了DDI对以及药物的四种特征:化学亚结构(chemical substructures)、靶标(targets)、途径(pathways)以及酶(enzymes),实验数据包含74528对DDI数据,其中涉及572种药物和65种DDI相关事件类型。


image.png

image.png

图 2  前10个高频率DDI事件

DDI相关事件定义为四元组形式(药物A,药物B,机制,作用),其中“药物A”指疗效受到影响的药物,另一个药物作为“药物B”,“机制”指药物在代谢、血清浓度、治疗效果等方面的作用,“作用”是指增加或降低。

image.png

图 3  DDI事件示例图

DDI相关事件提取使用StanfordNLP工具(Qi et al., 2018)进行依存分析,构建依存分析树。根据依存分析结果构建DDI相关事件四元组作为实验数据。

image.png

表 1  根据依存关系提取DDI事件四元组算法


4


实验


作者主要针对三种不同DDI任务进行评估:第一个任务是预测已知药物对之间未知的相互作用;第二个任务是预测已知药物与新药物之间的相互作用;第三个任务是预测新药物与新药物之间的相互作用。实验是通过把未参与模型训练的药物作为新药物进行模型测试。


作者通过消融实验针对不同特征组合对最终DDI事件预测的影响情况进行评估。作者将化学亚结构、靶标、途径和酶分别进行单个特征、两个特征、三个特征、四个特征组合。根据实验结果显示,在所有单个药物特征中,化学亚结构最为有用,能够达到0.8623的准确度;两个特征的情况下,化学亚结构和靶标拼接的组合也达到了最佳性能(0.8806);三个特征组合中化学亚结构、靶标和途径的组合性能最佳,准确率达到0.8852,甚至超过了四种药物特征组合情况(0.8725)。


image.png

image.png

表 2  特征集性能评估对比


作者将DDIMDL方法与最先进的DDI事件预测方法DeepDDI(Ryu等人,2018),几种流行的分类方法随即森林(RF)、K最近邻算法(KNN)、逻辑回归(LR),以及直接拼接四种特征向量送入DNN的方法,在三种不同任务上进行实验对比。实验结果表明,针对第一个任务,作者的方法DDIMDL在所有指标上都比其他方法有更好的性能。任务二和任务三主要和DeepDDI和DNN方法进行比较,可以发现在没有新药物的先验知识的情况下,这两个任务性能明显降低,特别是任务三,但是DDIMDL在所有评价指标中性能都优于DeepDDI,也再次证实深度学习和多样化的药物特征对DDI事件预测至关重要。

image.png

表 3  Baseline性能评估对比


作者还研究了不同DDI事件类型在不同模型下的预测性能,实验结果表示频率较高的事件可能会获得更好的性能,除了事件39之外,DDMDL对于1-46编号的事件有大于0.5的AUPR分数,一般来说,DDIMDL在大多数类型的事件中能比其他方法产生更高的AUPR和AUC分数。

image.png

图 4  不同方法针对每个事件类型的AUPR和AUC评估


此外,作者还进行了案例研究来验证DDIMDL在实践中的有用性。作者主要关注频率最高的前5个事件类型,提取每个事件预测的前20个DDI对,使用由drugs.com提供的Interactions Checker tool验证预测结果的准确性。如药物Dextroamphetamine和药物Fenfluramine相结合会引起事件2,即当药物A与药物B联合使用时,不良反应的风险或严重程度可能会增加。根据drugs.com的证据显示,Fenfluramine可能会增加Dextroamphetamine的作用,目前已经报道了诸如神经过敏、紧张、焦虑、烦躁不安和思绪奔涌等副作用。

image.png

表 4  确认的DDI对以及相关的事件类型


5总结


本文从DrugBank数据集中获取DDI数据,并使用NLP技术将DDI相关的事件分为65类,收集了572种药物以及74528个DDI对。作者提出DDIMDL多模态深度学习框架,将多种药物特征:化学亚结构、靶标、酶和途径与深度学习相结合对DDI事件类型进行预测,实验证明DDIMDL优于现有的DDI事件预测方法,多样化药物特征与多模态深度学习框架相结合能够明显提高DDI事件预测的性能。


目录
相关文章
|
21天前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现智能食品消费模式分析的深度学习模型
使用Python实现智能食品消费模式分析的深度学习模型
114 70
|
14天前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费模式预测的深度学习模型
使用Python实现智能食品消费模式预测的深度学习模型
40 2
|
1月前
|
机器学习/深度学习 监控 PyTorch
深度学习工程实践:PyTorch Lightning与Ignite框架的技术特性对比分析
在深度学习框架的选择上,PyTorch Lightning和Ignite代表了两种不同的技术路线。本文将从技术实现的角度,深入分析这两个框架在实际应用中的差异,为开发者提供客观的技术参考。
50 7
|
1月前
|
机器学习/深度学习 自然语言处理 并行计算
DeepSpeed分布式训练框架深度学习指南
【11月更文挑战第6天】随着深度学习模型规模的日益增大,训练这些模型所需的计算资源和时间成本也随之增加。传统的单机训练方式已难以应对大规模模型的训练需求。
146 3
|
2月前
|
机器学习/深度学习 搜索推荐 数据库
深度学习之药物筛选与发现
基于深度学习的药物筛选与发现是利用深度学习模型自动化和加速药物开发过程的一个重要方向。传统的药物发现过程通常耗时长、成本高,需要大量的实验和计算,而深度学习通过从大规模生物医学数据中学习规律,能够帮助研究人员更快速地筛选潜在药物,并预测其在体内的行为。
86 3
|
3月前
|
机器学习/深度学习 数据采集 TensorFlow
使用Python实现深度学习模型:智能药物研发与筛选
使用Python实现深度学习模型:智能药物研发与筛选
147 15
|
4月前
|
测试技术 数据库
探索JSF单元测试秘籍!如何让您的应用更稳固、更高效?揭秘成功背后的测试之道!
【8月更文挑战第31天】在 JavaServer Faces(JSF)应用开发中,确保代码质量和可维护性至关重要。本文详细介绍了如何通过单元测试实现这一目标。首先,阐述了单元测试的重要性及其对应用稳定性的影响;其次,提出了提高 JSF 应用可测试性的设计建议,如避免直接访问外部资源和使用依赖注入;最后,通过一个具体的 `UserBean` 示例,展示了如何利用 JUnit 和 Mockito 框架编写有效的单元测试。通过这些方法,不仅能够确保代码质量,还能提高开发效率和降低维护成本。
60 0
|
4月前
|
UED 开发者
哇塞!Uno Platform 数据绑定超全技巧大揭秘!从基础绑定到高级转换,优化性能让你的开发如虎添翼
【8月更文挑战第31天】在开发过程中,数据绑定是连接数据模型与用户界面的关键环节,可实现数据自动更新。Uno Platform 提供了简洁高效的数据绑定方式,使属性变化时 UI 自动同步更新。通过示例展示了基本绑定方法及使用 `Converter` 转换数据的高级技巧,如将年龄转换为格式化字符串。此外,还可利用 `BindingMode.OneTime` 提升性能。掌握这些技巧能显著提高开发效率并优化用户体验。
70 0
|
4月前
|
机器学习/深度学习 PyTorch TensorFlow
深度学习框架之争:全面解析TensorFlow与PyTorch在功能、易用性和适用场景上的比较,帮助你选择最适合项目的框架
【8月更文挑战第31天】在深度学习领域,选择合适的框架至关重要。本文通过开发图像识别系统的案例,对比了TensorFlow和PyTorch两大主流框架。TensorFlow由Google开发,功能强大,支持多种设备,适合大型项目和工业部署;PyTorch则由Facebook推出,强调灵活性和速度,尤其适用于研究和快速原型开发。通过具体示例代码展示各自特点,并分析其适用场景,帮助读者根据项目需求和个人偏好做出明智选择。
107 0
|
18天前
|
机器学习/深度学习 传感器 数据采集
深度学习在故障检测中的应用:从理论到实践
深度学习在故障检测中的应用:从理论到实践
79 5

热门文章

最新文章