Survey | 深度学习方法在生物网络中的应用

简介: Survey | 深度学习方法在生物网络中的应用

image.png

今天介绍厦门大学刘向荣老师团队在Briefings in Bioinformatics上发表的一篇综述论文,该论文首先介绍了应用在网络数据上的深度学习几种典型的模型,然后根据不同的生物网络数据分类,介绍了现有的实际研究和工作;最后对这篇文章提到的方法进行了总结和讨论。


1


背景


生物系统有很多不同层面和不同组织形式的网络,包括基因转录调控网络、生物代谢与信号传导网络、蛋白质相互作用网络等。除此之外,人们利用各种实验研究手段获得了像药物靶点网络,疾病与生物分子的关联网络等。生物网络的研究也涉及到生物分子以及与生物分子相关的各个方面。这些网络中的节点可以代表蛋白质,基因,疾病,以及一些与靶点相关联的药物等,网络中的边对应着节点之间的各种生化,物理或者功能交互等关联。深度学习的框架是学习样本数据的内在规律和表示层次,通过多层处理,逐渐将初始的“低层”特征表示转化为“高层”特征表示后,用“简单模型”即可完成复杂的分类预测等学习任务。随着深度学习技术的发展,被应用在网络数据上的深度学习算法也取得了很好的效果。这篇综述主要的目的就是为了介绍已有的利用深度学习模型在生物网络上的应用,及其可能应用的前景,为对这个领域感兴趣的研究人员提供一个参考。

image.png

图1 生物分子网络和深度学习发展的重要事件


2


模型介绍


这一部分,作者简要介绍了一些应用在网络数据上具有代表性的深度学习模型,包括基于RandomWalk的DeepWalk,基于AutoEncoder的Graph AutoEncoders (GAEs),基于CNN的Graph Convolution Networks (GCNs),基于RNN的Graph Recurrent Neural Networks (Graph RNNs)。

image.png

图2 应用在网络数据上具有代表性的深度学习模型


3


深度学习在生物网络中的应用


生物网络包含了生物体之间的大量信息。生物网络的探索对于理解生物分子的内在联系、药物的发现、疾病的治疗以及微生物的作用机制都是非常重要的。这些应用在网络数据上的深度学习模型可以多层次地表示网络结构,捕捉已知生物网络的拓扑特征,并结合其他异构信息挖掘生物网络中的潜在关联。在这一部分该论文通过对基因组数据研究、蛋白质组数据研究、转录组数据研究、药物发现、疾病生物学和微生物组数据研究六个方面,对现有的利用深度学习方法在生物网络数据上的研究应用进行了总结和介绍,希望够为今后利用深度学习技术挖掘生物网络中包含的信息提供思路。在介绍的过程中,作者选择了三个典型的研究案例,绘制了具体研究实例的流程图。

image.png

图3 生物网络数据中运用AutoEncoder模型的研究实例流程图

image.png

图4 生物网络数据中运用DeepWalk模型的研究实例流程

image.png

图5 生物网络数据中运用GCN模型的研究实例流程图


4


挑战和机遇


该论文主要从数据处理,异构信息,深度学习模型的限制方面介绍了现在深度学习在生物网络数据应用上的挑战。对于数据处理,目前许多生物数据集在样本类别上存在不平衡,生物数据的质量保证可能需要更为专业的研究人员获取更准确的数据。在计算时还应该找到克服数据冗余、不平衡和不完整的方法,以提高预测的准确性。生物网络可能包含多种生物分子,除了生物网络数据,还需要结合不同的生物信息来提高计算的准确性,如基因表达谱、蛋白质分子序列、药物分子结构、疾病的CT图像等。所以怎样更好的结合这些异构信息去进行计算,也是未来发展的重点和难点。虽然随着现在生物系统中可用的数据越来越多,但是对于许多深度学习框架来说,其数量级仍然很小,并且无法充分利用深度学习训练的优势。未来仍然需要提出更适合不同生物数据的深度学习模型来解决一些小而稀疏的生物数据集研究。


5


关键点总结


利用生物网络数据可以获得生物分子之间的关联性质。将生物网络数据与其他生物信息相结合可以提高预测性能。


应用在网络数据上的深度学习的引入为生物网络数据的处理带来了新的方向,能够处理大量的、多维的、复杂的生物数据。


将其他算法与深度学习模型相结合,可以克服一些数据质量问题的影响,提高深度学习算法的适用性。


目录
相关文章
|
6天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
115 55
|
3天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于yolov4深度学习网络的公共场所人流密度检测系统matlab仿真,带GUI界面
本项目使用 MATLAB 2022a 进行 YOLOv4 算法仿真,实现公共场所人流密度检测。通过卷积神经网络提取图像特征,将图像划分为多个网格进行目标检测和识别,最终计算人流密度。核心程序包括图像和视频读取、处理和显示功能。仿真结果展示了算法的有效性和准确性。
48 31
|
11天前
|
机器学习/深度学习 数据采集 人工智能
基于Huffman树的层次化Softmax:面向大规模神经网络的高效概率计算方法
层次化Softmax算法通过引入Huffman树结构,将传统Softmax的计算复杂度从线性降至对数级别,显著提升了大规模词汇表的训练效率。该算法不仅优化了计算效率,还在处理大规模离散分布问题上提供了新的思路。文章详细介绍了Huffman树的构建、节点编码、概率计算及基于Gensim的实现方法,并讨论了工程实现中的优化策略与应用实践。
58 15
基于Huffman树的层次化Softmax:面向大规模神经网络的高效概率计算方法
|
10天前
|
Kubernetes 安全 Devops
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
36 10
有效抵御网络应用及API威胁,聊聊F5 BIG-IP Next Web应用防火墙
|
5天前
|
机器学习/深度学习 网络架构 计算机视觉
深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过研究卷积神经网络(CNN)的结构和原理,本文展示了深度学习如何提高图像识别的准确性和效率。同时,本文也讨论了数据不平衡、过拟合、计算资源限制等问题,并提出了相应的解决策略。
38 19
|
3天前
|
域名解析 缓存 网络协议
优化Lua-cURL:减少网络请求延迟的实用方法
优化Lua-cURL:减少网络请求延迟的实用方法
|
5天前
|
机器学习/深度学习 传感器 人工智能
探索深度学习在图像识别中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。通过介绍卷积神经网络(CNN)的基本原理和架构设计,阐述了深度学习如何有效地从图像数据中提取特征,并在多个领域实现突破性进展。同时,文章也指出了训练深度模型时常见的过拟合问题、数据不平衡以及计算资源需求高等挑战,并提出了相应的解决策略。
41 7
|
9天前
|
机器学习/深度学习 算法 信息无障碍
基于GoogleNet深度学习网络的手语识别算法matlab仿真
本项目展示了基于GoogleNet的深度学习手语识别算法,使用Matlab2022a实现。通过卷积神经网络(CNN)识别手语手势,如"How are you"、"I am fine"、"I love you"等。核心在于Inception模块,通过多尺度处理和1x1卷积减少计算量,提高效率。项目附带完整代码及操作视频。
|
12天前
|
机器学习/深度学习 算法 数据安全/隐私保护
基于深度学习网络的宝石类型识别算法matlab仿真
本项目利用GoogLeNet深度学习网络进行宝石类型识别,实验包括收集多类宝石图像数据集并按7:1:2比例划分。使用Matlab2022a实现算法,提供含中文注释的完整代码及操作视频。GoogLeNet通过其独特的Inception模块,结合数据增强、学习率调整和正则化等优化手段,有效提升了宝石识别的准确性和效率。
|
5天前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
42 17
下一篇
DataWorks