新框架SyConn利用卷积神经网络和随机森林阅读神经成像:可识别线粒体和突触等

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 人脑是一个智能而复杂的机器。

人脑是一个智能而复杂的机器。这种类比在某些方面是准确的,并且在大脑研究领域中提供了一种方法。我们都知道,人脑可以分为四个部分:额叶、顶叶、颞叶和枕叶。这种划分的其中一个标准是功能性(functionality),或者说该区域负责行使哪种功能。例如,颞叶通常与听觉处理和嗅觉有关,而枕叶通常与视觉信息处理有关。


然而,大脑中的大多数神经行为非常复杂,不同程度上涉及了人脑的多个区域。其功能性也并不局限于对特定大脑区域的划分。歧义无所不在。因此,当发生脑部疾病并出现功能性障碍时,从宏观层面来调查其中的深层原因是相当困难的。回到机器的那个类比,科学家现在想弄清楚他们是否可以从微观层面来消除这种「歧义」,即通过大脑基本单元之间的连接——神经元。一个连接组(connectome)就是一张大脑中神经连接的全景图,显示了神经元的连接以及行驶不同功能的方式。


微信图片_20211128171343.jpg

体积成像电子显微镜(Volume Electron Microscopy)


体积电子显微镜(Volume EM)是一种常用的神经回路重建技术。其中,对大脑体积的三维 EM 成像技术可以用来重建神经元形态及其连接关系的细节信息。volume EM 之间的开发差异始于对中枢神经系统(CNS)检查的需要。正如导言所述,许多神经退化性疾病无法通过自上而下的方式来追究病因。因此,有必要使用足够大的分辨率来对轴突、树突和单个突触的活动进行分析。


荧光标记法通常适用于组织检查,相比之下,标准的 EM 染料并不受限于对稀疏标记或超分辨率光学成像的要求。这些染料可能会对所有的细胞膜和突触进行相对无偏见的染色。因此,Volume EM 可以用来塑造某个神经元前后突触结构的完整连接关系。此标准操作也可以拓展到脑体积中的所有神经元上,使我们能够建立一张全面的脑神经接线图或一个大脑连接组。


近年来,随着数据处理技术的进步,定量方法变得越来越重要。通过来自大数据集的解剖学电路重建技术(Anatomical Circuit Reconstruction),Volume EM 可以为神经计算提供之前所无法获得的见解。Volume EM 的技术进步以及计算能力的增强已经令使用足够大的数据集来重建完整的神经微电路成为可能。这些新的发现为一些研究项目提供了支持和示范——解剖电路重建技术如何才能为神经计算提供之前所无法获得的见解。

 

突触连接推理流程(Synaptic Connectivity Inference Pipeline, SYCONN)


脊椎动物和无脊椎动物的神经系统中都密密麻麻地交织着神经元,它们的轴突、树突和突触相互连接或彼此重叠。因此,试图破解成千上万个神经元之间的连接细节不是一件容易的事。从 Volume EM 的大数据集中重建的这种连接组是一个高维网络,这意味着对它的分析需要花费大量的时间和精力。虽然技术的进步使我们可以获得足够多具有良好分辨率的数据,但是分析过程仍然是一个问题。如图 1 所示,要想重建全部细节,人工分析需要花费数百万个小时的时间。


微信图片_20211128171358.jpg图 1:对不同数据集进行人工分析的预算时间。j0126(斑胸草雀,21,850 个神经元片段)、 斑马鱼幼体的大脑(100,000 个神经元)和小鼠脑(灰质,71,000,000 个神经元)。顶部颜色栏显示,除了最初手工重建的部分(红色),SyConn 将剩下的所有步骤(绿色部分)自动化。图表纵队显示了从 Volume EM 数据集中生成一个连接矩阵所需的步骤。


因此有必要开发一种能够自动分析所有可用数据的方法,使连接组的构建更具有可行性。在这篇论文中,研究人员介绍了一种自动化突触连接的推论流程(SyConn),该模型需要使用所生成的神经突起骨架以及分类器训练数据作为输入,并提供了一张有着丰富注解信息的接线图或是某个连接组的组件。在该推理流程模型中,第一步是对神经突起骨架进行体积重建。然后是对图像数据中的突触及其它超微结构对象(比如囊泡、线粒体)进行转换。对超微结构的检测可进一步增强神经突起的重建效果。


SyConn 框架采用深度卷积神经网络和随机森林分类器(Random Forest Classifier, RFC)来自动识别线粒体、突触及其它细胞类型,从而产生拥有丰富注解信息的突触连接矩阵。ElektroNN 是一个可有效利用图形处理单元(GPU)进行计算的高层次卷积神经网络(CNN)库,它被专门用来整合进 SyConn。通过消除冗余的计算和稀疏的训练标记,ElektroNN 在模型训练时间以及大数据集推理速度方面得到优化。



微信图片_20211128171419.jpg

图 2:一个前突触神经元与一个后突触神经元的连接图。囊泡朝着突触间隙运输神经递质,后者携带有生化信息。其中还有大量的能量生产者——线粒体。


为了进行骨架到体积重建的转换,可以训练一个递归的三维卷积神经网络模型来检测神经突起之间的障碍区(膜和细胞外空间,ECS)。然后 ECS 可用于制备样本以用于分割(segmentation)。研究人员选择对囊泡云(vesicle clouds)和线粒体(mitochondria)一起进行检测,以此作为两个神经元是否相互连接的标准,而非二者之间的接触面积。由于这些超微结构对象是神经元之间重要的信息传输因子,因而它们在前 & 后突触神经元中的数量颇丰。因此,对囊泡云和线粒体的同时出现进行检测是一个很好的连接迹象。从技术上讲,一个多类卷积神经网络就是被训练用于处理这一步骤的。


一定要注意的是,这些报导出来的最好的训练成绩依赖于测试集的大小。多类卷积神经网络在小规模测试集上表现良好,大概是因为这种体量的连接数仍然是可应对的。虽然实验中显示出的性能前景光明,但我们并不知道该性能是否可以泛化到更大的数据集上,毕竟大数据集有着很大的多样性。


微信图片_20211128171452.jpg

图 3:与其它前沿方法的比较。F1 分数反映了查准率和查全率的调和平均数。可以看出,SyConn 优于其它方法。


基于先前检测到的超微结构对象,SyConn 可以通过将它们的相对位置分配到神经突起的不同部分来进一步细化重建模型。这个过程可以辅助对亚细胞部分和神经细胞类型的分类。在这篇论文中,研究人员纳入了一个随机森林分类器来对树突棘头、树突棘颈或树突棘轴进行分类。增强细胞重建在细胞类型识别方面十分必要,该识别程序在构建连接矩阵和随后的分析过程中起到了重要的作用。通过比较线粒体和囊泡云在神经突起上的体积密度,研究人员发现,其中发射率最高的神经元类型具有最高的密度。对神经元的超微结构对象和相关发射率的研究,可能会在化学固定作用前为生命体内的生理特性提供一些见解。


讨论


连接组学(Connectomics)近年来经历了快速的发展。密集的连接组学分析受限于突触的注解时间并遵循着电路分析的步骤。SyConn 能够(在可接受的误差内)以较低错误率大大减少分析时间,从而令人工校对变得没有必要。对于数据集质量限制 SyConn 性能的问题,人工检查将会有利于准确率的提升。从该结果中我们也可以看到,利用预先训练的网络与后训练程序,深度卷积神经网络只需要最少的训练数据就能提取出超微结构对象的信息。


虽然自动化可以显著提高效率,但是自动化的神经突起重建技术到现在都没有成果,后者的可变性和复杂性更大。由于我们还处于专家在生物数据分析工作中发挥重要作用的阶段,可以预见,他们在未来的影响会越来越小。相反,学会了所有规则的机器可能会接管该工作。你认为该领域的专家会完全被计算机取代吗?

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
2天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
18 4
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
24天前
|
机器学习/深度学习 人工智能 算法
猫狗宠物识别系统Python+TensorFlow+人工智能+深度学习+卷积网络算法
宠物识别系统使用Python和TensorFlow搭建卷积神经网络,基于37种常见猫狗数据集训练高精度模型,并保存为h5格式。通过Django框架搭建Web平台,用户上传宠物图片即可识别其名称,提供便捷的宠物识别服务。
241 55
|
1月前
|
机器学习/深度学习 人工智能 算法
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
宠物识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了37种常见的猫狗宠物种类数据集【'阿比西尼亚猫(Abyssinian)', '孟加拉猫(Bengal)', '暹罗猫(Birman)', '孟买猫(Bombay)', '英国短毛猫(British Shorthair)', '埃及猫(Egyptian Mau)', '缅因猫(Maine Coon)', '波斯猫(Persian)', '布偶猫(Ragdoll)', '俄罗斯蓝猫(Russian Blue)', '暹罗猫(Siamese)', '斯芬克斯猫(Sphynx)', '美国斗牛犬
168 29
【宠物识别系统】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+图像识别
|
23天前
|
机器学习/深度学习 算法 PyTorch
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
本文探讨了图神经网络(GNN)与大型语言模型(LLM)结合在知识图谱问答中的应用。研究首先基于G-Retriever构建了探索性模型,然后深入分析了GNN-RAG架构,通过敏感性研究和架构改进,显著提升了模型的推理能力和答案质量。实验结果表明,改进后的模型在多个评估指标上取得了显著提升,特别是在精确率和召回率方面。最后,文章提出了反思机制和教师网络的概念,进一步增强了模型的推理能力。
52 4
基于图神经网络的大语言模型检索增强生成框架研究:面向知识图谱推理的优化与扩展
|
1月前
|
机器学习/深度学习 资源调度 算法
图卷积网络入门:数学基础与架构设计
本文系统地阐述了图卷积网络的架构原理。通过简化数学表述并聚焦于矩阵运算的核心概念,详细解析了GCN的工作机制。
100 3
图卷积网络入门:数学基础与架构设计
|
2月前
|
人工智能 自然语言处理
WebDreamer:基于大语言模型模拟网页交互增强网络规划能力的框架
WebDreamer是一个基于大型语言模型(LLMs)的网络智能体框架,通过模拟网页交互来增强网络规划能力。它利用GPT-4o作为世界模型,预测用户行为及其结果,优化决策过程,提高性能和安全性。WebDreamer的核心在于“做梦”概念,即在实际采取行动前,用LLM预测每个可能步骤的结果,并选择最有可能实现目标的行动。
66 1
WebDreamer:基于大语言模型模拟网页交互增强网络规划能力的框架
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)##
在当今的人工智能领域,深度学习已成为推动技术革新的核心力量之一。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,因其在图像和视频处理方面的卓越性能而备受关注。本文旨在深入探讨CNN的基本原理、结构及其在实际应用中的表现,为读者提供一个全面了解CNN的窗口。 ##
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深入理解深度学习中的卷积神经网络(CNN)
深入理解深度学习中的卷积神经网络(CNN)
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN): 从理论到实践
本文将深入浅出地介绍卷积神经网络(CNN)的工作原理,并带领读者通过一个简单的图像分类项目,实现从理论到代码的转变。我们将探索CNN如何识别和处理图像数据,并通过实例展示如何训练一个有效的CNN模型。无论你是深度学习领域的新手还是希望扩展你的技术栈,这篇文章都将为你提供宝贵的知识和技能。
350 7
|
2月前
|
机器学习/深度学习 自然语言处理 算法
深入理解深度学习中的卷积神经网络(CNN)
深入理解深度学习中的卷积神经网络(CNN)
72 1
下一篇
开通oss服务