新框架SyConn利用卷积神经网络和随机森林阅读神经成像:可识别线粒体和突触等

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 人脑是一个智能而复杂的机器。

人脑是一个智能而复杂的机器。这种类比在某些方面是准确的,并且在大脑研究领域中提供了一种方法。我们都知道,人脑可以分为四个部分:额叶、顶叶、颞叶和枕叶。这种划分的其中一个标准是功能性(functionality),或者说该区域负责行使哪种功能。例如,颞叶通常与听觉处理和嗅觉有关,而枕叶通常与视觉信息处理有关。


然而,大脑中的大多数神经行为非常复杂,不同程度上涉及了人脑的多个区域。其功能性也并不局限于对特定大脑区域的划分。歧义无所不在。因此,当发生脑部疾病并出现功能性障碍时,从宏观层面来调查其中的深层原因是相当困难的。回到机器的那个类比,科学家现在想弄清楚他们是否可以从微观层面来消除这种「歧义」,即通过大脑基本单元之间的连接——神经元。一个连接组(connectome)就是一张大脑中神经连接的全景图,显示了神经元的连接以及行驶不同功能的方式。


微信图片_20211128171343.jpg

体积成像电子显微镜(Volume Electron Microscopy)


体积电子显微镜(Volume EM)是一种常用的神经回路重建技术。其中,对大脑体积的三维 EM 成像技术可以用来重建神经元形态及其连接关系的细节信息。volume EM 之间的开发差异始于对中枢神经系统(CNS)检查的需要。正如导言所述,许多神经退化性疾病无法通过自上而下的方式来追究病因。因此,有必要使用足够大的分辨率来对轴突、树突和单个突触的活动进行分析。


荧光标记法通常适用于组织检查,相比之下,标准的 EM 染料并不受限于对稀疏标记或超分辨率光学成像的要求。这些染料可能会对所有的细胞膜和突触进行相对无偏见的染色。因此,Volume EM 可以用来塑造某个神经元前后突触结构的完整连接关系。此标准操作也可以拓展到脑体积中的所有神经元上,使我们能够建立一张全面的脑神经接线图或一个大脑连接组。


近年来,随着数据处理技术的进步,定量方法变得越来越重要。通过来自大数据集的解剖学电路重建技术(Anatomical Circuit Reconstruction),Volume EM 可以为神经计算提供之前所无法获得的见解。Volume EM 的技术进步以及计算能力的增强已经令使用足够大的数据集来重建完整的神经微电路成为可能。这些新的发现为一些研究项目提供了支持和示范——解剖电路重建技术如何才能为神经计算提供之前所无法获得的见解。

 

突触连接推理流程(Synaptic Connectivity Inference Pipeline, SYCONN)


脊椎动物和无脊椎动物的神经系统中都密密麻麻地交织着神经元,它们的轴突、树突和突触相互连接或彼此重叠。因此,试图破解成千上万个神经元之间的连接细节不是一件容易的事。从 Volume EM 的大数据集中重建的这种连接组是一个高维网络,这意味着对它的分析需要花费大量的时间和精力。虽然技术的进步使我们可以获得足够多具有良好分辨率的数据,但是分析过程仍然是一个问题。如图 1 所示,要想重建全部细节,人工分析需要花费数百万个小时的时间。


微信图片_20211128171358.jpg图 1:对不同数据集进行人工分析的预算时间。j0126(斑胸草雀,21,850 个神经元片段)、 斑马鱼幼体的大脑(100,000 个神经元)和小鼠脑(灰质,71,000,000 个神经元)。顶部颜色栏显示,除了最初手工重建的部分(红色),SyConn 将剩下的所有步骤(绿色部分)自动化。图表纵队显示了从 Volume EM 数据集中生成一个连接矩阵所需的步骤。


因此有必要开发一种能够自动分析所有可用数据的方法,使连接组的构建更具有可行性。在这篇论文中,研究人员介绍了一种自动化突触连接的推论流程(SyConn),该模型需要使用所生成的神经突起骨架以及分类器训练数据作为输入,并提供了一张有着丰富注解信息的接线图或是某个连接组的组件。在该推理流程模型中,第一步是对神经突起骨架进行体积重建。然后是对图像数据中的突触及其它超微结构对象(比如囊泡、线粒体)进行转换。对超微结构的检测可进一步增强神经突起的重建效果。


SyConn 框架采用深度卷积神经网络和随机森林分类器(Random Forest Classifier, RFC)来自动识别线粒体、突触及其它细胞类型,从而产生拥有丰富注解信息的突触连接矩阵。ElektroNN 是一个可有效利用图形处理单元(GPU)进行计算的高层次卷积神经网络(CNN)库,它被专门用来整合进 SyConn。通过消除冗余的计算和稀疏的训练标记,ElektroNN 在模型训练时间以及大数据集推理速度方面得到优化。



微信图片_20211128171419.jpg

图 2:一个前突触神经元与一个后突触神经元的连接图。囊泡朝着突触间隙运输神经递质,后者携带有生化信息。其中还有大量的能量生产者——线粒体。


为了进行骨架到体积重建的转换,可以训练一个递归的三维卷积神经网络模型来检测神经突起之间的障碍区(膜和细胞外空间,ECS)。然后 ECS 可用于制备样本以用于分割(segmentation)。研究人员选择对囊泡云(vesicle clouds)和线粒体(mitochondria)一起进行检测,以此作为两个神经元是否相互连接的标准,而非二者之间的接触面积。由于这些超微结构对象是神经元之间重要的信息传输因子,因而它们在前 & 后突触神经元中的数量颇丰。因此,对囊泡云和线粒体的同时出现进行检测是一个很好的连接迹象。从技术上讲,一个多类卷积神经网络就是被训练用于处理这一步骤的。


一定要注意的是,这些报导出来的最好的训练成绩依赖于测试集的大小。多类卷积神经网络在小规模测试集上表现良好,大概是因为这种体量的连接数仍然是可应对的。虽然实验中显示出的性能前景光明,但我们并不知道该性能是否可以泛化到更大的数据集上,毕竟大数据集有着很大的多样性。


微信图片_20211128171452.jpg

图 3:与其它前沿方法的比较。F1 分数反映了查准率和查全率的调和平均数。可以看出,SyConn 优于其它方法。


基于先前检测到的超微结构对象,SyConn 可以通过将它们的相对位置分配到神经突起的不同部分来进一步细化重建模型。这个过程可以辅助对亚细胞部分和神经细胞类型的分类。在这篇论文中,研究人员纳入了一个随机森林分类器来对树突棘头、树突棘颈或树突棘轴进行分类。增强细胞重建在细胞类型识别方面十分必要,该识别程序在构建连接矩阵和随后的分析过程中起到了重要的作用。通过比较线粒体和囊泡云在神经突起上的体积密度,研究人员发现,其中发射率最高的神经元类型具有最高的密度。对神经元的超微结构对象和相关发射率的研究,可能会在化学固定作用前为生命体内的生理特性提供一些见解。


讨论


连接组学(Connectomics)近年来经历了快速的发展。密集的连接组学分析受限于突触的注解时间并遵循着电路分析的步骤。SyConn 能够(在可接受的误差内)以较低错误率大大减少分析时间,从而令人工校对变得没有必要。对于数据集质量限制 SyConn 性能的问题,人工检查将会有利于准确率的提升。从该结果中我们也可以看到,利用预先训练的网络与后训练程序,深度卷积神经网络只需要最少的训练数据就能提取出超微结构对象的信息。


虽然自动化可以显著提高效率,但是自动化的神经突起重建技术到现在都没有成果,后者的可变性和复杂性更大。由于我们还处于专家在生物数据分析工作中发挥重要作用的阶段,可以预见,他们在未来的影响会越来越小。相反,学会了所有规则的机器可能会接管该工作。你认为该领域的专家会完全被计算机取代吗?

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
10天前
|
数据采集 存储 JSON
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第27天】本文介绍了Python网络爬虫Scrapy框架的实战应用与技巧。首先讲解了如何创建Scrapy项目、定义爬虫、处理JSON响应、设置User-Agent和代理,以及存储爬取的数据。通过具体示例,帮助读者掌握Scrapy的核心功能和使用方法,提升数据采集效率。
52 6
|
9天前
|
机器学习/深度学习 计算机视觉 Python
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力本文提出了一种简单且高效的卷积神经网络(ConvNets)注意力模块——SimAM。与现有模块不同,SimAM通过优化能量函数推断特征图的3D注意力权重,无需添加额外参数。SimAM基于空间抑制理论设计,通过简单的解决方案实现高效计算,提升卷积神经网络的表征能力。代码已在Pytorch-SimAM开源。
【YOLOv11改进 - 注意力机制】SimAM:轻量级注意力机制,解锁卷积神经网络新潜力
|
2天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络:从理论到实践
【10月更文挑战第35天】在人工智能的浪潮中,深度学习技术以其强大的数据处理能力成为科技界的宠儿。其中,卷积神经网络(CNN)作为深度学习的一个重要分支,在图像识别和视频分析等领域展现出了惊人的潜力。本文将深入浅出地介绍CNN的工作原理,并结合实际代码示例,带领读者从零开始构建一个简单的CNN模型,探索其在图像分类任务中的应用。通过本文,读者不仅能够理解CNN背后的数学原理,还能学会如何利用现代深度学习框架实现自己的CNN模型。
|
1天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【10月更文挑战第36天】探索卷积神经网络(CNN)的神秘面纱,揭示其在图像识别领域的威力。本文将带你了解CNN的核心概念,并通过实际代码示例,展示如何构建和训练一个简单的CNN模型。无论你是深度学习的初学者还是希望深化理解,这篇文章都将为你提供有价值的见解。
|
3天前
|
存储 安全 网络安全
网络安全法律框架:全球视角下的合规性分析
网络安全法律框架:全球视角下的合规性分析
12 1
|
11天前
|
数据采集 前端开发 中间件
Python网络爬虫:Scrapy框架的实战应用与技巧分享
【10月更文挑战第26天】Python是一种强大的编程语言,在数据抓取和网络爬虫领域应用广泛。Scrapy作为高效灵活的爬虫框架,为开发者提供了强大的工具集。本文通过实战案例,详细解析Scrapy框架的应用与技巧,并附上示例代码。文章介绍了Scrapy的基本概念、创建项目、编写简单爬虫、高级特性和技巧等内容。
36 4
|
11天前
|
网络协议 物联网 API
Python网络编程:Twisted框架的异步IO处理与实战
【10月更文挑战第26天】Python 是一门功能强大且易于学习的编程语言,Twisted 框架以其事件驱动和异步IO处理能力,在网络编程领域独树一帜。本文深入探讨 Twisted 的异步IO机制,并通过实战示例展示其强大功能。示例包括创建简单HTTP服务器,展示如何高效处理大量并发连接。
33 1
|
12天前
|
机器学习/深度学习 监控 自动驾驶
卷积神经网络有什么应用场景
【10月更文挑战第23天】卷积神经网络有什么应用场景
15 2
|
12天前
|
机器学习/深度学习 自然语言处理 算法
什么是卷积神经网络
【10月更文挑战第23天】什么是卷积神经网络
20 1
|
2天前
|
机器学习/深度学习 人工智能 自动驾驶
深入解析深度学习中的卷积神经网络(CNN)
深入解析深度学习中的卷积神经网络(CNN)
9 0
下一篇
无影云桌面