新框架SyConn利用卷积神经网络和随机森林阅读神经成像:可识别线粒体和突触等

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介: 人脑是一个智能而复杂的机器。

人脑是一个智能而复杂的机器。这种类比在某些方面是准确的,并且在大脑研究领域中提供了一种方法。我们都知道,人脑可以分为四个部分:额叶、顶叶、颞叶和枕叶。这种划分的其中一个标准是功能性(functionality),或者说该区域负责行使哪种功能。例如,颞叶通常与听觉处理和嗅觉有关,而枕叶通常与视觉信息处理有关。


然而,大脑中的大多数神经行为非常复杂,不同程度上涉及了人脑的多个区域。其功能性也并不局限于对特定大脑区域的划分。歧义无所不在。因此,当发生脑部疾病并出现功能性障碍时,从宏观层面来调查其中的深层原因是相当困难的。回到机器的那个类比,科学家现在想弄清楚他们是否可以从微观层面来消除这种「歧义」,即通过大脑基本单元之间的连接——神经元。一个连接组(connectome)就是一张大脑中神经连接的全景图,显示了神经元的连接以及行驶不同功能的方式。


微信图片_20211128171343.jpg

体积成像电子显微镜(Volume Electron Microscopy)


体积电子显微镜(Volume EM)是一种常用的神经回路重建技术。其中,对大脑体积的三维 EM 成像技术可以用来重建神经元形态及其连接关系的细节信息。volume EM 之间的开发差异始于对中枢神经系统(CNS)检查的需要。正如导言所述,许多神经退化性疾病无法通过自上而下的方式来追究病因。因此,有必要使用足够大的分辨率来对轴突、树突和单个突触的活动进行分析。


荧光标记法通常适用于组织检查,相比之下,标准的 EM 染料并不受限于对稀疏标记或超分辨率光学成像的要求。这些染料可能会对所有的细胞膜和突触进行相对无偏见的染色。因此,Volume EM 可以用来塑造某个神经元前后突触结构的完整连接关系。此标准操作也可以拓展到脑体积中的所有神经元上,使我们能够建立一张全面的脑神经接线图或一个大脑连接组。


近年来,随着数据处理技术的进步,定量方法变得越来越重要。通过来自大数据集的解剖学电路重建技术(Anatomical Circuit Reconstruction),Volume EM 可以为神经计算提供之前所无法获得的见解。Volume EM 的技术进步以及计算能力的增强已经令使用足够大的数据集来重建完整的神经微电路成为可能。这些新的发现为一些研究项目提供了支持和示范——解剖电路重建技术如何才能为神经计算提供之前所无法获得的见解。

 

突触连接推理流程(Synaptic Connectivity Inference Pipeline, SYCONN)


脊椎动物和无脊椎动物的神经系统中都密密麻麻地交织着神经元,它们的轴突、树突和突触相互连接或彼此重叠。因此,试图破解成千上万个神经元之间的连接细节不是一件容易的事。从 Volume EM 的大数据集中重建的这种连接组是一个高维网络,这意味着对它的分析需要花费大量的时间和精力。虽然技术的进步使我们可以获得足够多具有良好分辨率的数据,但是分析过程仍然是一个问题。如图 1 所示,要想重建全部细节,人工分析需要花费数百万个小时的时间。


微信图片_20211128171358.jpg图 1:对不同数据集进行人工分析的预算时间。j0126(斑胸草雀,21,850 个神经元片段)、 斑马鱼幼体的大脑(100,000 个神经元)和小鼠脑(灰质,71,000,000 个神经元)。顶部颜色栏显示,除了最初手工重建的部分(红色),SyConn 将剩下的所有步骤(绿色部分)自动化。图表纵队显示了从 Volume EM 数据集中生成一个连接矩阵所需的步骤。


因此有必要开发一种能够自动分析所有可用数据的方法,使连接组的构建更具有可行性。在这篇论文中,研究人员介绍了一种自动化突触连接的推论流程(SyConn),该模型需要使用所生成的神经突起骨架以及分类器训练数据作为输入,并提供了一张有着丰富注解信息的接线图或是某个连接组的组件。在该推理流程模型中,第一步是对神经突起骨架进行体积重建。然后是对图像数据中的突触及其它超微结构对象(比如囊泡、线粒体)进行转换。对超微结构的检测可进一步增强神经突起的重建效果。


SyConn 框架采用深度卷积神经网络和随机森林分类器(Random Forest Classifier, RFC)来自动识别线粒体、突触及其它细胞类型,从而产生拥有丰富注解信息的突触连接矩阵。ElektroNN 是一个可有效利用图形处理单元(GPU)进行计算的高层次卷积神经网络(CNN)库,它被专门用来整合进 SyConn。通过消除冗余的计算和稀疏的训练标记,ElektroNN 在模型训练时间以及大数据集推理速度方面得到优化。



微信图片_20211128171419.jpg

图 2:一个前突触神经元与一个后突触神经元的连接图。囊泡朝着突触间隙运输神经递质,后者携带有生化信息。其中还有大量的能量生产者——线粒体。


为了进行骨架到体积重建的转换,可以训练一个递归的三维卷积神经网络模型来检测神经突起之间的障碍区(膜和细胞外空间,ECS)。然后 ECS 可用于制备样本以用于分割(segmentation)。研究人员选择对囊泡云(vesicle clouds)和线粒体(mitochondria)一起进行检测,以此作为两个神经元是否相互连接的标准,而非二者之间的接触面积。由于这些超微结构对象是神经元之间重要的信息传输因子,因而它们在前 & 后突触神经元中的数量颇丰。因此,对囊泡云和线粒体的同时出现进行检测是一个很好的连接迹象。从技术上讲,一个多类卷积神经网络就是被训练用于处理这一步骤的。


一定要注意的是,这些报导出来的最好的训练成绩依赖于测试集的大小。多类卷积神经网络在小规模测试集上表现良好,大概是因为这种体量的连接数仍然是可应对的。虽然实验中显示出的性能前景光明,但我们并不知道该性能是否可以泛化到更大的数据集上,毕竟大数据集有着很大的多样性。


微信图片_20211128171452.jpg

图 3:与其它前沿方法的比较。F1 分数反映了查准率和查全率的调和平均数。可以看出,SyConn 优于其它方法。


基于先前检测到的超微结构对象,SyConn 可以通过将它们的相对位置分配到神经突起的不同部分来进一步细化重建模型。这个过程可以辅助对亚细胞部分和神经细胞类型的分类。在这篇论文中,研究人员纳入了一个随机森林分类器来对树突棘头、树突棘颈或树突棘轴进行分类。增强细胞重建在细胞类型识别方面十分必要,该识别程序在构建连接矩阵和随后的分析过程中起到了重要的作用。通过比较线粒体和囊泡云在神经突起上的体积密度,研究人员发现,其中发射率最高的神经元类型具有最高的密度。对神经元的超微结构对象和相关发射率的研究,可能会在化学固定作用前为生命体内的生理特性提供一些见解。


讨论


连接组学(Connectomics)近年来经历了快速的发展。密集的连接组学分析受限于突触的注解时间并遵循着电路分析的步骤。SyConn 能够(在可接受的误差内)以较低错误率大大减少分析时间,从而令人工校对变得没有必要。对于数据集质量限制 SyConn 性能的问题,人工检查将会有利于准确率的提升。从该结果中我们也可以看到,利用预先训练的网络与后训练程序,深度卷积神经网络只需要最少的训练数据就能提取出超微结构对象的信息。


虽然自动化可以显著提高效率,但是自动化的神经突起重建技术到现在都没有成果,后者的可变性和复杂性更大。由于我们还处于专家在生物数据分析工作中发挥重要作用的阶段,可以预见,他们在未来的影响会越来越小。相反,学会了所有规则的机器可能会接管该工作。你认为该领域的专家会完全被计算机取代吗?

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
9天前
|
存储 SQL 安全
网络安全与信息安全:守护数字世界的坚盾在这个高度数字化的时代,网络安全和信息安全已经成为个人、企业乃至国家安全的重要组成部分。本文将深入探讨网络安全漏洞、加密技术以及安全意识的重要性,旨在为读者提供一个全面的网络安全知识框架。
随着互联网技术的飞速发展,网络安全问题日益凸显。从个人信息泄露到企业数据被盗,再到国家安全受到威胁,网络安全事件层出不穷。本文将从网络安全漏洞的定义与分类入手,探讨常见的网络攻击手段;随后深入解析加密技术的原理及其在保护信息安全中的作用;最后强调提升公众与企业的安全意识的重要性,并提出具体的建议。通过综合运用这些知识点,我们可以更好地构建起一道道坚固的防线,守护我们的数字世界。
|
11天前
|
编解码 分布式计算 网络协议
Netty高性能网络框架(一)
Netty高性能网络框架(一)
|
11天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)及其应用
【9月更文挑战第24天】本文将深入探讨深度学习中的一种重要模型——卷积神经网络(CNN)。我们将通过简单的代码示例,了解CNN的工作原理和应用场景。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的信息。
36 1
|
11天前
|
机器学习/深度学习 人工智能 算法
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
文本分类识别系统。本系统使用Python作为主要开发语言,首先收集了10种中文文本数据集("体育类", "财经类", "房产类", "家居类", "教育类", "科技类", "时尚类", "时政类", "游戏类", "娱乐类"),然后基于TensorFlow搭建CNN卷积神经网络算法模型。通过对数据集进行多轮迭代训练,最后得到一个识别精度较高的模型,并保存为本地的h5格式。然后使用Django开发Web网页端操作界面,实现用户上传一段文本识别其所属的类别。
24 1
【新闻文本分类识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
4天前
|
机器学习/深度学习 人工智能 算法
深入理解卷积神经网络:从理论到实践
【9月更文挑战第31天】在深度学习的众多模型之中,卷积神经网络(CNN)以其在图像处理领域的出色表现而闻名。本文将通过浅显易懂的语言和直观的比喻,带领读者了解CNN的核心原理和结构,并通过一个简化的代码示例,展示如何实现一个简单的CNN模型。我们将从CNN的基本组成出发,逐步深入到其在现实世界中的应用,最后探讨其未来的可能性。文章旨在为初学者提供一个清晰的CNN入门指南,同时为有经验的开发者提供一些深入思考的视角。
|
4天前
|
机器学习/深度学习 人工智能 算法框架/工具
深度学习中的卷积神经网络(CNN)及其在图像识别中的应用
【9月更文挑战第31天】本文旨在通过浅显易懂的语言和直观的比喻,为初学者揭开深度学习中卷积神经网络(CNN)的神秘面纱。我们将从CNN的基本原理出发,逐步深入到其在图像识别领域的实际应用,并通过一个简单的代码示例,展示如何利用CNN进行图像分类。无论你是编程新手还是深度学习的初学者,这篇文章都将为你打开一扇通往人工智能世界的大门。
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
深度学习中的卷积神经网络(CNN)入门与实践
【8月更文挑战第62天】本文以浅显易懂的方式介绍了深度学习领域中的核心技术之一——卷积神经网络(CNN)。文章通过生动的比喻和直观的图示,逐步揭示了CNN的工作原理和应用场景。同时,结合具体的代码示例,引导读者从零开始构建一个简单的CNN模型,实现对图像数据的分类任务。无论你是深度学习的初学者还是希望巩固理解的开发者,这篇文章都将为你打开一扇通往深度学习世界的大门。
|
13天前
|
机器学习/深度学习
ACM MM24:复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它
【9月更文挑战第23天】复旦大学研究团队提出了ReToMe-VA,一种基于扩散模型的视频非限制性对抗攻击框架,通过时间步长对抗性潜在优化(TALO)与递归令牌合并(ReToMe)策略,实现了高转移性且难以察觉的对抗性视频生成。TALO优化去噪步骤扰动,提升空间难以察觉性及计算效率;ReToMe则确保时间一致性,增强帧间交互。实验表明,ReToMe-VA在攻击转移性上超越现有方法,但面临计算成本高、实时应用受限及隐私安全等挑战。[论文链接](http://arxiv.org/abs/2408.05479)
26 3
|
11天前
|
机器学习/深度学习 人工智能 算法
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台。果蔬识别系统,本系统使用Python作为主要开发语言,通过收集了12种常见的水果和蔬菜('土豆', '圣女果', '大白菜', '大葱', '梨', '胡萝卜', '芒果', '苹果', '西红柿', '韭菜', '香蕉', '黄瓜'),然后基于TensorFlow库搭建CNN卷积神经网络算法模型,然后对数据集进行训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地文件方便后期调用。再使用Django框架搭建Web网页平台操作界面,实现用户上传一张果蔬图片识别其名称。
31 0
【果蔬识别系统】Python+卷积神经网络算法+人工智能+深度学习+计算机毕设项目+Django网页界面平台
|
15天前
|
机器学习/深度学习 自动驾驶 TensorFlow
深入理解卷积神经网络(CNN)在图像识别中的应用
【9月更文挑战第20天】本文旨在通过直观的解释和代码示例,向初学者介绍卷积神经网络(CNN)的基本概念及其在图像识别领域的应用。文章将首先解释什么是CNN以及它如何工作,然后通过一个简单的Python代码示例展示如何构建一个基本的CNN模型。最后,我们将讨论CNN在现实世界问题中的潜在应用,并探讨其面临的挑战和发展方向。
36 2

热门文章

最新文章

下一篇
无影云桌面