一览无余!| BMEC:基于形状感知的红细胞细粒度分类

简介: 一览无余!| BMEC:基于形状感知的红细胞细粒度分类

Title: Shape-Aware Fine-Grained Classification of Erythroid Cells


Author: Ye Wang et al. (吉林大学)


Paper: https://arxiv.org/pdf/2212.13695.pdf


Github: https://github.com/wangye8899/BMEC


引言


骨髓红细胞的精细分类和计数对于评估健康状况和制定白血病或血液病的治疗方案至关重要。 由于不同类型的红细胞之间存在细微的视觉差异,因此将现有的基于图像的深度学习模型应用于细粒度的红细胞分类具有挑战性。 此外,目前还没有大型的红细胞开源数据集来支持模型训练。


在本文中,作者介绍了 BMEC(Bone Morrow Erythroid Cells),这是第一个大型细粒度红细胞图像数据集,以促进对红细胞的更多深度学习研究。 BMEC 包含 5,666 张单个红细胞的图像,每张图像都是从骨髓红细胞涂片中提取的,并专业注释为四种类型的红细胞中的一种。 区分红系细胞的一个关键指标是细胞形态,它与细胞的生长成熟密切相关。 因此,本文设计了一种用于细粒度红细胞分类的新型形状感知图像分类网络。 从形状掩码图像中提取形状特征,并使用形状注意模块将其聚合到原始图像特征。


与基线方法相比,借助形状关注图像特征,本文所提方法在 BMEC 数据集上实现了出色的分类性能(81.12% top-1 准确率)。 消融研究还证明了结合形状信息进行细粒度细胞分类的有效性。为了进一步验证所提方法的普遍性,作者在另外两个公共白细胞 (WBC) 数据集上测试了该网络,结果表明形状感知方法的有效性。


背景


红细胞或红细胞是体内最重要的细胞之一。根据它们的生长和成熟,有四种类型的红细胞,如下图所示。在健康的身体里,它们保持着相对平衡的状态。然而,在贫血等许多血液疾病中,这些红细胞的数量会发生变化并变得不平衡。因此,对不同类型的红细胞进行精细分类和计数,对于相关疾病的诊断和预防具有重要意义。


741f58099e984f8ff5d916ef5a490540.png


下面简单介绍下主流的几个细胞数据集。


白血细胞数据集

LISC 是一个早期的 WBC 数据集,其中包括从健康受试者的外周血中获取的血液学图像。通过 Gismo-right 技术对涂片进行染色,并使用 Sony 型号 SSCDC50AP 相机在 100X 放大倍数下捕捉 Axioskope 40 显微镜的观察结果。然后,一位血液专家提取并标记了 250 张 WBC 图像,分为五个细粒度类别。同样,BCCD 数据集包含 349 张 WBC 图像,这些图像取自外周血并由一位专家注释。涂片也用 Gismo-right 技术染色,并使用 CCD 彩色相机捕获 100X 的常规光学显微镜的观察结果。从涂片图像中提取的每个 WBC 图像都由一位专家注释为五个类别之一。Raabin-WBC 是最近从正常外周血样本中提取的白细胞图像的大型公共数据集。外周血涂片采用 Giemsa 技术染色,并使用三星 Galaxy S5 相机拍摄图像,以捕捉奥林巴斯 CX18 显微镜在 100 倍放大倍数下的观察结果。总共有 17,965 张白细胞图像从涂片图像中裁剪出来,并由两位血液专家标记为五类。与白细胞相比,不同类型的红细胞看起来更相似,类型之间的形状差异很小。因此,细粒度的红细胞分类更具挑战性,例如,在 Raabin-WBC 上可以实现超过 99% 的准确度,而在本文提出的 BMEC 上只能获得大约 80% 的准确度。由于难以区分红细胞类型,因此文研究请三位血液学家以更严格的方式共同标记 BMEC 图像。


红细胞数据集

与 WBC 数据集相比,只有少数包含红细胞的开源数据集,而与 BMEC 相比,数据质量、数量和多样性都有限。如下列表格所示,CBC 是一个混合数据集,包含三种类型的血细胞:红细胞、白细胞和血小板。 CBC 中的图像是使用尼康 V1 相机拍摄的,以捕捉 ECLIPSE 50i 显微镜在 100 倍放大倍数下的观察结果,然后由两位专家进行注释。它更侧重于研究三种血细胞之间的差异,而不是将红细胞分类为细粒度的类型。 此外,CBC 只有 360 幅图像,难以训练深度神经网络。 红细胞分类最相关的一个数据集是红细胞 IDB,它包含从 196 个全场外周血图像中提取的 629 个单个红细胞图像。 Kodak EasyShare V803 相机用于捕捉 Leika 显微镜在 100X 放大倍率下的观察结果。一位专家根据细胞形状将红细胞 IDB 图像注释为三类:圆形、细长形和其他形状。与BMEC相比,erythrocytesIDB 中红细胞的形状差异更为显着,因为它们侧重于研究某些血液疾病引起的细胞变形。因此,在 erythrocytesIDB 上更容易实现高精度。 相比之下,BMEC 提供了更多的具有微小形状差异的图像,因此它可用于训练更通用的深度学习模型以进行细粒度的红细胞分类。


e3ac347a7c3d0894aadbf7faf1bb48f5.png


下面展示下 BMEC 数据集的一些特征统计分布情况:



abd8a03b1c6f4f8bdccff16ee9c83650.png

根据生长和成熟期,红系细胞被注释为四种类型:原红细胞 (Pro)、嗜碱性红细胞 (Bas)、多染红细胞 (Pol) 和正色红细胞 (Ort)。请注意,此处关注具有正常形状的红细胞,而不考虑具有细长形状的异常红细胞,例如红细胞 IDB。作为参考,上述表格显示了四种红系细胞的特征(例如,百分比、大小和形状)。


b6c659153ee58f053cd9617c60fa9cd9.png


方法


34ff0226b3e8510e6b71464d2cdeadfa.png

为了将红细胞分类为细粒度类别,本文提出了一种新颖的形状感知图像分类模型,该模型将形状信息显式编码到网络中。具体来说,首先从输入的红细胞图像中提取细胞形状掩模图像。然后,使用现有的骨干图像特征提取模型提取形状掩模特征和输入图像特征。进一步采用形状注意模块来计算形状注意图像特征,该图像特征被聚合到形状特征和原始图像特征以形成用于最终分类的融合特征。


具体地,该 Pipeline 由四个模块组成:细胞形状提取模块、双分支网络、形状注意模块和细胞分类网络。其中,形状提取模块将 RGB 红细胞图像转换为二值形状掩码。RGB 图像和形状掩码分别传递给双分支网络以生成原始特征和形状特征。形状注意模块计算形状注意权重并从原始图像特征生成形状注意图像特征。然后,原始图像特征、形状关注图像特征和形状特征被聚合成融合的形状感知特征,传递给轻量级分类网络进行预测。


f07b59f277bb5d9b65e679897a6a554d.png


细胞形状提取模块


形状信息对于区分不同细粒度类型的红系细胞至关重要,尤其是当细胞的外观相似时。因此,本文将细胞形状信息显式提取为二元形状掩码,并将其视为分类模型的先验知识(或归纳偏差)。细胞形状提取的主要步骤如算法1所示,下图显示了不同类型红系细胞的图像分割结果。


a0f1ee1db4bdeabf7ef128b8dbb64c61.png


与利用核和 ROC(凸包 - 核)图像作为形状图像的不同,本文选择凸包图像作为形状图像。 主要原因是其他方法主要关注细胞核形状明显不同的 WBC。然而,对于红细胞来说,与白细胞相比,它们的细胞核更完整并且看起来非常相似。 此外,红系细胞的细胞质图像有噪声,不适合表示细胞形状。相比之下,凸包包含关键形状特征,与核相比,它对噪声的鲁棒性更强。因此,本文将凸包的二值图像传递给网络,并计算形状注意力以增强原始图像特征。


双分支网络


为了明确地将形状信息集成到深度学习框架中,本方法设计了一个双分支网络,它在两个独立的分支中对 RGB 图像和二分类形状掩码(凸包图像)进行编码。


如图所示,顶部分支网络将 RGB 图像作为输入,并使用 Swin-Transformer 提取原始特征。 虽然 RGB 图像分支可以学习不同细胞之间的像素强度变化,但它并不关注细胞的形状或结构特征。因此,作者额外引入了一个单独的底部分支网络,它采用 VGG19 模型从细胞形状提取模块获得的二值形状掩模图像中显式计算形状特征。 来自两个分支的原始图像特征和形状特征集成在形状注意模块中,并在后期融合。此外,该双分支网络是一种通用设计,每个分支中的主干模型都可以被其他深度图像特征提取模型所取代。


形状注意力


为了进一步将形状信息集成到提取的图像特征中,作者提出了一种新颖的形状关注模块,它将原始图像特征和形状特征作为输入并输出形状关注图像特征。首先,形状注意力权重是根据 SENet 中使用的类似注意力机制从二分类形状掩模图像计算出来的。然后,原始图像特征乘以形状注意力权重得到形状关注特征。


总的来说,形状注意模块是一个轻量级网络,可以有效地计算形状特征之间的相关性,并利用自学习的细胞形状信息增强原始图像特征。此外,形状注意模块可以与任何主干模型相结合,将形状信息集成到图像特征中。


细胞分类网络


细胞分类网络由两组完全连接的 ReLu 和 Dropout 层组成。 将原始图像特征 FR、形状特征 FS 和形状关注图像特征 FSA 连接起来形成融合细胞特征 FC = {FR, FSA, FS} 用于最终分类。 通过明确考虑形状特征和形状注意力,与仅使用 RGB 特征进行细粒度红细胞分类相比,形状感知网络可以获得更优的性能。


实验


79f46f7dd6dbd64345375abb91eba854.png



012284e1c28c3ba592ae3b103da8812e.png


43b42f92d5d92529f0643ff2d45a1825.png


74a6a6c55126455dec414281f8ed15aa.png

e2c98e8d264a2f553743461ab3738c48.png


总结


本文介绍了 BMEC,这是第一个也是最大的专业注释图像数据集,用于对红细胞进行细粒度分类。为此,作者提出了一种新颖的形状感知网络,它明确利用形状信息来提高双分支深度学习框架中的分类精度。最后,通过对不同的主干进行了广泛的评估,并对 BMEC 和其他两个 WBC 数据集进行了实验。 结果显示了形状感知双分支网络的优越性和普遍性,此外,消融研究也验证了形状信息对细粒度细胞分类的有效性。


写在最后

如果您也对人工智能和计算机视觉全栈领域感兴趣,强烈推荐您关注有料、有趣、有爱的公众号『CVHub』,每日为大家带来精品原创、多领域、有深度的前沿科技论文解读及工业成熟解决方案!欢迎添加小编微信号:cv_huber,一起探讨更多有趣的话题!


目录
相关文章
|
编译器 C语言
C语言中整数如何自动转换为浮点数
C语言中整数如何自动转换为浮点数
654 0
|
9月前
|
人工智能 文字识别 安全
Qwen开源视觉推理模型QVQ,更睿智地看世界!
在人类的思维中,语言和视觉紧密交织,塑造着我们感知和理解世界的方式。我们的推理能力深深植根于语言思维和视觉记忆之中。那么,当我们将这些能力赋予人工智能时,会发生什么呢?如今的大语言模型已经展现出卓越的推理能力,但我们不禁思考:它们能否通过掌握视觉理解的力量,攀登认知能力的新高峰?
989 5
Qwen开源视觉推理模型QVQ,更睿智地看世界!
|
11月前
|
人工智能 NoSQL 测试技术
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心
若需了解更多MongoDB Atlas相关内容,可前往:https://www.mongodb.com/zh-cn/atlas
使用 MongoDB 构建 AI:Patronus 如何自动进行大语言模型评估来增强对生成式 AI 的信心
|
12月前
|
JSON 数据格式 Python
6-1|Python如何将json转化为字符串写到文件内 还保留json格式
6-1|Python如何将json转化为字符串写到文件内 还保留json格式
|
机器学习/深度学习 编解码 算法
算法工程师面试问题总结 | YOLOv5面试考点原理全解析
本文给大家带来的百面算法工程师是深度学习目标检测YOLOv5面试总结,文章内总结了常见的提问问题,旨在为广大学子模拟出更贴合实际的面试问答场景。在这篇文章中,我们还将介绍一些常见的深度学习目标检测面试问题,并提供参考的回答及其理论基础,以帮助求职者更好地准备面试。通过对这些问题的理解和回答,求职者可以展现出自己的深度学习目标检测领域的专业知识、解决问题的能力以及对实际应用场景的理解。同时,这也是为了帮助求职者更好地应对深度学习目标检测岗位的面试挑战,提升面试的成功率和竞争力。
|
数据安全/隐私保护
error: Could not get shadow information for NOUSER问题如何处理
【5月更文挑战第15天】error: Could not get shadow information for NOUSER问题如何处理
414 3
|
SQL 存储 大数据
SQL中DISTINCT关键字的使用与性能影响分析
SQL中DISTINCT关键字的使用与性能影响分析
|
存储 安全 Java
ssm666社区流浪动物救助领养系统的设计与开发
ssm666社区流浪动物救助领养系统的设计与开发
|
编译器 C++
使用64位的编译工具进行编译
本文记录了使用64位的编译工具进行编译的过程
|
消息中间件 运维 Cloud Native
赋能10000家合作伙伴,阿里中间件合作伙伴计划升级为阿里云原生合作伙伴计划!
阿里云将继续深耕“被集成”战略,做强生态,未来一年投入20亿专项资金,助力50家伙伴云上营收过亿,并启动“云原生合作伙伴计划”。
3083 79
赋能10000家合作伙伴,阿里中间件合作伙伴计划升级为阿里云原生合作伙伴计划!

热门文章

最新文章