【计算机视觉 | 医学相关】arxiv 计算机视觉关于医学相关的学术速递(8 月 11 日论文合集)

简介: 【计算机视觉 | 医学相关】arxiv 计算机视觉关于医学相关的学术速递(8 月 11 日论文合集)

一、医学相关(3篇)

1.1 Attention-based 3D CNN with Multi-layer Features for Alzheimer's Disease Diagnosis using Brain Images

基于注意力的多层特征3D CNN脑图像诊断阿尔茨海默病
https://arxiv.org/abs/2308.05655
结构MRI和PET成像在阿尔茨海默病(AD)的诊断中起着重要的作用,分别显示了脑内的形态学改变和糖代谢变化。一些认知障碍患者的脑图像表现相对不明显,例如在临床实践中通过sMRI实现准确诊断仍存在困难。随着深度学习技术的出现,卷积神经网络(CNN)已经成为AD辅助诊断中一种有价值的方法,但一些CNN方法无法有效地学习大脑图像的特征,使得AD的诊断仍存在一些挑战。在这项工作中,我们提出了一个端到端的3D CNN框架的AD诊断的基础上,该框架集成了多层功能下的注意机制,以更好地捕捉大脑图像的细微差异。注意力图显示,我们的模型可以专注于与疾病诊断相关的关键大脑区域。我们的方法在消融实验中验证了两种模态图像的792例受试者从ADNI数据库,其中AD诊断准确率分别达到89.71%和91.18%,并且也优于一些国家的最先进的方法。

1.2 Are Sex-based Physiological Differences the Cause of Gender Bias for Chest X-ray Diagnosis?

性别生理差异是胸部X光诊断性别偏见的原因吗?
https://arxiv.org/abs/2308.05129
虽然许多研究已经评估了人工智能算法在医疗领域的公平性,但预测性能差异的原因往往是未知的。这种对偏差原因的了解的缺乏阻碍了偏差减轻的功效,如简单的数据集平衡在减少性能差距方面仍然通常表现最好但无法解决所有性能差异的事实所证明的。在这项工作中,我们调查了基于机器学习的胸部X光诊断中性别偏见的原因。特别是,我们探讨的假设,乳腺组织导致曝光不足的肺部,并导致较低的模型性能。在方法上,我们提出了一种新的采样方法,该方法解决了两个广泛使用的公共数据集中每个患者的记录的高度偏斜分布,同时减少了标签错误的影响。我们对训练集中疾病、数据集和性别表示的性别差异进行了全面分析,结果表明数据集不平衡并不是导致性能差异的唯一原因。此外,相对组的性能差异很大的数据集之间,表明重要的数据集特定的因素影响男性/女性组的性能。最后,我们调查的效果,乳房组织更具体地说,从录音裁剪出的乳房,发现这并没有解决观察到的性能差距。总之,我们的研究结果表明,特定于数据集的因素,而不是基本的生理差异,是广泛使用的NIH和CheXpert数据集的胸部X射线分析中男女性能差距的主要驱动因素。

1.3 Towards Automatic Scoring of Spinal X-ray for Ankylosing Spondylitis

强直性脊柱炎脊柱X线片自动评分的研究
https://arxiv.org/abs/2308.05123
由于骨骼形状复杂性和图像质量变化,在脊柱X线成像上使用改良的Stoke强直性脊柱炎脊柱评分(mSASSS)手动分级结构变化是昂贵和耗时的。在这项研究中,我们通过原型设计一个名为VertXGradeNet的两步自动分级管道来解决这一挑战,以自动预测X射线脊柱成像中颈椎和腰椎单位(VU)的mSASSS评分。VertXGradeNet利用由我们先前开发的VU提取流水线(VertXNet)生成的VU作为输入,并基于这些VU预测mSASSS。VertXGradeNet在轴性脊柱炎患者的颈椎侧部和腰椎X射线图像的内部数据集上进行了评价。我们的研究结果表明,VertXGradeNet可以预测每个VU的mSASSS得分时,数据的数量有限和不平衡。总体而言,它可以针对4个不同的mSASSS分数实现0.56和0.51的平衡准确度(即,0、1、2、3的分数)。所提出的方法的准确性显示了简化脊柱X光片读数的潜力,从而降低了未来临床试验的成本。

相关文章
|
6月前
|
机器学习/深度学习 编解码 资源调度
2024年3月的计算机视觉论文推荐
从去年开始,针对LLM的研究成为了大家关注的焦点。但是其实针对于计算机视觉的研究领域也在快速的发展。每周都有计算机视觉领域的创新研究,包括图像识别、视觉模型优化、生成对抗网络(gan)、图像分割、视频分析等。
136 0
|
6月前
|
机器学习/深度学习 自然语言处理 算法
2024年4月计算机视觉论文推荐
四月的计算机视觉研究涵盖多个子领域,包括扩散模型和视觉语言模型。在扩散模型中,Tango 2通过直接偏好优化改进了文本到音频生成,而Ctrl-Adapter提出了一种有效且通用的框架,用于在图像和视频扩散模型中添加多样控制。视觉语言模型的论文分析了CLIP模型在有限资源下的优化,并探讨了语言引导对低级视觉任务的鲁棒性。图像生成与编辑领域关注3D感知和高质量图像编辑,而视频理解与生成则涉及实时视频转游戏环境和文本引导的剪贴画动画。
142 0
|
5月前
|
编解码 机器人 测试技术
2024年6月计算机视觉论文推荐:扩散模型、视觉语言模型、视频生成等
6月还有一周就要结束了,我们今天来总结2024年6月上半月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展。
137 8
|
6月前
|
编解码 边缘计算 自然语言处理
2024年5月计算机视觉论文推荐:包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题
五月发布的计算机视觉领域重要论文涵盖了扩散模型、视觉语言模型、图像生成与编辑及目标检测。亮点包括:1) Dual3D提出双模式推理策略,实现高效文本到3D图像生成;2) CAT3D利用多视图扩散模型创建3D场景,仅需少量图像;3) Hunyuan-DiT是多分辨率的中文理解扩散Transformer,可用于多模态对话和图像生成;4) 通过潜在扩散模型从EEG数据重建自然主义音乐,展示复杂音频重建潜力。此外,还有关于视觉语言模型和图像编辑的创新工作,如BlobGEN用于合成具有控制性的图像。
236 3
|
机器学习/深度学习 算法 计算机视觉
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 14 日论文合集)
【计算机视觉 | 图像分割】arxiv 计算机视觉关于图像分割的学术速递(8 月 14 日论文合集)
|
机器学习/深度学习 算法 数据可视化
【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 14 日论文合集)
【计算机视觉 | 图像分类】arxiv 计算机视觉关于图像分类的学术速递(8 月 14 日论文合集)
|
6月前
|
机器学习/深度学习 计算机视觉
AIGC核心技术——计算机视觉(CV)预训练大模型
【1月更文挑战第13天】AIGC核心技术——计算机视觉(CV)预训练大模型
606 3
AIGC核心技术——计算机视觉(CV)预训练大模型
|
11月前
|
机器学习/深度学习 PyTorch 算法框架/工具
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
Azure 机器学习 - 使用 ONNX 对来自 AutoML 的计算机视觉模型进行预测
121 0
|
2月前
|
人工智能 测试技术 API
AI计算机视觉笔记二十 九:yolov10竹签模型,自动数竹签
本文介绍了如何在AutoDL平台上搭建YOLOv10环境并进行竹签检测与计数。首先从官网下载YOLOv10源码并创建虚拟环境,安装依赖库。接着通过官方模型测试环境是否正常工作。然后下载自定义数据集并配置`mycoco128.yaml`文件,使用`yolo detect train`命令或Python代码进行训练。最后,通过命令行或API调用测试训练结果,并展示竹签计数功能。如需转载,请注明原文出处。
|
2月前
|
人工智能 测试技术 PyTorch
AI计算机视觉笔记二十四:YOLOP 训练+测试+模型评估
本文介绍了通过正点原子的ATK-3568了解并实现YOLOP(You Only Look Once for Panoptic Driving Perception)的过程,包括训练、测试、转换为ONNX格式及在ONNX Runtime上的部署。YOLOP由华中科技大学团队于2021年发布,可在Jetson TX2上达到23FPS,实现了目标检测、可行驶区域分割和车道线检测的多任务学习。文章详细记录了环境搭建、训练数据准备、模型转换和测试等步骤,并解决了ONNX转换过程中的问题。

热门文章

最新文章