机器学习,流式 IoT 和医疗设备互联

简介: 机器学习,流式 IoT 和医疗设备互联

现如今,IoT数据,实时流式数据分析(streaming analytics),机器学习以及分布式计算的组合相比之前有了长足的进步,同时成本也比以前要低,这使得我们可以更快地完成更多数据的存储及分析。


image.png


这里列举一些IoT,大数据以及机器学习协同完成任务的例子:


  • 医疗保健:对慢性疾病的持续监控
  • 智慧城市:交通流量和拥堵的管理疏导
  • 制造业:结构优化以及预测建筑是否需要保养维护
  • 运输业:路径规划,减少燃油消耗
  • 汽车:无人驾驶汽车
  • 电信,信息传输:异常检查
  • 零售:基于位置的广告推荐


要理解IoT,流式数据和机器学习结合为什么可以提升医疗保健的效果,首先应当了解慢性疾病——如心脏病等是人类的主要疾病,人们的大部分医疗费用都是用在其上,而其中的关键是如何做好慢性疾病的护理以避免慢性病人不必要的住院。利用机器学习可以使用更便宜的传感器监控重要的生命体征,让医生更快地根据患者的病情开出更智能的药方,这一模式在低成本实现可扩展的慢性疾病管理上也具有着一定潜力。


image.png


斯坦福大学的一个研究小组的结果表明机器学习模型可以比专家更好地从心电图(EKG)中识别出心率失常。


image.png


正如麦肯锡全球研究所的Michael Chui所说:“放置在患者身上的传感器可以实现远程实时监控以提供早期预警,从而避免慢性疾病的突发和昂贵的护理费用。而单单对充血性心力衰竭更好的护理就可能为美国减少每年10亿美元的费用开销。”


监控数据可以进行实时分析并在必要时向护理人员发送警报以便他们可以即时了解病人情况的变化。低的误报率以及对真正的突发情况发出异常警报都是必不可少的;在UCSF的一名病人就是因为服用了超出常规剂量39倍的抗生素而死去。超量39倍的警告和超量1%的警告看起来是完全一样的,以至于看到了太多次警告的医生和药剂师常常不会看警告内容。


本文中我们将讨论流式机器学习在心脏监控数据异常检测上的应用,通过这个例子来展示数字医疗技术到底是怎样应用的。我们将细致讨论如何通过技术来控制触发警报的准确率从而降低误报率。关于这个应用的细节,可以从这里下载pdf文档查看,这项应用是基于 Ted Dunning 和 Ellen Friedman 编写的Practical Machine Learning: A New Look At Anomaly Detection。


image.png


什么是机器学习?


机器学习通过算法在数据中发现相应的模式(find patterns)并建模来识别这些模式(recognize patterns),从而在新的数据上进行预测(predict)。


image.png


什么是异常检测?


异常检测是无监督学习方法的一个实例。


无监督学习算法并不需要预先获得样本的类别或者目标值。它通常用于在输入数据中寻找到其中的规律以及数据之间的相似之处——比方说可以通过用户的消费数据对相似的顾客进行分组。


image.png


异常检测首先会建立起正常体征的模式/群组,然后将观测到的体征与之进行对比,如果确定两者之间存在明显的偏差,就可以发出警报。在这个方法之下,我们最初并没有我们想要分类的异常状况下心脏状况的数据集。所以我们首先查阅文献寻找偏差值并对它进行近乎实时的评估。


通过聚类构建模型


心脏病专家已经定义了正常心电图的波形模式;我们利用这些模式来训练模型根据之前观测到的心跳活动来预测后续时刻的观测值并与实际值进行比较来评估异常行为。


为了对正常的心跳行为进行建模,我们处理提取了一份心电图并将它拆分为大约1/3秒的片段(数据是从某一特定的病人或者许多患者中的一组提取得到的,片段与片段之间存在重叠),随后通过聚类算法来对相似的波形进行分组。


image.png


image.png

聚类算法可以对数据集中出现的数据进行分组。聚类算法训练完成后可以通过分析输入样本之间的相似度从而将样本归类到相应的类别下。K-means聚类算法会将观测值分为K组,每个观测值属于哪一个组取决于样本距离哪一个聚类中心的距离最短。


image.png


在下面的Apache Spark代码中,我们完成了一下工作:


  • 将心电图数据转化为向量。
  • 创建K-means对象并设置聚类的个数以及聚类算法训练的最大迭代次数。
  • 在输入数据上训练模型。
  • 保存模型以备随后使用。


image.png


通过以上步骤,我们得到了一系列聚类中心图像构成的目录(catalog),我们可以用它来重建(reconstruct)一个心电图的数据,判断它与我们目录中的哪一个心电图波形最为相似。


image.png


利用正常数据得到的模型对实时流数据进行处理


image.png


为了将获得的真实心电图数据与上一步建模得到的正常心跳行为进行比较,当心跳波形到达左图中的绿色波形中的重叠区域时,我们可以获得与之匹配的正常波形,如中间的红色波形所示,将两段红色波形进行叠加就可以得到与左侧绿色波形相似的正常心电图波形。(为了从重叠的波形片当中重建波形,我们乘了一个基于正弦的窗函数)


image.png


在下面的Apache Spark代码当中,我们完成了以下步骤:


  • 使用DStream的foreachRDD方法来处理DStream中的每一个RDD。
  • 将心电图数据解析为向量。
  • 利用聚类模型得到当前时间窗中波形对应的正常波形类别。
  • 用当前获得的类别id,32个实际心电图观测点以及32个重建得到的心电图数据点创建信息。
  • 将增强的信息传递给另一个MapR-ES topic

image.png


在实时的仪表盘中展示实际观测的心电图以及重建得到的正常心电图波形


我们使用了用于构建交互式时间驱动的微服务工具包Vert.x来构建实时的web应用展示观测到的心电图波形和重建的正常心电图数据。在这个web应用当中:


  • Vert.x Kafka客户端消费来自MapR-ES topic的增强心电图数据并将在Vert.x的event bus上进行消息推送。
  • JavaScript浏览器客户端订阅Vert.x 的event bus,使用SockJS来展示观测到的心电图波形(绿色)以及重建的预期波形(红色)。


image.png


异常检测


观测的心电图波形和预期的心电图波形之间的差值(绿色波形减去红色波形)即重建误差,也叫残差(对应下方的黄色波形),如果残差很大,那么可能出现了异常。


image.png


异常检测的目标是在保证低的误报率的同时发现真正的问题;这里的挑战是如何确定触发警报的残差阈值。


T-digest算法可以基于数据集的分布来评估重建误差的大小。将这个算法加入到异常检测的工作流之后你可以将警报的数目设定为全体观测值的一定百分比。T-digist算法可以用适量的样本非常精准地估计出它的分布(尤其是长尾分布,这也是我们通常关注的异常值的分布)。在得到分布的估计之后,就可以设定产生警报的阈值了。比方说,设定阈值为99%时每100次重建大约就有一次警报,这会产生相对多的警报(根据异常的定义,它应当是少见的)。而设置为99.9%时,基本1000次重建才会出现一次警报。


image.png


总结


这篇文章介绍了流式系统如何利用输入的心脏监控数据进行异常检测,展示了数据如何通过一个自编码器模型与后续的上下文数据进行比对从而检测出异常的心跳数据。本文也是IoT,实时流式数据,机器学习和数据可视化以及警报场景相结合提升医护人员工作效率并降低维护成本的一个实例。


在IoT的不同场景下,要求企业对数据进行收集、汇总,了解整个设备群从而理解其中会发生的事件和情况。除此之外,根据MapR的 Jack Norris所说,企业也应当对边界事件注入智能以便他们可以更快地对这些事件作出反应。拥有一个通用的数据结构可以帮助你以相同的方式处理所有的数据,控制数据的访问以及以更快、更高效的方式应用智能算法。




目录
相关文章
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与机器学习在医疗诊断中的应用
【9月更文挑战第32天】随着科技的不断发展,人工智能和机器学习已经在许多领域得到了广泛应用。在医疗领域,它们正在改变着医生和患者的生活。通过分析大量的医疗数据,AI可以帮助医生更准确地诊断疾病,预测患者的病情发展,并提供个性化的治疗方案。本文将探讨人工智能和机器学习在医疗诊断中的具体应用,包括图像识别、自然语言处理和预测分析等方面。我们还将讨论AI技术面临的挑战和未来的发展趋势。
|
2月前
|
机器学习/深度学习 数据采集 算法
机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用
医疗诊断是医学的核心,其准确性和效率至关重要。本文探讨了机器学习在医疗诊断中的前沿应用,包括神经网络、决策树和支持向量机等方法,及其在医学影像、疾病预测和基因数据分析中的具体应用。文章还讨论了Python在构建机器学习模型中的作用,面临的挑战及应对策略,并展望了未来的发展趋势。
169 1
|
3月前
|
机器学习/深度学习 数据采集 自然语言处理
【机器学习】大模型驱动下的医疗诊断应用
摘要: 随着科技的不断发展,机器学习在医疗领域的应用日益广泛。特别是在大模型的驱动下,机器学习为医疗诊断带来了革命性的变化。本文详细探讨了机器学习在医疗诊断中的应用,包括疾病预测、图像识别、基因分析等方面,并结合实际案例进行分析。同时,还展示了部分相关的代码示例,以更好地理解其工作原理。
126 3
【机器学习】大模型驱动下的医疗诊断应用
|
3月前
|
机器学习/深度学习 安全 算法
机器学习【医疗领域及其药品搭建】
机器学习【医疗领域及其药品搭建】
79 9
|
3月前
|
机器学习/深度学习 人工智能 算法
人工智能与机器学习在医疗诊断中的应用
【10月更文挑战第3天】人工智能与机器学习在医疗诊断中的应用
75 3
|
3月前
|
人工智能 安全 物联网
|
5月前
|
存储 监控 安全
使用IoT设备优化家庭生活的技术探索
【8月更文挑战第4天】IoT设备以其智能化、便捷性和高效性,正逐步成为现代家庭不可或缺的一部分。从智能照明到智能安防,从智能恒温器到智能厨房,再到智能语音助手,这些设备不仅优化了我们的家庭生活,还提升了我们的生活质量和幸福感。随着技术的不断进步和应用场景的不断拓展,我们有理由相信,未来的智能家居将会更加智能、更加人性化,为我们的生活带来更多惊喜和便利。
|
5月前
|
机器学习/深度学习 数据采集 人工智能
机器学习在医疗诊断中的应用:开启智慧医疗新时代
【8月更文挑战第5天】机器学习革新医疗诊断,提升精准度与效率。通过分析医学影像和基因数据,实现疾病早期检测与个性化治疗。在药物研发中,加速候选药物筛选与优化过程。智能化患者管理及智能辅助决策系统进一步增强医疗服务质量。面对数据质量和隐私保护挑战,持续技术创新推动智慧医疗发展。
|
4月前
|
机器学习/深度学习 人工智能 算法
物联网(IoT)就像是一个大型派对,无数的设备都在欢快地交流着信息
【9月更文挑战第4天】在这个万物互联的时代,物联网(IoT)犹如一场盛大的派对,各类设备欢聚一堂。然而,如何让这些设备互相理解并协同工作呢?这就需要机器学习与人工智能的助力。例如,智能空调通过学习你的使用习惯来调节温度,使你更加舒适;智能安防系统则能识别异常行为并及时报警,保障家庭安全。此外,智能农业、交通等领域也因机器学习和人工智能的应用变得更加高效。下面通过一个简单的温度预测代码示例,展示机器学习在物联网中的实际应用,让我们一起感受其强大潜力。
77 0
|
6月前
|
测试技术
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法
【7月更文挑战第8天】北京大学等研究者提出的新方法缓解了大模型如Llama-3-8B在持续预训练时的“稳定性差距”,通过多轮次训练、高质量子语料库选择和数据混合策略,提升性能和效率。在医疗领域,他们将OpenLlama-3B性能提升至40.7%,并创建的Llama-3-Physician模型达到GPT-4级别。尽管取得突破,该方法在其他模型和领域的适用性仍需探索,且持续预训练仍资源密集。[链接: https://arxiv.org/abs/2406.14833]
104 25