病例之外:信息可视化对于提高个人及公共健康的贡献-阿里云开发者社区

开发者社区> 大数据文摘> 正文
登录阅读全文

病例之外:信息可视化对于提高个人及公共健康的贡献

简介:

#大数据文摘很荣幸的邀请到医疗专栏作者,纽约西奈山医学院教授、临床基因检测信息部主任陈荣与各位读者分享。陈荣博士将在本周六(6月4日)大数据文摘“未来医疗与大数据”微信群中与各位见面并分享相关研究,回答大家的疑问。欢迎扫描文末二维码报名进群参与讨论。具体分享内容见今日二条。


 ◆ 


一个逻辑学家不需亲眼看到或听说过大西洋或尼亚加拉大瀑布,凭一滴水就能推测出它们存在的可能性。因此,所有的生命形成一根巨大的链条, 一旦我们看到其中的一环,整根链条的特性就能了然于心。


 --夏洛特•福尔摩斯   出自亚瑟·柯南·道尔爵士的《血字的研究》


【导读】1854年的夏天,浓重的恶臭笼罩着伦敦。瘴气从城市的屠宰场,污水池,工厂和无数其它污秽处飘来, 在大街小巷肆意弥漫。这时,恶性霍乱暴发,突袭宽街(Broad Street,位于伦敦中心——译者注),许多人认为这污秽的空气是罪魁祸首 。然而麻醉师约翰•斯诺(John Snow)并不这样想,他认为污水是传染源。他绘制了一张地图,显示出病例地点以及最接近的水泵,他用此图说服官员,拆去水泵的手柄(居民无法在此取水),后来传染病就消退了。虽然实际的故事远比这要复杂的多,但却成为了一个经典的例子,用以说明视觉呈现在帮助追踪和阻止致命性流行病方面发挥的能力。

0?wx_fmt=png

约翰•斯诺霍乱地图的局部


斯诺的创意性方法是用纸和墨体现的,而今数字化是媒介的主流。新兴的数字数据采集和可视化工具在医学界从疾病跟踪到医生决策,有着很广泛的应用。从显微镜到核磁共振成像(MRIs )再到流行病学检测,医学界最重要工具中的部分拓展了临床医生和研究人员从不同层面服务病人和大众的能力。


本文将从不同角度,从个体病例到全球人口,探讨医疗数据可视化的项目,以及如何挖掘和展现这些数据背后隐藏的极其重要的模型。


医疗信息,一目了然

画家不是要画他所看到的, 而是画他要让别人看到的。

 ——埃德加•德加(Edgar Degas)


随着我们收集的医疗信息越来越多,新兴的数据可视化技术可以帮助我们分析理解这些数据。美国国家医学图书馆的迈克尔•阿克曼,通过与可视化人体项目的合作,帮助创建了一个非常详细的数字化人体成像。这种直接呈现极其有用, 它使得可视解剖数字人体成为可能,并提出新的洞见。但是阿克曼曾写道 :“数据可视化更多的是以视觉隐喻说明问题而不是直接呈现”。捕捉和传递生活的无形面和抽象面,“传统意义上来讲属于艺术家的工作范畴,但是利用数据视觉化展示潜在的模型和关系,比如用来展示药物之间的交叉反应,这也成为了一种艺术,现今可以推进医疗科学的进程。”



用统计方法分析大量的不记名电子病历为推进医学研究提供了巨大动力。 阿克曼说:“所有医疗记录埋藏着巨大的财富。”但是只有当医疗记录的 相互操作性大幅提高,人们才有可能意识到它们的真正价值。


在他对生命线(LifeLines,病历可视化技术——译者注)的描述中提到, 一个互动式的可视化工具能够让医疗工作者有兴趣去挖掘多重医疗记录背后的数据模型和趋势,马里兰大学人机交互实验室的创始人本•施奈德曼(Ben Shneiderman)写道,只有当访问医疗信息的用户界面(UIs)设计得好, 所有为解决技术问题和政策挑战的努力才会获得成功。“长长的滚动列表,笨拙的搜索,繁琐的菜单和冗长的对话框会导致失去用户。”



然而,他也认为“精心的设计会使得快速访问关键数据成为可能,而总结、过滤并呈现大量信息的技术则正在被提升。通常来讲,当医生和其他医护人员刚开始接触信息可视化系统就很感兴趣。可是,他们需要花一点时间和改变思考方式来适应新的系统。一旦他们适应了,便会对可能性倍感兴奋。”


0?wx_fmt=png

生命线(LifeLines2)应用程序


【Lifelines2是王大卫(David Wang)作为研究论文开发的,由马里兰大学(University of Maryland)人机交互实验室(Human-Computer Interaction Lab)的凯瑟琳·普莱桑特(Catherine Plaisant)和本·施奈德曼(Ben Shneiderman)指导的,参见www.cs.umd.edu/hcil/lifelines2。】


吃药后,看过这些直方图,就可以安心入睡到天明


“医学”是一门不确定的科学和有关概率的艺术。

——威廉·奥斯勒爵士(Sir William Osler)


数据可视化的应用可以改善药物追踪和决策支持。雷根斯基夫研究所(Regenstrief Institute,位于美国印第安纳波利斯,隶属于印第安那大学医学院的非营利性研究机构——译者注)的研究员乔恩•杜克(Jon Duke)说:“ 网络上有很多很好的病人资源,但医生对在此浪费时间和一系列特别需求的容忍度非常低。”


他一直在开发一种称为Rxplore的可视化工具,用来帮助服用多种药物的患者减少药物的副作用或发生交叉反应的风险。在繁忙的医院里,分秒必争。评估单一药物潜在影响所需要的时间都相当紧张。对于同时服用10 或15 种甚至更多种药物的病人,忙碌的医务工作者更难分析药物的副作用,交叉相互作用以及禁忌情况。杜克说,“我负责照顾很多老年患者,他们自己很难追踪他们自己所服用的所有药物。这可以变得很复杂。”然而这个问题并非老年患者独有,早产儿和患有慢性疾病的儿童,他们的医疗方案里也有可能涉及大量的药物。


0?wx_fmt=png

杜克指出,目前的药物信息资源浏览有一些限制。一次只能看到一种药物详情, 而且数据呈现在密集的文本和表格里,难以查阅。曾经有过简化数据以方便扫描的尝试,但这个简化过程可能会遗漏重要的信息。“对于那些做出这种努力的医生来说,通常没有一个显然的方式来综合这些信息并做出决策。”


世界何处有病痛?


来自InSTEDD(InSTEDD, Innovative Support to Emergencies, Diseases and Disasters,中文大意为危机、疾病以及灾难创意预警系统——译者注)的Nicolas di Tada 说“疾病无政治边界”。 InSTEDD是一个非政府组织,致力于创造性地解决全球健康问题,如流感和生物恐怖主义。InSTEDD为公众健康、应急反应和环境问题提供技术工具和平台。此外,在其它方面,di Tada说他们目前正在东南亚与当地的公共医疗工作者一道,为疾病早期诊断开发可视化方法。


InSTEDD借助数据可视化来确定报道的病例数是否属实。Di Tada指出:“我们正在努力想办法来解释:临近的不同城市报告了非常不同的疾病暴发的数字。”例如:“为什么一个地区疟疾的发病率比附近另一个地区高得多?”Di Tada说,按照约翰•斯诺(伦敦霍乱绘图者)的传统理论,病例在地图上的可视化可以提供有关疫情源头的线索,以及其地理性的联系。然而,寻找疫情源头或暴发点却是一项艰巨的挑战。他认为,关键是要能够看到问题是否出在一个城市的实际报告中,或者问题确实是由一种特定的水或食物的供应造成的。


0?wx_fmt=png


Di Tada认为,灵活性思维在他的工作中是必不可少的。他补充说:“我们尽量保持一个开放的心态,尽量不因循守旧,只因恰好有一把锤子,就把眼前的东西看成是钉子。我们有一套自己适应的和逐步形成的的工具,如果第三方工具更合适,我们就会使用,并且如果需要新的东西, 我们从头开始构建它。”


约翰·布朗斯坦(John Brownstein)和哈佛 - 麻省理工学院卫生科学与技术部(Harvard-MIT Division of Health Sciences and Technology) 参与了健康地图项目,该项目为传染病暴发提供了全球视图。他说,学术界中,人们对于融合地理信息系统(Geospatial Information System,简称GIS——译者注)与公共卫生数据并将其可视化的兴趣和训练逐渐增加。“健康地图中真正的一个问题是,我们试图在一张图上绘制不同尺度的东西。”他补充说:“我们如何让人们专注于数据最显著的方面,并平衡不同技术水平用户群对于数据呈现的需求?这中间有很多取舍。”


0?wx_fmt=png


999岁的病人


阅读健康类书籍时要小心,否则你可能死于错误印刷。

——马克·吐温(Mark Twain)


本·施奈德曼(Ben Shneiderman )认为:“直到最近,医疗组织才意识到他们大部分的数据集是有错误的。借助于可视化,有时可以让我们看到潜在的危险错误和遗漏之处。


他被邀请审查一些医院的数据,当他在Spotfire(一个数据可视化应用程序)中挂上数据时,他发现有三名病人被列为999岁。如果没发现,这些错误可能已经扭曲了从这些数据中得到的信息。


施奈德曼说:“当进行合适的可视化时,数据集的问题就会‘蹦出来’ 。如果单纯是为了清洗数据, 是值得进行数据可视化的。”


0?wx_fmt=png


将大型复杂的医疗数据集迁移到可视化工具中会有很多挑战。乔恩·杜克(Jon Duke)指出:“将整个医疗方案呈现在一张图中并不总是漂亮整洁的。如何选择其中一部分,并将其转化成定量的数据?真的要根据问题来选择匹配的可视化方式。”


有数据才有发言权


这一切是什么意思,福尔摩斯先生?

哦,我没有数据。我不知道。

               ——夏洛特•福尔摩斯 《铜山毛榉案》


谷歌首席健康策略师罗尼·蔡格尔(Roni Zeiger)说,“得到数据中信息的启发和引导是非常重要的。”他举了个例子说,谷歌流感趋势的案例研究中一个简单的图形捕捉到了一个“非常有趣的故事”。通过分析与流感相关的搜索请求数据,谷歌追踪疾病的传播能力与采用传统的疾病监测方法的疾病控制中心和预防中心(CDC)一样有效,且速度更快。 “因为与CDC收集临床数据相比,我们更容易收集搜索数据,在时间上有一到两周的优势。”从简单到复杂,或许可视化可以帮助评估、解释、并显示使用各种抽象模型进行数据挖掘的有效性。


0?wx_fmt=png

蔡格尔说:“令人兴奋的是,越来越多的公共健康数据正在可供被进行各种各样的可视化。”这种趋势可能会促进良性循环。 例如,如果类似于美国卫生和公众服务部(United States Department of Health and Human Services ;HHS)的机构发布更多的研究报告,同时允许数据可视化社区使用并将其可视化,以展现出其真实价值,蔡格尔认为,这将鼓励公共服务部和其它机构提供更多的数据为大家所用。“


作为一个典型例子,(美国)国家医学院和公众服务部发布了关于社区、医院和疗养院的数据以供下载。作为一个示范项目,谷歌使用Fusion Tables(一种可以进行可视化和共享结构化数据的数据库服务)来整合这些信息。最终的结果是一个混搭网站,它显示了“昂贵”和“实惠”医院的位置,从而可以帮助医疗保健消费者做出更好的决策。


这个世界充满了明显的事情,但却没人留意 。

              ——夏洛特•福尔摩斯 《巴斯克维尔猎犬》


本·施奈德曼说:“数据可视化工具可能需要一种从可用性的角度来评估的方法。这些工具可以改变人们思考问题的方式。在研究过程中,你必须重新制定你的策略。”

原文发布时间为:2016-06-03

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据文摘
使用钉钉扫一扫加入圈子
+ 订阅

官方博客
官网链接