【独家】数据助力罕见病诊疗

简介:

演讲全文:


本次讲座主要分为以下三个方面的内容:


第一,罕见病的定义和理念。


第二,目前诊断治疗现状。


第三,提高罕见病诊断效率的探索。


首先,罕见病容易让大家觉得它是和常见病对立的,是很不常见的疾病,因此便不去关注和重视。但罕见病并不罕见,它并不是医学的名词,其社会含义大于医学含义。最初,罕见病这个名词被提出是源于患者及其家庭以及患者群体的自救自助行为。


目前已知的罕见病有7000种左右,其中80%为遗传性疾病,是由基因极端变异引起的明显的表型异常。罕见病是病因研究的天然模型,可以为很多常见疾病的发病机制和研究提供重要线索。


此外,罕见病离我们并不遥远,我们每个人都携带一些罕见病相关的有害基因突变,尤其是隐性遗传病致病基因突变,这也解释了为什么没有血缘关系的健康父母却生出不正常的孩子。


因此,每个家庭都有出生罕见病婴儿的风险。随着二胎政策的开放,罕见病带来的挑战越来越大,而相应的技术和流程还在发展过程中。




现在,需要让更多的人了解罕见病和公共健康之间的重要关系,真正地连接需要跨越一条河,需要更多的人参与。


首先,通过对出生缺陷、儿童期发病的严重性疾病、常染色体显性疾病、成年期发病的的表型隐匿的疾病数据进行积累及共享整合,可对出生缺陷的预防、孕期筛查、新生儿筛查及携带者筛查起到重要的参考作用。


第二,成年期发病疾病数据的整合对健康人群的疾病风险预测也是非常有用的。


第三、通过推动孤儿药的研发,药物适应症可能扩展到常见疾病。




罕见病的研究将推动了精准医学的发展,疾病谱的细分也对新治疗方法的探索有帮助。




这张模式图展示了目前大多数罕见病患者艰难的就医经历。导诊和诊前流程的缺乏、专业临床资源缺乏、基因检测行业的鱼龙混杂等现象都会让大多数患者的就医停留在ABC三个阶段。


但我们希望,如果有更多的患者能达到DEF模式,经历遗传咨询和医学建议、产前检测,或得到针对性药物的干预,并在后期接受随访注册,就会让更多的患者找到适合他们的治疗途径。




这是我们2009年做的一项探索,我和一些病友建立了中国共济失调病友协会网站,在2015年10月15日至2015年10月29日期间进行了短期的患者登记,调查患者的社会信息和一些医学信息。



从就医和和治疗上我们可以看出,病人辗转就医的过程非常曲折,治疗方法包括康复锻炼、中药、西药等。



就医花费的统计上,有的患者不愿意提供相关信息,收集到的花费数据信息也从5千以下到10万以上分为不同级别,且大部分的支付方式都是自付。




地域分布颜色的深浅代表患病人数的多少。从这张图可以看出,沿海地区就诊的人数更多,颜色浅的地区为中西部地区,可能由于医疗条件和经济水平的问题,就诊的人数较少。




目前罕见病的主要问题还是能否进行明确诊断,大部分疾病尚缺乏针对性治疗,部分疾病的治疗也主要是长期服药、特殊饮食及生活干预,因此门诊依然是罕见病的主要医疗方式。然而我们在诊治时发现,相当多的患者在来到我们医院之前就有过住院的经历,并且接受了一些非必需的、非常规及非精准的过度医疗。




大多数医疗机构的门诊信息碎片化非常严重,医疗资源浪费严重,信息分散、无序。这是一个患者的门诊病历,其中包含着多家医院多位医生的劳动,也包含着患者及其家人多次就医的过程,但是效率很低。



这是我自己的一些体会,信息、技术的群岛缺乏连接和合作,资源严重浪费。医疗资源分散且碎片化;相关技术之间彼此孤立,缺乏整合;医生、检测机构、患者群体、企业、政府部门及科研院校之间缺乏用于信息交流和共享的平台。




很多罕见病都是遗传性疾病,诊断涉及多个环节,每个环节应该精益求精,各个环节需要无缝衔接。医生掌握临床表型,通过分析推断疾病的分类和遗传模式,之后基于知识库和数据库可检索到这类疾病已知的基因缺陷属于哪一类,从而采用不同的基因检测技术进行检测。


然而图中这四个环节之间存在连接的问题,从左至右是细致的表型采集,从右至左则是基因检测的发展和优化应用,二者连接在一起才能进行更好的基因数据解读。这方面目前还很不完善,没有建立很好的流程,是未来的愿景。


后续的环节连接到临床的最后一公里难以实现完全自动化,可以探索机器学习等辅助方式帮助医生高效的收集表型。



其中客观的制约因素主要有:表型信息采集效率的严重滞后,由于医学发展历史的原因,疾病命名、分类的复杂交叉,疾病表型的变异性及各种环境因素影响下患者病程进展的不可控等。此外,基因检测技术虽然在飞速发展,但我们对基因的认识仍然不足。



提高罕见病诊疗效率的探索,首先是对诊断中临床表型的确认,其次就是基因数据和表型数据的对接,随着二代测序技术推广到临床应用,表型尤其是精准表型的确认在遗传病诊断中显得尤为重要。



医生作为临床一线的核心角色,拥有医学专业背景,能真正了解患者的情况,并将其转化成医学语言,这个环节是非常重要的。


此外,在诊断及干预过程中,医生也需要综合各方面的证据,针对不同患者来制定个性化的方案。医生需要通过终生学习来达到转化医学和精准医学的要求,然而医生也是需要支持的,需要能够帮助其获取更多的知识信息、提高工作效率的平台。



细致可靠的临床表型采集对疾病诊断十分重要,基因数据的积累建立参考数据库需要一个过程,同时还需要的能够将各方面的数据整合在一起的平台。在这方面我们也进行了一些探索。



HPO,即人类表型术语集,是标准化的表型,建立者起初从OMIM等数据库进行词汇抓取。



国内大部分医疗和科研工作者所使用的表型没有统一的标准,且表型数据大多数是自然语言,交流很不方便,后期数据挖掘也十分困难。一些数据机构因为没有汉化的HPO词语难以将自己的系统衔接临床,这一点需要突破。



因此,我们成立了CHPO,中文人类表型标准用语联盟,对HPO的词汇进行翻译,并对其词条进行更新,由国内外华人相关专业人士对其进行专业的编辑优化,建立搜索引擎并提供了词库的免费下载。


CHPO是一个逐步完善的过程。




CHPO将一边推广一边完善。



在此过程中,医生的参与尤为重要。目前的状况是医生提供表型信息给检测机构,但是缺乏统一的标准,质量参差不齐,检测机构基于医生提供的信息归纳核心表型,链接CHPO/HPO,进行生物信息分析和致病性评估,最后是基因检测结果的解读。


未来,需要让医生了解CHPO/HPO,在提供表型的时候进行标准化,这一点对于基因检测结果的解读也会十分有帮助。所以,需要把整个流程整合到一起。




流程的整合就是建立连接的过程,包括链接相关的专业人士、连接表型和基因的数据、连接个体数据与数据库。


目前,医生所掌握的患者个体的表型信息与基因数据相比常常是多样的、模糊的,检测机构得到的个体序列变异数量多而意义未名,各种疾病及生物信息数据库也非常多,HPO可以作为三方的接口,让医生与检测机构或科研机构建立共同语言,使医生收集的表型信息与各种数据库信息的描述方式尽可能统一,此外有助于通过表型连接数据库更好地进行基因变异选点分析。




搜索引擎可在输入表型后链接CHPO,输入疾病可链接OMIM和ORPHA;同时,可免费下载词库,现已包含1万多个词条。



目前已有38个项目组和机构申请下载。




另一个探索是在运动障碍和神经遗传病方面。



近20年来,我们通过临床和基因学研究和检测,建立了电子版的资料库,也探索了一些移动医疗模式;目前已经建立数据库,并与第三方检测机构、科研机构合作,并做了很多罕见病公益方面的工作。未来希望三者可以结合起来,整合资源,从而提高效率。




我们的资源库累计了3000多个家系的表型信息DNA样品。




在常染色体显性遗传共济失调方面,我们对基因检测确诊的患者家系数据进行分析可在一定程度上反映中国人SCA分型比例的特征。




运动障碍与神经遗传病数据库是与一脉基因合作开发的,我们希望能够基于门诊进行表型信息的采集,并实现与其他数据库的链接,该数据库已于2015年年底开始试运行。


左边为数据库的导航,包括病史、体格检查、辅助检查和基因数据、拟诊和医嘱等,每个页面包含相应的采集项目,其中基因数据页面希望能够通过授权给检测机构,让他们可以看到患者的表型数据,同时上传基因数据,由医生和检测机构共同出具检测报告。




这张图是我作为医生的梦想,建立一个有序的能将信息数据整合共享的平台。以患者数据为中心,从各个机构获取的患者就诊信息、患者的基因检测数据整合在一个平台上,流程和方式仍需探索,同时患者的个人隐私必须得到保护,数据共享需要建立授权方式。




MSA辅助诊断和聚类分析系统是与清华大学江瑞老师课题组合作的一项工作,选择MSA作为模型疾病的原因主要包括:MSA为神经退行性疾病,且迄今没有针对性的治疗方法;MAS为多因素疾病且具有临床表型多样性和病因异质性;病因复杂,难以进行聚类分析;国内外并无基于表型数据库进行MSA统计的报道。



此研究的目的主要包括辅助诊断和聚类分析。


在研究的策略和技术路线方面,首先拟定了一个数据库的表单,同时通过机器学习对临床病例进行分级诊断,最后是自然语言的处理,希望通过它为模型来实现机器的聚类和观测,将这个流程用于其他疾病的机器学习中,这是我们的愿望,希望在这个过程中得到各位专家和老师的支持。


谢谢!


原文发布时间为:2017-03-24 

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

相关文章
|
数据采集 供应链 安全
【年终特辑】看见科技创新力量 洞见时代创业精神—医疗健康—尊颐智能:智能康复护理设备,精准解决术后者/失能者日常护理难题
【年终特辑】看见科技创新力量 洞见时代创业精神—医疗健康—尊颐智能:智能康复护理设备,精准解决术后者/失能者日常护理难题
161 1
|
机器学习/深度学习 人工智能
基于人工智能的【患肺癌病】风险预测与分析(下)
基于人工智能的【患肺癌病】风险预测与分析
151 0
|
人工智能 数据处理
基于人工智能的【患肺癌病】风险预测与分析(上)
基于人工智能的【患肺癌病】风险预测与分析
207 0
|
算法 大数据
【年终特辑】看见科技创新力量 洞见时代创业精神—医疗健康—天微基因:POCT智能检测终端,一键式填补基层医疗的“信息鸿沟”
【年终特辑】看见科技创新力量 洞见时代创业精神—医疗健康—天微基因:POCT智能检测终端,一键式填补基层医疗的“信息鸿沟”
195 0
程序人生 - 如何区分感冒流感和新冠肺炎?
程序人生 - 如何区分感冒流感和新冠肺炎?
108 0
|
人工智能 算法
年轻人猝死频发,AI应用到心血管疾患筛查还有多远?
刚刚结束的2018年发生了太多的事,但最令人遗憾的还是那些年轻生命的猝然逝去。
年轻人猝死频发,AI应用到心血管疾患筛查还有多远?
|
安全
盘点COVID-19新冠药物和疫苗研发进展
盘点COVID-19新冠药物和疫苗研发进展
153 0
盘点COVID-19新冠药物和疫苗研发进展
|
安全 数据挖掘 C++
迄今最大规模新冠肺炎临床数据:男性病死率是女性3倍多,一人可传染3.77人
迄今最大规模新冠肺炎临床数据:男性病死率是女性3倍多,一人可传染3.77人
281 0
|
人工智能 达摩院 算法
达摩院医疗AI在26家医院上岗,已诊断3万个疑似肺炎病例
达摩院医疗AI已在湖北、上海、广东、江苏等16个省市的26家医院上岗,截至目前,达摩院AI已对3万个临床疑似新冠肺炎病例CT影像进行了诊断,单个病例影像分析可在20秒内完成,准确率达到96%。据介绍,该技术将很快在全国100多家新冠肺炎定点医院完成部署应用。
4254 0
达摩院医疗AI在26家医院上岗,已诊断3万个疑似肺炎病例