“我们不能只把大数据当做技术活儿,更应该让它形成一种文化。让更多老师和专家进入到医院里讲课,把大数据思维渗透到临床一线、科研一线,渗透到管理者的大脑里去。”
在提及大数据和AI对医院的好处时,黄伟红如此说道。
黄伟红现为中南大学湘雅医院"移动医疗"教育部-中国移动联合实验室副主任,该实验室是教育部唯一一个设在医院里的医疗信息化实验室。
雷锋网了解到,实验室成立的目的,主要是为探索交叉学科如何走向科研和技术前沿,以及成果转化。
医院做AI,人最重要,技术次之
黄伟红首先谈到,医疗大数据这件事很大,医工交叉环节中最重要的一点就是人。
“过去我在英国做大学老师时与同行有不少交流,发现真正进入医院接触最原始的数据,是最近两年发生的事。在这个新环境下,医院需要有复合型知识背景的人。既要具备数据技能也要对医疗有认知,更要有跨界思维。现在跨界人才太少,好的医生几乎没有时间去学习更多数据技能,而IT背景的人才也又对医疗认知太少。”
他不断强调到这一点:不管是大数据还是人工智能,成败的关键最终不是技术,而在于人。
“无论人工智能多厉害,首先病理需要标记,而且要标对。标注片子的病理医生,至少得看五万张病理片子后我觉得才合格。”
成功的大数据应用不是指创造一个新技术,而是要把一系列的技术、人员和流程都无缝链接起来,包括数据获取、数据清洗、数据查询、数据分析、数据可视化。有些事系统可以做,但有些事非得人工来做。
黄伟红继续讲到,很多公司都在谈大数据和人工智能。与医疗行业不同,业界互联网公司有一个好处是,即便数据挖掘没做好,他们也不需要对行业和用户承担太多责任,因为结果影响有限。
但医疗机构对大数据和AI这件事非常谨慎。
今年有些许不同,在各种因素的推动下,大家都开始谈大数据。
医疗领域的基因组学和药物研究诞生一批大数据公司,以及中国健康医疗大数据科技发展集团公司、中国健康医疗大数据产业发展集团公司、中国健康医疗大数据股份有限公司的筹建,都是关于大数据的。
小单位与大单位应用AI的现状与不同之处
大数据的浪潮追逐者里有很多小单位和大单位。
从地市级医院和部级医院的角度来谈,这类单位到底对大数据这件事情是什么心态?
“很多小机构都想着跟新技术沾点边,有钱后聘用新的技术官,CIO(首席信息官)也变成了CDO(首席数据官)。一个数据集不够两个凑,最后搞成数据池。”
“每个小单位都说自己会AI,但秀来秀去这几年真没有看出来有啥结果。我们搞计算机的人都知道弄出来的仅仅是BI,这拿出来多不好意思。大机构就不一样了,它们会想流程有什么问题,预算和项目这么大如何管理,涉及到如此多的部门需不需要找试点,实施、审计和财务事项如何解决?总体比较复杂。”
当下大单位对AI的态度,如同前几年面对云计算时类似,更多是观望。
医院信息中心主任真要上“云”的话,还需好好掂量,谁知道会遇到什么问题,实在不行就放在医院本地自己搭建。
在AI问题上,当下国家对数据安全非常重视,国内各大企业与原生数据产生点医院和原生技术公司这三方合作时,医院到底该怎么做?
一次性上?逐渐上?还是等到国家有扶持政策后再上?
一家公司还是几家公司一起做?一个分院做还是整个大院同时做?
黄伟红提出了这些很现实的问题。
大数据不仅是采用某种新技术,同时也是把技术、工作人员、流程都绑定在一起。这些环节中,有些问题是无法避免的,尤其是临床数据质量问题。
“我回国后,最初进入医院时就特别关注数据质量问题,数据获取、数据清洗、数据查询、数据分析、数据可视化,其中很多事情非得人工来做。直到两年后我才觉得部分任务用AI来解决有戏,数据进化在一点点的发生,技术进化的同时也会引出新的篇章,如技术架构层面从MapReduce过度到了Spark。当数据量足够大,可有效与人工智能融合时,ICD-10(国际疾病分类,依据疾病的某些特征,按照规则将疾病分门别类,并用编码的方法来表示的系统。)编码准确性,可能在未来的一段时间里,或许AI可以帮到忙”
“输入ICD-10的事应让医生来做,但不要让医生很忙时还要去记这些编码,病案科的医生很累,让每一个临床科室的医生记住手底下几百号不现实。”
大数据和人工智能是最好的组合,大数据提供管道,应对核心数据的挑战。机器学习提供一种智慧,从数据中提取价值。
“大数据并不单单是数据,更应该是一种文化,希望有更多的老师和专家进入到医院里做讲课宣传,让大数据的思维渗透到临床一线、科研一线,渗透到管理者的脑袋里去。”
湘雅医院在大数据方面的探索
随后,黄伟红介绍了湘雅医院在大数据方面的实践。
从2014年开始,为了提高患者就诊体验与质量、提升医生工作效率和能力、助力医疗改革深化模式升级、孵化重大医疗信息化成果、支撑健康医疗大数据产业应用、提升政府监管与决策水平等目标,湘雅医院投资几个亿开始建设医疗大数据平台。
平台建设随技术发展和社会进步不断演进,设计、实施和运营以学校为主导,统一制定规章制度和推进计划,在保证安全和隐私的前提下开放共享。平台服务对象不仅是普通的医护人员,还包括公共卫生、企业、管理、病友等。
“301医院的老师很认可我们的建设思路,湘雅的大数据平台内部环境互不影响。医院还有前置区,学校的大数据有IDC。”
湘雅医院的医疗大数据平台的数据区域中,学校的大数据平台专注于科研分析,医院的业务库、备份库、安全的服务器对数据进行采集,通过专网放在不同的大数据里面。
当时投入一点几个亿立102个专科,形成多个专病数据集。
湘雅很多专科属于国家级水平,同时拥有25个国家级重点专科,医生水平较高。在大数据方面,在14年左右LIS数据离线的汇聚已经完成,数据的增量每天会发生。
患者信息达1700多万条,药品8万多条,以及近3.7万余人次门(急)诊量。
给AI公司的一句忠告
最后黄伟红总结到,未来云端的战争将会变得愈加白热化,医院也在观望这一两年内三家国家队大数据公司会做成什么样子,现阶段仅仅开始试点。与此同时,大数据初创公司也在逐渐走向成熟,这对医疗行业是重大利好。
对于AI技术提供商,他认为一个公司不可能在多个场景里包打天下,选好并深耕垂直方向才是做好技术的第一步。