数字化、大数据以及人工智能如何引领医学变革

本文涉及的产品
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

数字医疗正在变革我们对疾病的认识,图片来源forbes。

2016年,世界超算大会(International Supercomputing Conference)公布了全球超级计算机排名,中国“神威•太湖之光”首次超越天河二号,成为世界第一的超级计算机,此次中国入围的超级计算机也首次超越美国,一时间这则振奋人心的新闻在朋友圈被刷屏。

人们追求越来越快的计算速度的背后,是我们日益增长的数据。面对如此复杂、庞大以及非结构化的数据,如果没有超级计算机来进行处理,我们很快会被淹没在毫无意义的信息汪洋之中。

2012年,在奥巴马的国情咨文中,大数据被重点提及,吸引了人们的高度关注。尽管大数据的拥趸很多,但对于它的概念,不同的人会有不同的理解。如下为2012年美国国会对大数据的定义:大数据是指多维度、复杂多样的数据,需要先进的技术进行获取、存储、分布、管理以及分析。

大数据很快就进入应用领域,很多公司都在拥抱它带来的数字或信息变革。在数学、物理、生物以及工程等领域,大数据扮演的角色愈发重要。在我们日常生活中,也会产生大量的数据,例如通过手机、智能手环以及其他可穿戴设备,每天都会产生大量的数据。通过对这些数据的分析,未来我们可预测健康或疾病,它将在医疗领域发挥重要作用。

 

大数据如何变革医疗

根据美国麦肯锡的一份报告显示“技术的发展正在变革我们的理解以及疾病的治疗”。2011年,美国医疗健康数据高达150eb,这一数字很快就会达到zb级别甚至yb级别。医疗数据正在快速地积累。

在传统的医生问诊环节中,医生在每一个患者面前的时间可能仅仅只有10分钟左右,但传感器以及移动健康APP能忠实地监控你过去一个月或一整年的健康信息,通过分析这部分大数据,医生很快就能做出趋向于正确的决策。这种基于综合数据获得的判断,准确率要远高于人类医生。美国食品与药品监督管理局(FDA)也向这一领域开绿灯,批准对人体血糖进行监控等相关设备。

尽管每年制药公司在医药研发领域投入巨资,但摆在眼前的是,他们仍无法充分了解我们的疾病以及获取足够多的有价值的信息,如果他们能够获取患者的DNA、蛋白质、代谢途径甚至细胞、组织、器官以及整个人体系统的信息,那么进行个性化治疗将会变得容易许多。当然获取这些数据的前提是,尊重患者的隐私。在未来,患者会携带好自己的医疗或健康大数据,参与到制药公司的药物研发中来,届时药物的研发将会越来越个性化。

通过大数据分析,能够帮助我们更早地发现疾病,并通过已有的数据,分析或预测未来疾病的发展状况。麦肯锡的一份报告显示,通过大数据分析,可每年为美国节约3000亿美元的医疗支出。

大数据将如何变革个人的生活

大数据不仅可用于疾病诊断和个性化治疗,还可应用于日常生活的不同场景,提升个人生活质量以及健康。传统的可穿戴设备,只是获得数据,而在未来通过智能手环或APP,可以为我们提供个性化的运动方案。例如,智能手机运动APP不仅能够记录我们每日行走的路程,同时还可以根据我们身体的健康信息,摄入的卡路里来提示我们每天应该要完成多少运动量才能保持健康。这会是可穿戴设备一个质的提升,可穿戴设备会是未来医疗数据采集的一个重要途径。

 

一款智能的、具有颠覆性的菜谱同样也会带来健康的变革

个人健康指数的上升,意味着我们可以将更少的钱花费在医疗上,这可能是大数据带来的福祉。以健康饮食为例,菜谱APP一直是家庭男女们的最爱,未来当菜谱APP与可穿戴设备结合起来,可根据时令、年龄、性别来提供吃什么食物的建议。它不仅能实时定位我们的地理位置,帮助我们寻找物美价廉的餐厅,同时也能推荐不同餐厅特色的营养菜谱。当我们在可穿戴设备上输入当前的健康指数,如BMI指数、腰臀比、血压、胆固醇指数等数据时,菜谱APP就可为我们提供有价值的、健康的膳食建议。例如,对一个胆固醇高的人,菜谱APP不会向他们推荐动物内脏,如含心、肝等食物,对于糖尿病患者,它也不会向他们推荐含糖量高的食物。它还可以根据身体特征来提供饮食建议,如果近期你的运动量比较大,在后台一直默默工作的菜谱APP根据你的运动量,会为你推荐一些热量比较高的食物,从而让你保持活力。

不过目前,通过现有的可穿戴设备或者移动APP,我们仍难以从中找出个人健康与疾病之间的关联,因为数据分析难以准确构建这些错综复杂的关系。例如,谷歌有一款隐形眼镜,可通过检测眼睛中的泪水,判断身体的血糖等指标,但这一技术目前尚未成熟,仍然属于“华而不实”的技术应用,仍有许多技术鸿沟需要逾越。

连接数据与健康间的鸿沟

数据与健康二者之间有何关系,首先摆在眼前的是:数据计算。传统的计算方法难以处理如此庞大和复杂的数据,这些数据既有实验室产生的数据,也有患者的影像数据以及电子病历数据(electronic patient records ),如何从这些错综复杂的数据中挖掘与健康之间的关联,将会是一个难上加难的问题。这也是本文前面提及为什么人们在追求越来越快的计算速度的原因。

作为互联网搜索引擎的巨头,谷歌和微软积累了庞大的数据,未来我们不仅可以在搜索引擎上获取信息,同时也能够更加精准地寻找到健康信息。利用医疗大数据来诊断疾病,IBM的沃森显然走到了这个领域的前沿。自2011年 Jeopardy!节目出现之后,IBM就将医疗视为未来一个主要发展的方向,目前,IBM已投入10亿美元,将研发团队1/3的成员纳入到这个研究组项目中。

实际上,沃森是一个智能的系统,使用自然语言、机器学习以及实时计算将庞大的、非机构化的数据进行处理,它可以通过经验和指示进行学习,类似人类那样进行思考。研究者通过大量的电子病历数据,甚至是教材中的知识输入,使其成为一个超级疾病诊断工具。

虽然在这一领域,还有微软的Cortana,苹果的Siri以及谷歌的Google Now,但认知计算仍只是初步发展阶段,IBM也是目前唯一一家使用大规模认知计算的公司。由于它们在预测以及疾病诊断上比人类更加具有优势,因此该应用会是医疗大数据未来一个非常具有前景的方向。

上海医疗大数据布局:从样本、队列研究到深度挖掘

上海正在建设具有全球影响力的创新中心,在医疗大数据方面自然也有布局。2013年,上海发布“推进大数据研究与发展三年行动计划”。该计划指出,“在健康信息网已有数据的基础上,汇聚整合医疗、药品、气象和社交网络等大数据资源。”从而形成智能临床诊断模式,自助就医模式等服务模式创新,为“医疗资源配置、流行病跟踪与分析、临床诊疗精细决策、疫情监测及处置”等方面提供帮助。

 

这些行动落实在具体项目上,可归结如下。2006年,上海医联工程就已正式启动,该项目是国内第一个大型跨医院区域医疗信息中心,拥有统一的技术标准,覆盖了上海市34家三级医院以及18个行政区。项目由上海瑞金医院、上海市第六人民医院,儿童医院等单位牵头,围绕高血压、糖尿病、肿瘤、儿童呼吸系统疾病等常见疾病开展大数据研究,并依托交大-耶鲁生物统计联合中心进行医学生物信息挖掘和分析。目前已建成了国内生物样本量最大的医疗健康信息库,拥有9.1亿个处方医嘱,诊疗事件拥有2.1亿,医学影像138Tb,检验报告9000万份。生物样本库以及医学诊断和影像资料是数据驱动医学变革的关键。

另一个大型项目是泰州队列研究,该项目由复旦大学等单位牵头,于2006年北京香山会议上,由陈竺、沈晓明联合发布,旨在通过宏观医学与微观医学的整合,大规模前瞻性队列研究,源源不断地产生有价值的医疗数据。

在医疗数据分析以及深度挖掘上,上海产研院正在筹划建立一个以医生和患者临床治疗体验为驱动,以生物医学大数据分析、知识库体系决策为主导、个性化用药为出口的一体化临床转化服务平台。未来该平台会利用深度学习、生物信息数据分析以及信息挖掘技术,处理医疗大数据。这既是精准医学的一部分,也是数据驱动医疗变革的一次创新。

不过我们必须承认,目前包括IBM在内的数字医疗项目,虽然雄心勃勃,但我们仍很难将大数据变成一个大发现,我们还将面对数据的权属、隐私、保护以及公开等问题。随着IBM的沃森机器人的崛起以及法律制度的健全,相信不久的将来,我们定会连接起医疗信息与疾病之间的鸿沟。


本文作者:纪十

来源:51CTO

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
12天前
|
数据采集 机器学习/深度学习 人工智能
面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布
2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。
|
27天前
|
人工智能 分布式计算 大数据
大数据& AI 产品月刊【2025年3月】
大数据& AI 产品技术月刊【2025年3月】,涵盖双月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
8天前
|
数据采集 机器学习/深度学习 人工智能
数据驱动智能,智能优化数据——大数据与人工智能的双向赋能
数据驱动智能,智能优化数据——大数据与人工智能的双向赋能
55 4
|
4月前
|
机器学习/深度学习 数据采集 人工智能
深入探索人工智能与大数据的融合之路
本文旨在探讨人工智能(AI)与大数据技术如何相互促进,共同推动现代科技的进步。通过分析两者结合的必要性、挑战以及未来趋势,为读者提供一个全面的视角,理解这一领域内的最新发展动态及其对行业的影响。文章不仅回顾了历史背景,还展望了未来可能带来的变革,并提出了几点建议以促进更高效的技术整合。
|
2月前
|
人工智能 DataWorks 大数据
大数据AI一体化开发再加速:DataWorks 支持GPU类型资源
大数据开发治理平台 DataWorks 的Serverless资源组支持GPU资源类型,以免运维、按需付费、弹性伸缩的Serverless架构,将大数据处理与AI开发能力无缝融合。面向大数据&AI协同开发场景,DataWorks提供了交互式开发和分析工具Notebook。开发者在创建个人开发环境时,可以选择GPU类型的资源作为Notebook运行环境,以支持进行高性能的计算工作。本教程将基于开源多模态大模型Qwen2-VL-2B-Instruct,介绍如何使用 DataWorks Notebook及LLaMA Factory训练框架完成文旅领域大模型的构建。
370 24
|
1月前
|
人工智能 分布式计算 DataWorks
大数据& AI 产品月刊【2025年1、2月】
大数据& AI 产品技术月刊【2025年1、2月】,涵盖双月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
2月前
|
人工智能 大数据
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
阿里云云计算ACA、大数据ACA、人工智能ACA三门认证升级调整公告
|
3月前
|
机器学习/深度学习 人工智能 分布式计算
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
我的阿里云社区年度总结报告:Python、人工智能与大数据领域的探索之旅
177 35
|
2月前
|
SQL 人工智能 大数据
【4月重点功能发布】阿里云大数据+ AI 一体化平台
【4月重点功能发布】阿里云大数据+ AI 一体化平台
|
2月前
|
SQL 人工智能 分布式计算
【3月重点功能发布】阿里云大数据+ AI 一体化平台
【3月重点功能发布】阿里云大数据+ AI 一体化平台
下一篇
oss创建bucket