云上的精准医疗——公有云、私有云案例分析和比较

简介: 在2016杭州云栖大会第二日,北京中科晶云科技有限公司云平台产品总监卜德超在基因计算专场分享了《抗击:大数据分析助力遗传病肿瘤精准医疗》,他简要介绍了精准医疗,并且通过两个案例分别介绍了中科晶云在公有云和私有云上针对不同场景的解决方案。

在2016杭州云栖大会第二日,北京中科晶云科技有限公司云平台产品总监卜德超在基因计算专场分享了《抗击:大数据分析助力遗传病肿瘤精准医疗》,他简要介绍了精准医疗,并且通过两个案例分别介绍了中科晶云在公有云和私有云上针对不同场景的解决方案

以下内容根据演讲PPT及现场分享整理。


 精准医疗时代

医药学领域从来不缺乏大数据,基于二代测序技术的基因检测大数据时代已经来临。精准医疗的短期目标是加强精准医疗在肿瘤、遗传病诊断治疗上的应用。精准医疗的长期目标是创建一个融合参与者、有责任的数据共享以及隐私保护的新型研究模型,挖掘疾病新的规律、发现新的诊疗模式。

痛点及难点

ae946a0a08024ebed7316b4985a98ba2ef71ba3b

精准医疗进行得如火如荼,其中测序已经不再是问题,目前最关键的问题是数据的解读和分析。针对上述问题中科晶云构建了云平台。

6c05db80aa0dc6b8c71b596a90b860652ad9b89f

如上图所示,细分为两个应用场景。单基因遗传病采用了公有云平台,肿瘤伴随诊断一体机采用的是私有云平台,因为一体机直接连接了测序仪,所以只能采用私有云模式。

单基因遗传病云平台

d1c35f42eb27031beb6b03173614e1b178cb437e

单基因遗传病是指只要一个基因异常就可以导致遗传病。单基因遗传病是如何检测出来的呢?往往是一个患者有各种的表型,导致临床难以诊断出来,但是通过基因测序可以找到其致病位点。这种方式反应了基因和疾病的关联关系,只有这种关系准确才能保证找出来的致病位点准确。针对这种案例,晶云平台采取了两个步骤:变异鉴定,变异解读。从用户的角度,主要通过数据上传、变异鉴定、变异解读、分析报告四个步骤完成解读。

数据上传

7ef683e6f454b08640a099642f63018cf580651f

使用了阿里的OSS,速度稳定可靠,支持断点续传等技术。

变异鉴定

ceb96a9c26f53337c9a68fde726373bc28172783

主要分为三种鉴定方式:单核苷酸变异(SNV)、插入缺失变异(INDEL)、拷贝数变异(CNV)。由于计算得到的结果有complex或者mnp的现象,所以鉴定之后需要有一个校正的过程来获得一个更准确的结果。阿里提供了一个很好的批量计算的能力——BCS服务,晶云利用BCS服务能够很快的将系统构建到云端,万核级的并行,不用再担心业务吞吐的限制。最终云端的分析速度达到了:全基因组测序数据,10亿Reads,100G数据在24小时内完成;全外显子测序数据,1亿Reads,10G数据大约5个小时完成;靶向测序数据,4 M Reads,330M数据大约14分钟完成。

变异解读

afca456e417ee8a93ea4df4ce26e429b2b951698

变异解读最关键的是需要具备基因和疾病相关的知识库,单基因遗传病最重要的是OMIM数据库。为了能让医学更好的介入变异解读,将OMIM数据库超过五千条单基因遗传病及其表型进行汉化,构建了中文的语义分词检索的算法。同时,将遗传规律做了细分,加上了可能常显、可能常隐两种规律。因为很多基因遗传病刚开始并不知道其遗传方式,OMIM只拥有五千多基因的数据库,而人类有两万多的基因,有些我们不知道的基因同样可能致病。

6eb04becc5ef3381bf3fe165b5260766ee8b9bc8

基于上下文的信息,构建了实现Reads可视化的浏览器。黄色部分是变异,白色部分是缺失的情况,从这个图我们可以直观地看到Reads传达的信息。那么,怎么在1000亿的数据中查出想要的信息?晶云采用了阿里的OTS进行了实现。OTS是分布式的表格存储,能很快的从大量数据中检索出想要的信息,精准获得想要区间的Reads信息。

分析报告

报告分为三个梯度:与患者表型相符的结果;与遗传方式明确的疾病相符的结果;与遗传方式不明确的疾病相符的结果。

晶锐肿瘤伴随诊断私有云平台

7fadd97f48c2428d7b1bd1b8febbb74509f84ba6

晶锐TM专用一体机与测序仪会有一个直连,然后经过两个关键的环节(找驱动基因、根据驱动基因获得推荐的治疗方式)。在底层,做了数据存储、计算、解读、传输、隐私等方面的管理。

81ff1ea3e189a354c80c6aaffd11b09eb2f5aff5

一体机模块如上图所示。最底层是云存储和计算,其上方是NGS数据分析模块、基因型和疾病型模块。右边是管理性的,包括API、数据管理、可视化。

e48b3cee8cb5e5ee9ef5fe1e705409b7b648cfef

私有云也是可以伸缩的。最简单的情况,可以把这七项服务都布在一个节点上,相当于一台集成的服务器。每个服务也可以进行扩充,比如左下角的生物信息服务可以不断增加运算节点。右边是文献存储的API,包括API和Web。

一体机有4个特色:易、准、快、可定制。

“易”是指自动抓取,一键操作。易是直连测序仪的目的,省去了数据传输的时间,防止传输过程中可能出现的数据丢失问题以及一些不稳定的情况。晶锐与PGM Server建立安全数据交换通道,每隔5分钟扫描并下载测序仪新产生数据,当其检测到这批数据已经产生并且不再变化时,就会同步过来并且启动数据分析。

“准”是指专属流程、严格质控,主要体现在挑选致病基因的过程中,这是肿瘤伴随诊断中非常重要的一点。只有致病基因挑选准确,之后的药物推荐才能可靠。晶锐使用一代测序和QPCR对模型进行了验证。

“快”对于肿瘤诊断不是一个很大的问题,因为肿瘤相关的基因一般是十几个基因到一百多个基因之间,而且数据量差别并不是很大。一个批次32例肿瘤、17基因测序下机数据运行时间小于1个小时。

3218bbc0f17807aa5b2cf805a5ef67b1a0ba6d97

“可定制”是指多种Panel选择、自定义hotspot、本地知识库。由于晶锐使用的是私有云部署的方式,所以可以做一个很大的扩充,具体的扩充方式如上图所示。
相关文章
|
2月前
|
消息中间件 运维 监控
基于SaaS云部署、云计算的区域医院云HIS系统源码(运维管理+运营管理+综合监管)
医院云his系统采用主流成熟技术开发,B/S架构,软件结构简洁、代码规范易阅读,SaaS应用,全浏览器访问,前后端分离,多服务协同,服务可拆分,功能易扩展。多医院统一登录患者主索引建立、主数据管理,统一对外接口管理。
84 1
|
存储 监控 安全
《互联网业务出海安全合规解决方案》|学习笔记
快速学习《互联网业务出海安全合规解决方案》
478 0
|
存储 缓存 运维
企业上云方案:阿里云企业六大通用场景为企业提供多场景、一站式上云服务
阿里云为企业提供企业上云、企业初创必备、数字营销、企业办公、企业安全、企业数据六大上云场景、一站式上云服务(解决方案),为企业提供多场景、一站式上云服务,满足企业各个发展阶段的软硬件需求,助力您的事业腾飞!
619 1
企业上云方案:阿里云企业六大通用场景为企业提供多场景、一站式上云服务
|
人工智能 运维 Prometheus
鼎茂科技和阿里云完成产品集成认证,深度发力云上智能运维建设
近日,鼎茂科技旗下智能运维AIOps平台与阿里云旗下可观测套件ACOS产品,经过严格测试程序,完成了产品集成认证,这是继阿里云云原生加速器生态合作后,双方在云上智能运维领域的深度产品化合作。
213 0
鼎茂科技和阿里云完成产品集成认证,深度发力云上智能运维建设
|
人工智能 运维 监控
助力企业提升运维效率 蚂蚁数科发布业务智能可观测平台
蚂蚁数科发布业务智能可观测平台 可助力企业提升运维效率3倍以上
273 0
助力企业提升运维效率 蚂蚁数科发布业务智能可观测平台
|
弹性计算 编解码 人工智能
阿里云发布企业云原生IT成本治理方案:五大能力加速企业 FinOps 进程
阿里云企业云原生 IT 成本治理方案助力企业落地企业 IT 成本治理的理念、工具与流程,让企业在云原生化的过程中可以数字化地实现企业 IT 成本管理与优化,成为 FinOps 领域的践行者与领先者。
811 0
阿里云发布企业云原生IT成本治理方案:五大能力加速企业 FinOps 进程
|
弹性计算 人工智能 Cloud Native
阿里云首家通过《可信云·云成本优化工具能力要求》评估,云原生企业 IT 成本治理方案助力企业 FinOps 落地
5 月 19 日,由中国信息通信研究院(以下简称“中国信通院”)和中国通信标准化协会联合主办的“2022 云管和云网大会”通过线上直播的形式成功召开。会上发布了《可信云•云成本优化工具能力要求 - 第1部分 原生工具》标准及首批评测结果。
阿里云首家通过《可信云·云成本优化工具能力要求》评估,云原生企业 IT 成本治理方案助力企业 FinOps 落地
|
存储 Cloud Native 关系型数据库
金融数据智能峰会 | 数据规模爆炸性增长,企业如何进行精准决策?云原生数据仓库数据化运营实战分享
在日前的2021阿里云金融数据智能峰会——《云原生驱动数智化运营的“增长黑马”》专场上,阿里云数据库资深技术专家魏闯先 从数据价值链路角度切入,为大家解读云原生数据仓库如何支撑数据化运营、全链路营销和阿里集团双11业务,并展示金融客户最佳实践案例和应用场景。本文内容根据演讲录音及PPT整理而成。
612 0
金融数据智能峰会 | 数据规模爆炸性增长,企业如何进行精准决策?云原生数据仓库数据化运营实战分享
|
机器学习/深度学习 安全 算法
重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障
DataTrust(隐私增强计算产品)是基于阿里云底层多项基础安全能力,经过阿里云数据中台丰富的客户业务实践,构建的一款为企业数据安全流通的产品。
2272 0
重磅发布 阿里云数据中台全新产品DataTrust聚焦企业数据安全保障
|
人工智能 运维 监控
阿里云混合云管理平台 企业上云的智能指挥官
日前,业界知名科技媒体2020年度奖项评选结果纷纷出炉!继阿里云混合云(Alibaba Cloud Hybrid Cloud)斩获由IT168、ITPUB主办2020年度技术卓越奖之后,阿里云混合云管理平台(Apsara Uni-manager)荣获了由至顶传媒推出的中国企业级IT领域权威奖项“2020年度凌云奖”之年度云平台奖。
2161 0
阿里云混合云管理平台 企业上云的智能指挥官