生命科学和智能计算峰会-高通量基因测序在药物研发和靶向治疗中的应用(一)
嘉宾信息
谷红仓 圣庭医疗联合创始人兼首席科学家
高通量基因测序在药物研发和靶向治疗中的应用(一)
内容介绍
一、 高通量测序技术(NGS背景介绍)
二、 高通量测序技术(NGS)在药物研发上的应用
非常高兴,跟大家分享我的一些工作,我是做基因测序的,我是从87年就开始做,做了三十几年了,也经过了一代二代三代,我刚才很多专家讲了个计算方面的,我从对前端和最后端是怎么产生的,对数据怎么应用进行讲解。
一、高通量测序技术(NGS背景介绍)
给大家介绍一下背景,在最早都做的是是低通量,低铜量的测序
的历史,可以追溯到1944年,最初的在也是在1994年,我们可以发现是异物质。
1、基因测序简史
在1953年的时候,发现定义的双结构就是分子学的诞生,在七七年的时候,发现序的方法,当时叫一序,大家可以看到我们国家的发展,刚刚开始高考,我们和国际的水平差距还是蛮大的,1987年的时候,我是大学刚刚毕业的时候,一代程序开始生产。九零年的时候,在美国有一批科学家,当然包括我自己的在美国的老板,他们就是要做人类基因测序计划,计划还是非常宏伟的。测序长度很短的,一般就在500个b,费用加起来做了十几年,每年30十亿美元。2003年的时候,计划换成刚才个推标,就是我们国家的1999年开始参加人类基因测序计划,我们国家也是在样的国内的条件下贡献了1%,这是一个非常了不起的贡献,是告诉我们,我们自己的团队当时为基因测序计划贡献了35%。为什么说有奖金计划,是人力基因计划测序的一个营销,它的巨大的商业价值,所以好多公司重要做程序,前前后后的20年的时间,有大约十几家公司做程序,现在在市场份额最大的就是这家公司。
我自己是从零六年以后在哈佛工作以后就开始做程序,负责雅化的程序一直做到2000年,下边我列的所有的,这些我自己都用过。另外一个的点是我们国家在弯道超车做得非常非常好,为什么叫弯道超车?2009年的时候,大家看到黄色的标记的就是一个公司金融,他的公司做推出来测序,但是到一三年公司运行不下来了,这时候怎么办?他们没破产的时候,我们华大的一帮人就把公司买下来了,花了2000万美元,后来华大在一些进行一系列的优化,最终到一八年推出来,现在我们华大顺序和几乎在各个层面质量通量非常接近,但是有一个优点,我们国家通过工程方面比较厉害的地方,我们会把一些非常贵的东西做成甲。
2、2001年至2021年测序费用比较
现在我们预算越来越低,从2001年到2021年的费用的比较大家可以看到,在2000 2001年的时候,费用是一万美金,到07年的时候,是100美元,到21年的时候,就一美分,对应的是当时是一个人的基金主。对应的,2001年的是一亿美金,是很少没有做到,到2007年的时候,因为有二代社区,第一个二代序推出以后,降到了100万美金,大家可以看到我箭头指的。
我们的支付,序列当时事给他换了100美金,到2001年的时候,在美国,结果它是1000美金。其实我们费用要远远远比他多,不比他少。
3、测序技术在生命科学的应用
另外,刚才也讲了可能是21世纪,发展最快最快的技术,为什么讲了最快的技术?大家看到中心法,刚才好好多专家也提到中心法。从dna是我们是可以做的,也是可以设的。另外在我们可以通过dna通过遗传通过,也可以推蛋白,定义程序技术在生命科学各个层面都照顾到了,所以这也是他为什么是最热门的技术。
4、NGS测序
首先是做基因测序的行业,大家看,从我本人,做前面s库,刚才讲依赖二代就打成很小的片段,下就拆很多,所以这也是程序的费用降低速度加快的一个很重要的原因。问题来了,因为下数据量太大,传统的做生物的人,根本处理不了看,大家可以看到声分析流程数据下来以后,经过后期的处理影像文件是非常大的,转成文件,不停的转,经过一系列,才能进行分析。但在我的右边,我左边图大家可以看到,假如说我们要数据,它数据量非常大的,它是250字节,这是数据量非常大,但是初步的一个计算,因为它经过刚我讲了不同的一些流程,一步一步的去产生累积一些好的数据。所以说,如果不单纯的自己建服务器的方式去做的话,是很难满足需求的。
5、生物信息分析中面临的关键挑战
因为有还有一个问题,一般现在无论企业或者是高校,他们程序一般都不自己上,为什么不自己上,因为自己的量太小,序量太小,成本非常高,所以一般都是一大的公司去做,这样就费用非常非常低。问题来了,数据怎么传输?刚才我讲了一个程序的激活,是250兆字节,你怎么把数据传输传输过去?一个基因,数量一次非常多,两万个基因包括这种数据量是非常大的,如果不安全的数据存储出来,如何进数据进行分析,尤其是做进行测序行业的一个比较大的一个挑战。
6、关键挑战的解决方案
原来是有自己的服务器,我们最初的样本量比较少,后来样本量越来越多,样本量多了以后,服务器的不停的更新,存储更丰富,但是还是不能满足,到后来就是也有返回,我们对企业对于病人做的数据是需要保存若干年的,又一个问题,我们必须得保证我们这些病人的信息存放多年,我们的服务器必须不出任何问题,如果像发生火灾,地震这些这些情况,这样就是对我们是是一个致命的打击。所以我们是希望跟这些像阿里云合作,把我们的数据放到上面,这样就完全没问题,我们刚才讲了,们的数据量是非常大的,我们自己对我的服务器的计算,影响影响进度还是非常大的,通过这种上计算以后,大大提高我们计算的速度。
另外,我们自己比较心安,因为我们数据比较安全了。
7、NGS检测产品——肿瘤检测主导市场
刚才讲了,前端做实验的数据分析,后端的基金程序这些结果经过沟通量的计算,计算以后具体做什么用的,
现在是最常用的4个场景。
第一个就是说肿瘤的基检测,另外慢进行的检测还有产前产前诊断,母婴诊断;还有一个是健康基因管理,这可能有些人比较熟悉,通过行检站可以推出你人是酒量是到底的高是低;另外因为我们主要是做肿瘤检测,大家可以看到,为什么肿瘤是个冷门,因为在肿瘤范围,研究投入力量最大,研究它的相对比较透彻,这样就发现,通过这种大量数据的计算,28000人的计算,各个不同的60个不同的肿瘤,大家发现研究发现的就是几乎每种肿瘤都有突变,这种就是将来要研发的重点了,有的是可以要的,但是有些是没法做。
8、肿瘤靶向药物作用机制导图
肿瘤靶向治疗目前是,也就是这五年时间,已经非常成熟了,大家可以看到通过对各个不同的基因的我表上列的些有些基因的重排重,这对应的药物都有了,而且简单就是说在这些药物不作用的机理研究也是比较比较明确了,这些都是在在肿瘤医院,中科医院肿瘤科每天发生的事,他通过行检测然发现的,医生就根据这些突片给病人开药方。
在目前,因为在肿瘤检测是在一八年的一一个统计,大家可以看到,在肿瘤医院2018年的情况下,也有75%的医生都在我们基检测,进行开药,就是现在数据应该更高,我们国内也要超过数据,这时75%瘤医生,无论是欧盟,美国还是中国,我们都是种沟通序然进行检测,这通过这种沟通技术,已经用到临床,而且临床上的这种指南非常详细,怎么产生数据,怎么分析,,怎么保存数据报告。
9、NGS技术知道临床肿瘤精准用药
另外主要是三个层面,一个治疗的一些竞争选择;另外,是因为已经有好多抗种类的药物,通过发现这些,过退序,医生就可以看出对应的靶药,效果传统的化疗效果要好得多,另外还一个免疫治疗也也是可以通过不稳定,对人用药,把另外还可以进行分析肿瘤病人医疗效果好不好,也是可以通过的方式来来进行预估的。
我有个一个例子,刚才讲了肺癌示例,对他信号通路常见的突变研究的也比较透彻,对应的药物也是有了很多,而且还有很多业务在开发的路上。
10、NGS助力携带EGFR突变的非小细胞肺癌患者的治疗
另外刚才我讲了,治疗前治疗后,肿瘤的基因的突变,它并不是一成不变的,在用药一段时间以后,可能就改变了,这样只有中国进行序进行重新分析,才能找到到底哪个驱动生改变。
11、肿瘤用药NGS检测三大方向之免疫治疗
刚讲的种药免疫治疗,这几年就是比较火,为什么比较火?有好多就化疗药副作用,也是比较大,效果不是特别明显。但是,有的肿瘤病,的确就是能治愈的,通过肿瘤病人的自身的免疫力,和程序有什么关系。在肿瘤有些病人突变特别特别多的时候,用这种免疫比传统的化疗效果要有好的多。
12、结直肠癌——基因检测/临床用药
刚讲了免疫治疗,另外就是我看可以通过这种高通程序的方式。可以看到这图,癌症我国发病率应该排前三的,通过对它高度突变的类型,可以有一些对应的药物,这样每个病人可以提供的精准治疗。
13、NGS是新兴的MRD检测方法,肿瘤疗效预测和复发检测利器
另外在肿瘤检测比较火的是,是一个叫环肿瘤dna,因为肿瘤胞肿瘤生长的过程中,它的细胞会进行破碎。
这些肿瘤会进到血液系统中,但我们通过人的外周学,检测有没有这种,从而可以坚持对病人的治疗的效果。大家可以看到,通过这种的监测的方式,它能达到缓解就并延长在肿瘤靶药应用。