高通量基因测序在药物研发和靶向治疗中的应用(一)

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 高通量基因测序在药物研发和靶向治疗中的应用(一)

生命科学和智能计算峰会-高通量基因测序在药物研发和靶向治疗中的应用(一)

嘉宾信息

谷红仓 圣庭医疗联合创始人兼首席科学家

高通量基因测序在药物研发和靶向治疗中的应用(一)


内容介绍

一、 高通量测序技术(NGS背景介绍)

二、 高通量测序技术(NGS)在药物研发上的应用

非常高兴,跟大家分享我的一些工作,我是做基因测序的,我是从87年就开始做,做了三十几年了,也经过了一代二代三代,我刚才很多专家讲了个计算方面的,我从对前端和最后端是怎么产生的,对数据怎么应用进行讲解。

 

一、高通量测序技术(NGS背景介绍)

给大家介绍一下背景,在最早都做的是是低通量,低铜量的测序

的历史,可以追溯到1944年,最初的在也是在1994年,我们可以发现是异物质。

 

1、基因测序简史

image.png

在1953年的时候,发现定义的双结构就是分子学的诞生,在七七年的时候,发现序的方法,当时叫一序,大家可以看到我们国家的发展,刚刚开始高考,我们和国际的水平差距还是蛮大的,1987年的时候,我是大学刚刚毕业的时候,一代程序开始生产。九零年的时候,在美国有一批科学家,当然包括我自己的在美国的老板,他们就是要做人类基因测序计划,计划还是非常宏伟的。测序长度很短的,一般就在500个b,费用加起来做了十几年,每年30十亿美元。2003年的时候,计划换成刚才个推标,就是我们国家的1999年开始参加人类基因测序计划,我们国家也是在样的国内的条件下贡献了1%,这是一个非常了不起的贡献,是告诉我们,我们自己的团队当时为基因测序计划贡献了35%。为什么说有奖金计划,是人力基因计划测序的一个营销,它的巨大的商业价值,所以好多公司重要做程序,前前后后的20年的时间,有大约十几家公司做程序,现在在市场份额最大的就是这家公司。

我自己是从零六年以后在哈佛工作以后就开始做程序,负责雅化的程序一直做到2000年,下边我列的所有的,这些我自己都用过。另外一个的点是我们国家在弯道超车做得非常非常好,为什么叫弯道超车?2009年的时候,大家看到黄色的标记的就是一个公司金融,他的公司做推出来测序,但是到一三年公司运行不下来了,这时候怎么办?他们没破产的时候,我们华大的一帮人就把公司买下来了,花了2000万美元,后来华大在一些进行一系列的优化,最终到一八年推出来,现在我们华大顺序和几乎在各个层面质量通量非常接近,但是有一个优点,我们国家通过工程方面比较厉害的地方,我们会把一些非常贵的东西做成甲。

 

2、2001年至2021年测序费用比较

image.png

现在我们预算越来越低,从2001年到2021年的费用的比较大家可以看到,在2000 2001年的时候,费用是一万美金,到07年的时候,是100美元,到21年的时候,就一美分,对应的是当时是一个人的基金主。对应的,2001年的是一亿美金,是很少没有做到,到2007年的时候,因为有二代社区,第一个二代序推出以后,降到了100万美金,大家可以看到我箭头指的。

我们的支付,序列当时事给他换了100美金,到2001年的时候,在美国,结果它是1000美金。其实我们费用要远远远比他多,不比他少。

 

3、测序技术在生命科学的应用

image.png

另外,刚才也讲了可能是21世纪,发展最快最快的技术,为什么讲了最快的技术?大家看到中心法,刚才好好多专家也提到中心法。从dna是我们是可以做的,也是可以设的。另外在我们可以通过dna通过遗传通过,也可以推蛋白,定义程序技术在生命科学各个层面都照顾到了,所以这也是他为什么是最热门的技术。

 

4、NGS测序

image.png

首先是做基因测序的行业,大家看,从我本人,做前面s库,刚才讲依赖二代就打成很小的片段,下就拆很多,所以这也是程序的费用降低速度加快的一个很重要的原因。问题来了,因为下数据量太大,传统的做生物的人,根本处理不了看,大家可以看到声分析流程数据下来以后,经过后期的处理影像文件是非常大的,转成文件,不停的转,经过一系列,才能进行分析。但在我的右边,我左边图大家可以看到,假如说我们要数据,它数据量非常大的,它是250字节,这是数据量非常大,但是初步的一个计算,因为它经过刚我讲了不同的一些流程,一步一步的去产生累积一些好的数据。所以说,如果不单纯的自己建服务器的方式去做的话,是很难满足需求的。

 

5、生物信息分析中面临的关键挑战

因为有还有一个问题,一般现在无论企业或者是高校,他们程序一般都不自己上,为什么不自己上,因为自己的量太小,序量太小,成本非常高,所以一般都是一大的公司去做,这样就费用非常非常低。问题来了,数据怎么传输?刚才我讲了一个程序的激活,是250兆字节,你怎么把数据传输传输过去?一个基因,数量一次非常多,两万个基因包括这种数据量是非常大的,如果不安全的数据存储出来,如何进数据进行分析,尤其是做进行测序行业的一个比较大的一个挑战。


6、关键挑战的解决方案

image.png

原来是有自己的服务器,我们最初的样本量比较少,后来样本量越来越多,样本量多了以后,服务器的不停的更新,存储更丰富,但是还是不能满足,到后来就是也有返回,我们对企业对于病人做的数据是需要保存若干年的,又一个问题,我们必须得保证我们这些病人的信息存放多年,我们的服务器必须不出任何问题,如果像发生火灾,地震这些这些情况,这样就是对我们是是一个致命的打击。所以我们是希望跟这些像阿里云合作,把我们的数据放到上面,这样就完全没问题,我们刚才讲了,们的数据量是非常大的,我们自己对我的服务器的计算,影响影响进度还是非常大的,通过这种上计算以后,大大提高我们计算的速度。

另外,我们自己比较心安,因为我们数据比较安全了。


7、NGS检测产品——肿瘤检测主导市场

刚才讲了,前端做实验的数据分析,后端的基金程序这些结果经过沟通量的计算,计算以后具体做什么用的,

现在是最常用的4个场景。

第一个就是说肿瘤的基检测,另外慢进行的检测还有产前产前诊断,母婴诊断;还有一个是健康基因管理,这可能有些人比较熟悉,通过行检站可以推出你人是酒量是到底的高是低;另外因为我们主要是做肿瘤检测,大家可以看到,为什么肿瘤是个冷门,因为在肿瘤范围,研究投入力量最大,研究它的相对比较透彻,这样就发现,通过这种大量数据的计算,28000人的计算,各个不同的60个不同的肿瘤,大家发现研究发现的就是几乎每种肿瘤都有突变,这种就是将来要研发的重点了,有的是可以要的,但是有些是没法做。

 

8、肿瘤靶向药物作用机制导图

 image.png

肿瘤靶向治疗目前是,也就是这五年时间,已经非常成熟了,大家可以看到通过对各个不同的基因的我表上列的些有些基因的重排重,这对应的药物都有了,而且简单就是说在这些药物不作用的机理研究也是比较比较明确了,这些都是在在肿瘤医院,中科医院肿瘤科每天发生的事,他通过行检测然发现的,医生就根据这些突片给病人开药方。

在目前,因为在肿瘤检测是在一八年的一一个统计,大家可以看到,在肿瘤医院2018年的情况下,也有75%的医生都在我们基检测,进行开药,就是现在数据应该更高,我们国内也要超过数据,这时75%瘤医生,无论是欧盟,美国还是中国,我们都是种沟通序然进行检测,这通过这种沟通技术,已经用到临床,而且临床上的这种指南非常详细,怎么产生数据,怎么分析,,怎么保存数据报告。

 

9、NGS技术知道临床肿瘤精准用药

另外主要是三个层面,一个治疗的一些竞争选择;另外,是因为已经有好多抗种类的药物,通过发现这些,过退序,医生就可以看出对应的靶药,效果传统的化疗效果要好得多,另外还一个免疫治疗也也是可以通过不稳定,对人用药,把另外还可以进行分析肿瘤病人医疗效果好不好,也是可以通过的方式来来进行预估的。

我有个一个例子,刚才讲了肺癌示例,对他信号通路常见的突变研究的也比较透彻,对应的药物也是有了很多,而且还有很多业务在开发的路上。

 

10、NGS助力携带EGFR突变的非小细胞肺癌患者的治疗

 image.png

另外刚才我讲了,治疗前治疗后,肿瘤的基因的突变,它并不是一成不变的,在用药一段时间以后,可能就改变了,这样只有中国进行序进行重新分析,才能找到到底哪个驱动生改变。

 

11、肿瘤用药NGS检测三大方向之免疫治疗

刚讲的种药免疫治疗,这几年就是比较火,为什么比较火?有好多就化疗药副作用,也是比较大,效果不是特别明显。但是,有的肿瘤病,的确就是能治愈的,通过肿瘤病人的自身的免疫力,和程序有什么关系。在肿瘤有些病人突变特别特别多的时候,用这种免疫比传统的化疗效果要有好的多。

 

12、结直肠癌——基因检测/临床用药

 

 

image.png

 

刚讲了免疫治疗,另外就是我看可以通过这种高通程序的方式。可以看到这图,癌症我国发病率应该排前三的,通过对它高度突变的类型,可以有一些对应的药物,这样每个病人可以提供的精准治疗。

 

13、NGS是新兴的MRD检测方法,肿瘤疗效预测和复发检测利器

 

image.png

 

另外在肿瘤检测比较火的是,是一个叫环肿瘤dna,因为肿瘤胞肿瘤生长的过程中,它的细胞会进行破碎。

这些肿瘤会进到血液系统中,但我们通过人的外周学,检测有没有这种,从而可以坚持对病人的治疗的效果。大家可以看到,通过这种的监测的方式,它能达到缓解就并延长在肿瘤靶药应用。

相关文章
|
Oracle 架构师 Java
Java 22 新增利器: 使用 Java Stream Gather 优雅地处理流中的状态
本文中我们分析了 什么 是 “流”,对比了 Java 上几种常见的 “流”库,引入和详细介绍了 Java 22 中的 Stream Gather API 。同时也简单分享了利用虚拟线程 如何简化 Stream map Concurrent操作符的实现。希望抛砖引玉和大家分享新的特性,共同进步。同时也希望大家都可以升级到新版本的 JDK,更好的赋能业务。
|
存储 弹性计算 关系型数据库
5 分钟玩转 OceanBase 社区版 Docker 部署
## 简介 本文是个人把 OceanBase 社区版 3.1 做了一个 Docker 镜像,仅用于学习研究。只要你有一个 4C10G的笔记本可以联公网,你就可以在5分钟内将 OceanBase 社区版跑起来。 OceanBase 社区版是今年 6月1日开源的,只兼容 MySQL,可以理解为分布式的MySQL。其核心功能跟内部业务在用的OceanBase 企业版基本一致。核心功能包含:**多副
3951 0
5 分钟玩转 OceanBase 社区版 Docker 部署
|
4月前
|
运维 安全 持续交付
Dockerfile中小型企业实战指南
本文档旨在为中小企业提供一份 实用、易懂 的 Dockerfile 实践指南。我们深知中小企业在技术标准化、快速迭代和资源有效利用方面的需求,因此本教程将涵盖从基础概念到进阶实战的多层次 Docker 镜像构建方法,重点关注如何在有限资源下,通过规范的 Dockerfile 来提升开发、测试和部署效率。无论您是初学者还是有一定经验的开发者、运维人员,都能从中获益,快速掌握不同场景下的镜像制作和优化技巧,最终构建出 安全、高效、轻量且易于维护 的容器镜像。
188 8
|
6月前
|
数据挖掘 API 数据安全/隐私保护
淘宝商品评论API接口全攻略
淘宝商品评论API接口为电商从业者提供重要数据支持,帮助分析商品评价和舆情。通过淘宝开放平台或第三方数据服务提供商可获取该接口。使用时需注册账号、创建应用并获取密钥。调用流程包括参数准备、签名生成、发送请求及处理响应。Python示例代码展示了具体实现方法。注意事项包括频率限制、数据更新和安全性。 简要步骤: 1. **淘宝开放平台**:注册账号、入驻、创建应用、获取密钥。 2. **第三方服务**:选择准确、稳定且价格合理的提供商。 3. **接口调用**:准备参数、生成签名、发送请求、解析响应。 4. **注意事项**:遵守频率限制,确保数据安全与及时更新。
245 28
|
9月前
|
机器学习/深度学习 人工智能 搜索推荐
《基因测序新视界:人工智能的关键赋能》
基因测序是解密生命密码的关键技术,开启了疾病诊断与个性化医疗的新纪元。然而,随着数据量的爆炸式增长,传统分析方法难以应对。人工智能(AI)凭借强大的模式识别和数据处理能力,在基因测序数据分析中崭露头角。AI不仅提高了疾病诊断的准确性和效率,还在药物研发、基因调控网络构建等领域发挥了重要作用。通过AI,研究人员能快速筛选药物靶点、预测药物反应,并揭示基因间的复杂调控机制。此外,AI在群体遗传学和进化生物学中的应用也取得了显著进展。尽管面临数据隐私和模型可解释性等挑战,AI已成为推动基因测序分析发展的关键力量,为人类健康和生命科学带来革命性变化。
316 18
|
传感器 编解码 供应链
禾赛张伟:激光雷达路线之争,已初见分晓
禾赛张伟:激光雷达路线之争,已初见分晓
296 0
禾赛张伟:激光雷达路线之争,已初见分晓
|
算法 搜索推荐 开发者
解锁Python代码的速度之谜:性能瓶颈分析与优化实践
探索Python性能优化,关注解释器开销、GIL、数据结构选择及I/O操作。使用cProfile和line_profiler定位瓶颈,通过Cython减少解释器影响,多进程避开GIL,优化算法与数据结构,以及借助asyncio提升I/O效率。通过精准优化,Python可应对高性能计算挑战。【6月更文挑战第15天】
1946 1
|
机器学习/深度学习 数据采集 传感器
机器学习实战 —— 工业蒸汽量预测(二)
机器学习实战 —— 工业蒸汽量预测(二)
194 1
|
缓存 安全 Java
Shiro框架的知识点一网打尽,生命不息,学习不止
Shiro框架的知识点一网打尽,生命不息,学习不止
203 0

热门文章

最新文章