生命科学和智能计算峰会-AI制药工业落地的痛点与前进方向(一)
嘉宾信息
潘麓蓉 圆壹智慧创始人兼CEO
AI制药工业落地的痛点与前进方向(一)
内容介绍
一、 The Drug Discovery Process
二、 What is AI?
三、Computational Drug Discovery Approaches
四、Computational Drug Discovery Approaches
五、Computational Complexity Conventional Physics Based Modeling Technology vs. AI Deep Learning
六、Computational Cost Studies AliCloud
七、How can machine learning and other AI technology help Drug Discovery
八、Core Scientific Challenges in AI Drug Discovery
九、Ainnocence’s Solution,From tools to whole system Superior Data Source,Higher Efficiency,Better Accuracy
十、Ainnocence’s Global Launch and Partnership
下面说下我个人,还有我过去的经历,跟阿里合作的一些渊源,当时第一次合作的时候,大概是2018年,当时正好和这边在创立阿里云的科研超算平台,与此同时,我在参与图的个人工智能平台。当时这个时代,所有的开源的,学术的软件全部在阿里云上做了一个系统性的测试,去找到一些这种工业场景,希望能够真的把这些这种在科研上的方法论转化到工业实验当中,在过去,四五年的时间里面,也在之前的平台上,像郭博士时介绍的科研机构,新冠过程当中有非常多的配合,逐步的计算技术跟生命科学的交叉领域技术逐步的从一个学术推广到工业的一个过程。
我是去年创立的原智慧这家公司,也是希望把生命科学跟计算的信息技术高度的,深度的结合,不管是从工业的能效的提高,最终的制药的最终节点,临床节点的分子设计的效果提供突破,甚至说是超越专家经验一些问题的突破,在工业上进行更广泛的一个实践,我创立了一个原慧公司,但过程当中跟云计算,是有非常多的渊源的。
我第一次使用云计算进行科研,计算已经大概是2014年的时候,当时是美国亚马逊首先推出了的一个科研计算的平台,当时我在美国的一家医学机构,做计算生物学研究,这个时候就定量的,已经计算出来最节省的方法使用云,而不是自己搭建自己的超算系统进行推动科研。
基本上从个时候一个比较坚定的个云计算未来的科研,就在新冠过程当中,也基本上就展现出通过云的一个平台,能够实现大效果,跨地域的一个合作。
非常抱歉,我今天课件都是英文的,大部分材料都是英文的,但是我会用中文给大家解释一下。我主要讲的题目是,AI制药工业落地的痛点与前进方向,整个的技术领域在欧美的药企以及学术机构已经迭代了三四十年的时间了,有非常多的已经前人采购。实际上,在中国的创新要有的一个,零到一的过程当中,实际上是可以借鉴的,能够更高效的,更快速的方法能够跟国际先进水平有一个的结合。
我大概从几个方面,跟同事讨论一下,首先我我会大概的介绍一下药的背景以及a i技术真正的属于系统性的ai技术到是什么样的一个学科背景,以及应该怎么样去利用整个制药里面从转化医学到化学一直到最终的临床的实验的过程。
当所有数据以及对数据的标记,清洗和创新过程当中,怎么去推动数据ai的这种这种模式,都会进行一些介绍。
最后也会讲一些,从学科层面的可张博跟郭博也都提到一些,最后讲一下在现在最先进的基于ai的的方法论下面,怎么能有一些更高效的手段实现的一个对生命科学的最精准的,计算效率最优的一个预测的手段。
一、The Drug Discovery Process
首先,说大部分人是没有参与过全程的,的一个行业专家来说,实际上,可能每个人都是在制药的每一个环节里面有过很深深度的理解。但说美国实际上是一个全球的行业标准,小分子为例的话,从识别,发现,优化,以及到最终的,每一步它都有非常成熟的方法论。筛选到优化的实验平台和理论渠道,以及这种监管的标准,但是实际上整个的系统它的数字化程度是非常低的,可以说制药行业是所有行业里面数字化程度最低的一个行业。我自己的见解,是实际上就从宏观的去看的整个流程,它实际上是一个说非常清晰的一个过程,每个过程里面它都有非常标准的语数,也说它实际上是一个可建模的系统,它涉及到从转化医学,一直到的具体的说的这种,产生的各种化学相关的数据,到临床的数据,以及到监管的数据,医保的数据,临床采样和体外采样的各种信号数据,都是有不同的机构和人员来负责的。
在的情况下,制药工业你要真的在系统上提效,只有两个方法,第一个方法是你需要把整个系统做一个重新的提议。第二个你需要在过去的历史数据当中去掉杂音,找到信号,把最先进的方法论取代过去的一些过去的方法论。因为生命科学是一个每天都在进步的科学,它不像物理,物理,化学,数学基本基本上100年前理论已经奠定了。
刚才可能都介绍过,实际上简单的一个流程,从最初的一个大规模筛选去确定的一个靶向性,一直到的多维度的成效性的优化吸收分布,代谢清楚以及各种系统毒性,一直到最后的漏斗到最后一个漏斗,要做多少实验,就决定了你最终的系统效率,过程当中说传统来说的话,基本上是两万个分子,新合成的分子为起点,从如果是盲衰的话,基本上是200万个分子作为一个起点,最后摘到一个分子,如果说能够打通分步骤的话,能不能从100分子就到一个分子,基本上它的整个的行业的和时间点就会到个提升整个行业。这个筛选流程引用了非常多年了,但在过去十年,基本上的投产出比在逐年的下降,现在说怎么样突破筛选过程,不管是按照过去的方法介入计算,还还是把计算重新的定一个新的流程,需要去考虑的问题。
什么是ai?我觉得大家再提到ai制药或者是整个ai+的概念的时候,实际上并没有明确的定义什么样才是一个严格意义。Ai还是一个半计算技术,说一个计算工具,因为工具跟ai之间实际上有很大区别的工具是需要人去用的,但是ai是自己可以优化自己,自己可以实现一个人体的目的,但不需要人去帮助实现目的,它实际上在最初的学科定里面,50年代大家就已经非常明确的了。
你需要像人一样思考,也有类似这图测试的一些测试去到底是不是一个ai。
二、What is AI?
现在的整个技术已经可以过渡到自优化的过程,但是最难的地方是怎么去定义给的,目的是什么?在制道的问题上,给的目的是优化一个选择性,还是说优化一个整体的体内药效?
还是说优化一个最终的适用的变成群体,它完全不同的。但是如果你给予足够的数据,实际上它都是可以通过自己的办法,可能是一个黑箱,也可能是基于经验,但一定是能够达到个节点的,最终人需要做的两件事情,首先要明确够给的是什么,第二个是需要知道你得给什么样的数据和规则,让实现够需要有一个宏观的对这件整个建模的一个理解。
人工智能本身它也是一个交叉学科的,的一个学科,它也是涉及到从最微观的化学,生物化学,细胞生物学到独立学,生理学都需要的一个多尺度的学科的信息。