中国的新锐公司和IT巨头希望将中国的人工智能能力转化为世界领先的药物创新,他们是否比西方企业更有优势?
中国的研究人员正在积极的探索以AI技术为基础的新药发现新范式。就在上个月,三个中国企业筹集了巨额资金,以推动其AI药物发现计划。Insilico Medicine是一家总部设在香港的公司,其全球业务的一半在上海,筹集了2.55亿美元,以推动其人工智能发现的候选药物进入临床试验,并开发新算法以寻找新靶标。此前,北京StoneWise在4月筹集了1亿美元,总部位于深圳的XtalP在去年9月筹集了3.19亿美元。(声明:此处无任何商业宣传,仅转述原文)
腾讯、百度和字节跳动等IT巨头也一直在将其强大的人工智能能力赋能于药物设计。凭借一项旨在实现人工智能占主导地位的雄心勃勃的国家战略、庞大的人工智能研究人员人才库、大量可供合作的合同研究组织(CRO)以及不断发展的健康数据隐私保护,中国的人工智能公司已准备好在全球竞争中更快、更便宜地制造更多药物。但是,即使14亿人口能够提供丰富的数据,使中国的人工智能公司比西方同行领先,但对于用于训练公司算法的临床前和临床数据的质量仍有疑问。
Insilico Medicine的创始人兼首席执行官Alex说:"如果你来到这里,看到正在发生的事情,它会给你留下深刻印象。创新工场是一家位于北京的风险投资公司,主要投资人工智能公司,其首席执行官李开复也同意:"中国确实有建立药物发现系统的先进能力。
但中国的人工智能药物发现公司是后来者。过去十年中,像Atomwise、BenevolentAI(伦敦)、Exscientia(牛津)、Relay Therapeutics和Numerate这样的公司正在与跨国制药公司达成大交易。甚至现在与中国有关的两家最著名的人工智能药物设计公司-Insilico Medicine和XtalPi都是2014年在美国成立的。当时,中国的人工智能药物研究几乎没有得到任何牵引力。XtalPi联合创始人马健说:"当他在2015年第一次回到中国,并开始与中国的制药公司交谈时,很明显,他们中的大多数人对人工智能在药物研发中的应用不感兴趣或没有做好准备。
然而,从那时起情况发生了迅速变化。AlphaGo在2016年和2017年战胜了人类顶尖的围棋选手,让业界关注到人工智能的潜力,在许多中国年轻人的心目中是一条通往成功的道路。第二年,中国政府推出了一个雄心勃勃的战略,以使中国在2030年前成为全球人工智能的领导者,这导致了新的大学培养计划等。
工智能代表了一种跨越式发展的方式。
中国的研究人员响应了这一号召。在一场 "风暴 "中,计算机科学家、物理学家、数学家和传统药物发现研究人员推出了50多家人工智能药物发现公司,张健说,他在上海交通大学领导一个分子设计实验室,并与少数人工智能药物设计初创公司合作。
中国人口众多,医院规模庞大,因此很容易收集大量数据集--这是训练人工智能的关键。在中国,人们对隐私的担忧也较少,意味着数据更容易获取。Lee说,美国的人工智能公司尤其受到法规的阻碍,例如1996年的《Health Insurance Portability and Accountability Act》,该法案规定了如何共享电子健康记录的标准。Lee说,HIPAA使得即使在患者同意的情况下,也很难将数据汇集起来。Lee说,尽管中国政府即将对那些出售泄露个人数据的人进行严厉的处罚,但像医渡云这样将得到同意的病人数据汇集到研究工具中的公司正在出现,以确保这些数据可以被访问。他们在美国的同行--Flatiron Health、Tempus、Aetion和Palantir也同样在大规模地整合现实世界的电子健康记录数据,以用于药物发现。
但许多数据的质量很差,这可能会误导人工智能。"数据质量是绝对的关键。大多数从事药物发现的中国公司没有高质量的数据用于训练。”( Ye Tao)
中国强大的人工智能研究人员队伍(包括从美国和欧洲回国的人员), 在百度、阿里巴巴和腾讯从事工业研究的资深人士,以及在支持中国长期人工智能战略的新政府项目下接受培训的人员,这应该使中国的人工智能行业具有竞争优势。根据斯坦福大学最近的一份报告,在全球人工智能研究论文中,以中国为基地的研究人员占总数的22.4%,而欧洲为16.4%,美国为14.6%。去年,来自中国的人工智能论文首次获得了比美国论文更多的引用。中国仍然缺乏取得根本性突破的科学家,由前1%的论文代表(特别是高引用率的会议论文),Lee说。"当涉及到真正的最具创造性的发散性思维者时,美国仍然领先。
但这对于药物发现来说可能并不重要。中国公司可以修补基于人工智能的算法(其中大部分是在美国、加拿大或欧洲开发的),因为它们通常是开源的,可以公开访问。NUTSHELL(中国)的Yu:"你改变几个字就能改变整个概念,你可以找到一种方法来解决你的问题。"The science is from there [the West], but the technology is from here."
Lee 说,中国人工智能药物发现的方法也可能更加务实,这可能给了中国一个优势。DeepMind 是谷歌的子公司,通过解决几十年前的蛋白质折叠让研究人员感到震惊,但中国公司“非常擅长将人工智能转化,用人工智能创造价值和构建新产品。
Nature | AlphaFold预测98.5%人类蛋白结构,科学研究新范式
让子弹飞 | 院士深度解析Alphafold DB的未来影响
然而,对人工智能的兴趣和机会的爆炸式增长推高了工资,并且难以留住专业知人士。Alex说,中国顶尖的人工智能专家的成本高于美国,而且往往会四处流动。Insilico 主要聘请中国大陆以外的人工智能专家。Insilico 的研究从生物假说和新生物靶点的识别延伸到候选分子的生成和测试,主要聘请中国大陆以外的人工智能专家,在后期化学设计和分子合成方面更依赖中国。
Alex说,中国有大量的CRO(总共约3000家)公司,这也许是中国的人工智能药物发现公司最吸引人的地方。Insilico正与其中80家公司合作。这使该公司能够避免与学术机构合作所带来的时间和知识产权的损失。它还允许在开发管线中的多个CRO公司平行运行多个实验。Alex说,比较结果 "对人工智能来说是一个巨大的学习经验"。中国有大量的实验室可以以合理的成本进行所有实验或同时并行,唯一能做到的地方就是中国。”
与其他地方一样,中国人工智能药物设计的成功将取决于其候选药物是否在临床上取得成功,这是人工智能设计的药物尚未实现的。新墨西哥大学的计算生物学家 Tudor Oprea 说:“有很多炒作,很多人试图向你推销根本不存在的东西。” “The proof of the pudding is in the eating. So you don’t really know until it’s on the market.”
腾讯、百度和字节跳动进入人工智能药物发现领域,将为中国的努力增添分量。2020 年 7 月,腾讯推出了自己的人工智能驱动药物设计平台 iDrug。它已经启动了十多个项目,包括寻找对抗冠状病毒的药物。该公司计划涵盖临床前研究、预测蛋白质结构、筛选候选药物、设计和优化分子以及表征蛋白质功能的整个领域。
Lee表示:这些 IT 巨头将扮演中国版的谷歌,生产像 DeepMind 这样的大型机器,可以解决蛋白质折叠等问题,这些问题需要比小型初创公司更多的计算能力。“所以现在有了一些更务实、更快速赚钱的小而灵活的公司,然后是大巨头。所以这是一个很好的分工。
虽然中美之间存在一些良性竞争,但许多研究人员更担心当前的政治紧张局势可能会损害两国在这个新兴领域的协同效应。中国人工智能药物设计的大部分投资来自美国,而有影响力的人工智能会议论文的作者中有三分之一在中国接受教育,但大部分在美国工作。Lee说:“所以他真的希望医疗保健或药物发现不会成为这种脱钩谈话的一部分,因为这项研究完全是为了人类的利益。