如果说这是未来的生物实验室,它似乎与现在的实验室没有多大差别。
里面有身穿白大褂的科学家,还有许多放着冷冻试管的盒子。架子上的化学品——有一瓶瓶的纯酒精、一罐罐的糖、蛋白质和盐——都是培养微生物和操纵它们基因的标准配置。
在听到机器人的声音前,你甚至不会注意到它们的存在:它们就像蟋蟀一样,用低沉的声音为彼此歌唱。
这些机器人都为Zymergen效力,这是一家生物技术公司,2014年搬进位于旧金山湾东岸的这个电子工厂旧址。他们在这里开展微生物实验,寻找各种方式来提高有用化学物的产量。里面有一台机器人名叫Echo(不是亚马逊那个Echo)。在一堆笨重的设备里面,有一个机械手臂抓取了一个塑料孔板,上面放着几百个盛着液体的孔。
一束激光扫描了孔板侧面的条形码,然后由Echo将其放到托盘上。之后的流程十分精细,用肉眼根本无法看清。
“这并不是复制了我手动移液的过程。”该公司联合创始人兼运营和工程副总裁Jed Dean说,他是一位分子生物学家。“而是一种截然不同的方法。”不必使用移液管吸取液体,然后把液体逐一注入每个容量只有细胞那么大的孔里面,机器人整个过程都没有触碰它。相反,它使用了每秒500次的声波脉冲让液体自己震动,形成比手动操作小100倍的液滴。
这些都算不上多么具有未来感。大型生物学实验室多年以前就开始使用机器人和条形码。即便那种名为“声学微滴喷出”的移液技术也已经存在了数十年。
但是,当我向Dean询问这个机器人正在从事什么项目的时候,才真正了解其中的玄机。“我不知道。”他说。他可以轻易得出答案,但这个实验并不是他设计的,而是由电脑程序自动生成的。
“我再说明一下,”Zymergen CEO Joshua Hoffman准备消除我们之间的误解,“这一过程中有人类科学家的参与,他们负责查看结果,并进行事实核查。”但之所以用程序来解读数据、生成假设和规划实验,最终目的还是“摆脱人类的直觉”。
与Zymergen秉承相同目标的公司还有好几家:他们都在利用人工智能技术增强甚至取代人类在科学流程中的作用。
他们将其称作“人工智能支持的生物科技”,但Zymergen的联合创始人却不太喜欢这种说法,“‘人工智能’听起来像是机器人在下象棋。”该公司CTO Aron Kimball说,“我更喜欢‘机器学习’。”霍夫曼说,他所说的机器学习是计算机科学的一个分支,最近的人工智能技术进步几乎都来自这一领域。“这样更能说明我们在干什么。”
Zymergen的工作其实是调整工业微生物,从而为生物燃料、塑料或药品制作原料。为了增加产量,很多企业都把繁重的工作交给Zymergen来完成。该公司的机器人之后会探索和修补每个微生物的基因,希望能够设计一个更好版本,提升其化合物的效率。
霍夫曼表示,问题在于,送到Zymergen的微生物已经“高度优化”。经过多年的研究和培育,这些细胞已经非常擅长它们所从事的工作。所以,想要进一步提升效率,就需要更加深入的探索基因,开展实验,然后使用所能获得的各种数据——换句话说,就是搞科研。
Zymergen试图加快这一过程。Hoffman表示,“一个人整天忙个不停也只能测试为数不多的假设,大约每月10个。”机器人则能加快这一过程——Zymergen的机器每周可以做1000次试验。但机器人只能遵照命令执行:如何向它们下达正确的指令才是真正的瓶颈。
当我问他们,这种算法是如何设计实验的时候,Kimball举了个简单的例子。“你拿到的原始微生物大约有5000个基因。假设有10种方式可以改变一个既有基因,那就要做5万次试验。”这些实验首先要制作1000个菌株,每一个都要有专门的突变。“每一个放在一滴里面。你可以向其中添加糖,培育一会儿,然后看看能得到多少产品。”可能有25个菌株可以多生产一些目标化学物。这些菌株可以用于培育下一轮实验使用的菌株,其余的放到冰箱里面。
但要发现过程绝非一帆风顺。Kimball表示,光是找到合适的突变就需要经过漫长的过程。如果只是一门心思想要实现最高效率,几乎不可能到达巅峰。原因在于,如果你只是将所有能够实现轻微提升的突变合并到单一的微生物里,未必能够实现重大改进。相反,由此生成的菌株会“生病”,效果远不及最初的菌株。所以,选择合适的路径(包括绕道达成目标)需要绘制一份心理地图,同时展示所有菌株的所有效果——这份地图不只是3个维度,而是数千个维度。这就需要机器学习来指引方向。
但其中还是有一个关键差异:当机器人终于发现能够提高化学品产出的基因变化后,他们不会了解这些效果背后的生物化学原理。
如果不能加深我们对生物学原理的理解,这还能算科学吗?在Kimball看来,这种哲学视角或许并不重要。“我们之所以能赚钱,是因为这的确有效,而不是因为我们理解背后的原理。”
Hoffman表示,Zymergen的机器人实验室已经可以把利用化学过程生成微生物的效率提升10%以上。听起来似乎不多,但由于依靠微生物发酵的化学行业每年产值高达1600亿美元,所以只需轻微的改进,就可以超过美国国家科学基金会70亿美元的年度预算。
而且,机器人发现的先进基因变化的确是实实在在的发现,这是人类科学家很难做到的。
例如,多数能够提升产出的基因都与希望合成的化合物没有直接关系,其中约有半数没有已知的功能。“我在几种不同的微生物中看到过这种情况。”Dean说。要在没有机器学习的情况下找到合适的基因组合,就像要破解带有数千个数字的保险箱一样困难。“我们的直觉很容易被复杂性压倒。”他说。
究竟能将多少科研过程委托给机器学习来执行?这取决于你询问的对象。
“很多。”研究基因组的加州大学戴维斯分校计算机科学家Ilias Tagkopoulos说,“我们没有理由不能让数据来指导实验过程,从而获取尽可能多的信息,最终更加接近我们的目标。”在他那些看似无穷无尽的应用中,包括预测细菌在变化的医院环境中如何进化,以及设计更好的零食。
如果机器真的能够在某些科学任务中取代人类,很多科学家都将主动拥抱它们。
与工厂工人和出租车司机不同,科学家还是很希望自己的工作能够多融入一些自动化流程。对于分子和细胞生物学来说尤其如此,因为这些领域的手工操作(包括注射液体、菌落计数等)过程既单调乏味,又成本高昂。一个研究生的犯一点小错,或者有一点不严谨的缺陷,就会浪费几个星期的时间。更糟糕的是,负责设计实验的博士后的一个草率决定,甚至会导致几个月的努力付诸东流。
然而,有的生物学家在使用人工智能来解读数据和设计实验之后,却感到挫败。“我们发现,目前的机器学习方法还是不太胜任这项任务。”斯坦福大学计算机生物化学家Rhiju Das说,他研究如何通过分子折叠来设计新药。“与获得同等数据的人类相比,它们在RNA设计问题上很失败。”尽管他并不知道具体原因,但涉及到“设计”的任务似乎都需要人类的直觉。或许Zymergen无意中发现了适合用电脑做实验的生物学领域。
加州Transcriptic公司也是一家探索自动化技术的生物科技公司,其联合创始人Max Hodak似乎看到了这种方法的局限。
他相信机器人会在实验室里从事更多单调的工作。他说,要不了多久,“如果你还在使用双手,那就不算做科研。”
但生物大脑短期不会被取代,原因在于自然界十分复杂。Hodak表示,进化“负责让生物更加丰富,这也是它如此难以理解的原因。它拥有不可思议的复杂性。”他认为,在设计更好的实验的过程中,人工智能可以给生物学家带来有限的帮助。但他也担心把更多的科研流程交给机器人来做,表明“它比我们预想的更加复杂。”
而且,即便人工智能控制的科研过程能够奏效,人类真的能理解电脑的发现吗?背后的计算过程可能仍然是个黑盒子。“一种令人感兴趣的可能是:我们正在接近一个‘可以理解的’科学时代。”与分子生物学家合作的卡内基梅隆大学计算机科学家Adrien Treuille说。研究人员可能不仅依赖计算机做科研,还会利用计算机进行解释:有的生物理论证据可能过于复杂,需要给予计算机足够的信任。
倘若如此,科学家是否应该把电脑作为共同作者写道论文的署名上去?“我不会这么做。”波士顿Nutonian公司CEO Michael Schmidt说,这家公司就利用人工智能来从事科研。但他也补充道,“但如果它们能够读懂论文,那也可以成为作者。”
这一天正在到来。
【完】