科学家正让AI自己做实验，想要机器摆脱人类的直觉-阿里云开发者社区

科学家正让AI自己做实验，想要机器摆脱人类的直觉

2018-01-08 1003

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

如果说这是未来的生物实验室，它似乎与现在的实验室没有多大差别。

里面有身穿白大褂的科学家，还有许多放着冷冻试管的盒子。架子上的化学品——有一瓶瓶的纯酒精、一罐罐的糖、蛋白质和盐——都是培养微生物和操纵它们基因的标准配置。

在听到机器人的声音前，你甚至不会注意到它们的存在：它们就像蟋蟀一样，用低沉的声音为彼此歌唱。

这些机器人都为Zymergen效力，这是一家生物技术公司，2014年搬进位于旧金山湾东岸的这个电子工厂旧址。他们在这里开展微生物实验，寻找各种方式来提高有用化学物的产量。里面有一台机器人名叫Echo(不是亚马逊那个Echo)。在一堆笨重的设备里面，有一个机械手臂抓取了一个塑料孔板，上面放着几百个盛着液体的孔。

一束激光扫描了孔板侧面的条形码，然后由Echo将其放到托盘上。之后的流程十分精细，用肉眼根本无法看清。

“这并不是复制了我手动移液的过程。”该公司联合创始人兼运营和工程副总裁Jed Dean说，他是一位分子生物学家。“而是一种截然不同的方法。”不必使用移液管吸取液体，然后把液体逐一注入每个容量只有细胞那么大的孔里面，机器人整个过程都没有触碰它。相反，它使用了每秒500次的声波脉冲让液体自己震动，形成比手动操作小100倍的液滴。

这些都算不上多么具有未来感。大型生物学实验室多年以前就开始使用机器人和条形码。即便那种名为“声学微滴喷出”的移液技术也已经存在了数十年。

但是，当我向Dean询问这个机器人正在从事什么项目的时候，才真正了解其中的玄机。“我不知道。”他说。他可以轻易得出答案，但这个实验并不是他设计的，而是由电脑程序自动生成的。

“我再说明一下，”Zymergen CEO Joshua Hoffman准备消除我们之间的误解，“这一过程中有人类科学家的参与，他们负责查看结果，并进行事实核查。”但之所以用程序来解读数据、生成假设和规划实验，最终目的还是“摆脱人类的直觉”。

与Zymergen秉承相同目标的公司还有好几家：他们都在利用人工智能技术增强甚至取代人类在科学流程中的作用。

他们将其称作“人工智能支持的生物科技”，但Zymergen的联合创始人却不太喜欢这种说法，“‘人工智能’听起来像是机器人在下象棋。”该公司CTO Aron Kimball说，“我更喜欢‘机器学习’。”霍夫曼说，他所说的机器学习是计算机科学的一个分支，最近的人工智能技术进步几乎都来自这一领域。“这样更能说明我们在干什么。”

Zymergen的工作其实是调整工业微生物，从而为生物燃料、塑料或药品制作原料。为了增加产量，很多企业都把繁重的工作交给Zymergen来完成。该公司的机器人之后会探索和修补每个微生物的基因，希望能够设计一个更好版本，提升其化合物的效率。

霍夫曼表示，问题在于，送到Zymergen的微生物已经“高度优化”。经过多年的研究和培育，这些细胞已经非常擅长它们所从事的工作。所以，想要进一步提升效率，就需要更加深入的探索基因，开展实验，然后使用所能获得的各种数据——换句话说，就是搞科研。

Zymergen试图加快这一过程。Hoffman表示，“一个人整天忙个不停也只能测试为数不多的假设，大约每月10个。”机器人则能加快这一过程——Zymergen的机器每周可以做1000次试验。但机器人只能遵照命令执行：如何向它们下达正确的指令才是真正的瓶颈。

当我问他们，这种算法是如何设计实验的时候，Kimball举了个简单的例子。“你拿到的原始微生物大约有5000个基因。假设有10种方式可以改变一个既有基因，那就要做5万次试验。”这些实验首先要制作1000个菌株，每一个都要有专门的突变。“每一个放在一滴里面。你可以向其中添加糖，培育一会儿，然后看看能得到多少产品。”可能有25个菌株可以多生产一些目标化学物。这些菌株可以用于培育下一轮实验使用的菌株，其余的放到冰箱里面。

但要发现过程绝非一帆风顺。Kimball表示，光是找到合适的突变就需要经过漫长的过程。如果只是一门心思想要实现最高效率，几乎不可能到达巅峰。原因在于，如果你只是将所有能够实现轻微提升的突变合并到单一的微生物里，未必能够实现重大改进。相反，由此生成的菌株会“生病”，效果远不及最初的菌株。所以，选择合适的路径（包括绕道达成目标）需要绘制一份心理地图，同时展示所有菌株的所有效果——这份地图不只是3个维度，而是数千个维度。这就需要机器学习来指引方向。

但其中还是有一个关键差异：当机器人终于发现能够提高化学品产出的基因变化后，他们不会了解这些效果背后的生物化学原理。

如果不能加深我们对生物学原理的理解，这还能算科学吗？在Kimball看来，这种哲学视角或许并不重要。“我们之所以能赚钱，是因为这的确有效，而不是因为我们理解背后的原理。”

Hoffman表示，Zymergen的机器人实验室已经可以把利用化学过程生成微生物的效率提升10%以上。听起来似乎不多，但由于依靠微生物发酵的化学行业每年产值高达1600亿美元，所以只需轻微的改进，就可以超过美国国家科学基金会70亿美元的年度预算。

而且，机器人发现的先进基因变化的确是实实在在的发现，这是人类科学家很难做到的。

例如，多数能够提升产出的基因都与希望合成的化合物没有直接关系，其中约有半数没有已知的功能。“我在几种不同的微生物中看到过这种情况。”Dean说。要在没有机器学习的情况下找到合适的基因组合，就像要破解带有数千个数字的保险箱一样困难。“我们的直觉很容易被复杂性压倒。”他说。

究竟能将多少科研过程委托给机器学习来执行？这取决于你询问的对象。

“很多。”研究基因组的加州大学戴维斯分校计算机科学家Ilias Tagkopoulos说，“我们没有理由不能让数据来指导实验过程，从而获取尽可能多的信息，最终更加接近我们的目标。”在他那些看似无穷无尽的应用中，包括预测细菌在变化的医院环境中如何进化，以及设计更好的零食。

如果机器真的能够在某些科学任务中取代人类，很多科学家都将主动拥抱它们。

与工厂工人和出租车司机不同，科学家还是很希望自己的工作能够多融入一些自动化流程。对于分子和细胞生物学来说尤其如此，因为这些领域的手工操作（包括注射液体、菌落计数等）过程既单调乏味，又成本高昂。一个研究生的犯一点小错，或者有一点不严谨的缺陷，就会浪费几个星期的时间。更糟糕的是，负责设计实验的博士后的一个草率决定，甚至会导致几个月的努力付诸东流。

然而，有的生物学家在使用人工智能来解读数据和设计实验之后，却感到挫败。“我们发现，目前的机器学习方法还是不太胜任这项任务。”斯坦福大学计算机生物化学家Rhiju Das说，他研究如何通过分子折叠来设计新药。“与获得同等数据的人类相比，它们在RNA设计问题上很失败。”尽管他并不知道具体原因，但涉及到“设计”的任务似乎都需要人类的直觉。或许Zymergen无意中发现了适合用电脑做实验的生物学领域。

加州Transcriptic公司也是一家探索自动化技术的生物科技公司，其联合创始人Max Hodak似乎看到了这种方法的局限。

他相信机器人会在实验室里从事更多单调的工作。他说，要不了多久，“如果你还在使用双手，那就不算做科研。”

但生物大脑短期不会被取代，原因在于自然界十分复杂。Hodak表示，进化“负责让生物更加丰富，这也是它如此难以理解的原因。它拥有不可思议的复杂性。”他认为，在设计更好的实验的过程中，人工智能可以给生物学家带来有限的帮助。但他也担心把更多的科研流程交给机器人来做，表明“它比我们预想的更加复杂。”

而且，即便人工智能控制的科研过程能够奏效，人类真的能理解电脑的发现吗？背后的计算过程可能仍然是个黑盒子。“一种令人感兴趣的可能是：我们正在接近一个‘可以理解的’科学时代。”与分子生物学家合作的卡内基梅隆大学计算机科学家Adrien Treuille说。研究人员可能不仅依赖计算机做科研，还会利用计算机进行解释：有的生物理论证据可能过于复杂，需要给予计算机足够的信任。

倘若如此，科学家是否应该把电脑作为共同作者写道论文的署名上去？“我不会这么做。”波士顿Nutonian公司CEO Michael Schmidt说，这家公司就利用人工智能来从事科研。但他也补充道，“但如果它们能够读懂论文，那也可以成为作者。”

这一天正在到来。

【完】

本文作者：李杉

原文发布时间：2017-07-08

科学家正让AI自己做实验，想要机器摆脱人类的直觉

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

科学家正让AI自己做实验，想要机器摆脱人类的直觉

量子位

热门文章

最新文章

相关课程

相关电子书

相关实验场景