科学家正让AI自己做实验,想要机器摆脱人类的直觉

简介:
本文来自AI新媒体量子位(QbitAI)

如果说这是未来的生物实验室,它似乎与现在的实验室没有多大差别。

里面有身穿白大褂的科学家,还有许多放着冷冻试管的盒子。架子上的化学品——有一瓶瓶的纯酒精、一罐罐的糖、蛋白质和盐——都是培养微生物和操纵它们基因的标准配置。

在听到机器人的声音前,你甚至不会注意到它们的存在:它们就像蟋蟀一样,用低沉的声音为彼此歌唱。

这些机器人都为Zymergen效力,这是一家生物技术公司,2014年搬进位于旧金山湾东岸的这个电子工厂旧址。他们在这里开展微生物实验,寻找各种方式来提高有用化学物的产量。里面有一台机器人名叫Echo(不是亚马逊那个Echo)。在一堆笨重的设备里面,有一个机械手臂抓取了一个塑料孔板,上面放着几百个盛着液体的孔。

一束激光扫描了孔板侧面的条形码,然后由Echo将其放到托盘上。之后的流程十分精细,用肉眼根本无法看清。

“这并不是复制了我手动移液的过程。”该公司联合创始人兼运营和工程副总裁Jed Dean说,他是一位分子生物学家。“而是一种截然不同的方法。”不必使用移液管吸取液体,然后把液体逐一注入每个容量只有细胞那么大的孔里面,机器人整个过程都没有触碰它。相反,它使用了每秒500次的声波脉冲让液体自己震动,形成比手动操作小100倍的液滴。

这些都算不上多么具有未来感。大型生物学实验室多年以前就开始使用机器人和条形码。即便那种名为“声学微滴喷出”的移液技术也已经存在了数十年。

但是,当我向Dean询问这个机器人正在从事什么项目的时候,才真正了解其中的玄机。“我不知道。”他说。他可以轻易得出答案,但这个实验并不是他设计的,而是由电脑程序自动生成的。

“我再说明一下,”Zymergen CEO Joshua Hoffman准备消除我们之间的误解,“这一过程中有人类科学家的参与,他们负责查看结果,并进行事实核查。”但之所以用程序来解读数据、生成假设和规划实验,最终目的还是“摆脱人类的直觉”。

与Zymergen秉承相同目标的公司还有好几家:他们都在利用人工智能技术增强甚至取代人类在科学流程中的作用。

他们将其称作“人工智能支持的生物科技”,但Zymergen的联合创始人却不太喜欢这种说法,“‘人工智能’听起来像是机器人在下象棋。”该公司CTO Aron Kimball说,“我更喜欢‘机器学习’。”霍夫曼说,他所说的机器学习是计算机科学的一个分支,最近的人工智能技术进步几乎都来自这一领域。“这样更能说明我们在干什么。”

Zymergen的工作其实是调整工业微生物,从而为生物燃料、塑料或药品制作原料。为了增加产量,很多企业都把繁重的工作交给Zymergen来完成。该公司的机器人之后会探索和修补每个微生物的基因,希望能够设计一个更好版本,提升其化合物的效率。

霍夫曼表示,问题在于,送到Zymergen的微生物已经“高度优化”。经过多年的研究和培育,这些细胞已经非常擅长它们所从事的工作。所以,想要进一步提升效率,就需要更加深入的探索基因,开展实验,然后使用所能获得的各种数据——换句话说,就是搞科研。

Zymergen试图加快这一过程。Hoffman表示,“一个人整天忙个不停也只能测试为数不多的假设,大约每月10个。”机器人则能加快这一过程——Zymergen的机器每周可以做1000次试验。但机器人只能遵照命令执行:如何向它们下达正确的指令才是真正的瓶颈。

当我问他们,这种算法是如何设计实验的时候,Kimball举了个简单的例子。“你拿到的原始微生物大约有5000个基因。假设有10种方式可以改变一个既有基因,那就要做5万次试验。”这些实验首先要制作1000个菌株,每一个都要有专门的突变。“每一个放在一滴里面。你可以向其中添加糖,培育一会儿,然后看看能得到多少产品。”可能有25个菌株可以多生产一些目标化学物。这些菌株可以用于培育下一轮实验使用的菌株,其余的放到冰箱里面。

但要发现过程绝非一帆风顺。Kimball表示,光是找到合适的突变就需要经过漫长的过程。如果只是一门心思想要实现最高效率,几乎不可能到达巅峰。原因在于,如果你只是将所有能够实现轻微提升的突变合并到单一的微生物里,未必能够实现重大改进。相反,由此生成的菌株会“生病”,效果远不及最初的菌株。所以,选择合适的路径(包括绕道达成目标)需要绘制一份心理地图,同时展示所有菌株的所有效果——这份地图不只是3个维度,而是数千个维度。这就需要机器学习来指引方向。

但其中还是有一个关键差异:当机器人终于发现能够提高化学品产出的基因变化后,他们不会了解这些效果背后的生物化学原理。

如果不能加深我们对生物学原理的理解,这还能算科学吗?在Kimball看来,这种哲学视角或许并不重要。“我们之所以能赚钱,是因为这的确有效,而不是因为我们理解背后的原理。”

Hoffman表示,Zymergen的机器人实验室已经可以把利用化学过程生成微生物的效率提升10%以上。听起来似乎不多,但由于依靠微生物发酵的化学行业每年产值高达1600亿美元,所以只需轻微的改进,就可以超过美国国家科学基金会70亿美元的年度预算。

而且,机器人发现的先进基因变化的确是实实在在的发现,这是人类科学家很难做到的。

例如,多数能够提升产出的基因都与希望合成的化合物没有直接关系,其中约有半数没有已知的功能。“我在几种不同的微生物中看到过这种情况。”Dean说。要在没有机器学习的情况下找到合适的基因组合,就像要破解带有数千个数字的保险箱一样困难。“我们的直觉很容易被复杂性压倒。”他说。

究竟能将多少科研过程委托给机器学习来执行?这取决于你询问的对象。

“很多。”研究基因组的加州大学戴维斯分校计算机科学家Ilias Tagkopoulos说,“我们没有理由不能让数据来指导实验过程,从而获取尽可能多的信息,最终更加接近我们的目标。”在他那些看似无穷无尽的应用中,包括预测细菌在变化的医院环境中如何进化,以及设计更好的零食。

如果机器真的能够在某些科学任务中取代人类,很多科学家都将主动拥抱它们。

与工厂工人和出租车司机不同,科学家还是很希望自己的工作能够多融入一些自动化流程。对于分子和细胞生物学来说尤其如此,因为这些领域的手工操作(包括注射液体、菌落计数等)过程既单调乏味,又成本高昂。一个研究生的犯一点小错,或者有一点不严谨的缺陷,就会浪费几个星期的时间。更糟糕的是,负责设计实验的博士后的一个草率决定,甚至会导致几个月的努力付诸东流。

然而,有的生物学家在使用人工智能来解读数据和设计实验之后,却感到挫败。“我们发现,目前的机器学习方法还是不太胜任这项任务。”斯坦福大学计算机生物化学家Rhiju Das说,他研究如何通过分子折叠来设计新药。“与获得同等数据的人类相比,它们在RNA设计问题上很失败。”尽管他并不知道具体原因,但涉及到“设计”的任务似乎都需要人类的直觉。或许Zymergen无意中发现了适合用电脑做实验的生物学领域。

加州Transcriptic公司也是一家探索自动化技术的生物科技公司,其联合创始人Max Hodak似乎看到了这种方法的局限。

他相信机器人会在实验室里从事更多单调的工作。他说,要不了多久,“如果你还在使用双手,那就不算做科研。”

但生物大脑短期不会被取代,原因在于自然界十分复杂。Hodak表示,进化“负责让生物更加丰富,这也是它如此难以理解的原因。它拥有不可思议的复杂性。”他认为,在设计更好的实验的过程中,人工智能可以给生物学家带来有限的帮助。但他也担心把更多的科研流程交给机器人来做,表明“它比我们预想的更加复杂。”

而且,即便人工智能控制的科研过程能够奏效,人类真的能理解电脑的发现吗?背后的计算过程可能仍然是个黑盒子。“一种令人感兴趣的可能是:我们正在接近一个‘可以理解的’科学时代。”与分子生物学家合作的卡内基梅隆大学计算机科学家Adrien Treuille说。研究人员可能不仅依赖计算机做科研,还会利用计算机进行解释:有的生物理论证据可能过于复杂,需要给予计算机足够的信任。

倘若如此,科学家是否应该把电脑作为共同作者写道论文的署名上去?“我不会这么做。”波士顿Nutonian公司CEO Michael Schmidt说,这家公司就利用人工智能来从事科研。但他也补充道,“但如果它们能够读懂论文,那也可以成为作者。”

这一天正在到来。

【完】

本文作者:李杉 
原文发布时间:2017-07-08 
相关文章
|
5月前
|
人工智能 Devops
AI 应用 DevOps 新体验--实验小结
AI 应用 DevOps 新体验--实验小结
135 0
|
13天前
|
人工智能 安全 决策智能
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
|
6天前
|
人工智能
AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率
【10月更文挑战第21天】普林斯顿大学研究人员提出了CORE-Bench,一个基于计算可重复性的AI代理基准,涵盖计算机科学、社会科学和医学领域的270个任务。该基准旨在评估AI代理在科学研究中的准确性,具有多样性、难度级别和现实相关性等特点,有助于推动AI代理的发展并提高计算可重复性。
17 4
|
23天前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
36 6
|
1月前
|
人工智能
用AI人模拟社会学实验,居然成功了?斯坦福、NYU用GPT-4模仿人类,准确度惊人!
斯坦福大学和纽约大学的研究团队利用GPT-4模型成功模拟了人类在社交互动中的行为模式,实验结果显示AI能以惊人准确度模仿人类对话,甚至在在线论坛和社交媒体上与真人难以区分。这一突破不仅展示了AI在社会学研究中的巨大潜力,还引发了对AI伦理和透明度的深入探讨。尽管存在一些局限性和挑战,这项研究为未来社会学实验提供了新工具和方法。[论文地址:https://docsend.com/view/qeeccuggec56k9hd]
46 2
|
20天前
|
机器学习/深度学习 存储 人工智能
2024年诺贝尔奖:AI科学家的辉煌时刻 | AI大咖说
在今年的诺贝尔物理学奖和化学奖颁奖典礼上,AI科学家分别摘得了这两项殊荣,这无疑为AI技术的发展和应用注入了新的动力【10月更文挑战第5天】
56 0
|
2月前
|
人工智能 数据处理
Nature:AI让抄袭问题更加复杂,科学家该如何应对?
【9月更文挑战第16天】《自然》杂志一篇文章指出,AI在科研领域的应用日益增长,带来了加速数据处理、提升计算效率等益处,同时也引发了对科学标准、数据偏见及研究诚信的挑战。一项针对1600多名研究人员的调查显示,超半数认为未来十年AI将成为其研究领域不可或缺的工具。AI能够显著提升科研效率,但也可能增加对模式识别的依赖,加剧数据偏见,并引发研究不可重复性等问题。尤其是大型语言模型如ChatGPT,虽有助于改进论文语法和翻译,但也可能传播错误信息。此外,部分科学家面临计算资源和高质量数据不足等使用障碍。
37 3
|
2月前
|
机器学习/深度学习 人工智能 算法
AI伦理边界:当机器决策超越人类认知
【9月更文挑战第5天】AI伦理边界的探索是一个复杂而艰巨的任务,需要政府、企业、学术界和社会各界的共同努力。随着AI技术的不断发展,我们有理由相信,通过不断的探索和实践,我们一定能够找到一条既符合伦理道德又能够充分发挥AI技术潜力的道路。在未来的日子里,让我们携手并进,共同迎接AI技术带来的机遇与挑战。
|
4月前
|
机器学习/深度学习 人工智能 算法
AI与创意写作:机器如何学习讲故事
【7月更文挑战第8天】在数字时代的浪潮中,人工智能已经从实验室走向了文学创作的领域。本文将探讨AI在创意写作中的应用,揭示它如何通过算法模仿人类的思维模式,生成引人入胜的故事。我们将一同穿梭于代码与文字之间,见证一个由数据驱动的叙事新纪元的诞生。
|
4月前
|
机器学习/深度学习 人工智能 数据可视化
东哥教你如何用Orange Ai pro为家里做一个垃圾分类检测机器
## 摘要 本文由东哥原创,介绍了使用Orange AI Pro开发板进行AI项目开发的体验。这款开发板主打强大的AI算力,搭载昇腾AI芯片,提供8-12TOPS的性能,媲美英伟达RTX3080显卡。它支持外接eMMC和4K显示器,适合实时视频流模型部署。作者详细阐述了从购买、烧录镜像到环境配置的过程,包括安装ACLLite库、模型转换工具ATC的使用,以及YOLOv5模型的转换和部署。文章还展示了如何建立一个垃圾检测项目,利用计算机视觉进行实时垃圾分类,并分享了性能体验,认为开发板在散热和噪音控制上表现良好,适合AI爱好者和开发者进行DIY项目。