深度学习会成为科学家的重要帮手吗?
苏珊娜 · 拉菲尔斯基和她的同事们有一个看似简单的目标:借助深度学习算法,成功地识别出细胞中难以识别的各种不同结构。
位于华盛顿州西雅图的艾伦细胞科学研究所的定量细胞生物学家和副主任Susanne Rafelski 说「我们希望能够在活体成像中标记细胞的多种不同结构」。
「我们想用3D 技术来拍摄。」
在以往的研究中,要实现这种目标通常依赖于荧光显微镜ーー但这种方法有很多的局限性,一是只有少数几种颜色可以使用,不足以标记所有的结构。 另一个问题是,这些试剂价格昂贵,费时费力。 此外,这些染色剂对活细胞是有害的,用来刺激它们的光线也是有害的,这意味着成像细胞的行为本身就会损害它们。 同样位于西雅图的艾伦脑科学研究所(Allen Institute for Brain Science)的显微镜专家福雷斯特•科尔曼(Forrest Collman)表示:「荧光很昂贵,这个「昂贵」体现在方方面面」。 当科尔曼和他的同事试图用三种不同的颜色制作3D 延时影像是时,结果很惊悚,「所有的细胞都会在你面前狗带」。 据介绍,Rafelski 团队将荧光显微技术和投射白光技术结合了起来,从而利用人工智能(AI)在明视野图像上预测荧光标记的形状。 2017 年,该团队提出利用深度学习来识别未标记细胞明视野图像中难以发现的结构。 通过对无标记细胞的深度学习算法,团队制作了3D 影像,显示了细胞核中的 DNA 和子结构,以及细胞膜和线粒体。
快速增长的领域
旧金山加利福尼亚大学和旧金山格拉德斯通心血管病研究所的神经学家 Steven Finkbeiner 使用机器人显微镜追踪细胞已经长达一年。 到21世纪初,他的团队每天累积的数据达到了兆兆字节。Finkbeiner 建议谷歌研究人员使用深度学习来发现他看不到的细胞特征。 深度学习利用计算机节点以类似于人脑神经元的方式进行分层。 首先,这个神经网络中的节点之间的连接是随机加权的,所以计算机最开始只是猜测。但是通过训练,计算机会调整权重或参数,直到它开始正确运行。 芬克贝纳的研究小组训练它的系统在二维图像中识别神经元,然后挑选出细胞核并确定给定的细胞是否是活的。 芬克贝纳说「主要的目的是向科学家们展示,图像数据中可能有比他们意识到的更多的信息」。研究小组称这项技术为硅胶标记技术。 然而,这种方法无法识别运动神经元,可能是因为在未标记的细胞中没有任何东西表明它们的特征。 科尔曼说,这些预测只有在人工智能能够使用某些可见线索的情况下才会起作用。例如,细胞膜与周围环境有着不同的折射率,从而产生对比。
展望未来
荧光预测也在制药行业中占据着主导地位。 在戈森堡的阿斯利康公司,药理学家 Alan Sabirsh 主要研究脂肪细胞在疾病和药物代谢中的作用。他和 AstraZeneca 与瑞典国家应用人工智能中心合作开展脂肪细胞成像挑战,要求在未标记的显微照片中识别细胞核、细胞质和脂滴。 该奖项5000美元的奖金授予了由 Ankit Gupta 和 h å kan Wieslander 领导的团队,他们是瑞典乌普萨拉大学的两名从事图像处理的博士生。 像 Chang 和她的同事一样,研究小组使用氮化镓来识别脂滴。但是为了得到原子核,他们使用了一种不同的技术,叫做 LUPI ーー利用特权信息学习,这种技术给了机器学习的额外帮助。 在这种情况下,研究小组使用了更新的图像处理技术来识别标准训练图像对中的细胞核。 由此得到的图像并不完美: 真正的荧光染色提供了比模型更真实的细胞核和细胞质纹理。 但是,对于 Sabirsh 来说,这已经足够了。他已经开始在机器人显微镜实验中使用该代码进行分析,目的是开发治疗方法。
虽然大规模的培训可能需要在有多个图形处理单元的超级计算机上花费数周时间。相应的,一旦这样做成功了,预测模型就可以用笔记本电脑甚至手机运行了。 对于许多研究人员来说,这种一次性的投资是值得的。「如果你可以收集未标记细胞的图片,而且你已经有了训练有素的算法,」芬克贝纳说。「你基本上可以轻松又免费地获得所有这些信息。」