利用人工智能众包数据,加速药物发现

简介: 利用人工智能众包数据,加速药物发现

新的加密系统可以让制药公司和学术实验室共同合作,更快地开发新的药物,而不会向竞争对手透露任何机密数据。


该计算系统的核心是一种称为神经网络的人工智能程序。AI研究哪些药物与人体内的各种蛋白质相互作用以预测新的药物蛋白质相互作用的信息。


更多的培训数据产生了更聪明的人工智能,这在过去是一个挑战,因为药物开发人员通常不会因知识产权问题而共享数据。研究人员在10月19日的“ 科学”杂志上报告说,新系统允许人工智能将数据众包,同时保持信息的私密性,从而鼓励合作伙伴加快药物开发。


确定新的药物蛋白质相互作用可以揭示各种疾病的潜在新疗法。或者它可以揭示药物是否与非预期的蛋白质靶标相互作用,这可能表明药物是否可能引起特殊的副作用,匹兹堡大学的计算生物学家Ivet Bahar说,他没有参与这项工作。


在新的AI培训系统中,从研究组汇集的数据在多个服务器之间进行分配,每个服务器的所有者看到的似乎只是随机数。“这就是加密魔法发生的地方,”位于夏洛茨维尔的弗吉尼亚大学的计算机科学家大卫吴说,他没有参与这项工作。虽然没有个体参与者能够看到组成训练集的数百万种药物蛋白质相互作用,但是服务器可以共同使用该信息来教导神经网络来预测先前看不见的药物蛋白质组合的相互作用。


“这项工作具有远见卓识,”伊利诺伊大学厄巴纳香槟分校的计算机科学家简鹏说。“我认为它将为生物医学合作的未来奠定基础。”


麻省理工学院计算生物学家Bonnie Berger及其同事Brian Hie和Hyunghoon Cho通过在大约140万个药物蛋白质对上训练神经网络来评估他们系统的准确性。这些对中的一半来自已知药物蛋白质相互作用的STITCH数据库; 另一半包含不相互作用的药物蛋白质对。当显示已知相互作用或不相互作用的新药物蛋白质对时,AI选择哪些组以95%的准确度相互作用。


为了测试该系统是否能够识别迄今未知的药物蛋白质相互作用,Berger团队随后在近200万个药物蛋白质对上训练神经网络:已知相互作用的整个STITCH数据集,以及相同数量的非相互作用对。经过充分培训的人工智能建议进行了几次以前从未报告或已报告但未在STITCH数据库中进行的互动。


例如,AI鉴定了雌激素受体蛋白与开发用于治疗乳腺癌的药物(称为屈洛昔芬)之间的相互作用。神经网络还发现了白血病药物伊马替尼与蛋白质ErbB4之间从未见过的相互作用,该蛋白质被认为与不同类型的癌症有关。研究人员证实这与实验室实验相互作用。


该安全计算网络还可以鼓励在药物开发之外的领域中的更多协作。彭说,医院可以分享机密健康记录,以培训预测患者预后或设计治疗策略的人工智能项目。


“无论什么时候你想研究大量的人的行为,基因组学,医疗记录,法律记录,财务记录,任何对隐私敏感的东西,这些技术都非常有用,”吴说。


目录
相关文章
|
2月前
|
人工智能 算法 语音技术
人工智能语音数据
人工智能语音数据
75 5
|
2月前
|
人工智能 自然语言处理 语音技术
人工智能语音数据的多样性
人工智能语音数据的多样性
37 2
|
2月前
|
机器学习/深度学习 传感器 人工智能
人工智能图像数据
人工智能图像数据
50 3
|
2天前
|
机器学习/深度学习 人工智能 前端开发
人工智能平台PAI产品使用合集之创建了实时特征视图,里面的数据是通过什么传入的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
3天前
|
机器学习/深度学习 人工智能 算法
人工智能伦理:机器学习中的数据偏见与公平性挑战
在机器学习领域,算法的公正性与透明度日益成为社会关注的焦点。本文深入探讨了AI系统在处理数据时可能遇到的偏见问题及其对社会公平性的影响。通过分析具体案例和最新研究成果,本文揭示了数据偏见如何影响算法决策,并提出了减轻这些偏见的策略。文章呼吁开发更加负责任的AI系统,以促进技术与社会价值的和谐共存。
|
2月前
|
传感器 人工智能 自然语言处理
人工智能数据
人工智能数据
50 1
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
|
2月前
|
人工智能 测试技术
测试数据不再难,人工智能批量生成给你用!
本文介绍了如何利用ChatGPT生成测试数据。测试数据是验证功能和触发异常场景的关键,设计时需全面考虑等价类、边界值和正交法。实践中,先明确数据类型、格式和需求,然后向ChatGPT提供相关信息。例如,对于只能输入中国手机号的输入框,初始提示可能只包含正常手机号,但应进一步补充异常场景,如非数字、长度错误、非中国号码、特殊字符、空输入等。此外,可通过指定yaml格式来满足代码使用需求。总结来说,生成测试数据需清晰定义需求,拆分任务,并系统测试各种变化。
40 2
|
2月前
|
机器学习/深度学习 人工智能 API
人工智能平台PAI 操作报错合集之DSSM负采样时,输入数据不同,被哈希到同一个桶里,导致生成的embedding相同如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。
|
2月前
|
机器学习/深度学习 SQL 人工智能
人工智能平台PAI 操作报错合集之机器学习PAI缺失值补充报错,从odps读取数据正常 进行下一步时,补充缺失值报错如何解决
阿里云人工智能平台PAI (Platform for Artificial Intelligence) 是阿里云推出的一套全面、易用的机器学习和深度学习平台,旨在帮助企业、开发者和数据科学家快速构建、训练、部署和管理人工智能模型。在使用阿里云人工智能平台PAI进行操作时,可能会遇到各种类型的错误。以下列举了一些常见的报错情况及其可能的原因和解决方法。