利用人工智能众包数据,加速药物发现

简介: 利用人工智能众包数据,加速药物发现

新的加密系统可以让制药公司和学术实验室共同合作,更快地开发新的药物,而不会向竞争对手透露任何机密数据。


该计算系统的核心是一种称为神经网络的人工智能程序。AI研究哪些药物与人体内的各种蛋白质相互作用以预测新的药物蛋白质相互作用的信息。


更多的培训数据产生了更聪明的人工智能,这在过去是一个挑战,因为药物开发人员通常不会因知识产权问题而共享数据。研究人员在10月19日的“ 科学”杂志上报告说,新系统允许人工智能将数据众包,同时保持信息的私密性,从而鼓励合作伙伴加快药物开发。


确定新的药物蛋白质相互作用可以揭示各种疾病的潜在新疗法。或者它可以揭示药物是否与非预期的蛋白质靶标相互作用,这可能表明药物是否可能引起特殊的副作用,匹兹堡大学的计算生物学家Ivet Bahar说,他没有参与这项工作。


在新的AI培训系统中,从研究组汇集的数据在多个服务器之间进行分配,每个服务器的所有者看到的似乎只是随机数。“这就是加密魔法发生的地方,”位于夏洛茨维尔的弗吉尼亚大学的计算机科学家大卫吴说,他没有参与这项工作。虽然没有个体参与者能够看到组成训练集的数百万种药物蛋白质相互作用,但是服务器可以共同使用该信息来教导神经网络来预测先前看不见的药物蛋白质组合的相互作用。


“这项工作具有远见卓识,”伊利诺伊大学厄巴纳香槟分校的计算机科学家简鹏说。“我认为它将为生物医学合作的未来奠定基础。”


麻省理工学院计算生物学家Bonnie Berger及其同事Brian Hie和Hyunghoon Cho通过在大约140万个药物蛋白质对上训练神经网络来评估他们系统的准确性。这些对中的一半来自已知药物蛋白质相互作用的STITCH数据库; 另一半包含不相互作用的药物蛋白质对。当显示已知相互作用或不相互作用的新药物蛋白质对时,AI选择哪些组以95%的准确度相互作用。


为了测试该系统是否能够识别迄今未知的药物蛋白质相互作用,Berger团队随后在近200万个药物蛋白质对上训练神经网络:已知相互作用的整个STITCH数据集,以及相同数量的非相互作用对。经过充分培训的人工智能建议进行了几次以前从未报告或已报告但未在STITCH数据库中进行的互动。


例如,AI鉴定了雌激素受体蛋白与开发用于治疗乳腺癌的药物(称为屈洛昔芬)之间的相互作用。神经网络还发现了白血病药物伊马替尼与蛋白质ErbB4之间从未见过的相互作用,该蛋白质被认为与不同类型的癌症有关。研究人员证实这与实验室实验相互作用。


该安全计算网络还可以鼓励在药物开发之外的领域中的更多协作。彭说,医院可以分享机密健康记录,以培训预测患者预后或设计治疗策略的人工智能项目。


“无论什么时候你想研究大量的人的行为,基因组学,医疗记录,法律记录,财务记录,任何对隐私敏感的东西,这些技术都非常有用,”吴说。


目录
相关文章
|
6月前
|
人工智能 自然语言处理 语音技术
人工智能语音数据的多样性
人工智能语音数据的多样性
80 2
|
4月前
|
机器学习/深度学习 人工智能 专有云
人工智能平台PAI使用问题之怎么将DLC的数据写入到另一个阿里云主账号的OSS中
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
数据采集 人工智能 自然语言处理
GPT被封锁了怎么办?轻松获取高质量的数据,训练自己的人工智能和大语言模型。
2023年标志着AI大模型时代的到来,GPT-4等模型在多个领域展现巨大潜力。然而,OpenAI对中国区服务的限制提出了挑战。本文探讨如何使用亮数据代理获取训练大模型所需的数据,包括确定目标、选择代理、数据抓取、清洗,并以西方历史为例,展示如何使用亮数据的静态住宅代理稳定获取DE区域数据,最终在国产AI平台上训练模型,提升知识库的丰富度和准确性。尽管面临外部障碍,但自主获取和训练数据能增强本土AI能力。
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI使用问题之如何在MaxCompute上使用Protobuf处理数据
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI使用问题之如何实现数据在MaxCompute中是永久的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
机器学习/深度学习 人工智能 前端开发
人工智能平台PAI产品使用合集之创建了实时特征视图,里面的数据是通过什么传入的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
5月前
|
机器学习/深度学习 人工智能 监控
人工智能平台PAI产品使用合集之设置了7个特征,但在最后生成的数据表中只包含了6个id_feature的特征,是什么导致的
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
|
4月前
|
存储 人工智能 安全
人工智能浪潮下的数据隐私保护技术
在大数据与人工智能(AI)的高速发展中,数据隐私保护成为亟待解决的关键议题。本文将探讨当前AI时代下数据隐私保护的技术手段及其面临的挑战,并分析未来发展趋势。文章首先介绍数据隐私的重要性和当前面临的风险,然后深入讨论加密技术和匿名化处理等保护措施,最后评估这些技术的有效性及潜在的改进方向。
183 0
|
5月前
|
机器学习/深度学习 人工智能 算法
人工智能伦理:机器学习中的数据偏见与公平性挑战
在机器学习领域,算法的公正性与透明度日益成为社会关注的焦点。本文深入探讨了AI系统在处理数据时可能遇到的偏见问题及其对社会公平性的影响。通过分析具体案例和最新研究成果,本文揭示了数据偏见如何影响算法决策,并提出了减轻这些偏见的策略。文章呼吁开发更加负责任的AI系统,以促进技术与社会价值的和谐共存。
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?
【5月更文挑战第4天】【AI 生成式】如何利用生成式人工智能进行机器学习的数据增强?