Social Graphs for Drug Development
通过提供更好的清晰度和对异构数据集的访问,构建社交图谱(知识图谱)以改善临床试验的流程并降低成本。
The Valley of Death
阿斯利康的健康信息学总监Paul Agapow在Grakn Labs的第一次全球用户大会Grakn Cosmos上讲述了他的团队在构建社交图谱以减少临床试验招募时的时间和减少资源的工作。
药物开发是一个非常困难,旷日持久且昂贵的过程。当一家制药公司开始生产一种新药时,它已经通过了临床试验的所有阶段。许多制药公司都在内部存储了药物蛋白质相互作用集,即能够与人体某些部分相互作用的成千上万个候选分子。这是许多药物开发项目的起点。然后根据可行的方法和合理的方法对它们进行缩减。甚至在将药物放入人体之前,可能最终会得到250个候选分子左右。
从这250个候选分子进入临床试验的第1阶段(在其中检查安全性和有效性)中,可能会减少到5,然后再进行法规审查;最后,您将获得一种新药。
1. 临床试验过程的简要概述
阶段1:研究对少量患者给药时药物的安全性。通常在第1阶段的试验中包含10个人。
阶段2:重新评估安全性-对人类安全吗?并着眼于预期的治疗效果。第2阶段中,该药物针对100例患者进行了测试。
阶段3:最终的安全性和功效检查-这种药物会意外杀死您并且对您有好处吗-并问这是否比目前生产的药物做得更好?
大量受试者可以使临床试验受益。一般来说,受试者越多,统计能力越强。但是,由于每个受试者的费用在10,000美元至60%的临床试验中均无法达到其招募目标,因此这是该过程中比较艰巨的方面之。
2. 招募工作如何进行?
传统上,招募是通过社会方式来完成的:个人联系,小册子,招募站点,医院周围的广告等。如今,这与增加的招募目标和正在投放的药品无关。
借助Trinetx等联邦电子健康记录(EHR),可以从各个地区获取大量的患者数据。不利的一面是,这仍然只是潜在学科总数的一部分,通常缺少资格认定所需的细节。
通过提出社交问题可以减轻许多失败的情况。可能有助于减少确保完整的跟踪主题组所需的时间和资源。
3. 真实证据
当组织和团队意识到这一现实时,那里的数据利用不足,价格便宜,并且数量和范围不断扩大。这些数据通常无法以其他任何方式获取,并且代表了个人或个人群体的更真实的图画。在生命科学领域的某些圈子中,此数据称为“真实世界证据”。
研究人员正在谈论的是来自健康跟踪器和可穿戴设备的数据,电子病历和调查数据,医院和药房数据,社交媒体和消费者数据。杂乱的数据不是来自受控的临床试验,即任何不整齐地放入表格中的数据。
越来越多地将该数据视为以前无法获得或无法识别的信号的驱动器。除了这些“新”数据便宜外,它还使制药公司能够覆盖以前无法访问的人群。此外,数据还包括出于道德考虑而不允许公司提出的问题。
这些“世界信号”为临床试验提供了扩展的范围,其中主要涉及的人群并不典型。保罗指出,受试人群的人口统计往往是年轻的,受过大学教育的白人男性。因此,需要“真实世界的证据”-但是它将如何帮助减少成本和时间呢?
4.解决方案
- 来自异类资源的最新可访问“真实世界证据”社交数据-杂乱数据;
- 识别和发现新患者库的机会;
- 有机会更快,更准确地获得资格,避免在不合格的科目上花费时间和金钱;
Paul和他AstraZeneca的团队提出的解决方案是试验从业人员的社交图谱。Paul称其为“肿瘤医生脸书”。该图将通过他们的协作,出版物和工作场所将他们联系起来。他们可以使用“现实世界证据”的各种来源来注释图形,并询问有关这些从业人员的问题。
该项目被称为OPSIN-肿瘤医生社会互动网络,作为“精简和激发临床试验”的更大努力的一部分。
2008年,一个团队使用“手动”图形数据库将一个类似的概念组合在一起,在互联网上搜刮了所有可以让他们找到关键意见领袖的数据。今天,可以使用如此丰富的信息和技术平台来解决此问题。
此外,可以将现在可用的外部信息与他们的所有内部数据相结合,也许更重要的是,它可以伴随多年的试验和磨难而获得的知识。
5. 建立社交图谱
从前辈那里学到的东西,这些早期的努力一直存在着一些问题。关键是它们不是为可持续性而构建的-这些早期图表的构建不仅仅是一个一次性的项目。Paul指出,这些通常是由使用R或一起入侵python脚本的人构建的,手工建立自己的图形数据库。
这些都不适合操作,需要将其插入其他系统,以便组织中的团队能够使用它。这是Grakn介入的地方。
Grakn是来自Grakn Labs团队的复杂数据数据库。知道阿斯利康(AstraZeneca)的团队将对边缘,出处边缘以及对边缘进行陈述感兴趣之后,他们才意识到他们真正在谈论的是超图。Grakn作为一个超图数据库,使这一过程变得更加容易。
6.模型基础
对于热爱形式图式的生物信息学家来说,他们经常在争先恐后地将内部庞大的本体放入其中,而不考虑这种情况是否适合这种情况。Paul在Grakn Labs的某些团队的鼓舞下,从不以现有的本体论开始,而是以一系列他们想问的问题开始。从以上思路出发,将在下面介绍生物信息学家可能提出的一些问题。
但是,由于他们确实需要模式,因此以下是他们做出的一些决定:
- 让事情从简单开始,不要一开始就为整个世界建模;
- 使用您要提出的问题作为模型潜在概念的一种方法,当大声地或在纸上清晰地表达问题时,能够更清楚地看到事物;
- 从人和机构开始,通过诸如合作和出版之类的关系将它们联系起来;
- 给这些关系中的每个关系一个时间元素作为属性;
- 将范围保持在5年-人和人际关系发生变化,5年对于目标而言足够相关。
7.结论
制药界变得越来越以数据为驱动力的情况下,仍然要问很多软问题,这些问题将为临床试验过程带来巨大的价值。那里有大量的数据可以用来解决这些问题。