2019年6月28日牛津大学Julian C. Knight教授团队以及欧盟创新药物计划ULTRA-DD协会在Nature Genetics在线发表题为 A genetics-led approach defines the drug target landscape of 30 immune-related traits研究成果, 使以遗传学为导向的GWAS医学转化研究更靠近临床现实。
1
研究背景
目前大多数候选药物在后期临床试验中失败,很大程度上是因为对早期靶点选择的疗效预测不足。具有遗传支持的药物靶点更有可能用于治疗,但将基因组关联研究等基因组数据用于复杂疾病的药物靶点发现仍具有挑战性。在这里,本文展示了功能基因组和免疫相关注释的整合,以及网络连接的知识,最大化靶验证的遗传信息性,在基因和通路水平上定义了30种免疫特性的靶标优先级。本文演示了基因引导的药物靶标优先排序方法(优先指数)如何成功地识别当前的治疗方法,预测高通量细胞筛选(包括L1000、CRISPR、诱变和病人来源的细胞化验)中的活性,使未开发的靶标优先排序成为可能,并允许确定靶标级性状关系。优先级指标是一个开放获取的、可扩展的系统,加速免疫介导性疾病的早期药物靶点选择。
2
方法流程及实验
牛津大学Julian C. Knight教授团队开发了优先级指数(Pi)途径(图1),以特定免疫性状的全基因组关联研究(GWAS)变量作为输入。全基因组关联研究(GWAS)产生了海量遗传学大数据,蕴含潜在疾病易感遗传位点,是研究复杂疾病的有效手段。GWAS最大的希望之一是将GWAS结果转化成支持药物研发的靶点,然而实现起来极具挑战性。GWAS发现的复杂疾病易感遗传位点大部分位于基因组的非编码区,其生物学意义(目标基因和疾病通路)难以解释,进而加大对治疗潜在靶点选择的难度。优先指数攻克了这一难题,针对复杂免疫疾病GWAS统计数据,通过功能基因组数据(产自于基因表达数量性状定位分析技术与染色体构象捕获技术)预测疾病易感基因,对易感基因进一步注解功能、表型、疾病信息,整合基因间相互作用网络信息将潜在基因扩展至网络关键节点,对遗传治疗靶点量化推荐。
图1 优先指数的方法学
2.1 生成基因级靶点优先级
首先,将Pi应用于类风湿关节炎,使用整理的GWAS汇总数据生成基因级靶点优先级。排名最高的基因包括:ICAM1 (内皮粘附的作用), TRAF1 (肿瘤坏死因子(TNF)受体相关), STAT4 (免疫调节), PTPN2 (炎症), PTPN22 (T-cell 活化), CD40 and BLK (B细胞功能), 和IRF8 (骨代谢)。尽管没有直接的基因证据,黄金标准的靶点TNF,由于相互作用伙伴的互动而被高度评价,如图2所示。对高度优先的靶点中显著富集的通路所涉及的T-cell antigen receptor signal transduction, interferon-γ (IFN-γ), programmed cell death protein 1, interleukin-6 (IL-6), interleukin-20 (IL-20) 和 tumor necrosis factor receptor 1 signaling,如图3所示。然后确定途径之间的串扰,使高度优先的相互连接基因的数量最大化。这确定了潜在的干预节点,包括JAK1, JAK3 和 TYK2, IL2, IL6, STAT1, STAT4, STAT5A, RELA, EGFR, TRAF2 和 PTPN2,如图4所示。
图2. 举例说明网络连接与高度优先的种子基因如何识别非种子基因(TNF)。
图3. 优先目标路径。采用Fisher精确检验(单边检验)计算95%置信区间(Cls;由行表示)的优势比(ORs)。
图4. 靶点通路串扰的可视化,并将相关证据制成表格。
2.2 建立支持Pi优先级的证据
目标是建立证据支持Pi优先用于类风湿关节炎和潜在的效用。研究者发现目前类风湿关节炎的临床概念验证目标往往是高度优先的。研究者将Pi应用于29个额外的免疫介导性状(如图5),利用临床概念验证指标(限制在16个性状和10个这样的目标)和批准指标的知识分析Pi输出,使其能够建立Pi预测因子的信息性。
图5. 分类学共分析了30个与免疫相关的性状。来源于实验因子本体论(EFO),与“免疫系统疾病”相关(用粗体标记)。
探讨基因如何影响免疫特性的治疗前景,发现Pi评分(在“发现模式”中)捕获了16个性状中的15个或批准药物的临床概念验证靶标的显著比例(如图6ab)。其中溃疡性结肠炎、强直性脊柱炎、全身性红斑狼疮(SLE)、克罗恩病、类风湿关节炎和多发性硬化症最明显(如图6c)。
图6.
a, 16种免疫特性;
b, 显示TSEA结果的散点图,包括标准化富集评分、覆盖率和FDR;
c, 基因主导的16个免疫性状的治疗景观,高度指示G2CT潜力。
然后,询问Pi对单个基因的评分如何告知通路级靶点的优先级(如图7),研究者发现,在多个特征中高度优先的基因的富集途径包括TH1 / 2/17分化,TCR,趋化因子,核苷酸寡聚化域样受体,磷酸肌醇3激酶(PI3K),丝氨酸/苏氨酸激酶(AKT),TNF ,有丝分裂原激活的蛋白激酶和JAK / STAT信号传导。具体富集包括I型和II型IFNs及其受体在多发性硬化症,与目前的治疗方法一致。研究者假设来自随机诱变筛选的IFN调节因子1(IRF1)调节剂的活性与多发性硬化症中的Pi评分相关,并且发现情况确实如此(图8),其中高度优先的基因(如SOCS1)显示在小鼠模型中的治疗潜力。
图7. 径向布局的免疫系统优先路径概述
图8. IRF1阳性调节因子(n = 65)在突变指数29和Pi评级(左)之间的相关性分析,以SOCS1的优先级交互图(右)。相关性基于皮尔逊检验(双边)。
研究特定蛋白质家族的Pi优先次序如何与治疗功效相关。研究者分析了一套完整的小分子抑制剂作为表观遗传学靶标,重点研究了SLE,因为有证据表明在发病机理中DNA甲基化和组蛋白乙酰化失调,获批药物的表观遗传学作用以及在小鼠模型中组蛋白脱乙酰基酶抑制的治疗益处。研究者发现在SLE患者来源的细胞测定中特异性抑制剂的活性与SLE的Pi评分之间存在高度相关性。排名最高的基因EHMT2编码一个甲基转移酶,促进核稳定性,其核结构改变被认为可促进SLE自身免疫(图9).
图9. 顶部,SLE患者(n = 5)PBMC中细胞因子刺激的免疫球蛋白G(IgG)水平在1μM时的表观遗传学探针活性与Pi值的关系。底部,计算Spearman等级相关性,根据随机检验(左下方)估算显着性水平(经验P值),并评估与其他29种免疫性状的特异性(右下方;误差线代表sd,平均居中)。
最后,研究者考虑如何识别跨性状评价很高的靶标。研究者首先根据排名(多性状评分分数(MRS))计算了大多数性状中靶标的高度评价,基于12个具有高G2CT潜力的性状鉴定了668个基因。然后,考虑了通路串扰,对这些基因进行了分析,确定了一个高度重要的网络(P = 5.4×10-67),包含丰富的JAK / STAT和TNF信号传导的50个基因(图10),与既定的TNF抑制作用和当前的研究兴趣JAK抑制剂相符。交叉验证这一点,研究者发现该网络高度丰富了小鼠免疫介导的疾病表型,可用药干扰性和免疫疾病治疗,但未批准的非免疫特性(图11)。
图10. 目标通路串扰的可视化,根据MRS对节点进行颜色编
图11. 网络中的目标富集(顶部;免疫和非免疫)和批准的治疗方法的详细信息(底部)。
3
总结
综上所述,研究者已经展示了基因信息的价值是如何通过一个整合的基因组级方法来转化的,以确定潜在的药物靶点和干预节点的优先级,并了解免疫特性的治疗前景。研究者已经证明Pi能够在没有偏置输入的情况下恢复实验/临床验证的目标和通路。研究者预计Pi将允许用户提出假设,以推进基因组中尚未开发但可能有药物作用的目标。pi是一个为转化研究而设计的开源和可扩展的系统,其目的是促进社区工作,支持利用遗传学进行早期药物开发。