近日来自Genome Biology的一项研究中提出了一个综合数据库:My Personal Mutanome (MPM),用于加速精准癌症医学方案的开发。MPM提供了基于网络的诊断和药物基因组学方法,用来了解临床环境中复杂的基因型-表型关系和治疗反应,有望促进肿瘤发生的可操作突变的鉴定和人类相互作用组水平的个体化治疗。
大量的基因组测序数据激发了个性化治疗的新挑战,并促进了肿瘤药物的发现。My Personal Mutanome (MPM)数据库包含了来自The Cancer Genome Atlas的33种癌症类型中超过10,800个肿瘤外显子组的490,245个突变,映射至94,563个结构分辨/预测的蛋白-蛋白相互作用界面(“网络边扰动”)和311,022个功能位点(“网络节点扰动”),包括配体蛋白结合位点和8种类型的蛋白质翻译后修饰。对于这些作图的相互作用,总共获得了8,844个存活结果和1,271,132个药物反应。
随着高通量测序不断发展,已经有数十万个外显子组和基因组发布。癌症基因组图谱(TCGA,https://www.cancer.gov/tcga)计划已对33种癌症类型中超过11,000名患者的基因组/外显子组进行了表征。癌症的体细胞突变目录(COSMIC)和cBioPortal等这些数据和网络资源极大地促进了癌症的研究和药物发现,但对于精准医学发展至关重要的变异体致病性仍没有更好解释。典型的计算方法也只能以临床决策所需的高置信度来识别一小部分致病变体。对因果和临床上可行的突变进行鉴定和优先排序对于了解其在肿瘤发生和疾病进展中的作用、发现新的生物标记并提供生物学相关的药物靶标方面至关重要。
论文小组的所有先前的观察和其他研究提供了人类癌症体细胞突变的节点和边缘效应的功能验证。这些结果激励作者开发一个系统生物学工具,用于查询人类相互作用体中的此类节点突变和边缘突变,这将有助于识别用于精确癌症药物的新的功能突变/基因、药物靶点和药物基因组学生物标志物。
图1数据库的总体设计
论文研究小组收集并处理了包括21,759种蛋白质,490,245个体细胞突变和544,692个突变病例的121,172个PPI,在1074个癌细胞系中测试的251种药物的药物反应,41,843种 PDB和535,182个蛋白质功能位点,用于蛋白质-配体结合并跨越7种类型的蛋白质翻译后修饰(PTMs):乙酰化,丙二酸化,甲基化,邻位糖基化,磷酸化,琥珀酰化,泛素化。
以上所有的数据及其结果都已经集成到了关系数据库MPM中。此外,作者的网站利用的几个主要实体(如药物、蛋白质)和各实体之间的关系如下图所示,用户可依据此体系结构找到需要搜索的信息。
图2.数据库的信息体系结构
作者表示,将继续把人类相互作用组更新到数据库中,特别是包括更无偏的系统PPIs数据。此外,将为功能站点提供选择较小窗口的功能。MPM的未来更新将侧重于提供更完整、更高质量的人类相互作用体(包括蛋白质-DNA/RNA相互作用)、功能位点和来自CPTAC的蛋白质基因组学数据。作者将整合更多的人类基因组测序数据,包括跨组学精准医疗(TOPMed)计划,阿尔茨海默症测序项目(ADSP),以及国际癌症基因组联盟(ICGC),通过添加更加个性化的基因组分析来改善MPM的实用性。MPM将每年更新一次。