TCGA数据挖掘 | Xena - TCGA数据下载

简介: TCGA数据挖掘 | Xena - TCGA数据下载

本文首发于“生信补给站”公众号   https://mp.weixin.qq.com/s/e3a7q4eY8CwnZOP28z5F9Q



TCGA (The Cancer Genome Atlas)作为目前超常用的癌症基因信息的数据库,有多种肿瘤的表达谱数据,变异信息(mutation,copy number),甲基化信息以及临床信息(人口学信息,分期,随访,生存状况),在生信挖掘文章中出镜率极高。

TCGA数据下载方式有很多种,本次简单介绍自己喜欢用的方式-使用UCSC xena 网站进行下载。


1,Xena官网

浏览器中输入网址 http://xena.ucsc.edu/ ,下拉找到Explore TCGA, GDC, and other public cancer genomics resources,点击

2,选择GDC,然后进入TCGA数据队列列表

其他数据集可根据需要自行常看。

3,选择数据集

下拉选择需要的队列,此处以BRCA为例

4,查看数据

点击  GDC TCGA Breast Cancer (BRCA) ,进入BRCA数据集,查看有哪些数据

5,下载所需数据

选择对应的文件链接,点击即可。此处以点击 HTSeq - Counts 为例


注意

  • 此数据为count数是log转化后的,需要的时候可以自行转为count数。
  • 记得下载probeMap,探针注释文件。
  • 涉及预后及生存相关分析,记得下载 survival data


完成以上,数据就准备好了 。

后面基于此数据会有一些简单的处理技巧以及生信挖掘中常见的分析思(TAO)路(LU)。

相关文章
|
4月前
|
数据采集 算法 数据挖掘
【数据挖掘】数据变换与离散化讲解与实战(超详细 附源码)
【数据挖掘】数据变换与离散化讲解与实战(超详细 附源码)
86 0
|
4月前
|
数据可视化 数据挖掘 大数据
【数据挖掘】数据规约中维归约、小波变换、主成分分析的讲解及实战(超详细 附源码)
【数据挖掘】数据规约中维归约、小波变换、主成分分析的讲解及实战(超详细 附源码)
65 0
|
4月前
|
数据可视化 算法 JavaScript
【Python数据挖掘】数据可视化及数据对象的相似性度量算法详解(超详细 附源码)
【Python数据挖掘】数据可视化及数据对象的相似性度量算法详解(超详细 附源码)
82 0
|
5天前
|
移动开发 算法 数据可视化
数据分享|Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例
数据分享|Spss Modeler关联规则Apriori模型、Carma算法分析超市顾客购买商品数据挖掘实例
|
4月前
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】逻辑Logistic回归在鸢尾花数据集中讲解及实战(超详细 附源码)
【数据挖掘】逻辑Logistic回归在鸢尾花数据集中讲解及实战(超详细 附源码)
64 0
|
4月前
|
数据挖掘
【数据挖掘】一元线性回归在鸢尾花数据集中实战预测(超详细 附源码)
【数据挖掘】一元线性回归在鸢尾花数据集中实战预测(超详细 附源码)
78 0
|
4月前
|
数据采集 存储 自然语言处理
【数据挖掘】数据清洗、数据集成、数据标准化的详解(超详细 附源码)
【数据挖掘】数据清洗、数据集成、数据标准化的详解(超详细 附源码)
98 0
|
4月前
|
数据采集 安全 数据挖掘
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
【数据挖掘】属性及其类型和数据的统计描述四分位数等详解(图文解释 超详细)
92 0
|
5月前
|
机器学习/深度学习 数据可视化 数据挖掘
Python数据分析与数据挖掘:解析数据的力量
Python数据分析与数据挖掘:解析数据的力量
|
5月前
|
机器学习/深度学习 算法 数据挖掘
【大数据】数据挖掘工具:发现数据中的宝藏
【大数据】数据挖掘工具:发现数据中的宝藏
67 0

热门文章

最新文章