每日文献:2018-01-09

简介: PIVOT:转录组数据整合分析和可视化平台原标题:platform for interactive analysis and visualization of transcriptomics data原文地址: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1994-0转录组分析是目前可以说最成熟的分析体系,并且已经有有很多的R包可以用来进行数据分析。

PIVOT:转录组数据整合分析和可视化平台

原标题:platform for interactive analysis and visualization of transcriptomics data
原文地址: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1994-0

转录组分析是目前可以说最成熟的分析体系,并且已经有有很多的R包可以用来进行数据分析。但是使用这些R包需要你有一定写脚本的能力,并且还要懂得如何对原始数据进行处理。为了方便用户使用, 作者整合了目前开源的R包,开发了一个网页工具,相当于给其他R包增加了可视化界面,用来满足大家用鼠标分析数据的渴望。

目前该工作有如下的分析模块

  • 数据标准化
  • 数据过滤
  • 基本分析模块
  • 差异表达分析模块:DESeq2, edgeR, SCDE, Monocle, Mann-Whitney U test
  • 聚类: Hierarchical, K-means, SC3, Community detection, Classification with caret, Cell state ordering with Monocle2/Diffusion pseudotime
  • 降维:PCA, t-SNE, Metric/Non-Metric MDS, penalized LDA, Diffusion Map
  • 相关分析
  • 基因集富集分析(Gene Set Enrichment Analysis):KEGG pathway analysis, Gene ontology analysis
  • 互作网络分析:STRING protein association network, Regnetwork visualization, Mogrify based trans-differentiation factor prediction
  • 其他

作者文章还给了几张很好看的图,或许你会感兴趣

img_b017ccab18daf031e9f56294113b2821.png
几个分析模块结果

我觉得要是你都知道如何正确使用这些工具,那你的数据分析能力也就合格了。所以感觉这个包不是给完全新手用,而是给那些写代码累了,用鼠标点点休息娱乐下的人用。

安装非常的简单,由于PIVOT只是对已有的R包进行整合开发,所以仅仅只要保证你先安装了R,之后就输入如下命令,等待30分钟左右即可。

# dependecies that need to be manually installed 
install.packages("devtools") 
library("devtools")
source("http://bioconductor.org/biocLite.R")  
biocLite("BiocUpgrade") 
biocLite("GO.db")
biocLite("HSMMSingleCell")
biocLite("org.Mm.eg.db")
biocLite("org.Hs.eg.db")
biocLite("DESeq2")
biocLite("SingleCellExperiment")
biocLite("scater")
biocLite("monocle")

# Install PIVOT
install_github("qinzhu/PIVOT")
biocLite("BiocGenerics") # You need the latest BiocGenerics >=0.23.3

如果你在Windows下安装,你可能会遇到一些波折,请坚持住!希望你会看到这个界面

img_c66ce5c8c76fb87b4a8f2b5b1977d75a.png
登陆界面

而我已经因为下面这个问题而放弃了

img_1e53f0950ec6c70fc5389814bd0c6716.png
我看不懂的报错

TCGA-Assembler 2--获取TCGA/CPTAC数据的好帮手

原标题:TCGA-assembler 2: software pipeline for retrieval and processing of TCGA/CPTAC data
原文地址:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btx812/4764001?redirectedFrom=fulltext

The Cancer Genome Atlas (TCGA)项目里存放着大量的数据可供分析,但是下载数据一直是一个老大难的问题。尤其是2016年,TCGA的数据还转移到了Genomic Data Commons (GDCs),并且还多了由CPTAC提供的TCGA的蛋白组学数据。

作者在开发过TCGA-Assembler方便进行数据下载,为了能够从新的数据库中下载数据,他更新了软件版本,叫做TCGA-assembler 2 (TA2),能够自动化从GDC和CPTAC里下载数据。

项目地址是:http://www.compgenome.org/TCGA-Assembler/

PS 这篇文章是2017年10月发的。

目录
相关文章
每日文献:2018-02-27
如何使用高通量测序检测T-DNA插入 之前拿到了一批混池测序的数据,师兄除了让我帮他找一个突变位点,还让我顺便检查下基因组上的T-DNA插入。我去查了一下相关资料,已经有人那么干了,这里简要说明一下步骤。
973 0
每日文献:2018-02-24
自然选择的分子印迹(精读第三天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
1021 0
|
自然语言处理
每日文献:2018-02-23
自然选择的分子印迹(精读第二天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
873 0
每日文献:2018-02-20
自然选择的分子印迹(精读第一天) 由于最近不知不觉开始涉及群体遗传学,所以准备精读(其实就是原文翻译)一篇review尽力去了解这个我陌生的领域。文章原标题为Molecular Signatures of Natural Selection, 作者Rasmus Nielsen。
720 0
|
Perl
每日文献:2018-01-29
原文标题:hppRNA—a Snakemake-based handy parameter-free pipeline for RNA-Seq analysis of numerous samples 原文地址: https://academic.
1008 0
每日文献:2018-01-25
原文标题:APAtrap: identification and quantification of alternative polyadenylation sites from RNA-seq data 工具网址:https://sourceforge.net/projects/apatrap/ 可变多聚腺苷酸 (APA)逐渐地被认为在转录组多样性和基因表达调控中起到重要的作用。
928 0
|
数据库
每日文献:2018-01-24
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天要读部分是我看到这篇文章才接触到的一个概念基因的PAV(presence-absence variation)突变, 也是这篇文章对66个物种深度测序组装contig的主要用途。
1131 0
每日文献:2018-01-23
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 今天看的部分是【Identification of functionally diverse alleles】,也就是找到功能变化等位基因。
889 0
每日文献:2018-01-22
植物基因组的同线性和共线性 原文题目:Synteny and Collinearity in Plant Genomes 先明确两个概念,虽然synteny和collineraity翻译之后都有线性,但是要注意两者的联系和区别: 同线性(syn...
913 0
每日文献:2018-01-19
Nature Genetics:水稻泛基因组文章继续解读 原文标题: Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice 原文地址: https://www.nature.com/articles/s41588-018-0041-z 在组装完66个品系水稻的contig后,也找到了变异信息如SNP/InDel, SV等,下面的工作就是从各种角度对这些变异信息继续解读。
931 0