植物的Transcription Factor挖掘笔记

简介: 1、了解一下有哪些转录因子1、在网站http://planttfdb.cbi.pku.edu.cn/中查找已知转录因子有哪些2、下载已有种子根据第一步中已知的转录因子的简写,在http://pfam.xfam.org/search#searchKeywordBlock中检索相应的种子文件,如果有,则下载,若没有则下一步自己制作。

1、了解一下有哪些转录因子

1、在网站http://planttfdb.cbi.pku.edu.cn/中查找已知转录因子有哪些

2、下载已有种子

根据第一步中已知的转录因子的简写,在http://pfam.xfam.org/search#searchKeywordBlock中检索相应的种子文件,如果有,则下载,若没有则下一步自己制作。

3、制作种子

  1. http://planttfdb.cbi.pku.edu.cn中下载其原始序列。
  2. 截取原始序列的前200条,在https://www.ebi.ac.uk/Tools/msa/clustalo/进行比对,输出文件格式为STOCKHOLM,并下载至本地。
  3. 使用hmmbuild工具,将sto文件转换为种子为种子文件xx.hmm
hmmbuild xx.hmm xx.sto 
#hmm文件为输出文件
  1. 将待提取转录因子的蛋白质文件与种子文件进行对比,得出相应转录因子的序列号,输出为txt格式。
hmmsearch xx.hmm xx.pep.fa >xx.txt
  1. 从输出文件中提取出对应的ID号,并保存为纯文本格式,每一个序列号独占一行。
    (关于ID的提取,主要是提取阈值以上的ID号,其他信息一概舍去)
perl fetch.pl ID.txt xx.fas

这一步也可以用ccj的TBtools来完成。

相关文章
|
1天前
|
数据可视化 算法
【视频】Copula算法原理和R语言股市收益率相依性可视化分析(一)
【视频】Copula算法原理和R语言股市收益率相依性可视化分析(一)
|
1天前
|
数据可视化 算法
Copula算法原理和R语言股市收益率相依性可视化分析
Copula算法原理和R语言股市收益率相依性可视化分析
|
1天前
|
算法 数据可视化
【视频】Copula算法原理和R语言股市收益率相依性可视化分析(二)
【视频】Copula算法原理和R语言股市收益率相依性可视化分析(二)
|
2天前
|
数据可视化 算法 数据挖掘
R语言 PCA(主成分分析),CA(对应分析)夫妻职业差异和马赛克图可视化
R语言 PCA(主成分分析),CA(对应分析)夫妻职业差异和马赛克图可视化
13 3
|
1天前
|
数据可视化 算法 数据挖掘
PCA(主成分分析),CA(对应分析)夫妻职业差异和马赛克图可视化
PCA(主成分分析),CA(对应分析)夫妻职业差异和马赛克图可视化
|
18天前
|
机器学习/深度学习 弹性计算 数据可视化
玩ST、肿瘤研究的来学习一下!16分Nature子刊的单细胞空间转录组+机器学习
Nature Communications 发表了一项关于空间转录组和机器学习在肿瘤研究中的应用。研究聚焦于HPV阴性口腔鳞状细胞癌,通过整合单细胞和空间转录组分析,揭示了肿瘤核心(TC)和前沿边缘(LE)的独特转录特征。TC和LE的基因表达模式与多种癌症的预后相关,其中LE基因标志关联不良预后,而TC则与较好预后相关。利用机器学习,研究人员建立了预测模型,识别出跨癌症类型的保守TC和LE特征。此外,他们还分析了RNA剪接动态,发现了潜在的治疗脆弱性。这项工作为肿瘤生物学和靶向治疗提供了新见解,并为药物开发提供了依据。
20 0
|
1月前
单细胞分析|在 Seurat 中使用 sctransform
单细胞分析|在 Seurat 中使用 sctransform
19 0
|
2月前
|
机器学习/深度学习 算法 数据挖掘
数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析
数据分析案例-基于PCA主成分分析法对葡萄酒数据进行分析
69 0
|
10月前
|
数据可视化 关系型数据库 数据挖掘
scRNA分析|一(尽)文(力)解决你的单细胞火山图问题
scRNA分析|一(尽)文(力)解决你的单细胞火山图问题
227 0
|
8月前
|
算法 数据挖掘
高分SCI必备-全方位无死角展示降维数据的三维立体图
高分SCI必备-全方位无死角展示降维数据的三维立体图
77 0