植物的Transcription Factor挖掘笔记

简介: 1、了解一下有哪些转录因子1、在网站http://planttfdb.cbi.pku.edu.cn/中查找已知转录因子有哪些2、下载已有种子根据第一步中已知的转录因子的简写,在http://pfam.xfam.org/search#searchKeywordBlock中检索相应的种子文件,如果有,则下载,若没有则下一步自己制作。

1、了解一下有哪些转录因子

1、在网站http://planttfdb.cbi.pku.edu.cn/中查找已知转录因子有哪些

2、下载已有种子

根据第一步中已知的转录因子的简写,在http://pfam.xfam.org/search#searchKeywordBlock中检索相应的种子文件,如果有,则下载,若没有则下一步自己制作。

3、制作种子

  1. http://planttfdb.cbi.pku.edu.cn中下载其原始序列。
  2. 截取原始序列的前200条,在https://www.ebi.ac.uk/Tools/msa/clustalo/进行比对,输出文件格式为STOCKHOLM,并下载至本地。
  3. 使用hmmbuild工具,将sto文件转换为种子为种子文件xx.hmm
hmmbuild xx.hmm xx.sto 
#hmm文件为输出文件
  1. 将待提取转录因子的蛋白质文件与种子文件进行对比,得出相应转录因子的序列号,输出为txt格式。
hmmsearch xx.hmm xx.pep.fa >xx.txt
  1. 从输出文件中提取出对应的ID号,并保存为纯文本格式,每一个序列号独占一行。
    (关于ID的提取,主要是提取阈值以上的ID号,其他信息一概舍去)
perl fetch.pl ID.txt xx.fas

这一步也可以用ccj的TBtools来完成。

相关文章
|
6月前
|
数据挖掘 数据库
略微学习一下二区4.5分纯生信,单基因肺结核叶酸基因集+泛癌分析
研究摘要: 一项发表于2023年《MEDIATORS OF INFLAMMATION》杂志的文章发现,RTP4基因可能成为诊断肺结核的新生物标志物。研究者通过分析GEO数据库中的多个微阵列数据集,使用WGCNA方法识别与肺结核和叶酸生物合成相关的基因模块。RTP4在健康与肺结核患者间的表达有显著差异,并且在抗结核治疗前后表达量变化。泛癌分析显示,RTP4在不同肿瘤类型中的表达与预后关联不一,提示其可能在多种癌症中具有重要功能。这些发现支持RTP4作为诊断工具的潜力,并为进一步研究其在结核病和癌症中的作用奠定了基础。
87 1
|
6月前
|
自然语言处理 数据可视化 数据挖掘
基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析(下)
基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析
268 0
|
6月前
|
存储 自然语言处理 数据可视化
基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析(上)
基于词云图+Kmeans聚类+LDA主题分析+社会网络语义分析对大唐不夜城用户评论进行分析
239 0
|
6月前
|
数据采集 机器学习/深度学习 算法
数据分享|WEKA关联规则挖掘Apriori算法在学生就业数据中的应用
数据分享|WEKA关联规则挖掘Apriori算法在学生就业数据中的应用
|
6月前
|
算法 数据可视化 网络可视化
R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化(上)
R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化
R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化(上)
|
6月前
|
数据可视化 数据挖掘 定位技术
数据分享|R语言生态学种群空间点格局分析:聚类泊松点过程对植物、蚂蚁巢穴分布数据可视化
数据分享|R语言生态学种群空间点格局分析:聚类泊松点过程对植物、蚂蚁巢穴分布数据可视化
|
6月前
|
数据可视化 算法
R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化(下)
R语言Apriori算法关联规则对中药用药复方配伍规律药方挖掘可视化(下)
|
6月前
|
数据采集 数据可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
|
6月前
|
数据挖掘 网络可视化
R语言APRIORI关联规则、K-MEANS均值聚类分析中药专利复方治疗用药规律网络可视化
R语言APRIORI关联规则、K-MEANS均值聚类分析中药专利复方治疗用药规律网络可视化
|
6月前
|
机器学习/深度学习 算法 数据挖掘
JCR一区5.4分|经典~非肿瘤机器学习筛选生物标志物+qPCR
本文介绍了一项使用机器学习算法识别间变性甲状腺癌(ATC)新型生物标志物和免疫浸润特征的研究。该研究发表在2023年9月的《Journal of Endocrinological Investigation》上,IF为5.4。通过对GEO数据库中的RNA测序数据进行分析,研究人员鉴定出425个差异表达基因,并利用LASSO和SVM-RFE算法确定了4个ATC特征基因(ADM、PXDN、MMP1和TFF3)。这些基因在诊断、药物敏感性和免疫微环境中具有潜在价值,可能成为ATC诊断和治疗的生物标志物。
127 0
下一篇
无影云桌面