文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)

简介: 文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)

TaMYB4-A关键SNP变异影响

最后,作者想知道TaMYB4-A的不同单倍型是如何影响小麦穗部结构,因此进行关联分析

640.png

  • SNP-939(C/T)变异位点位于TaMYB4-A的启动子区,而且刚好在WFZP核心结合基序的下方。该位置的SNP变异可能通过影响WFZP结合从而导致TaMYB4-A表达差异。
  • 通过对保守基序的识别,证实了WFZP对TamyB4-A的抑制作用,在荧光素酶报告试验中,发现烟草叶片的C→T突变消除了这种抑制作用
  • 作者进一步选择了两种类型(C型和T型)的33个不同小麦品种,测定了TaMYB4-A的表达量和穗形态
    这一结果为SNP变异引起TaMYB4-A表达水平差异进而影响SL和FSPS提供了遗传学依据
  • C型:表现出优良的农艺性状,即SL较长,FSPS较多,TaMYB4-A表达水平显著较高
  • T型:表现出SL较短,FSPS较少,TaMYB4-A表达水平较低。
  • 此外,作者还想知道TaMYB4-A启动子中的C/T变异位点是如何在我国育种过程中被选择的。于是基于中国小麦微型核心种质的外显子捕获测序数据,得出:

640.png

  • 相比于引进品种(45.45%) ,我国地方品种(82.08%)和现代品种(78.18%)携带C型等位基因的种质比例较高。
  • 随着育种时间推移,C型的等位基因频率显著升高,表明TaMYB4-A的C型基因在我国育种过程中得到了广泛的应用 ,尤其是1978年以后。
  • 自1950年以来,骨干亲本在我国广泛应用于小麦品种改良,包括Zhoumai16, St2422/464, Nanda2419,Nanda2419, St2422/464, Funo, Xiaoyan6, Aimengniu, Zhou8425B, Abbondanza and Lovrin10(图中的十个品种),21个骨干亲本中有17个在SNP-939位点为C型,除了Aimengniu 和 Lovrin10,这两个亲本的衍生品种在我国广泛种植,这些衍生品种更倾向于从另一个亲本中保留SNP-939的C型。
  • 该图是SNP-939在中国不同生态区的等位基因的比例,中国主要小麦种植区的等位基因具有明显的分布特征,以下为T型的占比情况:
  • 春小麦区相对较多(≥40%,VI, VII, VIII)
  • 其次是冬春混合区(IX和X,分别为22.22%和23.08%)
  • 在冬麦区(I、II、III、IV、V)出现频率较低(<20%)
    因此,TaMYB4-A的C型等位基因可能来源于中国地方种质,在育种过程中被广泛应用

讨论部分

小麦是最早被驯化的作物之一,驯化与穗部结构变化联系在一起,以利于收获和提高产量。提高产量也是育种的主要目标之一。对于谷类作物来说,穗结构通过影响小穗和小花的发育,在很大程度上决定着籽粒数量,研究控制穗部结构的分子机制将有助于设计育种过程.

作者制作了一个基于时间序列的表观基因组图谱,包括从营养发育到生殖生长过程中各种类型的组蛋白修饰,染色质可及性变化和转录组数据,这将为系统研究小麦穗发育的关键调控因子提供有价值的数据资源。

640.png

总之,作者结合多组学数据揭示了小麦穗发育过程中的转录调控网络TRN和表观遗传变化。结合GWAS分析,作者发现了几十个影响小穗结构的新调控因子,揭示了TaMYB4-A启动子内WFZP结合位点的SNP变异在我国小麦育种过程中起着关键作用。

材料与方法

材料:冬小麦品种KN9204

环境:温室

取样:在8个发育阶段,各取10-50个小穗

转基因植株

利用冬小麦品种KN9204进行基因序列扩增,春小麦品种Fielder获得转基因小麦植株

测序数据处理

  • reference genome:Chinese Spring-RefSeq v1.0
  • FastQC v0.11.8:for ensure the high quality of reads
  • BWA-MEM v0.7.17:for ATAC-seq and CUT&Tag seq
  • hisat2:短序列比对工具,主要用于RNAseq数据的比对
  • Samtools v1.4:进行索引、排序、过滤
  • Picard v2.23.3:删除读数中重复项
  • deepTools v3.3.0:数据规范化可视化

RNA数据分析

  • Counts v2.0.1:计数
  • DESeq2 v1.26.0:差异表达分析
  • ComplexHeatmap (v2.4.3):聚类、可视化
  • clusterProfiler v3.18.1:基因功能富集

ATAC-seq数据分析

  • MACS2 v2.1.4:调用峰
  • ChIPseeker v1.26.2:注释峰
  • HINT tool v0.13.2:鉴定转录因子变化情况

差异染色质修饰富集区检测

  • DiffBind v2.16.2:计算峰值读数

构建基因调控网络

  1. 通过PCA分析对穗发育过程中表达的基因进行分组
  2. 计算相邻组之间的欧几里得距离
  3. 进行坐标缩放,计算基因的拟合曲线
  4. 根据基因表达情况和标准化的数据,对每个基因进行PCA分析

构建系统发育树

  • 利用水稻MADS34和MADS15蛋白序列鉴定小麦和玉米中的同源基因
  • MUSCLE v3.8.1551:序列比对
  • trimAl v1.4.rev15:筛选氨基酸位置
  • RAxML v8.2.12:构建最大似然系统发生树

GWAS全基因组关联分析

  • 214份小麦660K单核苷酸序列中筛选出319,558个单核苷酸序列与表型进行关联分析
  • Tassel v5.2
  • CMplot:Manhattan plots and quantile-quantile plots

基于基因的关联分析

利用287份中国小麦微型核心种质的全基因组外显子捕获测序数据,确定了TaMYB4-A基因6kb区的单核苷酸多态性,包括外显子区、内含子区、4kb启动子区和0.5kb 3'-UTR区。

  • Haploview 4.2:计算连锁不平衡,制作LD图

数据获取

荧光素酶实验

LUC荧光素酶,可以极其灵敏、高效地检测基因的表达。是检测转录因子与目的基因启动子区DNA相互作用的一种检测方法。

荧光素酶基因报告是指以荧光素(luciferin)为底物来检测萤火虫荧光素酶(fireflyluciferase)活性的一种报告系统。荧光素酶可以催化luciferin氧化成oxyluciferin,在luciferin氧化的过程中,会发出生物荧光,是检测转录因子目的基因启动子区DNA相互作用的一种检测方法。

原位杂交

原位杂交技术的基本原理是利用核酸分子单链之间有互补的碱基序列,将有放射性或非放射性的外源核酸(即探针)与组织、细胞或染色体上待测DNA或RNA互补配对,结合成专一的核酸杂交分子,经一定的检测手段将待测核酸在组织、细胞或染色体上的位置显示出来。

END

© 素材来源于网络,侵权请联系后台删除

往期推荐:

文献丨群体转录组分析锁定关键转录因子

文献丨转录组RNA seq——青年阶段!

笔记丨ggplot2热图入门学习笔记

笔记丨PCA分析基本知识和数学原理

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
4月前
|
前端开发 JavaScript 开发者
JavaScript:构建动态网络的引擎
JavaScript:构建动态网络的引擎
|
4月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
430 0
|
5月前
|
机器学习/深度学习 数据采集 传感器
【故障诊断】基于matlab BP神经网络电机数据特征提取与故障诊断研究(Matlab代码实现)
【故障诊断】基于matlab BP神经网络电机数据特征提取与故障诊断研究(Matlab代码实现)
197 0
|
3月前
|
机器学习/深度学习 大数据 关系型数据库
基于python大数据的青少年网络使用情况分析及预测系统
本研究基于Python大数据技术,构建青少年网络行为分析系统,旨在破解现有防沉迷模式下用户画像模糊、预警滞后等难题。通过整合多平台亿级数据,运用机器学习实现精准行为预测与实时干预,推动数字治理向“数据驱动”转型,为家庭、学校及政府提供科学决策支持,助力青少年健康上网。
|
4月前
|
分布式计算 安全 大数据
别等被黑客敲门才醒悟:大数据如何帮你防住网络攻击?
别等被黑客敲门才醒悟:大数据如何帮你防住网络攻击?
202 32
|
3月前
|
机器学习/深度学习 人工智能 算法
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
【基于TTNRBO优化DBN回归预测】基于瞬态三角牛顿-拉夫逊优化算法(TTNRBO)优化深度信念网络(DBN)数据回归预测研究(Matlab代码实现)
183 0
|
4月前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
3月前
|
机器学习/深度学习 分布式计算 Java
Java与图神经网络:构建企业级知识图谱与智能推理系统
图神经网络(GNN)作为处理非欧几里得数据的前沿技术,正成为企业知识管理和智能推理的核心引擎。本文深入探讨如何在Java生态中构建基于GNN的知识图谱系统,涵盖从图数据建模、GNN模型集成、分布式图计算到实时推理的全流程。通过具体的代码实现和架构设计,展示如何将先进的图神经网络技术融入传统Java企业应用,为构建下一代智能决策系统提供完整解决方案。
410 0
|
4月前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
809 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
4月前
|
机器学习/深度学习 数据采集 运维
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断
改进的遗传算法优化的BP神经网络用于电厂数据的异常检测和故障诊断