基因共表达和转录调控网络
随着生殖生长
(DR)的开始,依次经历SMI、GPD、FMI和FOP过程形成穗结构,这是决定SNS每穗小穗数的关键,有助于粮食产量。因此,作者分析了基因共表达情况和调控网络,目的是找出控制这一过程的潜在因素。
- 作者基于PCA的距离计算了SMI到FOP阶段的伪时间,发现
GPD期和FMI期
(前半段)相对比较接近 - 在穗结构形成过程中,在四个阶段里一共鉴定出了
8200
个基因差异表达DGE,分为6个不同的簇cluster。
花分生组织和各种激素代谢基因
在SMI中高表达;激素信号转导、极性建立相关基因
在GPD和FMI中高表达;- 在花器官发育方面,
极性控制基因
在FOP时高表达。
- 同时,发现在第3簇和第6簇内,
ERF和WRKY
转录因子TFS在SMI期富集并高表达。 - 这种基因表达模式符合时空特征,并说明了
单个
TFs家族在调控穗发育过程转录网络中的潜在重要性。
可及性较高
的染色质区域能为TF的结合提供对接位点
,在图中,可以看出ERF、BHLH和SPL
的结合基序(模体)在SMI与FOP的结合过程中可及性变异程度最大
,说明这些TFs转录因子具有的潜在重要性。- 从SMI到FMI的
时间序列表达基因簇
之间存在明显的序列调控关系,即C6-C3-C2-C4。而在C1和C5中,FOP特异表达的基因是相互分离调控的。表明小穗和小花发育之间存在不同的转录调控网络 - 从图中可以看出
ERF、B3、TCP
等TFs可能在该网络中起核心调控作用
- 在该调控网络中可以找到一些与小麦穗发育有关的调节因子,比如:TaTB1、VRN1。表明了作者构建出来的
TRN网络在发掘重要调节因子方面的能力
。 - 接下来,作者为了验证TFs之间转录调控层次的预测能力,提取了一个小模块,其中包含了在其他作物中单独进行功能研究但尚未知道调控关系的因子,比如SPL6、MADS34。即红框中这些因子
- 作者推测在SPL6-MADS34-MADS15-HMA模块后有一个
正的转录调控体系
,通过荧光素酶报告检测,在烟草叶片中观察到它们之间存在一个正转录调控回路。
多组学数据挖掘调控因子
染色质的开放
区域是建立转录调控关系的关键
- 多数TFs结合基序存在于染色质的
开放区域
。 - 在转录因子结合
中心
区域,DNA的变异程度明显降低
。 - 在开放染色质区域含有明显较
高
的GWAS信号,这些信号与穗形态特征相关。 - 开放染色质区的QTL频率是全基因组QTL频率的5倍,GNPS、SNS等许多性状均有类似结果。
- 作者以每穗可育小穗数FSPS为例,经GWAS分析,共有153个显著相关位点,将候选区间扩大到以GWAS信号峰为中心的
1兆比
MB,共鉴定出2916
个候选基因。其中有1762
个基因(C1和C4)在DR和SMI阶段的染色质可及性开放程度最高,这可能与小穗原基的分化有关,最终影响小穗数。这一结果表明,大部分GWAS候选基因在与相应性状关键发育阶段具有较高的染色质开放度。 - 一共
6000
多个基因,以转录因子TFS编码基因为要求,得到776
个候选基因进行进一步筛选,其中,超过一半(404
个TFs)位于穗发育相关的遗传区域内。然后通过寻找开放染色质区域中的SNP来进一步将候选TFs缩小到260
个,它们可能影响转录调控回路,并重新连接穗发育的转录调控网络TRN
- 在候选TFs中,分为三类:
第一类
在小麦中功能已经被研究,第二类
在其他物种中已被研究,称其为“保守型”,第三类
在小麦和其他作物中功能未知,称其为“新型” - 值得注意的是,大多数是“新型”转录因子TFs,多达
208
个,它们没有在小麦或其他作物中研究过。这些转录因子TFs在ERF、WRKY、BHLH、MYB、B3家族中富集。
验证调控因子遗传结构
在保守型
调控因子中,TaSPL6, TaMADS34, TaMADS15同样出现在之前提到的转录调控网络中,因此,作者接来来验证它们是否会参与穗发育过程。
- 通过原位杂交技术展示了这些调控因子
时空表达
模式,TaSPL6,TaMADS34和 TaMADS15在SAM期弱表达,而在SMI和FOP期高表达。TaHMA是TaMADS15的下游靶位点,在FOP小花原基中也有表达。相似的时空表达模式说明它们在穗发育中的转录调控结构和潜在作用。 - 然后作者对这三个调控因子进行
RNAi
沉默,得到转基因植株,34和15(后两个)表现出相似的表型变化,穗长SL
缩短 - 每穗小穗数
SNS
降低 - 穗粒数
GNPS
降低
- 在TasPL6-RNAi转基因小麦中,观察到TaMADS34的表达显著降低,进一步表明TaSPL6正向调节TaMADS34,另外后续的调控过程也相类似。证明TASPL6-TAMADS34-TAMADS15-TAHMA模块在小麦穗发育过程中具有调控功能。
- 然后从进化的角度进一步分析了小麦和禾本科中TASPL6-TAMADS34-TAMADS15-TAHMA调控模块,在二倍体、四倍体、六倍体小麦中,发现在
MADS15同源基因
的启动子区均存在一个MADS34
结合模体,同时,在附图5C中,可以得出在MADS34
同源基因的启动子区存在SPL6
的结合模体,表明该调控模块可能在小麦中保守
。 - 然而,在水稻(Oryza sativa)和玉米(Zea Mays)中,MADS15的启动子区没有MADS34的结合模体,MADS34的启动子区也没有SPL6的结合模体,说明
该调控模块在禾本科植物中可能存在差异
。
验证新发现的调控因子
作者为了验证该模型在识别新型小麦穗发育调节因子方面的能力,研究了Kronos、Cadenza、KN9204的Meta Tilling突变系的穗发育缺陷,将其突变位点
经全外显子测序
鉴定。
全外显子测序:利用序列捕获技术将全基因组中所有外显子区域DNA序列捕获,富集后进行高通量测序的方法。可用于研究已知基因的单核苷酸多态性位点、插入缺失位点等,不适合用于研究基因组结构的变异。
- 在208个新型TFs中,131个TFs包含至少有一个
功能缺失突变
的突变系 - 在85个纯合突变株系中,有44个TFs在三种类型中表现出
穗发育缺陷
,分别是:
- 第一组:开花时间差异
- 第二组:小穗或小花退化差异
- 第三组:穗长或每穗小穗数差异
- 图C和D展示了不同类型的突变系,可以得出:
- TaCAMTA-A突变体的
开花时间
比对照提前
了两周左右 - TaWRKY37-A突变体的
退化小穗数
显著增多
,导致穗粒数降低 - TabHLH009-A突变体突变体
穗长缩短
,小穗密度增加
- 在四倍体小麦
Kronos
的功能缺失突变体TaNAC22-A
中,由于花原基分化
没有正常终止,所以每个小穗的小花数增加。但是多数小花败育,最终导致穗粒数GNPS
降低。 - 通过
原位杂交
进一步证实了这些基因的时空表达模式,TaWRKY37-A、TabHLH009-A和TanAC22-A基因均在小穗发育起始期和花原基分化期,与它们的表型缺陷一致。
- TaWRKY37-A在
穗基部和小花分生组织
中高表达 - TaBHLH009-A在
穗上部和小花分生组织
中高表达 - TaNAC22-A在
小花原基
中有显著表达。
TaMYB4-A对穗发育的影响
为了进一步了解TRN和GWAS技术在单个基因分子功能研究中的应用前景,作者选取了一个新型调控因子TaMYB4-A进行深入的研究。TaMYB4-A
是TRN中的TFs之一(在前期调控阶段)
- 通过GWAS分析,发现它位于一个与每穗可育小穗数
FSPS
显著相关的区间内。 - 它的两种单倍型(C型和T型)可分离出214个小麦自然群体,它们的每穗可育小穗数FSPS具有差异显著。
- 通过原位杂交发现TaMYB4-A在
DR期
的小穗分生组织
初步表达,在SMI期和FMI期
的小穗和小花原基
中高表达,说明它在确定小穗数中起作用。
- 作者从KN9204、Cadenza中找到了TaMYB4-A功能缺失突变体,发现突变后SL、SNS、GNPS显著
降低
,进一步证实了它在调节小穗发育中的作用。 - 荧光素酶报告检测得出在TaMYB4-A的潜在上游调节因子中,
WFZP
和DOF型TFTADOF17
(Traescs2B02G592700)分别能抑制或激活烟草中的TaMYB4-A
。
上面三个基因在穗形成过程中表现出与TaMYB4-A同步的时空表达
模式
- TaAP2-39:通过控制
ABA/GA
平衡调控水稻分蘖和穗/花序的发育 - TaI-BAK1:与
油菜素甾体激酶
相关,在水稻中过量表达可增加穗长和每穗粒数 - TaPILS7:编码
生长素
载体成分
- WFZP高表达转基因小麦中TaMYB4-A的表达量下调,进一步
证明了WFZP对TaMYB4-A的抑制
作用 - 小麦TaMYB4-A的遗传网络