TaMYB4-A关键SNP变异影响
最后,作者想知道TaMYB4-A的不同单倍型是如何影响小麦穗部结构,因此进行关联分析
- SNP-939(
C/T
)变异位点位于TaMYB4-A的启动子区,而且刚好在WFZP核心结合基序的下方。该位置的SNP变异
可能通过影响WFZP结合
从而导致TaMYB4-A表达差异。 - 通过对保守基序的识别,证实了WFZP对TamyB4-A的
抑制
作用,在荧光素酶报告试验中,发现烟草叶片的C→T突变消除
了这种抑制作用 - 作者进一步选择了两种类型(C型和T型)的33个不同小麦品种,测定了TaMYB4-A的表达量和穗形态
这一结果为SNP变异引起TaMYB4-A表达水平差异进而影响SL和FSPS提供了遗传学依据
- C型:表现出
优良
的农艺性状,即SL较长,FSPS较多,TaMYB4-A表达水平显著较高 - T型:表现出SL较短,FSPS较少,TaMYB4-A表达水平较低。
- 此外,作者还想知道TaMYB4-A启动子中的C/T变异位点是如何在我国育种过程中被选择的。于是基于中国小麦微型核心种质的
外显子捕获
测序数据,得出:
- 相比于引进品种(45.45%) ,我国地方品种(82.08%)和现代品种(78.18%)携带C型等位基因的种质比例较高。
- 随着育种时间推移,C型的等位基因频率显著升高,表明TaMYB4-A的C型基因在我国育种过程中得到了广泛的应用 ,尤其是1978年以后。
- 自1950年以来,骨干亲本在我国广泛应用于小麦品种改良,包括Zhoumai16, St2422/464, Nanda2419,Nanda2419, St2422/464, Funo, Xiaoyan6, Aimengniu, Zhou8425B, Abbondanza and Lovrin10(图中的十个品种),
21个骨干亲本中有17个在SNP-939位点为C型
,除了Aimengniu 和 Lovrin10,这两个亲本的衍生品种在我国广泛种植,这些衍生品种更倾向于从另一个亲本中保留SNP-939的C型。 - 该图是SNP-939在中国不同生态区的等位基因的比例,中国主要小麦种植区的等位基因具有明显的分布特征,以下为T型的占比情况:
- 春小麦区相对较多(≥40%,VI, VII, VIII)
- 其次是冬春混合区(IX和X,分别为22.22%和23.08%)
- 在冬麦区(I、II、III、IV、V)出现频率较低(<20%)
因此,TaMYB4-A的C型等位基因可能来源于中国地方种质
,在育种过程中被广泛应用
讨论部分
小麦是最早被驯化的作物之一,驯化与穗部结构变化联系在一起,以利于收获和提高产量。提高产量也是育种的主要目标之一。对于谷类作物来说,穗结构通过影响小穗和小花的发育,在很大程度上决定着籽粒数量,研究控制穗部结构的分子机制将有助于设计育种过程
.
作者制作了一个基于时间序列的表观基因组图谱
,包括从营养发育到生殖生长过程中各种类型的组蛋白修饰,染色质可及性变化和转录组数据,这将为系统研究小麦穗发育
的关键调控因子提供有价值的数据资源。
总之,作者结合多组学
数据揭示了小麦穗发育过程中的转录调控网络
TRN和表观遗传变化
。结合GWAS
分析,作者发现了几十个影响小穗结构的新调控因子
,揭示了TaMYB4-A
启动子内WFZP
结合位点的SNP变异
在我国小麦育种过程中起着关键作用。
材料与方法
材料:冬小麦品种KN9204
环境:温室
取样:在8个发育阶段,各取10-50个小穗
转基因植株
利用冬小麦品种KN9204进行基因序列扩增,春小麦品种Fielder获得转基因小麦植株
测序数据处理
- reference genome:Chinese Spring-RefSeq v1.0
- FastQC v0.11.8:for ensure the high quality of reads
- BWA-MEM v0.7.17:for ATAC-seq and CUT&Tag seq
- hisat2:短序列比对工具,主要用于RNAseq数据的比对
- Samtools v1.4:进行索引、排序、过滤
- Picard v2.23.3:删除读数中重复项
- deepTools v3.3.0:数据规范化可视化
RNA数据分析
- Counts v2.0.1:计数
- DESeq2 v1.26.0:差异表达分析
- ComplexHeatmap (v2.4.3):聚类、可视化
- clusterProfiler v3.18.1:基因功能富集
ATAC-seq数据分析
- MACS2 v2.1.4:调用峰
- ChIPseeker v1.26.2:注释峰
- HINT tool v0.13.2:鉴定转录因子变化情况
差异染色质修饰富集区检测
- DiffBind v2.16.2:计算峰值读数
构建基因调控网络
- 通过PCA分析对穗发育过程中表达的基因进行分组
- 计算相邻组之间的欧几里得距离
- 进行坐标缩放,计算基因的拟合曲线
- 根据基因表达情况和标准化的数据,对每个基因进行PCA分析
构建系统发育树
- 利用水稻MADS34和MADS15蛋白序列鉴定小麦和玉米中的同源基因
- MUSCLE v3.8.1551:序列比对
- trimAl v1.4.rev15:筛选氨基酸位置
- RAxML v8.2.12:构建最大似然系统发生树
GWAS全基因组关联分析
- 214份小麦660K单核苷酸序列中筛选出319,558个单核苷酸序列与表型进行关联分析
- Tassel v5.2
- CMplot:Manhattan plots and quantile-quantile plots
基于基因的关联分析
利用287份中国小麦微型核心种质的全基因组外显子捕获测序数据,确定了TaMYB4-A基因6kb区的单核苷酸多态性,包括外显子区、内含子区、4kb启动子区和0.5kb 3'-UTR区。
- Haploview 4.2:计算连锁不平衡,制作LD图
数据获取
- Genome Sequence Archive:https://ngdc.cncb.ac.cn/gsa
- PRJCA013096
荧光素酶实验
LUC荧光素酶,可以极其灵敏、高效地检测基因的表达。是检测转录因子与目的基因启动子区DNA相互作用的一种检测方法。
荧光素酶基因报告是指以荧光素(luciferin)为底物来检测萤火虫荧光素酶(fireflyluciferase)活性的一种报告系统。荧光素酶可以催化luciferin氧化成oxyluciferin,在luciferin氧化的过程中,会发出生物荧光,是检测转录因子
与目的基因
启动子区DNA相互作用
的一种检测方法。
原位杂交
原位杂交技术的基本原理是利用核酸分子单链之间有互补
的碱基序列,将有放射性或非放射性的外源核酸(即探针)与组织、细胞或染色体上待测DNA或RNA互补配对,结合成专一的核酸杂交分子,经一定的检测手段将待测核酸
在组织、细胞或染色体上的位置
显示出来。
END
© 素材来源于网络,侵权请联系后台删除
往期推荐: