文献精读笔记
全文约7000字,阅读预计耗时21分钟
英文题目:Systematic mining and genetic characteriza;tion of regulatory factors for wheat spike development
中文题目:小麦穗发育调控因子的系统挖掘及遗传特性研究
通讯作者:Jun Xiao,Chinese Academy of Sciences,Beijing, China
发布时间:2022.11.11 bioRxiv
doi:10.1101/2022.11.11.516122
论文初步介绍
研究目的
小麦每穗粒数
是决定单产
的重要性状,增加每穗小穗数能够增加每穗粒数并最终增加产量
,提高花序分生组织的活性和创制多小穗的种质是提高小麦小穗数的有效途径,提高穗粒数是高产、超高产小麦栽培和品种选育的主攻目标。
该文章从转录组学
、表观遗传学
、基因组学
等多组学手段,深入解析了小麦穗发育
过程中转录因子的调控网络和层次关系。
摘要
① 本文将多组学数据,系统地探讨了小麦穗发育的遗传调控网络
。产生了8个发育时期的转录组和表观基因组图谱。
② 作者发现染色质可及性
和H3K27Me3
组蛋白的变化与开花过程中转录组
改变密切相关。
③ 构建了一个核心转录调控网络
(TRN),该网络可能驱动各种分生组织细胞转换形成穗。
④ 将TRN
与全基因组关联分析(GWAS
)相结合,共鉴定出260个转录因子,其中52个是作物特有的转录因子,但大部分未被研究。
⑤ 进一步验证了TRN提出的TASPL6、TsMADS34和TAMADS14之间的多层调控模块
。TaMYB4-A可能通过调节激素稳态或信号传导从而调节可育小穗数,作用于下游并受WFZP抑制。
⑥ 在国内育种过程中,逐渐筛选出TaMYB4-A
的优势等位基因,表达量高,小穗可育性强。本文为系统地理解小麦穗发育的遗传调控提供了宝贵的资源和新的策略。
创新点
- 制作了
转录组
和表观基因组
图谱 - 构建了核心
转录调控网络
- 验证了穗发育过程的
多重调控模块
注释缩写信息补充
技术介绍
ATAC-seq
:Assay for Transposase Accessible Chromatin with high-throughput sequencing,利用转座酶研究染色质可及性的高通量测序技术,属于表观遗传学研究领域。
真核生物的基因组DNA是被高度紧密折叠包装的,DNA与组蛋白缠绕形成核小体,串珠状的核小体经过螺旋折叠等方式盘绕成染色体。DNA需要进行转录等活动的时候,DNA的高级结构才会部分解开,裸露出需要与转录因子等反式作用元件进行作用的DNA双链(未经组蛋白或核小体保护的DNA部位),便于转录。染色质的这种特性叫做染色质的可及性(chromatin accessibility),而暴露的这段染色质称为“
开放染色质
”(open chromatin),研究发现,开放染色质通常是转录因子、增强子、绝缘子或者其他调控蛋白结合的片段,结合的过程仿佛是触发了细胞内的开关,可以影响细胞内基因复制以及调控基因的转录活性。转座酶可以将携带的DNA片段(接头)插入开放的染色质区域,可以得到全基因组上处于开放状态的染色质区域。
RNA-seq
:转录组测序技术,就是用高通量测序技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。H3K27me3
:表观遗传修饰,H3是组蛋白,H3K27me3表示组蛋白H3的第27个氨基酸上三甲基化,这是一个标记,表明赖氨酸27三甲基化的组蛋白。TRN
:转录调控网络(transcriptional regulation network)是由转录因子
(transcription factors,TF)和其目标基因
的调控关系所构成的有向
网络WFZP
:一个控制小麦穗形态的基因。New Phytologist发表了倪中福教授团队题为FRIZZY PANICLE defines a regulatory hub for simultaneously controlling spikelet formation and awn elongation in bread wheat的论文,其中讲到WFZP抑制小穗形成但促进芒伸长相关内容。TSS
:转录起始位点DAPR
:differential accessible promoter regions ,差异可及启动子区Motif
:模体,基序。一段典型的序列或者一个结构。
是指构成任何一种特征序列的基本结构。通俗来讲,即是
有特征的短序列
,拥有生物学功能的保守序列,可能包含特异性的结合位点,或者是涉及某一个特定生物学过程的有共性的序列区段。基于motif序列的提取,我们可以预测潜在的结合位点。比如转录因子的结合位点
,其motif往往意味着某蛋白结构域与DNA碱基序列的相互作用
TILLING
:即Targeting Induced Local Lesions IN Genomes(定向诱导基因组局部突变技术)Cleavage
Under Targets and Tagmentation (CUT&Tag):目标下的切割和干扰(Cut&Tag)
小麦穗部性状
- GNPS:grain number per spike,每穗粒数
- SNS:spikelet number per spike ,每穗小穗数
- FSPS:fertile spikelet number per spike,每穗可育的小穗数
- DSNS:degenerated spikelet number per spike ,每穗退化的小穗数
- FNPS:floret number per spikelet ,每小穗的小花数
- SD:spikelet density,小穗密度
- SL:spike length ,穗长
- IM:inflorescence meristem,花序分生组织
- SM:spikelet meristem,小穗分生组织
小麦穗发育阶段
1.SAM:shoot apex meristem,顶端分生组织
2.EL:elongation stage,伸长期(生长锥伸长期)
茎生长锥伸长生长,长度大于宽度,呈透明光滑的圆锥形。
3.SR:single edge ,单棱期(穗轴节片原基分化期)
生长锥迅速伸长,生长锥的基部由下而上形成像叶原基的环状突起,即为苞叶原始体。每片苞叶原始体之间即为穗轴节片。每个苞叶原基呈棱形,故称单棱期。
4.DR:double ridge,二棱期
小穗原基分化期,苞叶原基发育逐渐停止,在幼穗中部两个相邻苞叶原基之间最先长出一个突出,即小穗原始体,呈棱形,开始较小,以后逐渐增大,在生长锥上成长大、小棱相间存在故称二棱期。
5.SMI:spikelet meristem initiation stage,小穗分生组织起始期
6.GPD:glume primordium differentiation stage ,护颖原基分化期
幼穗中部两侧小穗原基已分化结束,顶端小穗原基逐渐分化,此时每穗小穗数基本定型,中部小穗基部形成两个碗状突起,后发育成颖片。
7.FMI:floral meristem initiation stage,小花分生组织起始期
8.FOP:floral organ primordia differentiation stage 小花原基分化阶段
小花原基分化先从幼穗中部,然后向上向下相继分化。
研究结果
转录组和染色质图谱
- 展示了穗发育的8个时期,利用
转录组测序RNA-seq
和染色质可及性测序ATAC-seq
得出了全局基因表达、染色质可及性信息。同时,基于染色质开放动态,选择SAM、DR、SMI、GPD和FOP五个阶段,在靶点和靶点作用下进行组蛋白修饰分析
- 主成分分析(PCA)结果表明,这8个阶段可分为两大类,
营养生长组
包括SAM、EL、SR、DR和生殖生长组
包括SMI、GPD、FMI和FOP - 在DR到SMI、FMI到FOP等
形态学转变点
,相邻阶段间差异表达基因较多
- 通过聚类方法鉴定阶段特异性表达基因,从具体聚类中突出了参与
开花时间和花序发育
的已知调控因子
。例如,Cluster 2中的开花时间基因TappD1在花从SAM向DR过渡之前表达。表明可以捕捉到小麦穗发育过程中的动态基因表达谱。 - 可及染色质主要位于
远端基因间区
和启动子区
- PCA分析揭示小麦穗发育过程中
染色质可及性
动态的变化轨迹
- 从营养生长到开花过渡和花序萌发过程中,染色质的
可及性
总体呈上升
趋势,而在小穗和小花形成过程中,染色质的可及性
呈下降
趋势。 - 主成分分析和聚类分析表明,在不同发育阶段,不同组蛋白修饰具有阶段特异性的转变。
- 值得注意的是,
H3K27Me3
呈现连续轨迹,而其他的则不是,可能具有较高的相关性。 - H3K27Me3和染色质可及性共同影响穗发育过程中不同基因的表达模式
染色质环境对调控的影响
- 共鉴定出49,153个DAPR(差异可及启动子区),分为6个cluster。其中,大多数在
DR期或SMI期
表现出更高的可及性。 - 图B中2,3,4,6这四个基因簇的
染色质可及性
与转录表达能力
呈较高的正相关。 - 通过分析发现,表达量增加的基因
显著重叠
,染色质可及性增加的程度与表达水平升高的变化高度相关。
- 对基因集I中的基因进行
GO富集分析
,发现激素合成和信号传递
、花序分生组织发育
、细胞分裂不对称性
相关基因富集程度较高。 - 热图结果表明在营养顶端分生组织向花序分生组织过渡过程中,染色质可及性的增加与基因表达的提高是
同步
的 - 基因集II虽然在SMI和GPD阶段染色质可及性提高,但相对开放程度较低。结果表明,随着H3K27Me3基因表达水平的降低,如WAP3基因表达水平逐渐升高,这可能是H3K27Me3启动转录状态的原因之一。对于基因集III,可以发现其染色质可及性最低和H3K27ME3组蛋白修饰覆盖度最高,限制了基因的激活,就像TAEHD2基因一样。