文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(一)

简介: 文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控

文献精读笔记

全文约7000字,阅读预计耗时21分钟

英文题目:Systematic mining and genetic characteriza;tion of regulatory factors for wheat spike development

中文题目:小麦穗发育调控因子的系统挖掘及遗传特性研究

通讯作者:Jun Xiao,Chinese Academy of Sciences,Beijing, China

发布时间:2022.11.11  bioRxiv

doi:10.1101/2022.11.11.516122


640.png

论文初步介绍

研究目的

小麦每穗粒数是决定单产的重要性状,增加每穗小穗数能够增加每穗粒数并最终增加产量,提高花序分生组织的活性和创制多小穗的种质是提高小麦小穗数的有效途径,提高穗粒数是高产、超高产小麦栽培和品种选育的主攻目标。

该文章从转录组学表观遗传学基因组学等多组学手段,深入解析了小麦穗发育过程中转录因子的调控网络和层次关系。

摘要

① 本文将多组学数据,系统地探讨了小麦穗发育的遗传调控网络。产生了8个发育时期的转录组和表观基因组图谱。

② 作者发现染色质可及性H3K27Me3组蛋白的变化与开花过程中转录组改变密切相关。

③ 构建了一个核心转录调控网络(TRN),该网络可能驱动各种分生组织细胞转换形成穗。

④ 将TRN与全基因组关联分析(GWAS)相结合,共鉴定出260个转录因子,其中52个是作物特有的转录因子,但大部分未被研究。

⑤ 进一步验证了TRN提出的TASPL6、TsMADS34和TAMADS14之间的多层调控模块。TaMYB4-A可能通过调节激素稳态或信号传导从而调节可育小穗数,作用于下游并受WFZP抑制。

⑥ 在国内育种过程中,逐渐筛选出TaMYB4-A的优势等位基因,表达量高,小穗可育性强。本文为系统地理解小麦穗发育的遗传调控提供了宝贵的资源和新的策略。

创新点

  • 制作了转录组表观基因组图谱
  • 构建了核心转录调控网络
  • 验证了穗发育过程的多重调控模块

注释缩写信息补充

技术介绍

  1. ATAC-seq:Assay for Transposase Accessible Chromatin with high-throughput sequencing,利用转座酶研究染色质可及性的高通量测序技术,属于表观遗传学研究领域。

640.png

真核生物的基因组DNA是被高度紧密折叠包装的,DNA与组蛋白缠绕形成核小体,串珠状的核小体经过螺旋折叠等方式盘绕成染色体。DNA需要进行转录等活动的时候,DNA的高级结构才会部分解开,裸露出需要与转录因子等反式作用元件进行作用的DNA双链(未经组蛋白或核小体保护的DNA部位),便于转录。染色质的这种特性叫做染色质的可及性(chromatin accessibility),而暴露的这段染色质称为“开放染色质”(open chromatin),研究发现,开放染色质通常是转录因子、增强子、绝缘子或者其他调控蛋白结合的片段,结合的过程仿佛是触发了细胞内的开关,可以影响细胞内基因复制以及调控基因的转录活性。转座酶可以将携带的DNA片段(接头)插入开放的染色质区域,可以得到全基因组上处于开放状态的染色质区域。

  1. RNA-seq:转录组测序技术,就是用高通量测序技术进行测序分析,反映出mRNA,smallRNA,noncodingRNA等或者其中一些的表达水平。
  2. H3K27me3:表观遗传修饰,H3是组蛋白,H3K27me3表示组蛋白H3的第27个氨基酸上三甲基化,这是一个标记,表明赖氨酸27三甲基化的组蛋白。
  3. TRN:转录调控网络(transcriptional regulation network)是由转录因子(transcription factors,TF)和其目标基因的调控关系所构成的有向网络
  4. WFZP:一个控制小麦穗形态的基因。New Phytologist发表了倪中福教授团队题为FRIZZY PANICLE defines a regulatory hub for simultaneously controlling spikelet formation and awn elongation in bread wheat的论文,其中讲到WFZP抑制小穗形成但促进芒伸长相关内容。
  5. TSS:转录起始位点
  6. DAPR:differential accessible promoter regions ,差异可及启动子区
  7. Motif:模体,基序。一段典型的序列或者一个结构。

640.png

是指构成任何一种特征序列的基本结构。通俗来讲,即是有特征的短序列,拥有生物学功能的保守序列,可能包含特异性的结合位点,或者是涉及某一个特定生物学过程的有共性的序列区段。基于motif序列的提取,我们可以预测潜在的结合位点。比如转录因子的结合位点,其motif往往意味着某蛋白结构域与DNA碱基序列的相互作用

  1. TILLING:即Targeting Induced Local Lesions IN Genomes(定向诱导基因组局部突变技术)
  2. Cleavage Under Targets and Tagmentation (CUT&Tag):目标下的切割和干扰(Cut&Tag)

小麦穗部性状

  1. GNPS:grain number per spike,每穗粒数
  2. SNS:spikelet number per spike ,每穗小穗数
  3. FSPS:fertile spikelet number per spike,每穗可育的小穗数
  4. DSNS:degenerated spikelet number per spike ,每穗退化的小穗数
  5. FNPS:floret number per spikelet ,每小穗的小花数
  6. SD:spikelet density,小穗密度
  7. SL:spike length ,穗长
  8. IM:inflorescence meristem,花序分生组织
  9. SM:spikelet meristem,小穗分生组织

小麦穗发育阶段

640.png

1.SAM:shoot apex meristem,顶端分生组织

2.EL:elongation stage,伸长期(生长锥伸长期

茎生长锥伸长生长,长度大于宽度,呈透明光滑的圆锥形。

3.SR:single edge ,单棱期(穗轴节片原基分化期

生长锥迅速伸长,生长锥的基部由下而上形成像叶原基的环状突起,即为苞叶原始体。每片苞叶原始体之间即为穗轴节片。每个苞叶原基呈棱形,故称单棱期。

4.DR:double ridge,二棱期

小穗原基分化期,苞叶原基发育逐渐停止,在幼穗中部两个相邻苞叶原基之间最先长出一个突出,即小穗原始体,呈棱形,开始较小,以后逐渐增大,在生长锥上成长大、小棱相间存在故称二棱期。

5.SMI:spikelet meristem initiation stage,小穗分生组织起始期

6.GPD:glume primordium differentiation stage ,护颖原基分化期

幼穗中部两侧小穗原基已分化结束,顶端小穗原基逐渐分化,此时每穗小穗数基本定型,中部小穗基部形成两个碗状突起,后发育成颖片。

7.FMI:floral meristem initiation stage,小花分生组织起始期

8.FOP:floral organ primordia differentiation stage 小花原基分化阶段

小花原基分化先从幼穗中部,然后向上向下相继分化。

研究结果

转录组和染色质图谱

640.png

  • 展示了穗发育的8个时期,利用转录组测序RNA-seq染色质可及性测序ATAC-seq得出了全局基因表达、染色质可及性信息。同时,基于染色质开放动态,选择SAM、DR、SMI、GPD和FOP五个阶段,在靶点和靶点作用下进行组蛋白修饰分析
  • 主成分分析(PCA)结果表明,这8个阶段可分为两大类,营养生长组包括SAM、EL、SR、DR和生殖生长组包括SMI、GPD、FMI和FOP
  • 在DR到SMI、FMI到FOP等形态学转变点,相邻阶段间差异表达基因较多
  • 通过聚类方法鉴定阶段特异性表达基因,从具体聚类中突出了参与开花时间和花序发育已知调控因子。例如,Cluster 2中的开花时间基因TappD1在花从SAM向DR过渡之前表达。表明可以捕捉到小麦穗发育过程中的动态基因表达谱。
  • 可及染色质主要位于远端基因间区启动子区
  • PCA分析揭示小麦穗发育过程中染色质可及性动态的变化轨迹

640.png

  • 从营养生长到开花过渡和花序萌发过程中,染色质的可及性总体呈上升趋势,而在小穗和小花形成过程中,染色质的可及性下降趋势。
  • 主成分分析和聚类分析表明,在不同发育阶段,不同组蛋白修饰具有阶段特异性的转变。
  • 值得注意的是,H3K27Me3呈现连续轨迹,而其他的则不是,可能具有较高的相关性。
  • H3K27Me3和染色质可及性共同影响穗发育过程中不同基因的表达模式

染色质环境对调控的影响

640.png

  • 共鉴定出49,153个DAPR(差异可及启动子区),分为6个cluster。其中,大多数在DR期或SMI期表现出更高的可及性。
  • 图B中2,3,4,6这四个基因簇的染色质可及性转录表达能力呈较高的正相关。
  • 通过分析发现,表达量增加的基因显著重叠,染色质可及性增加的程度与表达水平升高的变化高度相关。

640.png

  • 对基因集I中的基因进行GO富集分析,发现激素合成和信号传递花序分生组织发育细胞分裂不对称性相关基因富集程度较高。
  • 热图结果表明在营养顶端分生组织向花序分生组织过渡过程中,染色质可及性的增加与基因表达的提高是同步
  • 基因集II虽然在SMI和GPD阶段染色质可及性提高,但相对开放程度较低。结果表明,随着H3K27Me3基因表达水平的降低,如WAP3基因表达水平逐渐升高,这可能是H3K27Me3启动转录状态的原因之一。对于基因集III,可以发现其染色质可及性最低和H3K27ME3组蛋白修饰覆盖度最高,限制了基因的激活,就像TAEHD2基因一样。
相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1天前
|
云安全 安全 网络安全
云端防御战线:构建云计算环境下的网络安全体系
【4月更文挑战第25天】 随着企业数字化转型的加速,云计算以其灵活性、成本效益和可扩展性成为众多组织的首选技术平台。然而,云服务的广泛采用也带来了前所未有的安全挑战,特别是在数据保护、隐私合规以及网络攻击防护等方面。本文将深入探讨云计算环境中的网络安全策略,从云服务模型出发,分析不同服务层次的安全责任划分,并针对网络威胁提出综合性的防御措施。此外,文中还将讨论信息加密、身份验证、入侵检测等关键技术在维护云安全中的作用,以期为读者提供一套全面的云安全解决方案框架。
|
1天前
|
数据可视化 数据挖掘
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
|
1天前
|
机器学习/深度学习 存储 监控
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
数据分享|Python卷积神经网络CNN身份识别图像处理在疫情防控下口罩识别、人脸识别
10 0
|
2天前
|
存储 SQL 安全
网络安全与信息安全:保护数据的关键策略
【4月更文挑战第24天】 在数字化时代,数据成为了新的货币。然而,随着网络攻击的日益猖獗,如何确保信息的安全和隐私成为了一个亟待解决的问题。本文将深入探讨网络安全漏洞的概念、加密技术的重要性以及提升安全意识的必要性,旨在为读者提供一套综合性的网络安全防护策略。通过对这些关键知识点的分享,我们希望能够增强个人和组织在面对网络威胁时的防御能力。
|
3天前
|
移动开发 Java Android开发
构建高效Android应用:采用Kotlin协程优化网络请求
【4月更文挑战第24天】 在移动开发领域,尤其是对于Android平台而言,网络请求是一个不可或缺的功能。然而,随着用户对应用响应速度和稳定性要求的不断提高,传统的异步处理方式如回调地狱和RxJava已逐渐显示出局限性。本文将探讨如何利用Kotlin协程来简化异步代码,提升网络请求的效率和可读性。我们将深入分析协程的原理,并通过一个实际案例展示如何在Android应用中集成和优化网络请求。
|
3天前
|
安全 JavaScript 前端开发
第十六届山东省职业院校技能大赛中职组 “网络安全”赛项竞赛试题—B模块安全事件响应/网络安全数据取证/应用安全
该内容描述了一次网络安全演练,包括七个部分:Linux渗透提权、内存取证、页面信息发现、数字取证调查、网络安全应急响应、Python代码分析和逆向分析。参与者需在模拟环境中收集Flag值,涉及任务如获取服务器信息、提权、解析内存片段、分析网络数据包、处理代码漏洞、解码逆向操作等。每个部分都列出了若干具体任务,要求提取或生成特定信息作为Flag提交。
6 0
|
3天前
|
安全 测试技术 网络安全
2024年山东省职业院校技能大赛中职组 “网络安全”赛项竞赛试题-C安全事件响应/网络安全数据取证/应用安全
B模块涵盖安全事件响应和应用安全,包括Windows渗透测试、页面信息发现、Linux系统提权及网络安全应急响应。在Windows渗透测试中,涉及系统服务扫描、DNS信息提取、管理员密码、.docx文件名及内容、图片中单词等Flag值。页面信息发现任务包括服务器端口、主页Flag、脚本信息、登录成功信息等。Linux系统渗透需收集SSH端口号、主机名、内核版本,并实现提权获取root目录内容和密码。网络安全应急响应涉及删除后门用户、找出ssh后门时间、恢复环境变量文件、识别修改的bin文件格式及定位挖矿病毒钱包地址。
9 0
|
3天前
|
安全 测试技术 Linux
2024年山东省职业院校技能大赛中职组 “网络安全”赛项竞赛试题-A模块安全事件响应/网络安全数据取证/应用安全
该内容描述了一个网络安全挑战,涉及Windows和Linux系统的渗透测试以及隐藏信息探索和内存取证。挑战包括使用Kali Linux对Windows Server进行服务扫描、DNS信息提取、密码获取、文件名和内容查找等。对于Linux系统,任务包括收集服务器信息、提权并查找特定文件内容和密码。此外,还有对Server2007网站的多步骤渗透,寻找登录界面和页面中的隐藏FLAG。最后,需要通过FTP获取win20230306服务器的内存片段,从中提取密码、地址、主机名、挖矿程序信息和浏览器搜索关键词。
6 0
|
1月前
|
机器学习/深度学习 数据采集 人工智能
m基于深度学习网络的手势识别系统matlab仿真,包含GUI界面
m基于深度学习网络的手势识别系统matlab仿真,包含GUI界面
43 0
|
1月前
|
机器学习/深度学习 算法 计算机视觉
基于yolov2深度学习网络的火焰烟雾检测系统matlab仿真
基于yolov2深度学习网络的火焰烟雾检测系统matlab仿真