文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 文献丨多组学大数据构建小麦穗发育转录调控网络,TRN+GWAS挖掘关键转录调控(三)

TaMYB4-A关键SNP变异影响

最后,作者想知道TaMYB4-A的不同单倍型是如何影响小麦穗部结构,因此进行关联分析

640.png

  • SNP-939(C/T)变异位点位于TaMYB4-A的启动子区,而且刚好在WFZP核心结合基序的下方。该位置的SNP变异可能通过影响WFZP结合从而导致TaMYB4-A表达差异。
  • 通过对保守基序的识别,证实了WFZP对TamyB4-A的抑制作用,在荧光素酶报告试验中,发现烟草叶片的C→T突变消除了这种抑制作用
  • 作者进一步选择了两种类型(C型和T型)的33个不同小麦品种,测定了TaMYB4-A的表达量和穗形态
    这一结果为SNP变异引起TaMYB4-A表达水平差异进而影响SL和FSPS提供了遗传学依据
  • C型:表现出优良的农艺性状,即SL较长,FSPS较多,TaMYB4-A表达水平显著较高
  • T型:表现出SL较短,FSPS较少,TaMYB4-A表达水平较低。
  • 此外,作者还想知道TaMYB4-A启动子中的C/T变异位点是如何在我国育种过程中被选择的。于是基于中国小麦微型核心种质的外显子捕获测序数据,得出:

640.png

  • 相比于引进品种(45.45%) ,我国地方品种(82.08%)和现代品种(78.18%)携带C型等位基因的种质比例较高。
  • 随着育种时间推移,C型的等位基因频率显著升高,表明TaMYB4-A的C型基因在我国育种过程中得到了广泛的应用 ,尤其是1978年以后。
  • 自1950年以来,骨干亲本在我国广泛应用于小麦品种改良,包括Zhoumai16, St2422/464, Nanda2419,Nanda2419, St2422/464, Funo, Xiaoyan6, Aimengniu, Zhou8425B, Abbondanza and Lovrin10(图中的十个品种),21个骨干亲本中有17个在SNP-939位点为C型,除了Aimengniu 和 Lovrin10,这两个亲本的衍生品种在我国广泛种植,这些衍生品种更倾向于从另一个亲本中保留SNP-939的C型。
  • 该图是SNP-939在中国不同生态区的等位基因的比例,中国主要小麦种植区的等位基因具有明显的分布特征,以下为T型的占比情况:
  • 春小麦区相对较多(≥40%,VI, VII, VIII)
  • 其次是冬春混合区(IX和X,分别为22.22%和23.08%)
  • 在冬麦区(I、II、III、IV、V)出现频率较低(<20%)
    因此,TaMYB4-A的C型等位基因可能来源于中国地方种质,在育种过程中被广泛应用

讨论部分

小麦是最早被驯化的作物之一,驯化与穗部结构变化联系在一起,以利于收获和提高产量。提高产量也是育种的主要目标之一。对于谷类作物来说,穗结构通过影响小穗和小花的发育,在很大程度上决定着籽粒数量,研究控制穗部结构的分子机制将有助于设计育种过程.

作者制作了一个基于时间序列的表观基因组图谱,包括从营养发育到生殖生长过程中各种类型的组蛋白修饰,染色质可及性变化和转录组数据,这将为系统研究小麦穗发育的关键调控因子提供有价值的数据资源。

640.png

总之,作者结合多组学数据揭示了小麦穗发育过程中的转录调控网络TRN和表观遗传变化。结合GWAS分析,作者发现了几十个影响小穗结构的新调控因子,揭示了TaMYB4-A启动子内WFZP结合位点的SNP变异在我国小麦育种过程中起着关键作用。

材料与方法

材料:冬小麦品种KN9204

环境:温室

取样:在8个发育阶段,各取10-50个小穗

转基因植株

利用冬小麦品种KN9204进行基因序列扩增,春小麦品种Fielder获得转基因小麦植株

测序数据处理

  • reference genome:Chinese Spring-RefSeq v1.0
  • FastQC v0.11.8:for ensure the high quality of reads
  • BWA-MEM v0.7.17:for ATAC-seq and CUT&Tag seq
  • hisat2:短序列比对工具,主要用于RNAseq数据的比对
  • Samtools v1.4:进行索引、排序、过滤
  • Picard v2.23.3:删除读数中重复项
  • deepTools v3.3.0:数据规范化可视化

RNA数据分析

  • Counts v2.0.1:计数
  • DESeq2 v1.26.0:差异表达分析
  • ComplexHeatmap (v2.4.3):聚类、可视化
  • clusterProfiler v3.18.1:基因功能富集

ATAC-seq数据分析

  • MACS2 v2.1.4:调用峰
  • ChIPseeker v1.26.2:注释峰
  • HINT tool v0.13.2:鉴定转录因子变化情况

差异染色质修饰富集区检测

  • DiffBind v2.16.2:计算峰值读数

构建基因调控网络

  1. 通过PCA分析对穗发育过程中表达的基因进行分组
  2. 计算相邻组之间的欧几里得距离
  3. 进行坐标缩放,计算基因的拟合曲线
  4. 根据基因表达情况和标准化的数据,对每个基因进行PCA分析

构建系统发育树

  • 利用水稻MADS34和MADS15蛋白序列鉴定小麦和玉米中的同源基因
  • MUSCLE v3.8.1551:序列比对
  • trimAl v1.4.rev15:筛选氨基酸位置
  • RAxML v8.2.12:构建最大似然系统发生树

GWAS全基因组关联分析

  • 214份小麦660K单核苷酸序列中筛选出319,558个单核苷酸序列与表型进行关联分析
  • Tassel v5.2
  • CMplot:Manhattan plots and quantile-quantile plots

基于基因的关联分析

利用287份中国小麦微型核心种质的全基因组外显子捕获测序数据,确定了TaMYB4-A基因6kb区的单核苷酸多态性,包括外显子区、内含子区、4kb启动子区和0.5kb 3'-UTR区。

  • Haploview 4.2:计算连锁不平衡,制作LD图

数据获取

荧光素酶实验

LUC荧光素酶,可以极其灵敏、高效地检测基因的表达。是检测转录因子与目的基因启动子区DNA相互作用的一种检测方法。

荧光素酶基因报告是指以荧光素(luciferin)为底物来检测萤火虫荧光素酶(fireflyluciferase)活性的一种报告系统。荧光素酶可以催化luciferin氧化成oxyluciferin,在luciferin氧化的过程中,会发出生物荧光,是检测转录因子目的基因启动子区DNA相互作用的一种检测方法。

原位杂交

原位杂交技术的基本原理是利用核酸分子单链之间有互补的碱基序列,将有放射性或非放射性的外源核酸(即探针)与组织、细胞或染色体上待测DNA或RNA互补配对,结合成专一的核酸杂交分子,经一定的检测手段将待测核酸在组织、细胞或染色体上的位置显示出来。

END

© 素材来源于网络,侵权请联系后台删除

往期推荐:

文献丨群体转录组分析锁定关键转录因子

文献丨转录组RNA seq——青年阶段!

笔记丨ggplot2热图入门学习笔记

笔记丨PCA分析基本知识和数学原理

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps&nbsp;
相关文章
|
2月前
|
存储 监控 安全
单位网络监控软件:Java 技术驱动的高效网络监管体系构建
在数字化办公时代,构建基于Java技术的单位网络监控软件至关重要。该软件能精准监管单位网络活动,保障信息安全,提升工作效率。通过网络流量监测、访问控制及连接状态监控等模块,实现高效网络监管,确保网络稳定、安全、高效运行。
79 11
|
1月前
|
传感器 人工智能 大数据
高科技生命体征探测器、情绪感受器以及传感器背后的大数据平台在健康监测、生命体征检测领域的设想与系统构建
本系统由健康传感器、大数据云平台和脑机接口设备组成。传感器内置生命体征感应器、全球无线定位、人脸识别摄像头等,搜集超出现有科学认知的生命体征信息。云平台整合大数据、云计算与AI,处理并传输数据至接收者大脑芯片,实现实时健康监测。脑机接口设备通过先进通讯技术,实现对健康信息的实时感知与反馈,确保身份验证与数据安全。
|
1月前
|
分布式计算 Shell MaxCompute
odps测试表及大量数据构建测试
odps测试表及大量数据构建测试
|
11天前
|
Shell 网络架构 计算机视觉
YOLOv11改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络
YOLOv11改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络
41 14
|
7天前
|
Shell 网络架构 计算机视觉
RT-DETR改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络
RT-DETR改进策略【模型轻量化】| ShufflenetV2,通过通道划分构建高效网络
23 5
|
20天前
|
数据采集 存储 机器学习/深度学习
数据的秘密:如何用大数据分析挖掘商业价值
数据的秘密:如何用大数据分析挖掘商业价值
46 9
|
28天前
|
前端开发 小程序 Java
uniapp-网络数据请求全教程
这篇文档介绍了如何在uni-app项目中使用第三方包发起网络请求
42 3
|
1月前
|
运维 监控 Cloud Native
构建深度可观测、可集成的网络智能运维平台
本文介绍了构建深度可观测、可集成的网络智能运维平台(简称NIS),旨在解决云上网络运维面临的复杂挑战。内容涵盖云网络运维的三大难题、打造云原生AIOps工具集的解决思路、可观测性对业务稳定的重要性,以及产品发布的亮点,包括流量分析NPM、网络架构巡检和自动化运维OpenAPI,助力客户实现自助运维与优化。
|
1月前
|
人工智能 大数据 网络性能优化
构建超大带宽、超高性能及稳定可观测的全球互联网络
本次课程聚焦构建超大带宽、超高性能及稳定可观测的全球互联网络。首先介绍全球互联网络的功能与应用场景,涵盖云企业网、转发路由器等产品。接着探讨AI时代下全球互联网络面临的挑战,如大规模带宽需求、超低时延、极致稳定性和全面可观测性,并分享相应的解决方案,包括升级转发路由器、基于时延的流量调度和增强网络稳定性。最后宣布降价措施,降低数据与算力连接成本,助力企业全球化发展。
|
2月前
|
人工智能 分布式计算 数据处理
MaxCompute Data + AI:构建 Data + AI 的一体化数智融合
本次分享将分为四个部分讲解:第一部分探讨AI时代数据开发范式的演变,特别是MaxCompute自研大数据平台在客户工作负载和任务类型变化下的影响。第二部分介绍MaxCompute在资源大数据平台上构建的Data + AI核心能力,提供一站式开发体验和流程。第三部分展示MaxCompute Data + AI的一站式开发体验,涵盖多模态数据管理、交互式开发环境及模型训练与部署。第四部分分享成功落地的客户案例及其收益,包括互联网公司和大模型训练客户的实践,展示了MaxFrame带来的显著性能提升和开发效率改进。

热门文章

最新文章