简化基因组分析注意事项

简介: 简化基因组的方法一定要问清楚建库前无论公司说的是RAD-seq,还是说的是GBS,都不要太当真,因为这两个名词定义越来越不清了,你只要问清楚,他们建库是检测哪个部分:1)对单酶切位点邻近片段测序,如最初的RAD-seq2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing具体看我写的这篇文章: 简化基因组的测序方法关于建库的选择:如果没有参考基因组: 使用RAD-seq双端测序,或者亲本50x以上进行组装,然后是GBS如果有参考基因组: 使用GBS,这个很便宜。

简化基因组的方法一定要问清楚

建库前无论公司说的是RAD-seq,还是说的是GBS,都不要太当真,因为这两个名词定义越来越不清了,你只要问清楚,他们建库是检测哪个部分:

1)对单酶切位点邻近片段测序,如最初的RAD-seq
2)对酶切位点两翼片段测序,如Genoytping-by-Sequencing

具体看我写的这篇文章: 简化基因组的测序方法

关于建库的选择:

如果没有参考基因组: 使用RAD-seq双端测序,或者亲本50x以上进行组装,然后是GBS
如果有参考基因组: 使用GBS,这个很便宜。

分析时一定不能去重复

  1. 比对之后的预处理,不能去重,可以标记重复,当然这一步可以省去
  2. 如果上一步标记了重复,那么在使用GATK HaplotypeCaller时, 3.x版本参数需要增加-drf DuplicateRead4.x版本则是-DF NotDuplicateReadFilter。 其实-drf-DF都是--disable-read-filter的缩写。

具体原因见https://gatkforums.broadinstitute.org/gatk/discussion/6124

目录
相关文章
|
7月前
|
监控
2、软件项目跟踪和监督过程——所有表集合
2、软件项目跟踪和监督过程——所有表集合
73 0
|
搜索推荐
过滤概念(可行性分析)
过滤概念(可行性分析)
|
2月前
|
机器学习/深度学习 数据采集 算法
目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)
这篇博客文章介绍了如何使用包含多个网络和多种训练策略的框架来完成多目标分类任务,涵盖了从数据准备到训练、测试和部署的完整流程,并提供了相关代码和配置文件。
62 0
目标分类笔记(一): 利用包含多个网络多种训练策略的框架来完成多目标分类任务(从数据准备到训练测试部署的完整流程)
|
3月前
|
数据采集 监控 关系型数据库
选择合适的数据收集方法
选择合适的数据收集方法
77 4
|
4月前
|
存储 人工智能 自然语言处理
知识库优化增强,支持多种数据类型、多种检索策略、召回测试 | Botnow上新
Botnow近期对其知识库功能进行了全面升级,显著提升了数据处理能力、检索效率及准确性。新版本支持多样化的数据格式,包括PDF、Word、TXT、Excel和CSV等文件,无需额外转换即可直接导入,极大地丰富了知识来源。此外,还新增了细致的文本分片管理和编辑功能,以及表格数据的结构化处理,使知识管理更为精细化。 同时,平台提供了多种检索策略,包括混合检索、语义检索和全文检索等,可根据具体需求灵活选择,有效解决了大模型幻觉问题,增强了专业领域的知识覆盖,从而显著提高了回复的准确性。这些改进广泛适用于客服咨询、知识问答等多种应用场景,极大提升了用户体验和交互质量。
88 4
|
7月前
静态时序分析:工艺库的特征化条件和工作条件
静态时序分析:工艺库的特征化条件和工作条件
56 0
|
7月前
|
C++
【SPSS】两独立样本T检验分析详细操作教程(附案例实战)
【SPSS】两独立样本T检验分析详细操作教程(附案例实战)
1266 0
|
7月前
|
自然语言处理 数据挖掘 Java
20源代码模型的数据增强方法:克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】
20源代码模型的数据增强方法:克隆检测、缺陷检测和修复、代码摘要、代码搜索、代码补全、代码翻译、代码问答、问题分类、方法名称预测和类型预测对论文进行分组【网安AIGC专题11.15】
302 0
|
自然语言处理 测试技术 Python
通过Chain Prompts方式将LLM的能力引入测试平台:正交实验测试用例生成
通过Chain Prompts方式将LLM的能力引入测试平台:正交实验测试用例生成
233 0
|
存储 测试技术 API
LLM 回答更加准确的秘密:为检索增强生成(RAG)添加引用源
如何让你的大模型变得更强?如何确定其获取信息来源的准确性?想要回答这两个问题,就不得不提到 RAG。
1658 0