snpEff构建物种数据库及完成vcf变异文件注释

简介: snpEff构建物种数据库及完成vcf变异文件注释

1. 如果在没有jdk12的conda下安装snpeff,会报错

Error: A JNI error has occurred, please check your installation and try again
Exception in thread "main" java.lang.UnsupportedClassVersionError: org/snpeff/SnpEff has been compiled by a more recent version of the Java Runtime (class file version 55.0), this version of the Java Runtime only recognizes class file versions up to 52.0
 at java.lang.ClassLoader.defineClass1(Native Method)
 at java.lang.ClassLoader.defineClass(ClassLoader.java:756)
 at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
 at java.net.URLClassLoader.defineClass(URLClassLoader.java:468)
 at java.net.URLClassLoader.access$100(URLClassLoader.java:74)
 at java.net.URLClassLoader$1.run(URLClassLoader.java:369)
 at java.net.URLClassLoader$1.run(URLClassLoader.java:363)
 at java.security.AccessController.doPrivileged(Native Method)
 at java.net.URLClassLoader.findClass(URLClassLoader.java:362)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:418)
 at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:352)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:351)
 at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:495)


解决方法(针对非root用户)

conda create -n java12
conda activate java12
conda install -c r r-rjava
java -version
openjdk version "11.0.9.1-internal" 2020-11-04
OpenJDK Runtime Environment (build 11.0.9.1-internal+0-adhoc..src)
OpenJDK 64-Bit Server VM (build 11.0.9.1-internal+0-adhoc..src, mixed mode)
##足够能带动snpEff就行
conda install -y snpeff   ##下载后启动snpEff

参考:https://www.jianshu.com/p/3e3ebd397293

https://zhuanlan.zhihu.com/p/476561285


2.构建自有物种数据库

因为我是要从头构建注释基因集,所以它自带的数据库对我就没有什么用

而第一步便是要找到snpEff.config这个文件进行添加

这个文件在哪呢?

我的是在下面这个这个文件,如果你使用conda安装的,基本就是在minicondas下面pkgs里面的snpeff开头的文件夹里面,然后依次往下找就是了

cd /home/wangshuangyi/miniconda2/pkgs/snpeff-5.1-hdfd78af_2/share/snpeff-5.1-2
#该目录下存在:
scripts  snpEff  snpEff.config  snpEff.jar

假设我要构建的基因组叫Amur_ide


(1) 追加一行文件内容到snpEff.config

echo "Amur_ide.genome: Amur_ide" >> snpEff.config


(2) 在含有snpEff.config那个地方,创建个文件夹data, 然后在data里面又创建两个文件夹Amur_ide,genomes

Amur_ide/   genomes/
 Amur_ide/中包括了genes.gff3   cds.fa protein.fa   ##无论原名是啥都改为这个
genomes/中包括了基因组文件 Amur_ide.fa ##无论原名是啥都改为这个。


(3)  在含有snpEff.config那个地方,执行命令构建数据库

./snpEff build -gff3 -v Amur_ide
# -c , -config   : Specify config file
#  -v , -verbose : Verbose mode (详细模式)


(4) 注释

在注释之前,检查vcf变异文件,应去除##注释信息,开头应为:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT

java -Xmx4g -jar ../snpEff.jar ann Amur_ide  -o vcf -v ./alk_fw_pass_merged_filter.vcf -csvStats 1.csv -stats 1.html > selected.ann.vcf
##-Xmx:堆内存的最⼤值,默认值是物理内存的1/4(且⼩于1G),如默认情况下当堆中可⽤内存⼤于70%时,堆内存会开始减少,⼀直减⼩到-Xms的⼤⼩
# -csvStats <file> : Create CSV summary file.
#-s , -stats, -htmlStats: Create HTML summary file.  Default is 'snpEff_summary.html'
#-o <format> : Ouput format [ vcf, gatk, bed, bedAnn ]. Default: VCF.
#-formatEff: Use 'EFF' field compatible with older versions (instead of 'ANN'). (使用与旧版本兼容的'EFF'字段(而不是'ANN')。)


相关文章
|
2天前
|
人工智能 容灾 关系型数据库
【AI应用启航workshop】构建高可用数据库、拥抱AI智能问数
12月25日(周三)14:00-16:30参与线上闭门会,阿里云诚邀您一同开启AI应用实践之旅!
|
16天前
|
关系型数据库 MySQL 数据库
数据库数据恢复—MYSQL数据库文件损坏的数据恢复案例
mysql数据库文件ibdata1、MYI、MYD损坏。 故障表现:1、数据库无法进行查询等操作;2、使用mysqlcheck和myisamchk无法修复数据库。
|
20天前
|
SQL 关系型数据库 MySQL
MySQL导入.sql文件后数据库乱码问题
本文分析了导入.sql文件后数据库备注出现乱码的原因,包括字符集不匹配、备注内容编码问题及MySQL版本或配置问题,并提供了详细的解决步骤,如检查和统一字符集设置、修改客户端连接方式、检查MySQL配置等,确保导入过程顺利。
|
28天前
|
Oracle 关系型数据库 数据库
Oracle数据恢复—Oracle数据库文件有坏快损坏的数据恢复案例
一台Oracle数据库打开报错,报错信息: “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。管理员联系我们数据恢复中心寻求帮助,并提供了Oracle_Home目录的所有文件。用户方要求恢复zxfg用户下的数据。 由于数据库没有备份,无法通过备份去恢复数据库。
|
1月前
|
SQL 安全 Java
MyBatis-Plus条件构造器:构建安全、高效的数据库查询
MyBatis-Plus 提供了一套强大的条件构造器(Wrapper),用于构建复杂的数据库查询条件。Wrapper 类允许开发者以链式调用的方式构造查询条件,无需编写繁琐的 SQL 语句,从而提高开发效率并减少 SQL 注入的风险。
30 1
MyBatis-Plus条件构造器:构建安全、高效的数据库查询
|
1月前
|
存储 SQL API
探索后端开发:构建高效API与数据库交互
【10月更文挑战第36天】在数字化时代,后端开发是连接用户界面和数据存储的桥梁。本文深入探讨如何设计高效的API以及如何实现API与数据库之间的无缝交互,确保数据的一致性和高性能。我们将从基础概念出发,逐步深入到实战技巧,为读者提供一个清晰的后端开发路线图。
|
1月前
|
缓存 NoSQL 数据库
运用云数据库 Tair 构建缓存为应用提速,完成任务得苹果音响、充电套装等好礼!
本活动将带大家了解云数据库 Tair(兼容 Redis),通过体验构建缓存以提速应用,完成任务,即可领取罗马仕安卓充电套装,限量1000个,先到先得。邀请好友共同参与活动,还可赢取苹果 HomePod mini、小米蓝牙耳机等精美好礼!
|
1月前
|
Java 数据库连接 数据库
如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面
本文介绍了如何构建高效稳定的Java数据库连接池,涵盖连接池配置、并发控制和异常处理等方面。通过合理配置初始连接数、最大连接数和空闲连接超时时间,确保系统性能和稳定性。文章还探讨了同步阻塞、异步回调和信号量等并发控制策略,并提供了异常处理的最佳实践。最后,给出了一个简单的连接池示例代码,并推荐使用成熟的连接池框架(如HikariCP、C3P0)以简化开发。
55 2
|
2月前
|
存储 关系型数据库 MySQL
PACS系统 中 dicom 文件在mysql 8.0 数据库中的 存储和读取(pydicom 库使用)
PACS系统 中 dicom 文件在mysql 8.0 数据库中的 存储和读取(pydicom 库使用)
43 2
|
2月前
|
安全 NoSQL 关系型数据库
阿里云数据库:构建高性能与安全的数据管理系统
在企业数字化转型过程中,数据库是支撑企业业务运转的核心。随着数据量的急剧增长和数据处理需求的不断增加,企业需要一个既能提供高性能又能保障数据安全的数据库解决方案。阿里云数据库产品为企业提供了一站式的数据管理服务,涵盖关系型、非关系型、内存数据库等多种类型,帮助企业构建高效的数据基础设施。
138 2