snpEff构建物种数据库及完成vcf变异文件注释

简介: snpEff构建物种数据库及完成vcf变异文件注释

1. 如果在没有jdk12的conda下安装snpeff,会报错

Error: A JNI error has occurred, please check your installation and try again
Exception in thread "main" java.lang.UnsupportedClassVersionError: org/snpeff/SnpEff has been compiled by a more recent version of the Java Runtime (class file version 55.0), this version of the Java Runtime only recognizes class file versions up to 52.0
 at java.lang.ClassLoader.defineClass1(Native Method)
 at java.lang.ClassLoader.defineClass(ClassLoader.java:756)
 at java.security.SecureClassLoader.defineClass(SecureClassLoader.java:142)
 at java.net.URLClassLoader.defineClass(URLClassLoader.java:468)
 at java.net.URLClassLoader.access$100(URLClassLoader.java:74)
 at java.net.URLClassLoader$1.run(URLClassLoader.java:369)
 at java.net.URLClassLoader$1.run(URLClassLoader.java:363)
 at java.security.AccessController.doPrivileged(Native Method)
 at java.net.URLClassLoader.findClass(URLClassLoader.java:362)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:418)
 at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:352)
 at java.lang.ClassLoader.loadClass(ClassLoader.java:351)
 at sun.launcher.LauncherHelper.checkAndLoadMain(LauncherHelper.java:495)


解决方法(针对非root用户)

conda create -n java12
conda activate java12
conda install -c r r-rjava
java -version
openjdk version "11.0.9.1-internal" 2020-11-04
OpenJDK Runtime Environment (build 11.0.9.1-internal+0-adhoc..src)
OpenJDK 64-Bit Server VM (build 11.0.9.1-internal+0-adhoc..src, mixed mode)
##足够能带动snpEff就行
conda install -y snpeff   ##下载后启动snpEff

参考:https://www.jianshu.com/p/3e3ebd397293

https://zhuanlan.zhihu.com/p/476561285


2.构建自有物种数据库

因为我是要从头构建注释基因集,所以它自带的数据库对我就没有什么用

而第一步便是要找到snpEff.config这个文件进行添加

这个文件在哪呢?

我的是在下面这个这个文件,如果你使用conda安装的,基本就是在minicondas下面pkgs里面的snpeff开头的文件夹里面,然后依次往下找就是了

cd /home/wangshuangyi/miniconda2/pkgs/snpeff-5.1-hdfd78af_2/share/snpeff-5.1-2
#该目录下存在:
scripts  snpEff  snpEff.config  snpEff.jar

假设我要构建的基因组叫Amur_ide


(1) 追加一行文件内容到snpEff.config

echo "Amur_ide.genome: Amur_ide" >> snpEff.config


(2) 在含有snpEff.config那个地方,创建个文件夹data, 然后在data里面又创建两个文件夹Amur_ide,genomes

Amur_ide/   genomes/
 Amur_ide/中包括了genes.gff3   cds.fa protein.fa   ##无论原名是啥都改为这个
genomes/中包括了基因组文件 Amur_ide.fa ##无论原名是啥都改为这个。


(3)  在含有snpEff.config那个地方,执行命令构建数据库

./snpEff build -gff3 -v Amur_ide
# -c , -config   : Specify config file
#  -v , -verbose : Verbose mode (详细模式)


(4) 注释

在注释之前,检查vcf变异文件,应去除##注释信息,开头应为:

#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO    FORMAT

java -Xmx4g -jar ../snpEff.jar ann Amur_ide  -o vcf -v ./alk_fw_pass_merged_filter.vcf -csvStats 1.csv -stats 1.html > selected.ann.vcf
##-Xmx:堆内存的最⼤值,默认值是物理内存的1/4(且⼩于1G),如默认情况下当堆中可⽤内存⼤于70%时,堆内存会开始减少,⼀直减⼩到-Xms的⼤⼩
# -csvStats <file> : Create CSV summary file.
#-s , -stats, -htmlStats: Create HTML summary file.  Default is 'snpEff_summary.html'
#-o <format> : Ouput format [ vcf, gatk, bed, bedAnn ]. Default: VCF.
#-formatEff: Use 'EFF' field compatible with older versions (instead of 'ANN'). (使用与旧版本兼容的'EFF'字段(而不是'ANN')。)


相关文章
|
10月前
|
SQL 弹性计算 关系型数据库
如何用读写分离构建高效稳定的数据库架构?
在少写多读业务场景中,主实例读请求压力大,影响性能。通过创建只读实例并使用数据库代理实现读写分离,可有效降低主实例负载,提升系统性能与可用性。本文详解配置步骤,助你构建高效稳定的数据库架构。
存储 人工智能 机器人
304 0
|
10月前
|
安全 关系型数据库 数据管理
阿里云数据库:构建高性能与安全的数据管理系统
阿里云数据库提供RDS、PolarDB、Tair等核心产品,具备高可用、弹性扩展、安全合规及智能运维等技术优势,广泛应用于电商、游戏、金融等行业,助力企业高效管理数据,提升业务连续性与竞争力。
|
存储 SQL Java
数据存储使用文件还是数据库,哪个更合适?
数据库和文件系统各有优劣:数据库读写性能较低、结构 rigid,但具备计算能力和数据一致性保障;文件系统灵活易管理、读写高效,但缺乏计算能力且无法保证一致性。针对仅需高效存储与灵活管理的场景,文件系统更优,但其计算短板可通过开源工具 SPL(Structured Process Language)弥补。SPL 提供独立计算语法及高性能文件格式(如集文件、组表),支持复杂计算与多源混合查询,甚至可替代数据仓库。此外,SPL 易集成、支持热切换,大幅提升开发运维效率,是后数据库时代文件存储的理想补充方案。
|
安全 OLAP 数据库
拒绝等待!阿里云瑶池数据库 x Qwen3,构建增强式RAG
阿里云瑶池 Dify on DMS + AnalyticDB 现已支持通义千问 Qwen3 全系列模型的私域部署,并提供独占模型服务,实现高效安全的 GraphRAG 业务应用及大模型应用开发解决方案。
|
监控 关系型数据库 MySQL
云数据库:从零到一,构建高可用MySQL集群
在互联网时代,数据成为企业核心资产,传统单机数据库难以满足高并发、高可用需求。云数据库通过弹性扩展、分布式架构等优势解决了这些问题,但也面临数据安全和性能优化挑战。本文介绍了如何从零开始构建高可用MySQL集群,涵盖选择云服务提供商、创建实例、配置高可用架构、数据备份恢复及性能优化等内容,并通过电商平台案例展示了具体应用。
|
存储 NoSQL MongoDB
数据库数据恢复—MongoDB数据库迁移过程中丢失文件的数据恢复案例
某单位一台MongoDB数据库由于业务需求进行了数据迁移,数据库迁移后提示:“Windows无法启动MongoDB服务(位于 本地计算机 上)错误1067:进程意外终止。”
|
移动开发 监控 关系型数据库
使用云数据库RDS和低代码开发平台“魔笔”,高效构建门户网站,完成任务领智能台灯!
使用云数据库RDS和低代码开发平台“魔笔”,高效构建门户网站,完成任务领智能台灯!
|
人工智能 容灾 关系型数据库
【AI应用启航workshop】构建高可用数据库、拥抱AI智能问数
12月25日(周三)14:00-16:30参与线上闭门会,阿里云诚邀您一同开启AI应用实践之旅!

热门文章

最新文章