展开

VEP

最后发布时间 : 2023-08-04 11:18:19 浏览量 :

学习资料

软件安装

conda create -n ensembl-vep ensembl-vep

安装数据库

vep_install -a cf -s homo_sapiens -y GRCh38 -c /output/path/to/GRCh38/vep --CONVERT

变异的注释这一个步骤,我把它单独拎出来,原因是它完全可以独立于以上的流程。任何SNP和Indel数据(VCF格式),只要有需要你都可以随时完成这个注释。最难的其实只是如何安装好VEP和它需要的相关数据集(cachedir目录下的数据)。

## 使用VEP完成变异的注释
VEP=/your_path_to/ensembl-vep/vep
time $VEP --fasta $reference/Homo_sapiens_assembly38.fasta \
 --vcf --merged --fork 10 --hgvs --force_overwrite --everything \
   --offline --dir_cache /your_path_to/ensembl-vep/cachedir \
   -i $outdir/gatk/${sample}.HC.VQSR.vcf.gz \
   -o $outdir/gatk/${sample}.HC.VQSR.VEP.vcf.gz

vep(Variant Effect Predictor) determines the effect of your variants(SNPs, insertions, deletions, CNVs or structural variants) on genes, transcripts, and protein sequence, as well as regulatory regions.

test.chr22.vcf

#CHROMPOSIDREFALTQUALFILTERINFO
2217071756.TC...
2217072035.CT...
2217072258.CA...
2217072674.GA...
2217072747.TC...
2217072781.CT...
2217073043.CT...
2217073066.AG...
2217073119.CT...