学习资料
软件安装
conda create -n ensembl-vep ensembl-vep
安装数据库
vep_install -a cf -s homo_sapiens -y GRCh38 -c /output/path/to/GRCh38/vep --CONVERT
变异的注释这一个步骤,我把它单独拎出来,原因是它完全可以独立于以上的流程。任何SNP和Indel数据(VCF格式),只要有需要你都可以随时完成这个注释。最难的其实只是如何安装好VEP和它需要的相关数据集(cachedir目录下的数据)。
## 使用VEP完成变异的注释 VEP=/your_path_to/ensembl-vep/vep time $VEP --fasta $reference/Homo_sapiens_assembly38.fasta \ --vcf --merged --fork 10 --hgvs --force_overwrite --everything \ --offline --dir_cache /your_path_to/ensembl-vep/cachedir \ -i $outdir/gatk/${sample}.HC.VQSR.vcf.gz \ -o $outdir/gatk/${sample}.HC.VQSR.VEP.vcf.gz
vep(Variant Effect Predictor) determines the effect of your variants(SNPs, insertions, deletions, CNVs or structural variants) on genes, transcripts, and protein sequence, as well as regulatory regions.
test.chr22.vcf