sra数据下载

最后发布时间:2024-05-03 16:58:51 浏览量:

如果下载单个样品的SRA,可以在NCBI上先找到SRA 的ID,如在NCBI上找到的Oreocharis longifolia ID为 SRR12339613,可以在服务器上输入

fastq-dump SRR12339613 

即可进行下载SRA文件.
或直接将文件下载并转成双端的fastq的gz压缩文件

nohup fastq-dump --split-files SRR12339613 -gzip & 
# --split-files -gzip 会将SRA文件下载的同时分割成正反两个方向测序的文件并进行压缩
fastq-dump SRR12339613  #将sra转换成fastq
fastq-dump --fasta 50 SRR12339613  #sra转换成fasta,50为每行50个碱基
fastq-dump --split-files SRR12339613  #将双端测序文件分开
fastq-dump --split-3 filename其中--split-3参数代表着如果是单端测序就生成一个  、.fastq文件,如果是双端测序就生成_1.fastq 和*_2.fastq 文件。

若需要批量下载,可先获得ID list, 如若需要某一个项目中的所有SRA数据,可以直接在NCBI中搜索该project的ID,获得Accession List。

prefetch --option-file SRR_Acc_List.txt 

若下载下来的为sra文件需要批量转化为fastq文件,可以使用简单的for循环脚本:

for i in *sra
do
  echo $i
  fastq-dump --split-3 $i
done
快捷入口
生物数据库 思维导图 浏览PDF 下载PDF
分享到:
标签