Reads

读数是 DNA 片段。“短读长”的大小范围通常为 35 – 1,000 bp(核苷酸碱基对)。“长读长”的大小通常在 1,000 – 500,000 bp 之间。出于我们的目的,我们假设读取长度为 150 bp,但读取长度取决于用于特定测序运行的测序仪模型和文库制备协议。测序仪生成的原始读数通常存储在FastQ文件中。

Contigs

Contigs 是一组重叠的定向读取。单个重叠群由两个或多个重叠和定向读取构建。读取共享一个子集或所有的核苷酸碱基对。读取可能必须颠倒(“翻转”)以产生匹配的方向,尽管这很少必要。

Scaffolds

脚手架是一组面向连接的重叠群。单个支架由两个或多个连接和定向的重叠群构建而成。重叠群可能必须颠倒(“翻转”)以产生匹配的方向。重叠群可以重叠或不重叠。

Chromosomes

染色体是一组面向连接的支架。单个染色体由两个或多个连接和定向的支架构成。支架可能必须颠倒(“翻转”)以产生匹配的方向。支架可以重叠或不重叠。

参考

https://learn.gencore.bio.nyu.edu/rna-seq-analysis/