特征表构建
最后发布时间 : 2022-11-04 10:42:06
浏览量 :
OTU和ASV统称为特征(Feature),它们的区别是:
OTU通常按97%聚类后挑选最高丰度或中心的代表性序列;
ASV是基于序列进行去噪(排除或校正错误序列,并挑选丰度较高的可信序列)作为代表性序列
filtered.fa
cat results/raw/filtered.fa |less -S
>KO1.1
GTAGTCCACGCCCTAAACGATGTGTGCTGGGCGTCGGGGGGCTTGCCCCTCGGTGCCGGAGCCAACGCGGTAAGCACACC
GCCTGGGGAGTACGGCCGCAAGGTTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTTGCTTAAT
TCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATCGCCGGAAAACTCGCAGAGATGCGGGGTCCTTTTGGGCCGGTG
ACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTTCTAT
GTTGCCAGCACGCCCTTCGGGGTGGTGGGGACTCATAGGAGACTGCCGGGGTCAACTCGG
>KO1.2
GTAGTCCACGCCGTAAACGATGGATGCTAGCCGTTGGCCGGTTTACCGGTCAGTGGCGCAGCTAACGCTTTAAGCATCCC
GCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTCAAT
TCGACGCAACGCGAAGAACCTTACCAGCTCTTGACATGTCTCGTATGGGTTTCAGAGATGAGACCCTTCAGTTCGGCTGG
CGAGAACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTC
GCCTTTAGTTGCCATCATTTAGTTGGGCACTCTAAAGGGACTGCCGGTGATAAGCCGCGA
otus.fa
>ASV_1
GTAGTCCACGCCGTAAACGGTGGGCGCTAGATGTGGGGACCTTCCACGGTTTCTGCGTCGCAGCTAACGCATTAAGCGCC
CCGCCTGGGGAGTACGGTCGCAAGACTAAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGCGGAGCATGTTGCTTA
ATTCGACGCAACGCGAAGAACCTTACCAAGGCTTGACATCGCCGGAAAACTCGCAGAGATGCGGGGTCCTTTTGGGCCGG
TGACAGGTGGTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTCGTTCT
ATGTTGCCAGCACGCCCTTCGGGGTGGTGGGGACTCATAGGAGACTGCCGGGGTCAACTCGGA
>ASV_2
GTAGTCCACGCCCTAAACGATGTCAACTGGTTGTTGGGAGGGTTTCTTCTCAGTAACGTAGCTAACGCGTGAAGTTGACC
GCCTGGGGAGTACGGCCGCAAGGTTGAAACTCAAAGGAATTGACGGGGACCCGCACAAGCGGTGGATGATGTGGTTTAAT
TCGATGCAACGCGAAAAACCTTACCTACCCTTGACATGTCTGGAATCCTGAAGAGATTTGGGAGTGCTCGAAAGAGAGCC
AGAACACAGGTGCTGCATGGCCGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGT
CATTAGTTGCTACGAAAGGGCACTCTAATGAGACTGCCGGTGACAAACCGGA
usearch生成特征表
小样本(小于30)快;但大样本受限且多线程效率低,83.2%,4核17s
usearch -otutab temp/filtered.fa \
-otus result/raw/otus.fa \
-threads 4 \
-otutabout result/raw/otutab.txt
vsearch生成特征表
mkdir -p results/matrix
vsearch --usearch_global results/raw/filtered.fa \
--db results/raw/otus.fa \
--id 0.97 --threads 4 \
--otutabout results/matrix/otutab.txt
otutab.txt
#OTU ID | KO1 | KO2 | KO3 | KO4 | KO5 | KO6 | OE1 | OE2 | OE3 | OE4 | OE5 | OE6 | WT1 | WT2 | WT3 | WT4 | WT5 | WT6 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ASV_1 | 382 | 671 | 282 | 438 | 381 | 390 | 476 | 590 | 500 | 360 | 490 | 357 | 799 | 830 | 567 | 664 | 508 | 519 |
ASV_10 | 107 | 129 | 231 | 264 | 372 | 240 | 70 | 65 | 82 | 105 | 138 | 103 | 138 | 201 | 83 | 94 | 189 | 93 |
ASV_100 | 22 | 34 | 4 | 6 | 10 | 22 | 43 | 20 | 27 | 23 | 23 | 38 | 19 | 12 | 28 | 16 | 22 | 27 |
ASV_1000 | 1 | 1 | 3 | 0 | 0 | 2 | 1 | 1 | 3 | 1 | 2 | 0 | 0 | 0 | 1 | 1 | 4 | 3 |
ASV_1001 | 3 | 1 | 0 | 0 | 0 | 3 | 3 | 3 | 0 | 1 | 1 | 2 | 1 | 0 | 3 | 4 | 0 | 1 |
ASV_1002 | 4 | 1 | 1 | 4 | 4 | 2 | 5 | 2 | 2 | 5 | 3 | 7 | 6 | 7 | 3 | 5 | 0 | 1 |