Tenho 12 leituras WGS Nextseq do microbioma intestinal humano (extremidade emparelhada de 151 bp). Qual será uma estratégia eficaz para montar um metagenoma?
Digamos que eu já tenha filtrado o fastq quanto à qualidade, sequência do adaptador e contaminação do hospedeiro (humano, neste caso).
1) Devo concatenar todas as leituras de R1 como uma única leitura de R1 e uma única leitura de R2?
cat Sample [1..12] .R1 > Single_R1. fastqcat Sample [1..12] .R2 > Single_R2.fastq
e então usar Diginorm para normalizar Single_R1.fastq e Single_R2.fastq. Posteriormente, alimente esses arquivos fastq em qualquer montador de metagenoma, como Megahit, MetaSPAdes?
Normalize a saída usando CD-HIT ou ferramenta semelhante para remover duplicatas e filtrar por comprimento de contig.
OU
2) Execute a montagem do metagenoma para cada uma das amostras individualmente após a aplicação da filtragem, removendo os adaptadores e a contaminação do hospedeiro.
R1 = (* _ R1_001.filtered.fastq) R2 = (* _ R2_001.filtered.fastq) para ((i = 0; i< = $ {# R1 [@]}; i ++) ); do / bin / metagenome-assembler -1 "$ {R1 [i]}" -2 "$ {R2 [i]}" -o $ {R1 [i]%. *}. contigs.fa; done
Seguido pela combinação de todos os contigs.fa em um mega_contigs.fa
cat * .contigs.fa > Mega_contigs.fa
e use o CD-HIT ou ferramenta semelhante para remover duplicatas.