Questão:
Quais são todos os arquivos de referência produzidos pelo índice bwa e eles dependem de a referência ser compactada?
mattm
2017-06-03 00:36:08 UTC
view on stackexchange narkive permalink

Eu indexei uma referência gzipada com bwa: bwa index reference.fa.gz , que produz uma série de outros arquivos reference.fa.gz. {amb, ann, bwt, pac, sa} . Eles estão funcionando bem com o alinhamento de bwa.

Eu descobri que samtools não leva uma referência gzipada, então estou planejando usar uma versão descompactada da referência para meu fluxo de trabalho em vez de lidar com duas representações separadas A referência.

Os arquivos reference.fa.gz. {amb, ann, bwt, pac, sa} dependem da referência que está sendo compactada? Eu preciso reindexar o reference.fa descompactado com bwa, ou posso apenas renomear os arquivos atuais para remover a parte .gz do nome do arquivo?

Um responda:
#1
+6
Devon Ryan
2017-06-03 00:46:16 UTC
view on stackexchange narkive permalink

Você obterá exatamente o mesmo índice (o amb , ann , bwt , pac e sa files) se a referência foi compactada com gzip ou não. O BWA também faz sua própria sequência de referência compactada (o arquivo .pac) para que você nem precise do genoma depois de indexar.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...