Questão:
As bases de soft-clip são usadas para chamadas de variantes em samtools + bcftools?
mattm
2017-05-19 23:50:05 UTC
view on stackexchange narkive permalink

Se houver pares de base soft clip especificados na string CIGAR para uma leitura em um arquivo SAM / BAM, eles serão usados ​​para chamadas de variantes em samtools + bcftools fluxo de trabalho?

O GATK HaplotypeCaller, por exemplo, tem uma opção explícita --dontUseSoftClippedBases para se usar bases de recorte suave. A documentação do samtools não menciona bases cortadas.

Um responda:
#1
+12
Devon Ryan
2017-05-20 00:19:13 UTC
view on stackexchange narkive permalink

Não, samtools (e, portanto, bcftools) não usa bases soft-clip. Você pode confirmar isso rapidamente usando samtools depth ou samtools mpileup para observar uma região com um alinhamento soft-clip. Você notará que a região com recorte suave não é usada na profundidade / empilhamento (ambas as ferramentas usam o mesmo código subjacente, portanto, não importa qual você use). Se você estiver curioso, o samtools ignora as bases com clip porque é baseado em fazer uma pilha de alinhamentos por base cobrindo cada posição. No formato BAM, os alinhamentos são classificados e atribuídos aos bins de acordo com suas posições inicial / final, o que não inclui recorte suave. Consequentemente, quando as samtools estão fazendo o pileup, elas nem mesmo verão os alinhamentos que se sobreporiam a uma determinada base se as bases com clipagem suave fossem incluídas.

Isso, então, levanta a questão de o que o HaplotypeCaller do GATK está fazendo de forma diferente. Lá, as regiões do genoma são essencialmente montadas em um pequeno gráfico de Bruijn, que permite que as bases recortadas em torno dos indels sejam resolvidas, uma vez que o gráfico começaria / terminaria um pouco além de cada lado dos indels. É também por isso que você não precisa fazer o realinhamento indel com o HaplotypeCaller (isso era necessário no antigo UnifiedGenotyper).

Editar : Para obter mais detalhes sobre o HaplotypeCaller, consulte esta página legal no site do GATK, que oferece muito mais detalhes do que eu fiz aqui.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...