Questão:
Os efeitos da conversão de bissulfito incompleta sobre a eficiência do mapeamento
DDRRpy
2017-05-24 11:41:10 UTC
view on stackexchange narkive permalink

Esta questão também foi postada em Biostars

Eu sequenciei vários pools multiplexados de bibliotecas seq amplicon BS derivadas de amostras humanas em um MiSeq nas últimas semanas. Tenho utilizado trim-galore e Bismark para o alinhamento e estou descobrindo que a eficiência do mapeamento é realmente baixa para dois pools (55% & 30% respectivamente), ambos com uma citosina por sequência de base de cerca de 10-20% em todo o ler em seus arquivos fastqc.

O alto conteúdo de C visível nos arquivos fastqc me faz pensar que a baixa eficiência do mapeamento se deve à baixa conversão de bissulfito, pois seria de se esperar que estivesse perto de zero se a conversão de bissulfito tivesse realmente aconteceu.

Sou novo no campo, então qualquer ajuda seria muito apreciada.

Pode ser bom se familiarizar com as etapas por trás do mapeamento de leituras convertidas de bissulfito. Neste post em [biostars] (https://www.biostars.org/p/107871/), apresento uma rápida análise das etapas envolvidas se você quiser dar uma olhada (mas é claro que há muito material disponível nele).
Um responda:
#1
+7
Devon Ryan
2017-05-24 11:46:37 UTC
view on stackexchange narkive permalink

A eficiência de conversão de bissulfito não tem efeito na taxa de mapeamento em bismark e ferramentas semelhantes. O motivo é que as leituras são totalmente convertidas em bissulfito in silico antes do alinhamento para minimizar o viés de mapeamento.

Sugiro que você brinque com as configurações entregues ao bowtie2, como usar alinhamento local e modificação da opção --score-min para permitir mais incompatibilidades. Alternativamente, você pode tentar um alinhador diferente como bwameth, que sempre fará o alinhamento local.

Obrigado. - a bandeira local na documentação do bowtie2 parece promissora, vou tentar isso quando eu entrar no escritório. O Bismark analisará quaisquer opções / sinalizadores de bowtie2 para bowtie2 (pergunto porque --local não está presente nos documentos bisamark, mas apenas nos documentos bowtie2)? O que posso concluir sobre a citosina alta por sequência de base nos arquivos fastqc? Eu geralmente descobri que isso é 0% em análises anteriores ou 10% nas extremidades, ponto em que eu cortaria as extremidades.
Eu não acho que o bismark irá lidar com o sinalizador `--local` corretamente, uma vez que ele espera que as leituras se alinhem totalmente ou sejam descartadas, sem qualquer recorte suave.
Se depois de executar bismark os gráficos MBIAS não parecerem relativamente planos, você pode passar um parâmetro de filtro para bismark_methylation_extractor, de modo que, por exemplo, você ignora os últimos 10 bp de cada leitura.
@719016: Você pode estar correto, já se passaram alguns anos desde que olhei para o código bismark, geralmente tento evitar usá-lo, pois é incrivelmente lento e costuma dar resultados ruins.
Como Devon Ryan também propõe, você pode tentar o bwameth, que é um invólucro simples em torno do bwa-mem, e mantém os alinhamentos com recorte suave, se houver. Você pode então aplicar outro script para contar os CpGs do bam, por exemplo, este: https://github.com/dariober/bioinformatics-cafe/tree/master/bam2methylation
Geralmente recomendo [MethylDackel] (https://github.com/dpryan79/MethylDackel) para extração de metilação e controle de qualidade, mas estou inclinado: P


Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...