Questão:
Baixando um genoma de referência para Bowtie2
EMiller
2017-06-01 03:56:27 UTC
view on stackexchange narkive permalink

Como faço o download de um genoma de referência que posso usar com o bowtie2? Especificamente HG19. No UCSC, existem várias opções de arquivo.

Dois respostas:
#1
+11
Konrad Rudolph
2017-06-01 14:38:53 UTC
view on stackexchange narkive permalink

É uma questão de preferência, mas recomendo as compilações do Ensembl . Decida se deseja a montagem de nível superior ou primária e se deseja arquivos com máscara suave, máscara de repetição ou sem máscara. O esquema de nomenclatura é muito direto; as combinações são descritas no arquivo README , e todos os arquivos residem em um diretório.

Por exemplo, se você deseja o assembly primário desmascarado, o arquivo para download seria Homo_sapiens.GRCh37.75.dna.primary_assembly.fa.gz .

Quanto a GoldenPath / UCSC , não há necessidade de baixar e concatenar cromossomos separados (ao contrário do que a outra resposta disse); você pode baixar toda a referência (nível superior) do diretório bigZips ; do README:

Este diretório contém a montagem de fevereiro de 2009 do genoma humano (hg19, GRCh37 Genome Reference Consortium Human Reference 37 (GCA_000001405.1)), bem como repetir anotações e sequências do GenBank.

Existem essencialmente três opções aqui:

  1. chromFa.tar.gz , que contém todo o genoma em um cromossomo por arquivo;
  2. chromFaMasked.tar.gz , o mesmo com repetições mascaradas por N ;
  3. hg19.2bit , que é o genoma inteiro em um arquivo, mas precisa ser extraído usando o programa utilitário twoBitToFa , que precisa ser baixado separadamente.

De qualquer forma, sempre faço o download da referência e construo meu próprio índice de mapeamento, pois isso me permite mais controle; nem todo mundo precisa de tanto controle, mas construir o índice uma vez é bastante rápido de qualquer maneira.

Acho que isso desencadeia outra pergunta "qual é a diferença entre as diferentes versões da mesma construção do genoma?". A resposta da pergunta deve incluir a diferença entre a análise de DNA e RNA-seq / genômica funcional. No mundo do DNA / variante, as pessoas geralmente se atêm aos grandes projetos de sequenciamento que Heng Li decide ser "o melhor". No mundo da genômica RNA-seq / funcional, a curadoria cuidadosa de genomas é importante, dependendo do mapeador de leitura e também do suporte de ferramentas de downstream (conjunto maior de ferramentas significa cauda mais longa de ferramentas menos usadas com requisitos idiossincráticos).
#2
+9
Manuel
2017-06-01 04:21:54 UTC
view on stackexchange narkive permalink

tl; dr: Basta usar os downloads na página inicial do Bowtie2 ou nos iGenomes da Illumina. Ou apenas descompacte e concatene os arquivos FASTA encontrados no UCSC goldenpath e, em seguida, construa o índice.

Uma resposta um pouco mais longa:

Existem dois componentes para " genoma para um mapeador de leitura ", como Bowtie ou BWA.

Primeiro, você precisa escolher a sequência real (versão do genoma, como GRCh37 / hg19 ou GRCh38 / hg38). Existem versões de patch como GRCh37.p3 onde algumas bases podem ser trocadas e dependendo da versão, alguns contigs "não mapeados" podem ser adicionados, mas geralmente GRCh37.p1 é quase o mesmo que GRCh37.p2, por exemplo. Normalmente, as pessoas concordam com alguma versão de patch específica para cada leitura e usam isso para mapeamento de leitura.

Geralmente, há o tipo UCSC hg19 / hg38 etc. e o tipo NCBI / GRC GRCh37, GRCh38 etc. (semelhante ao mouse). A UCSC não tem controle de versão além do lançamento do genoma e (até onde sei) não atualiza a sequência do genoma após lançar um arquivo FASTA hg19.

Em segundo lugar, você deve construir os arquivos de índice para cada genoma. Dependendo do mapeador de leitura usado, você pode ou não precisar dos arquivos FASTA originais para o alinhamento. Para Bowtie e Bowtie 2, você não precisa dos arquivos FASTA originais depois de construir o índice, pois Bowtie 1/2 pode reconstruir a sequência "on the fly" a partir dos arquivos de índice.

HTH

Não sei como deixei de fazer o download na página inicial do Bowtie. Espero que isso ajude mais alguém!


Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...