Meu trabalho envolve a pesquisa de genes / fragmentos marcadores em bancos de dados metagenômicos (como o Sequence Read Archive). Assim que encontrar essas sequências, gostaria de saber mais sobre a região genômica vizinha.
Existe uma maneira de montar apenas sequências que criam um contig que contém minha região de interesse? Contigs que não contêm esta região não são úteis para mim. Meu organismo de interesse pode representar uma minoria do metagenoma, e reunir tudo no conjunto de dados usaria muito poder de computação.