Software de simulação de mutação de última geração

Questão:

Software de simulação de mutação de última geração

Iakov Davydov

2017-12-08 15:54:57 UTC

view on stackexchange narkive permalink

Existem muitos recursos que afetam as probabilidades de mutação, por exemplo, Mutações CpG são 10 vezes mais prováveis do que outros tipos de mutações.

Existe um modelo (de preferência com software) que pode levar duas regiões genômicas alinhadas, parâmetros de estimativa do neutro a mutação processa e simula mutações para outra região? Obviamente, existem modelos como HKY e GTR, mas eles são um tanto simplistas e não levam o contexto em consideração.

Um modelo que encontrei é este, mas parece que há não há software implementando o modelo. Há algo mais recente?

Também estou procurando um software que possa contabilizar indels .

Quão boa deve ser a simulação? Deveria incluir que fatores de transcrição e genes traduzidos são menos mutados além de CpG e transverstions indels ...? (Não tenho conhecimento de nenhum software, mas acho que com uma única referência qualquer ferramenta terá problemas para estimar bons parâmetros)

A ideia do @Llopis é usá-lo em todas as regiões com seleção muito fraca (por exemplo, não funcional intergênica), apenas para contabilizar o processo de mutações, não a seleção, que obviamente afeta genes e elementos reguladores.

Não tenho certeza se essas ferramentas permitem a estimativa de parâmetros a partir dos dados, mas ouvi coisas boas sobre Indelible https://academic.oup.com/mbe/article/26/8/1879/980884 e Evolver https: // www.drive5.com/evolver/EvolverUserGuide.pdf

Isso ajuda: https: //www.biorxiv.org/content/early/2017/11/22/223297 Novo benchmark sintético-diplóide para avaliação precisa da chamada de variantes

FoldX é o método mais moderno para modelagem de mutações (citado por inúmeros artigos). Porém, ele não faz exatamente o que você deseja sem trabalho extra.

A [MMOS] (http://mmos.ch/) empresa que desenvolve soluções [Citizen science] (https://en.wikipedia.org/wiki/Citizen_science) para este tipo de tarefas.

Um responda:

Michael

2019-04-29 15:56:21 UTC

view on stackexchange narkive permalink

Pergunta Suspeito que esta pergunta seja sobre a filogenética da metilação e a abordagem que o investigador está propondo seria a última abordagem a ser usada.

Resumo As abordagens para avaliar a filogenética da metilação em ordem de preferência são:

dN / dS entre locais CpG e locais não CpG,
Um relógio molecular explícito entre CpG sites e sites não CpG
Um teste de razão de verossimilhança (LRT) com base em uma distribuição nula de mutações geradas por um algoritmo de Monte Carlo

Histórico / Justificativa As abordagens que você está usando já existem há muito tempo e geram a distribuição aleatória de mutações para uma determinada filogenia. Sua filogenética é reversa e a técnica é conhecida como Monte Carlo, você começa com uma probabilidade aleatória e envia através de um modelo parametrizado para prever o aminoácido / nucleotídeo. Assim, é ML (probabilidade máxima), Bayesiano, "phylogenetic-HMM" ao contrário. É usado em cálculos de teste de razão de verossimilhança. O modelo é determinado por um ML padrão, algoritmo de filogenia Bayesiana, ou seja, sua matemática circular porque não há meios independentes de calcular o comportamento da mutação, então o contexto preciso para o qual você está usando isso precisa ser considerado cuidadosamente.

Pacotes Existem muitos pacotes que fazem este tipo de simulação Monte Carlo, sendo o SOWHat um bom (LRT) e você gera um grande número de conjuntos de dados replicados (100 ou 1000). Um dos algoritmos básicos é "seq-gen", embora PAML possa ter implementado isso.

Considerações Para usar esse estilo de abordagem, você precisa considerar cuidadosamente sua pergunta. As "simulações de mutação", quando analisadas por meio de um programa filogenético, produzirão os mesmos parâmetros que você definiu inicialmente e árvores com basicamente o mesmo comprimento. Se você estiver usando isso para gerar uma distribuição nula para um teste filogenético, essas abordagens são úteis, então compare a probabilidade observada com a distribuição nula. Se você estiver usando para descobrir se a taxa de mutação em sites CpG é mais alta do que em outros sites, é uma abordagem entre uma série de alternativas.

Desvantagens O cálculo de uma distribuição nula de novo da taxa de mutação é computacionalmente muito caro e, portanto, tende para o último cálculo realizado. Ele abordará uma única hipótese, geralmente em relação à topologia.

Ponto crucial do problema Para realmente fazer o que (eu acho) você quer, você precisa de uma medida independente de mutação e mutação comportamento e não é trivial de alcançar. Você teria que considerá-lo como um cálculo de aprendizado de máquina, com um conjunto de treinamento formal, não sei se essa abordagem foi implementada.

Pontos fortes / Resumo Em resumo, a simulação de filogenética de Monte Carlo tem uma aplicação limitada por causa da circularidade do cálculo, MAS, MAS, MAS o que eu omiti é quando é apropriado é um teste muito poderoso, de fato.

Pontos de interesse Eu gosto das simulações de dinâmica populacional dentro da Fera, isso certamente "a priori" e seu potencial IMO precisa de mais exploração . No entanto, não acho que você esteja olhando como a epidemiologia molecular pode impactar o comportamento mutacional de metilação. Eu não olhei para Indelible, mas parece interessante.

Eu ia falar sobre "simulações de guerra do processador", mas provavelmente está fora do assunto.

Obrigado pela sua resposta. Minha pergunta não é tanto sobre a filogenética da metilação. O que eu preciso essencialmente é uma distribuição nula para mutações neutras. MCMC ou máxima verossimilhança ajuda muito, dado que existe um modelo :) Mas não estou ciente de um modelo não revesível no tempo que contabilize o contexto de sequência e indels.

Eu não sei o que é "contexto de sequência", mas a não reversibilidade de mutações (e por tempo de inferência) é Besta, todos os outros algoritmos ML ou Bayes (MCMCMC) têm matrizes de mutação simétricas. MCMC em Bayes é diferente do Monte Carlo usado para simulação de nucleotídeos. Para ser honesto, a falta de clareza da pergunta é preocupante, então não posso ajudar mais.

Em modelos filogenéticos clássicos, a probabilidade de mutação na posição N depende apenas do nucleotídeo nessa posição e de alguma medida de tempo. O que quero dizer com contexto de sequência aqui é o fato de que a probabilidade de mutação também dependerá de nucleotídeos e mutações nas posições N-M..N + M. Temos uma abundância de evidências empíricas de que existe [tal dependência] (https://doi.org/10.1038/ng.3292). Mas não há muitos modelos responsáveis por isso (como [este] (https://doi.org/10.1093/molbev/msh039)). Vou tentar esclarecer a questão e dar algumas informações básicas.

Eu também, mas aposto que você não sabe o nome do mecanismo. De qualquer forma, Nick Goldman fez isso anos atrás, não é novo

ⓘ

Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.

about - legalese

Loading...