Pergunta Suspeito que esta pergunta seja sobre a filogenética da metilação e a abordagem que o investigador está propondo seria a última abordagem a ser usada.
Resumo As abordagens para avaliar a filogenética da metilação em ordem de preferência são:
- dN / dS entre locais CpG e locais não CpG,
- Um relógio molecular explícito entre CpG sites e sites não CpG
- Um teste de razão de verossimilhança (LRT) com base em uma distribuição nula de mutações geradas por um algoritmo de Monte Carlo
Histórico / Justificativa As abordagens que você está usando já existem há muito tempo e geram a distribuição aleatória de mutações para uma determinada filogenia. Sua filogenética é reversa e a técnica é conhecida como Monte Carlo, você começa com uma probabilidade aleatória e envia através de um modelo parametrizado para prever o aminoácido / nucleotídeo. Assim, é ML (probabilidade máxima), Bayesiano, "phylogenetic-HMM" ao contrário. É usado em cálculos de teste de razão de verossimilhança. O modelo é determinado por um ML padrão, algoritmo de filogenia Bayesiana, ou seja, sua matemática circular porque não há meios independentes de calcular o comportamento da mutação, então o contexto preciso para o qual você está usando isso precisa ser considerado cuidadosamente.
Pacotes Existem muitos pacotes que fazem este tipo de simulação Monte Carlo, sendo o SOWHat um bom (LRT) e você gera um grande número de conjuntos de dados replicados (100 ou 1000). Um dos algoritmos básicos é "seq-gen", embora PAML possa ter implementado isso.
Considerações Para usar esse estilo de abordagem, você precisa considerar cuidadosamente sua pergunta. As "simulações de mutação", quando analisadas por meio de um programa filogenético, produzirão os mesmos parâmetros que você definiu inicialmente e árvores com basicamente o mesmo comprimento. Se você estiver usando isso para gerar uma distribuição nula para um teste filogenético, essas abordagens são úteis, então compare a probabilidade observada com a distribuição nula. Se você estiver usando para descobrir se a taxa de mutação em sites CpG é mais alta do que em outros sites, é uma abordagem entre uma série de alternativas.
Desvantagens O cálculo de uma distribuição nula de novo da taxa de mutação é computacionalmente muito caro e, portanto, tende para o último cálculo realizado. Ele abordará uma única hipótese, geralmente em relação à topologia.
Ponto crucial do problema Para realmente fazer o que (eu acho) você quer, você precisa de uma medida independente de mutação e mutação comportamento e não é trivial de alcançar. Você teria que considerá-lo como um cálculo de aprendizado de máquina, com um conjunto de treinamento formal, não sei se essa abordagem foi implementada.
Pontos fortes / Resumo Em resumo, a simulação de filogenética de Monte Carlo tem uma aplicação limitada por causa da circularidade do cálculo, MAS, MAS, MAS o que eu omiti é quando é apropriado é um teste muito poderoso, de fato.
Pontos de interesse Eu gosto das simulações de dinâmica populacional dentro da Fera, isso certamente "a priori" e seu potencial IMO precisa de mais exploração . No entanto, não acho que você esteja olhando como a epidemiologia molecular pode impactar o comportamento mutacional de metilação. Eu não olhei para Indelible, mas parece interessante.
Eu ia falar sobre "simulações de guerra do processador", mas provavelmente está fora do assunto.