Questão:
A fgsea e a Broad Institute GSEA são equivalentes?
llrs
2017-05-19 17:32:54 UTC
view on stackexchange narkive permalink

Vários métodos de enriquecimento de conjuntos de genes estão disponíveis, o mais famoso / popular é a ferramenta Broad Institute. Muitas outras ferramentas estão disponíveis (ver por exemplo o biocView de GSE que lista 82 pacotes diferentes). Existem vários parâmetros em consideração:

  • a estatística usada para ordenar os genes,
  • se for competitiva ou independente,
  • se for supervisionado ou não,
  • e como a pontuação de enriquecimento é calculada.

Estou usando o pacote fgsea - Fast Gene Set Enrichment Analysis para calcule as pontuações de enriquecimento e alguém me disse que os números são diferentes dos do Broad Institute, apesar de todos os outros parâmetros serem equivalentes.

Esses dois métodos (fgsea e Broad Institute GSEA) são equivalentes para calcular o pontuação de enriquecimento?

Eu olhei para os algoritmos de ambos os artigos, e eles parecem bastante semelhantes, mas não sei se em conjuntos de dados reais eles são equivalentes ou não.

Existe algum artigo revisando e comparando como o método de pontuação de enriquecimento afeta o resultado?

Dois respostas:
burger
2017-05-21 01:24:45 UTC
view on stackexchange narkive permalink

De acordo com a pré-impressão FGSEA:

Executamos o GSEA de referência com parâmetros padrão. O número de permutação foi definido como 1000, o que significa que para cada conjunto de genes de entrada, foram geradas 1000 amostras independentes. A execução levou 100 segundos e resultou em 79 conjuntos de genes com valor q FDR ajustado para GSEA de menos de 10−2. Todos os conjuntos de genes significativos estavam em um modo positivo. Primeiro, para obter uma precisão de valores p nominais semelhantes, executamos o algoritmo FGSEA em 1000 permutações. Isso levou 2 segundos, mas não resultou em nenhum acerto significativo devido à correção de vários testes (com FRD ≤ 1%).

Portanto, FGSEA e GSEA não são idênticos.

E novamente na conclusão:

Consequentemente, os conjuntos de genes podem ser classificados com mais precisão nos resultados e, o que é ainda mais importante, métodos de correção de teste múltiplo padrão podem ser aplicados em vez dos aproximados, como em [GSEA].

O autor argumenta que FGSEA é mais preciso, portanto, não pode ser equivalente.

Se você estiver interessado especificamente na pontuação de enriquecimento, que foi abordado pelo autor nos comentários de pré-impressão:

Os valores das pontuações de enriquecimento e pontuações de enriquecimento normalizado são os mesmos para a versão ampla e fgsea.

Então, essa parte parece ser a mesma.

Sim, a pré-impressão fala muito sobre como os valores p são calculados de forma diferente, mas eu estava perguntando se os escores de enriquecimento são iguais ou não, eu estava ciente das diferentes maneiras de calcular os valores p. Eu encontro a resposta pelo próprio autor
Desculpe. Não percebi que você estava perguntando especificamente sobre a pontuação de enriquecimento. Você pode querer editar a pergunta para torná-la mais óbvia.
llrs
2017-05-21 15:41:34 UTC
view on stackexchange narkive permalink

Descobri que o autor respondeu que na discussão na pré-impressão,

Eu me pergunto se a pontuação de enriquecimento foi calculada da mesma maneira que em amplo gsea?

Os valores das pontuações de enriquecimento e pontuações de enriquecimento normalizadas são os mesmos para a versão ampla e fgsea.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...