Questão:
validar subpopulações de células identificadas em scRNA-seq
Deffiz
2017-06-03 00:22:35 UTC
view on stackexchange narkive permalink

Nas análises de dados de RNA-seq de célula única, existem diferentes abordagens não supervisionadas para identificar subpopulações putativas (por exemplo, conforme disponível com pacotes Suerat ou SCDE).

Existe uma boa maneira de validar computacionalmente as soluções de cluster? Métodos diferentes podem resultar em resultados de agrupamento ligeiramente diferentes. Como saber qual é o melhor, ou seja, representante de subpopulações biológicas?

É um pouco insensato tentar validar computacionalmente métodos computacionais sem um conjunto de dados verdade conhecido ...
Eu mudei o scRNA para o RNA de uma única célula (uma vez que o scRNA também significa um pequeno RNA condicional).
@Kamil “scRNA-seq” é um nome estabelecido para RNA-seq de célula única.
Dois respostas:
#1
+6
olga
2017-06-03 00:50:22 UTC
view on stackexchange narkive permalink

Uma abordagem SC3, agrupamento de consenso de célula única, pode ser útil aqui. Seu objetivo é alcançar "alta precisão e robustez combinando várias soluções de clustering por meio de uma abordagem de consenso" https://www.nature.com/nmeth/journal/v14/n5/full/nmeth.4236.html

#2
+2
Alec
2017-06-14 06:38:02 UTC
view on stackexchange narkive permalink

Embora os melhores métodos de avaliação de clusters sejam usar um conjunto de dados externo ou um conjunto de dados com verdade conhecida, há uma variedade de métricas de validação interna que podem ser usadas para comparar soluções de cluster sem outro conjunto de dados.

Aqui estão algumas métricas:

  • Índice Davies-Bouldin
  • Índice Calinski-Harabasz
  • Desvio padrão da raiz quadrada média

Muitos mais podem ser encontrados nesta análise de agrupamento: http://stke.sciencemag.org/content/9/432/re6

Estes internos as métricas de validação classificam sua solução de cluster com base em três medidas: compactação, conectividade e separação. Ao usar essas métricas para comparar soluções de cluster, certifique-se de considerar qual métrica é apropriada para seus resultados, pois alguns algoritmos funcionam otimizando certas medidas.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...