Questão:
Classificação de amostras com base na expressão do gene marcador
GWW
2017-05-24 20:41:28 UTC
view on stackexchange narkive permalink

Tenho alguns conjuntos de genes marcadores que posso classificar as amostras de RNA-seq usando agrupamento semissupervisionado. Gostaria de automatizar o processo, no entanto, estou lutando para encontrar o algoritmo ideal que poderia gerar algum tipo de pontuação para o gene marcador definido de uma determinada amostra.

Presumo que esta seja uma análise padrão em muitos grupos, mas não tenho certeza de quais métodos estão produzindo bons resultados na prática.

Recentemente, houve uma pergunta semelhante no Biostars que não rendeu respostas: https://www.biostars.org/p/239228/
Eu estou surpreso. Parece um problema tão importante. Especialmente com o scRNA-seq ganhando popularidade.
Como você mencionou os dados scRNA-seq, pode estar interessado em [Buettner * & al. *] (Https://www.nature.com/nbt/journal/v33/n2/full/nbt.3102.html): “ A análise computacional da heterogeneidade célula a célula em dados de sequenciamento de RNA de uma única célula revela subpopulações ocultas de células ”. Não resolve bem o seu problema, mas mostra alguns dos problemas associados à identificação de populações de células em scRNA-seq em particular, que são amplamente suavizadas em bulk RNA-seq.
Um responda:
#1
+7
Peter Humburg
2017-05-25 04:32:41 UTC
view on stackexchange narkive permalink

Eu consideraria o uso de assinaturas de expressão gênica para classificar amostras (especialmente subtipos de câncer, mas os mesmos princípios se aplicam a outros problemas desse tipo) um dos problemas clássicos da bioinformática. Muito trabalho foi feito em métodos para derivar conjuntos de genes que fornecem um bom desempenho de classificação. Isso é um pouco diferente do seu problema, pois você já tem uma assinatura de gene, mas ainda pode ser útil.

Esses métodos normalmente se ajustam a um modelo que seleciona um (pequeno) número de genes a partir de dados de expressão de todo o genoma que distinguem entre os tipos / condições celulares em questão, ou seja, derivam uma assinatura genética. O modelo resultante permite então a classificação de novas amostras. Tive sucesso ao usar o GeneRave para essa finalidade (mas observe que ele foi projetado para dados de microarray, não o usei com dados de RNA-seq e não sei como ele se mantém lá ) Um artigo mais recente relacionado a esse problema pode ser encontrado aqui.

Então, como isso o ajuda? Uma opção seria ajustar um desses classificadores aos dados de expressão gênica para os genes que você já conhece para obter um modelo que pode então ser aplicado a novas amostras automaticamente.

Isso é muito útil, muito obrigado. Vou dar uma chance a eles ou pelo menos ver como posso adaptar seus métodos.
Seguindo a advertência de @Peter Humberg de que GeneRave foi projetado para dados de microarray, você poderia `voom` transformar suas contagens usando` limma` para torná-los * semelhantes a microarray *.
Quando preciso comparar a expressão cDNASeq com microarray, uso uma normalização de comprimento de transcrição aplicada à transformação VST de DESeq (que chamo de 'VSTPk'). Mais detalhes sobre isso podem ser encontrados na seção de métodos de nosso artigo Th2 RNASeq: http: //dx.doi.org/10.1084/jem.20160470


Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...