Questão:
Confirme o sucesso ou falha da normalização de RNA-Seq
Scott Gigante
2017-05-18 05:28:24 UTC
view on stackexchange narkive permalink

Estou trabalhando com um conjunto de dados de RNA-Seq (em massa) coletados em várias execuções em diferentes épocas do ano. Eu normalizei meus dados usando a normalização de tamanho / quantil / RUV da biblioteca e gostaria de verificar (quantitativamente e / ou qualitativamente) se a normalização teve sucesso ou não na remoção dos efeitos do lote.

É importante observar que por "normalização bem-sucedida", quero dizer simplesmente que a variação indesejada foi removida - uma análise mais aprofundada é necessária para garantir que a variação biológica não foi removida. Quais são algumas plotagens / testes estatísticos / pacotes de software que fornecem um controle de qualidade de primeira etapa para normalização?

Dois respostas:
SmallChess
2017-05-18 05:49:44 UTC
view on stackexchange narkive permalink

Você deve usar boxplots e PCA plot. Vamos dar uma olhada no artigo RUV:

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4404308/

Antes da normalização e depois da normalização UQ :

enter image description here

As bibliotecas fazem não agrupar como esperado de acordo com o tratamento. ... para contagens normalizadas UQ. A normalização UQ não leva a um melhor agrupamento das amostras ...

Antes da normalização, as medianas no box-plot obviamente parecem muito diferentes entre as repetições.

Depois Normalização UQ, as medianas parecem mais próximas, mas Trt.11 parece um outlier. Além disso, os tratamentos não são agrupados no gráfico PCA. Uma vez que são réplicas, você gostaria que estivessem perto do gráfico.

Após a normalização RUV

enter image description here

... RUVg reduz as medidas de expressão da Biblioteca 11 para a mediana entre as bibliotecas, sugerindo robustez contra outliers. ... As bibliotecas agrupam-se conforme esperado pelo tratamento. ...

O RUV tornou a distribuição mais robusta e as amostras mais próximas no gráfico PCA. No entanto, ainda não é perfeito, pois um dos tratamentos não se aproxima dos outros dois no primeiro PC.

As vinhetas para Biocondutor RUVSeq descreve as duas funções: plotRLE e plotPCA .

Eu poderia apontar a distinção entre um gráfico RLE (mostrado aqui) e um boxplot comum (uma distinção feita na página 3 da pré-impressão de abril de 2017 em gráficos RLE: Visualizando variação indesejada em dados dimensionais elevados em https://arxiv.org/ pdf / 1704.03590.pdf). Caso contrário, uma resposta excelente, mas importante para explicar o que significa RLE.
Daniel Standage
2017-05-23 00:07:50 UTC
view on stackexchange narkive permalink

A inspeção visual com histogramas, boxplots ou alguma outra visualização de distribuição é o caminho a percorrer. Antes da normalização, suas abundâncias podem ser parecidas com isto. Pre-norm

Pós-normalização, elas devem ser parecidas com isto. Post-norm

Veja esta postagem do blog para obter um exemplo de código.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...