Questão:
Como pode a contribuição da linha celular ser estimada a partir dos dados RNASeq?
llrs
2017-05-30 12:30:54 UTC
view on stackexchange narkive permalink

Usando uma microdissecção por captura a laser de células, um grupo de células coradas com o marcador de interesse foi sequenciado. Em outra coorte de pacientes (este é todo tecido de fígado humano), todo o tecido foi sequenciado (RNA-seq em ambos os casos)

Posso estimar a contribuição das células marcadas em todo o fígado ("peso de essas células "no fígado, nas palavras do meu IP?

Meu pressentimento é que isso não pode ser feito dessa maneira, seria necessário o sequenciamento de uma única célula e o sequenciamento de todo o tecido para estimar a contribuição de cada linha celular. Mas talvez haja uma ferramenta que, dadas as linhas celulares ou a expressão principal de outras linhas celulares, possa ser comparada ao uso de GSVA ou alguma ferramenta semelhante.

Você já olhou para as ferramentas de estimativa de mistura (é isso que você está fazendo)? Quão precisa você precisa que a estimativa seja?
Eu não ouvi falar de estimativa de mistura, então não procurei ferramentas com essa palavra-chave. Não tenho um requisito de precisão, quanto mais, melhor: D. Mas eu suspeito que meus dados não são muito bons (eu tenho apenas 6 réplicas técnicas da microdissecção a laser), então não posso esperar muito.
Quatro respostas:
#1
+6
Iakov Davydov
2017-06-01 14:01:04 UTC
view on stackexchange narkive permalink

Existem alguns métodos computacionais que tentam fazer isso (nunca os usei, portanto, não tenho experiência):

  1. CellMix, com base em conjuntos de genes marcadores listas
  2. Predição de subconjunto da correlação de enriquecimento, que se baseia em correlações com genes específicos de subconjunto em um conjunto de amostras.
  3. Enriquecimento do tipo celular, que usa nosso banco de dados de genes específicos de células altamente expresso
  4. Análise de significância específica de tipo de célula usando expressão diferencial de genes para cada tipo de célula
  5. ol >

    Você pode ter que obter alguns níveis de expressão de referência de bancos de dados públicos ou documentos para alguns dos métodos.

    Uma coisa a se ter em mente: você não pode realmente calcular a proporção das células, apenas a proporção do RNA. Se você tiver um bom motivo para supor que a quantidade de RNA por célula é muito semelhante, este é um bom indicador da proporção de células em um tecido.

Boas referências. Terei essa limitação em mente. obrigado
#2
+4
gringer
2017-06-01 17:48:19 UTC
view on stackexchange narkive permalink

A deconvolução celular é mencionada nesta postagem do Biostars, que menciona o CIBERSORT para combinações de células imunes, e o pacote Biocondutor DeconRNASeq.

Até Estou ciente de que, na melhor das hipóteses, é possível obter representação proporcional para a expressão da transcrição a partir de resultados de sequenciamento de alto rendimento padrão, porque os sequenciadores e o fluxo de trabalho de preparação de amostra são projetados de forma que o mesmo número de leituras seja gerado, independentemente do quantidade de entrada.

CIBERSORT parece uma boa ferramenta, vale a pena tentar.
#3
  0
Dr_Hope
2020-08-18 19:18:02 UTC
view on stackexchange narkive permalink

Você pode baixar dados públicos de RNA-seq de célula única ou RNA-seq em massa para células primárias purificadas para referência e, em seguida, usar CIBERSORT ou MuSiC para deconvolver. Uma coisa a notar: para fazer referência de RNA-seq e de célula única compatível, TPM de RNA-seq pode ser comparado com CPM em dados de célula única 3 '(10X, Drop-seq etc.) e TPM em dados de célula única de comprimento total (SMARTseq etc.)

#4
  0
Reza Rezaei
2020-08-18 21:31:11 UTC
view on stackexchange narkive permalink

Na verdade, um mês atrás, eu estava pesquisando a mesma pergunta e encontrei alguns pacotes que podem ser usados. Em primeiro lugar, a funcionalidade deles pode ser estimativa da proporção da célula, estimativa da expressão do gene específico da célula ou ambas as funções. Em segundo lugar, sua entrada primária, como esperado, são dados de seq de RNA em massa e alguns também querem dados de seq de RNA de uma única célula como entrada secundária. O mais popular é o filho do famoso cibersort, CIBERSORTX. Visitei o site deles e li os tutoriais. Eles têm vários conjuntos de dados de exemplo que podem ser usados ​​para aprender sua plataforma. No entanto, as duas maiores falhas foram que eles não compartilharam seu código-fonte, o que significa que não podemos reproduzir o resultado em nossos próprios sistemas e temos que fazer upload de todos os nossos dados para os servidores de Stanford (questões de segurança!). O segundo problema é que não há acesso à API para o servidor e tudo deve ser feito online, o que significa baixíssima compatibilidade com outras ferramentas.

A ideia, usar deconvolução e aprendizado profundo para inferir subpopulação de células em massa RNA-seq, é ótimo. Então, procurei ver se outras pessoas também fizeram algo semelhante e talvez até melhor. Encontrei três outras ferramentas:

  1. MuSiC: https://www.nature.com/articles/s41467-018-08023-x
    Publicado em comunicação natural e alguns meses mais antigo que o cibersortx. Ainda não estudei o algoritmo deles e, portanto, não posso dizer se o método deles é melhor do que o cibersortx ou não. No entanto, a parte que faz a diferença é que todos os seus trabalhos, incluindo o código-fonte, são de código aberto. Portanto, posso acessar o código deles e não precisamos carregar nossos dados não publicados em algum servidor online não seguro (ao contrário do cibersortx). A segunda coisa boa é que ele é implementado na linguagem R, que eu uso para a maioria das minhas análises de dados de RNA-seq, por isso é facilmente compatível com outras ferramentas.

  2. Scaden: https://advances.sciencemag.org/content/6/30/eaba2619.full Este também é de código aberto e facilmente acessível. Ele é escrito em Python e executado no shell. Portanto, é um pouco compatível com outras ferramentas (não tão compatível quanto MuSic). Mais uma vez, podemos processar nossos dados localmente e não precisamos fazer upload de nossos dados para nenhum servidor (o que é bom). Eles afirmam que seu método tem uma correlação melhor com os dados reais de scRNA-seq do que o cibersortx e o MuSic (nem sempre !!). Executar suas ferramentas parece fácil com base em seus tutoriais (ainda não o executei em meu sistema!). No entanto, seus tutoriais parecem um pouco confusos e parece que ainda está em uma versão de pré-lançamento e eles têm bugs !!

  3. CDSeq: https: / /github.com/kkang7/CDSeq_R_Package Finalmente, encontrei o pacote CDSeq que não precisa de nenhuma entrada de scRNA-seq para encontrar proporções de células únicas e expressão de genes específicos de células em dados em massa. Ele apenas obtém suas contagens de buld como entrada e informações sobre poucos parâmetros e faz tudo automaticamente, e surpreendentemente bom, eu verifiquei! Se você pudesse encontrar o padrão de expressão gênica de suas células específicas e também usá-lo como uma entrada, é opcional, ele lhe dará uma estimativa ainda melhor.



Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...