Questão:
Como encontrar conjuntos de dados GEO usando Drug Bank ID e bioDBnet
hhoomn
2017-06-15 18:09:16 UTC
view on stackexchange narkive permalink

Quero encontrar todos os experimentos em GEO que estão associados a um medicamento (por exemplo, tolvaptano). Existe alguma maneira rápida e escalável de fazer isso? Quero consultar mais de 100 medicamentos.

Tentei usar bioDBnet para mapear o ID do Drug Bank para pesquisar conjuntos de dados, mas não sei qual formato de saída devo selecionar.

Eu diria que a maneira mais rápida é simplesmente pesquisar os conjuntos de dados GEO no NCBI com o nome do medicamento. Você tinha algum tipo de pipeline programático em mente?
existem mais de 100 medicamentos, portanto, um método mais rápido ajudaria.
Em seguida, sugiro uma pesquisa programática de GEO usando a API EUtils. Feliz em postar uma resposta baseada nisso, se isso ajudasse? (terá que esperar algumas horas embora)
@hhoomn Bem-vindo à nossa comunidade. Tentei adicionar o requisito de escalabilidade à pergunta. Sinta-se à vontade para melhorá-lo. Geralmente, estamos tentando manter todas as questões precisas, portanto, não hesite em adicionar outras especificações diretamente na questão, em vez de comentários.
Também seria útil ver alguns exemplos de entrada (presumivelmente uma lista de IDs do DrugBank?) E alguma ideia da saída desejada (IDs de conjuntos de dados GEO ou resumos?)
Trzy respostas:
pedrostrusso
2018-09-24 20:51:35 UTC
view on stackexchange narkive permalink

Você poderia dar uma olhada no pacote rentrez para R. Você pode usar a função entrez_search para obter os IDs GEO para os estudos relacionados à sua consulta e, em seguida, a função entrez_summary para os resultados. Assim, por exemplo:

  x <- rentrez :: entrez_search (db = "gds", term = paste0 ("tolvaptan AND gse [ETYP]"), use_history = T) res <- rentrez :: entrez_summary (db = "gds", id = x $ ids) str (res)  

Onde res será uma lista contendo objetos do esummary classe. Então, você pode usar a seguinte linha para obter os números de acesso GSE relacionados ao tolvaptan:

  lapply (res, `[[`, "gse")  

Então você poderia colocar esta função em um loop substituindo "tolvaptan" por seus medicamentos:

  drug <- c ("drugA", "drugB", "drugC") por (drug in drogas) {x <- rentrez :: entrez_search (db = "gds", term = paste0 (drug, "AND gse [ETYP]")) res <- rentrez :: entrez_summary (db = "gds", id = x $ ids) lapply (res, `[[`, "gse")} 

Dê uma olhada na rentrez documentação para mais detalhes.

jaslibra
2017-06-16 00:10:23 UTC
view on stackexchange narkive permalink

Um dos problemas que encontrei com o GEO e até mesmo com o ArrayExpress é que parece que há toneladas de falsos positivos que aparecem na pesquisa. Além disso, pode haver uma tonelada de resultados que você perde porque não incluiu o sinônimo da droga.

Para ter certeza de que tenho todas as informações relacionadas ao nome, etc, você pode escrever um script que baixa o resultado de uma pesquisa no PubChem (isso também pode ser feito com o drugbank, eu acho) e em seguida, analise o resultado da pesquisa, extraindo informações importantes, como sinônimos do nome do medicamento.

Por fim, pegue esses sinônimos e use-os em uma pesquisa de Entrez (EUtils) para os experimentos. Em seguida, tente filtrar os resultados para manter apenas o que você realmente está procurando. Uma maneira ruim de fazer isso é garantir que o resumo da experiência contenha o termo que você está procurando. Outra maneira de fazer isso potencialmente, por exemplo, se houver um grande experimento que testa vários fatores diferentes, é pesquisar programaticamente os arquivos associados para garantir que contenham a palavra-chave desejada.

Você obterá diferentes tipos de experimentos e, portanto, os arquivos associados aos resultados dependerão do tipo de experimento no resultado da pesquisa.

Quando você obter, terá uma lista de IDs de os experimentos que você deseja, você pode alimentá-los através de GEOquery no Bioconductor.

Breck
2018-09-22 05:39:03 UTC
view on stackexchange narkive permalink

Eu recomendaria usar GEOmetadb da Bioconductor. GEOmetadb é um wrapper simples que fará o download de um banco de dados SQLite atualizado com os metadados para todas as entidades no GEO. Você pode então usar seu cliente SQL favorito para consultar o banco de dados rapidamente, já que ele está offline, refinando sua pesquisa conforme você avança.

Bem vindo ao site. Embora a recomendação seja útil, como o GEOmetadb poderia ser usado para baixar os dados GEO associados a um medicamento?
GEOmetadb permitirá que você faça pesquisas rápidas de texto completo para que você possa pesquisar todos os GSEs por nomes ou ids de medicamentos específicos.


Estas perguntas e respostas foram traduzidas automaticamente do idioma inglês.O conteúdo original está disponível em stackexchange, que agradecemos pela licença cc by-sa 3.0 sob a qual é distribuído.
Loading...