Informations

Requête R/Bioconducteur pour un gène ?

Requête R/Bioconducteur pour un gène ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je suis assez nouveau en bioinformatique, alors soyez indulgents s'il vous plait ;0

Existe-t-il un moyen d'interroger un gène particulier à l'aide d'un script dans R/Bioconductor ? Je suis particulièrement intéressé par les termes d'ontologie génétique. Il existe de nombreux sites Web qui, étant donné le nom du gène, renverront les termes GO pertinents. Ma question est, peut-il être automatisé?


Veuillez poser des questions sur Bioconducteur sur le Bioconducteur site d'assistance.

Bioconductor distribue également des packages « d'annotation » avec des informations sélectionnées. Celles-ci ne reposent pas sur un service Web, elles sont donc toujours disponibles et sont fixées à chaque version (6 mois) de Bioconductor, mais sont moins complètes. Choisissez votre organisme

BiocInstaller::biocLite(c("org.Hs.eg.db", "GO.db")) # bibliothèque pour la première fois("org.Hs.eg.db"); bibliothèque("GO.db")

Requête pour les identifiants GO

symboles = c("BRCA1", "BRCA2") df = select(org.Hs.eg.db, symboles, colonnes="GO", keytype="SYMBOL")

Symbole - Les mappages GO sont 1: beaucoup, donc

> dim(df) [1] 149 4 > head(df) SYMBOLE GO EVIDENCE ONTOLOGY 1 BRCA1 GO:0000151 NAS CC 2 BRCA1 GO:0000724 IDA BP 3 BRCA1 GO:0000724 TAS BP 4 BRCA1 GO:0000794 IEA CC 5 BRCA1 GO :0003677 TAS MF 6 BRCA1 GO:0003682 AIE MF

Utilisez le package GO.db pour mieux comprendre les identifiants GO

> head(select(GO.db, df$GO, "TERM")) 'select()' a renvoyé plusieurs:1 mappage entre les clés et les colonnes GOID TERM 1 GO:0000151 ubiquitine ligase complex 2 GO:0000724 réparation de cassure double brin par recombinaison homologue 3 GO:0000724 réparation de cassure double brin par recombinaison homologue 4 GO:0000794 chromosome nucléaire condensé 5 GO:0003677 liaison à l'ADN 6 GO:0003682 liaison à la chromatine

Voir les vignettes sur la page de destination d'AnnotationDbi, les flux de travail liés aux annotations et le matériel de formation sur le site Web de Bioconductor.


Jetez un œil au package biomart. Ce package vous permet d'accéder directement à certaines bases de données dans R. Citation du guide de l'utilisateur :

Le package permet de récupérer de grandes quantités de données de manière uniforme sans avoir besoin de connaître les schémas de base de données sous-jacents ou d'écrire des requêtes SQL complexes. Des exemples de bases de données BioMart sont Ensembl, Uniprot et HapMap. Ces bases de données majeures donnent aux utilisateurs de biomaRt un accès direct à un ensemble diversifié de données et permettent un large éventail de requêtes en ligne puissantes de R.

Dans le guide de l'utilisateur, vous trouverez tout ce dont vous avez besoin, c'est-à-dire une description et des exemples de tâches, pour effectuer des requêtes sur les symboles HGNC, les termes GO, etc.