Informations

Empreinte génomique numérique pour ENCODE

Empreinte génomique numérique pour ENCODE


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je lis les articles d'ENCODE Nature, et l'un des articles auxquels il est fait référence est "Global mapping of protein-ADN interactions in vivo by digital" par Hesselberth et al.[1].

L'empreinte génomique est une variante massivement parallèle du dépistage de l'hypersensibilité à la DNAse I, que j'ai l'impression de bien maîtriser, mais je ne comprends pas ce paragraphe depuis le début des résultats (la partie gênante est dans gras):

Pour visualiser l'occupation des protéines régulatrices dans le génome de Saccharomyces cerevisiae, nous avons couplé la digestion par la DNase I des noyaux de levure avec un séquençage d'ADN massivement parallèle pour créer une carte dense du génome entier de l'accessibilité du modèle d'ADN au niveau des nucléotides. Nous avons analysé une seule condition environnementale bien étudiée, des cellules de levure traitées avec le facteur de la phéromone, qui synchronise les cellules dans la phase G1 du cycle cellulaire. Nous avons isolé des noyaux de levure et les avons traités avec une concentration de DNase I suffisante pour libérer des fragments d'ADN courts (<300 pb) tout en maintenant la majeure partie de l'échantillon dans des espèces de poids moléculaire élevé (Fig.1 supplémentaire). Ces petits fragments dérivent de deux « hits » de DNase I à proximité immédiate et, par conséquent, leur isolement minimise la contamination par des extrémités de fragments uniques provenant d'un cisaillement aléatoire. Étant donné que chaque extrémité des fragments « double-hit » de la DNase I libérés représente un site de clivage de la DNase I in vivo, la séquence et donc la localisation génomique de ces sites peuvent être facilement déterminées par séquençage (méthodes supplémentaires).

Il y a une référence à un autre article de Sabo et al.[2] sur les tests de DNase à l'échelle du génome à l'aide de puces à ADN dans ce paragraphe que je lis, mais si quelqu'un comprend bien la biologie, j'apprécierais vraiment une réponse.

  1. Hesselberth JR, Chen X, Zhang Z, Sabo PJ, Sandstrom R, Reynolds AP, Thurman RE, Neph S, Kuehn MS, Noble WS, Fields S, Stamatoyannopoulos JA. 2009. Cartographie globale des interactions protéine-ADN in vivo par empreinte génomique numérique. Nature Methods 6(4) : 283-289, doi : 10.1038/nmeth.1313.
  2. Sabo PJ, Kuehn MS, Thurman R, Johnson BE, Johnson EM, Cao H, Yu M, Rosenzweig E, Goldy J, Haydock A, Weaver M, Shafer A, Lee K, Neri F, Humbert R, Singer MA, Richmond TA , Dorschner MO, McArthur M, Hawrylycz M, Green RD, Navas PA, Noble WS, Stamatoyannopoulos JA. 2006. Cartographie à l'échelle du génome de la sensibilité à la DNase I in vivo à l'aide de puces à ADN en mosaïque. Nature Methods 3: 511-518, doi: 10.1038/nmeth890.

Après avoir lu l'article cité, je pense que la logique est la suivante : DNAse Je créerai des extrémités libres sur des sites accessibles du génome. Cependant, le cisaillement lors de l'isolement ultérieur de l'ADN est également une source d'extrémités libres, et celles-ci représentent du bruit dans l'analyse. Vous devez mettre beaucoup d'énergie pour cisailler l'ADN en très petits fragments, donc j'en déduis qu'un léger cisaillement pendant l'isolement de l'ADN est très peu susceptible de créer une nouvelle extrémité proche d'une extrémité existante générée par la DNase I. Par conséquent, dans les conditions utilisées, tous les petits fragments sont beaucoup plus susceptibles d'avoir été générés par deux hits de DNase I étroitement espacés. En limitant l'analyse à ces fragments, le bruit de cisaillement est minimisé.

Maintenant que j'ai écrit cette réponse, cela ne semble pas être beaucoup plus qu'une réécriture de la phrase en gras, mais j'espère qu'elle sera quand même utile.


Empreinte génomique numérique pour ENCODE - Biologie

L'Encyclopedia of DNA Elements (ENCODE) Consortium est une collaboration internationale de groupes de recherche financée par le National Human Genome Research Institute (NHGRI). L'objectif d'ENCODE est de construire une liste complète des éléments fonctionnels du génome humain, y compris des éléments qui agissent au niveau des protéines et de l'ARN, et des éléments régulateurs qui contrôlent les cellules et les circonstances dans lesquelles un gène est actif.

    pour les pistes affichables et les fichiers téléchargeables de fichiers de données dans le navigateur de génome UCSC (données ENCODE marquées du logo NHGRI) avec le navigateur de table UCSC et d'autres outils de bioinformatique de génome UCSC

Pour rechercher des données ENCODE liées à votre domaine d'intérêt et configurer une vue de navigateur, utilisez la matrice d'expérimentation UCSC ou l'outil de recherche de piste (Avancée caractéristiques). Les liens Experiment List (Human) et Experiment List (Souris) fournissent des listes complètes des données ENCODE publiées ou en préparation. Un accès anticipé aux données ENCODE préliminaires est fourni à l'adresse http://genome-preview.ucsc.edu. Si vous souhaitez recevoir des notifications par e-mail des publications de données ENCODE et des nouvelles connexes, abonnez-vous à la liste de diffusion encode-announce. Pour plus d'informations sur la façon d'accéder à ces données, consultez le didacticiel gratuit en ligne OpenHelix ENCODE.

Toutes les données ENCODE sont disponibles gratuitement pour téléchargement et analyse. Cependant, avant de publier une recherche qui utilise les données ENCODE, veuillez lire la politique de diffusion des données ENCODE, qui impose certaines restrictions sur l'utilisation de la publication des données pendant neuf mois après la diffusion des données. En savoir plus sur les données ENCODE à l'UCSC.

Les résultats du projet ENCODE ont été publiés aujourd'hui dans un ensemble coordonné de 30 articles publiés dans plusieurs revues. Ces publications sont le résultat d'une analyse intégrative inter-consortium, couvrant plus de 4 millions de régions régulatrices du génome humain cartographiées dans le cadre d'ENCODE. L'ensemble de publication coordonné comprend un article intégratif principal et cinq autres articles dans la revue La nature 18 articles dans Recherche sur le génome et six articles dans Biologie du génome. Les données ENCODE sont si complexes que les trois revues ont développé une manière pionnière de présenter l'information sous une forme intégrée qu'elles appellent « threads ». Étant donné que les mêmes sujets ont été abordés de différentes manières dans différents articles, le La nature Le site Web ENCODE a été développé pour permettre aux lecteurs de suivre un sujet à travers tous les articles de l'ensemble de publications ENCODE. En plus de ces publications, six articles de synthèse sont publiés dans le Journal de chimie biologique, et d'autres journaux affiliés dans Science, Cellule, et d'autres revues. La nouvelle page d'analyse intégrative de ce portail fournit des liens et du matériel descriptif pour ces publications et les ressources d'analyse connexes. 28 août 2012 - Publication des données ENCODE : mises à jour de UW DNaseI DGF, Duke DNaseI HS, Broad Histone, GIS RNA PET, SYDH TFBS, UTA TFBS

Modifications des histones par ChIP-seq de ENCODE/Broad Institute (version 3) : ajoute 83 nouvelles expériences, dont 6 nouvelles lignées cellulaires et 25 nouveaux anticorps.

Localisation sous-cellulaire de l'ARN par séquençage diTag apparié à partir d'ENCODE/GIS (version 2) : ajoute des données pour 4 lignées cellulaires supplémentaires (carcinome pulmonaire A549, neuroblastome SK-N-SH, fibroblaste pulmonaire IMR90 et carcinome mammaire MCF-7) .

Sites de liaison au facteur de transcription par ChIP-seq de ENCODE/Stanford/Yale/USC/Harvard (version 3) : ajoute 37 nouvelles expériences, dont 1 nouvelle lignée cellulaire (neuroblastome SK-N-SH) et 7 nouveaux anticorps.

21 août 2012 - Publication des données d'ENCODE sur la souris : DNaseI HS de Penn State, Histone ChIP-seq de Penn State (Rel 2) et Stanford/Yale (Rel 2), TFBS ChIP-seq de Stanford/Yale (Rel 4) et Penn State (Rel 2). Lire la suite.

9 août 2012 - Listes d'expériences mises à jour : Le DCC ENCODE a mis à jour les feuilles de calcul détaillant les soumissions ENCODE pour refléter l'état des données dans la période ENCODE Y5Q3 (1er juillet). Lire la suite.

Les données de séquence et d'annotation affichées dans le navigateur du génome sont disponibles gratuitement pour un usage académique, à but non lucratif et personnel dans les conditions suivantes :


Introduction

La cartographie de l'occupation des protéines associées à l'ADN, y compris les facteurs de transcription (TF) et les histones, est essentielle pour déterminer les circuits de régulation cellulaire. Le séquençage conventionnel de ChIP (ChIP-seq) repose sur la réticulation des protéines cibles à l'ADN et la fragmentation physique de la chromatine [1]. En pratique, le masquage des épitopes et l'insolubilité des complexes protéiques peuvent interférer avec l'utilisation réussie de ChIP-seq conventionnel pour certaines protéines associées à la chromatine [2,3,4]. CUT&RUN est une méthode basée sur une endonucléase native récemment décrite basée sur la liaison d'un anticorps à une protéine associée à la chromatine in situ et le recrutement d'une fusion protéine A-nucléase microcoque (pA-MN) à l'anticorps pour cliver efficacement l'ADN entourant la liaison sites [5]. La méthode CUT&RUN a été appliquée avec succès à une gamme de TF dans des cellules de levure [5, 6] et de mammifères [7, 8]. La procédure permet d'obtenir une cartographie à plus haute résolution de la liaison aux protéines, car la digestion par endonucléase génère des fragments plus courts que la fragmentation physique. D'après notre expérience, les outils existants pour analyser de telles données se sont révélés inadéquats en raison de l'absence d'un pipeline de calcul de bout en bout spécifiquement adapté à cette technologie. Par conséquent, nous avons développé un nouveau pipeline, appelé CUT&RUNTools, qui rationalise le traitement, l'utilisation et la visualisation des données générées par CUT&RUN (Fig. 1a).

une Schéma de CUT&RUN. pA-MN est recruté sur l'anticorps lié au TF et se clive autour du site de liaison du TF, libérant des fragments d'ADN pour le séquençage. Les étapes suivantes nécessitent un pipeline de calcul spécialement conçu pour extraire un maximum d'informations des données. b Présentation des outils CUT&RUN. Étape 1 : les lectures brutes appariées d'entrée sont alignées sur le génome de référence avec un soin particulier pour le rognage et l'alignement des lectures courtes. Étape 2 : les pics sont appelés en fonction de l'empilement de fragments. Une fenêtre fixe autour du sommet de chaque pic est utilisée pour effectuer une recherche de motif de novo. Étape 3 : la matrice de coupe est calculée pour chaque motif d'intérêt et utilisée pour générer les trois sorties : (i) empreinte du motif, (ii) identification du site de liaison directe et (iii) visualisation. c La sortie de CUT&RUNTools dans la région chr3:98302650-950 à titre d'exemple


Les références

Tullius, T.D. Études physiques des complexes protéine-ADN par empreinte. Annu. Rév. Biophys. Biophys. Chem. 18, 213–237 (1989).

Church, G.M., Ephrussi, A., Gilbert, W. & Tonegawa, S. Contacts spécifiques au type cellulaire avec les activateurs d'immunoglobuline dans les noyaux. La nature 313, 798–801 (1985).

Jackson, P.D. & Felsenfeld, G. Une méthode de cartographie des interactions protéine-ADN intranucléaires et son application à un site hypersensible à la nucléase. Proc. Natl. Acad. Sci. Etats-Unis 82, 2296–2300 (1985).

Hesselberth, J.R. et al. Cartographie globale des interactions protéine-ADN in vivo par empreinte génomique numérique. Nat. Méthodes 6, 283–289 (2009).

Thurman, R.E. et al. Le paysage accessible de la chromatine du génome humain. La nature 489, 75–82 (2012).

Baek, S., Sung, M.H. & Hager, G.L. Analyse quantitative du remodelage de la chromatine à l'échelle du génome. Méthodes Mol. Biol. 833, 433–441 (2012).

Morris, S.A. et al. Les systèmes de remodelage de la chromatine qui se chevauchent collaborent à l'échelle du génome lors des transitions dynamiques de la chromatine. Nat. Structurer. Mol. Biol. 21, 73–81 (2014).

John, S. et al. L'accessibilité de la chromatine prédétermine les modèles de liaison aux récepteurs des glucocorticoïdes. Nat. Genet. 43, 264–268 (2011).

Sung, M.H., Guertin, M.J., Baek, S. & Hager, G.L. Les signatures d'empreinte DNase sont dictées par la dynamique des facteurs et la séquence d'ADN. Mol. Cellule 56, 275–285 (2014).

Il, H.H. et al. Le protocole DNase-seq raffiné et l'analyse des données révèlent un biais intrinsèque dans l'identification de l'empreinte des facteurs de transcription. Nat. Méthodes 11, 73–78 (2014).

Pique-Regi, R. et al. Inférence précise de la liaison du facteur de transcription à partir de la séquence d'ADN et des données d'accessibilité de la chromatine. Génome Res. 21, 447–455 (2011).

Neph, S. et al. Un lexique régulateur humain expansif codé dans les empreintes de facteurs de transcription. La nature 489, 83–90 (2012).

Mercer, T.R. et al. Le transcriptome mitochondrial humain. Cellule 146, 645–658 (2011).

Boyle, A.P. et al. Haute résolution à l'échelle du génome in vivo l'empreinte de divers facteurs de transcription dans les cellules humaines. Génome Res. 21, 456–464 (2011).

Cuellar-Partida, G. et al. Priorités épigénétiques pour l'identification des sites de liaison des facteurs de transcription actifs. Bioinformatique 28, 56–62 (2012).

Luo, K. & Hartemink, A.J. Utilisation des données de digestion de la DNase pour identifier avec précision les sites de liaison des facteurs de transcription. Pac. Symp. Bioinformatique. 2013, 80–91 (2013).

Gusmao, E.G., Dieterich, C., Zenke, M. & Costa, I.G. Détection de sites de liaison actifs de facteurs de transcription avec la combinaison d'hypersensibilité à la DNase et de modifications des histones. Bioinformatique 30, 3143–3151 (2014).

Sherwood, R.I. et al. Découverte de facteurs de transcription pionniers directionnels et non directionnels en modélisant l'amplitude et la forme du profil de la DNase. Nat. Biotechnologie. 32, 171–178 (2014).

Piper, J. et al. Wellington : une nouvelle méthode pour l'identification précise des empreintes génomiques numériques à partir des données DNase-seq. Acides nucléiques Res. 41, e201 (2013).

Lazarovici, A. et al. Sondage de la forme et de l'état de méthylation de l'ADN à l'échelle génomique avec la DNase I. Proc. Natl. Acad. Sci. Etats-Unis 110, 6376–6381 (2013).

Yardimci, G.G., Frank, C.L., Crawford, G.E. & Ohler, U. La modélisation explicite du biais de séquence de la DNase permet la détection de l'empreinte du facteur de transcription à haute résolution. Acides nucléiques Res. 42, 11865–11878 (2014).

Grøntved, L. et al. Cartographie rapide à l'échelle du génome de l'accessibilité de la chromatine dans les tissus. Épigénétique Chromatine 5, 10 (2012).

Nakahashi, H. et al. Une carte à l'échelle du génome de la multivalence du CTCF redéfinit le code du CTCF. Cellule Rep. 3, 1678–1689 (2013).

Poorey, K. et al. Mesure de la dynamique d'interaction de la chromatine sur la deuxième échelle de temps au niveau des gènes à copie unique. Science 342, 369–372 (2013).

Buenrostro, J.D. et al. L'accessibilité de la chromatine unicellulaire révèle des principes de variation régulatrice. La nature 523, 486–490 (2015).

Cusanovitch, D.A. et al. Profilage unicellulaire multiplex de l'accessibilité de la chromatine par indexation cellulaire combinatoire. Science 348, 910–914 (2015).

Voss, T.C. & Hager, G.L. Régulation dynamique des états transcriptionnels par la chromatine et les facteurs de transcription. Nat. le révérend Genet. 15, 69–81 (2014).

Chanté, M.H. & McNally, J.G. Imagerie des cellules vivantes et biologie des systèmes. Wiley Interdiscip. Rév. Syst. Biol. Méd. 3, 167–182 (2011).

Hager, G.L., McNally, J.G. & Misteli, T. Dynamique de transcription. Mol. Cellule 35, 741–753 (2009).

Voss, T.C. et al. L'échange dynamique au niveau des éléments régulateurs pendant le remodelage de la chromatine sous-tend le mécanisme de chargement assisté. Cellule 146, 544–554 (2011).

Morisaki, T., Muller, W.G., Golob, N., Mazza, D. & McNally, J.G. Analyse d'une molécule unique de la liaison du facteur de transcription aux sites de transcription dans les cellules vivantes. Nat. Commun. 5, 4456 (2014).

van Royen, M.E. et al. Les complexes de récepteurs aux androgènes sondent l'ADN pour des séquences de reconnaissance par de courtes interactions aléatoires. J. Cell Sci. 127, 1406–1416 (2014).

Groeneweg, F.L. et al. Quantification de la dynamique de liaison à l'ADN des récepteurs des glucocorticoïdes par microscopie à molécule unique et FRAP. PLoS UN 9, e90532 (2014).

Gebhardt, J.C. et al. Imagerie d'une molécule unique du facteur de transcription se liant à l'ADN dans des cellules de mammifères vivantes. Nat. Méthodes 10, 421–426 (2013).

Crocker, J. et al. Les clusters de sites de liaison à faible affinité confèrent une spécificité Hox et une robustesse réglementaire. Cellule 160, 191–203 (2015).

Chen, J. et al. Dynamique d'une molécule unique de l'assemblage d'enhanzosomes dans les cellules souches embryonnaires. Cellule 156, 1274–1285 (2014).

Sharp, Z.D. et al. L'échange œstrogène-récepteur-alpha et la dynamique de la chromatine dépendent du ligand et du domaine. J. Cell Sci. 119, 4101–4116 (2006).

Bosisio, D. et al. Un équilibre hyperdynamique entre les dimères liés au promoteur et les dimères nucléoplasmiques contrôle l'activité du gène NF-kB-dépendant. EMBO J. 25, 798–810 (2006).

McNally, J.G., Mueller, W.G., Walker, D., Wolford, R.G. & Hager, G.L. Le récepteur des glucocorticoïdes : échange rapide avec les sites de régulation dans les cellules vivantes. Science 287, 1262–1265 (2000).

Stergachis, A.B. et al. Conservation des circuits agissant en trans au cours de l'évolution régulatrice des mammifères. La nature 515, 365–370 (2014).

Neph, S. et al. Circuits et dynamique des réseaux de régulation des facteurs de transcription humains. Cellule 150, 1274–1286 (2012).

Badis, G. et al. Diversité et complexité de la reconnaissance de l'ADN par les facteurs de transcription. Science 324, 1720–1723 (2009).

Jolma, A. et al. Spécificités de liaison à l'ADN des facteurs de transcription humains. Cellule 152, 327–339 (2013).

Weirauch, M.T. et al. Évaluation de méthodes de modélisation de la spécificité de séquence des facteurs de transcription. Nat. Biotechnologie. 31, 126–134 (2013).

Buenrostro, J.D., Giresi, P.G., Zaba, L.C., Chang, H.Y. & Greenleaf, W.J. Transposition de la chromatine native pour un profilage épigénomique rapide et sensible de la chromatine ouverte, des protéines de liaison à l'ADN et de la position des nucléosomes. Nat. Méthodes 10, 1213–1218 (2013).

Gerstein, M.B. et al. Architecture du réseau de régulation humaine dérivée des données ENCODE. La nature 489, 91–100 (2012).

Bailey, T.L. et al. MEME SUITE : outils de découverte et de recherche de motifs. Acides nucléiques Res. 37, W202–W208 (2009).

Grant, C.E., Bailey, T.L. & Noble, W.S. FIMO : recherche d'occurrences d'un motif donné. Bioinformatique 27, 1017–1018 (2011).

Biddie, S.C. et al. Le facteur de transcription AP1 potentialise l'accessibilité de la chromatine et la liaison aux récepteurs des glucocorticoïdes. Mol. Cellule 43, 145–155 (2011).

Lickwar, C.R., Mueller, F., Hanlon, S.E., McNally, J.G. & Lieb, J.D. La dynamique de liaison protéine-ADN à l'échelle du génome suggère un embrayage moléculaire pour la fonction du facteur de transcription. La nature 484, 251–255 (2012).

Malnou, C.E. et al. L'hétérodimérisation avec différentes protéines Jun contrôle la dynamique et la distribution intranucléaires de c-Fos. J. Biol. Chem. 285, 6552–6562 (2010).

Mayr, B.M., Guzman, E. & Montminy, M. Les domaines riches en glutamine et région basique/leucine zipper (bZIP) stabilisent la protéine de liaison à l'élément de réponse à l'AMPc (CREB) se liant à la chromatine. J. Biol. Chem. 280, 15103–15110 (2005).

Guertin, M.J., Zhang, X., Coonrod, S.A. & Hager, G.L. La liaison ER transitoire et la redistribution de p300 prennent en charge un mécanisme de suppression automatique des gènes réprimés par E2. Mol. Endocrinol. 28, 1522–1533 (2014).

Grøntved, L. et al. Activation transcriptionnelle par le récepteur de l'hormone thyroïdienne via le recrutement de récepteurs dépendant du ligand et le remodelage de la chromatine. Nat. Commun. 6, 7048 (2015).

Marcelli, M. et al. Quantification des effets des ligands sur la translocation nucléaire des récepteurs androgènes, la dynamique intranucléaire et la solubilité. J. Cell. Biochimie. 98, 770–788 (2006).

Yu, J. et al. Un réseau intégré de fusions de récepteurs androgènes, de polycomb et de gènes TMPRSS2-ERG dans la progression du cancer de la prostate. Cellule cancéreuse 17, 443–454 (2010).

Tirard, M., Almeida, O.F., Hutzler, P., Melchior, F. & Michaelidis, T.M. La sumoylation et l'activité protéasomale déterminent les propriétés de transactivation du récepteur minéralocorticoïde. Mol. Cellule. Endocrinol. 268, 20–29 (2007).

Le Billan, F. et al. Cistrome du récepteur minéralocorticoïde activé par l'aldostérone dans les cellules rénales humaines. FASEB J. 29, 3977–3989 (2015).


Affiliations

Département des sciences du génome, Université de Washington, Seattle, Washington, États-Unis

Jeff Vierstra & John A Stamatoyannopoulos

Altius Institute for Biomedical Sciences, Seattle, Washington, États-Unis

Jeff Vierstra & John A Stamatoyannopoulos

Division d'oncologie, Département de médecine, Université de Washington, Seattle, Washington, États-Unis

John A Stamatoyannopoulos

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Auteurs correspondants


ACCÈS AUX DONNÉES

Les données produites par les laboratoires affiliés au projet ENCODE sont soumises au DCC pour affichage et data mining. Dès leur sortie, les nouvelles pistes ENCODE sont annoncées dans la section Actualités de la page du portail ENCODE DCC et sur la liste de diffusion encode-announce ( https://lists.soe.ucsc.edu/mailman/listinfo/encode-announce ). Les données ENCODE sont librement accessibles au public selon les termes de la politique de diffusion des données ( http://genome.ucsc.edu/ENCODE/terms.html ). La publication des données est limitée pendant neuf mois après la soumission initiale au DCC. Pendant ce temps, les chercheurs intéressés sont encouragés à contacter les producteurs de données pour explorer des collaborations potentielles. Passé ce délai, les données pourront être utilisées sans restriction. La feuille de calcul Data Submission Status ( Supplementary Data S1 ) contient la liste complète des expériences ENCODE soumises au DCC en août 2010.

Les données du génome entier ENCODE sont entrecoupées de pistes de données non ENCODE sur le navigateur du génome. En août 2010, ces données étaient disponibles principalement sur l'assemblage humain NCBI36/hg18, mais de nouvelles données sont mappées sur l'assemblage GRCh37/hg19. Chaque type de données de chaque laboratoire est organisé en une seule piste composite, qui peut contenir plusieurs sous-pistes représentant des conditions expérimentales telles que le type de cellule et d'autres attributs spécifiques au test. Si une piste a plusieurs sous-pistes, seules les sous-pistes sélectionnées seront affichées par défaut. L'affichage des sous-pistes peut être configuré via les pages de configuration des pistes. Vous trouverez plus d'informations sur l'utilisation du navigateur et la configuration de la piste ENCODE dans le guide de l'utilisateur du navigateur Genome : http://genome.ucsc.edu/goldenPath/help/hgTracksHelp.html .

Toutes les données soumises au DCC sont conservées dans leur état d'origine sur un serveur de fichiers accessible via FTP et HTTP. Les fichiers téléchargeables sont classés par laboratoire soumettant, avec chaque combinaison laboratoire/type de données dans son propre répertoire. Chaque fichier soumis peut être associé à ses métadonnées, soit visuellement en affichant le fichier d'index avec un navigateur Web, soit par programme en utilisant le fichiers.txt fichier présent dans chaque répertoire de téléchargement. La zone de téléchargement est accessible via les liens de téléchargement dans les pages de détails de la piste, ou directement sur http://genome.ucsc.edu/ENCODE/downloads.html . Les données ENCODE sont également saisies sur NCBI GEO ( http://www.ncbi.nlm.nih.gov/geo/info/ENCODE.html ).

La plupart des données ENCODE sont représentées dans l'un des trois types de fichiers différents, qui peuvent tous être chargés en tant que pistes personnalisées : BAM (10) pour le stockage d'alignement, bigWig (11) pour les graphiques de signaux et fichiers BED étendus contenant des données de crête. Les formats de données bigWig et BAM sont sans perte, accessibles de manière aléatoire et indexés de sorte que seules les données nécessaires à la vue actuelle soient lues à partir du fichier, qui peut être local ou accessible via Internet ( http://genome.ucsc. edu/FAQ/FAQformat ).

Pour les utilisateurs enquêtant sur le ver ( Caenorhabditis elegans ) et la mouche des fruits ( Drosophila melanogaster ) organismes modèles, nous recommandons fortement les données du projet modENCODE ( http://www.modencode.org/ ) ( 12 ). Pour explorer d'autres données sur la variation génomique humaine, nous recommandons le projet 1000 génomes ( http://www.1000genomes.org/ ) (13).

Pour fournir des informations et une formation supplémentaires sur l'utilisation du navigateur de génome, y compris l'accès et l'utilisation des données ENCODE, le DCC a passé un contrat avec OpenHelix ( http://www.openhelix.com/ ). Ils proposent des sessions de formation sur site et lors de plusieurs réunions mondiales très fréquentées tout au long de l'année, ainsi que des didacticiels en ligne et des documents de référence.


Interprétation de la sortie Wellington’s¶

Explorez le dossier que vous avez créé ci-dessus ( K562_footprints ) et vous remarquerez trois choses.

wgEncodeUwDgfK562Aln.bam.K562.DHSs.bed.WellingtonFootprints.FDR.0.01.bed contient les empreintes au FDR de 0,01 - c'est un bon point de départ pour vos empreintes. Ce qui se passe ici, c'est que les données de chaque DHS sont randomisées et que la valeur seuil de p pour chaque DHS est augmentée par rapport à la ligne de base de -fdrlimit en fonction de la fréquence à laquelle les données aléatoires génèrent des empreintes. Si vous n'êtes pas satisfait des empreintes ici (c.

wgEncodeUwDgfK562Aln.bam.K562.DHSs.bed.WellingtonFootprints.wig contient les scores bruts d'empreinte - regardez dans IGV (vous devrez convertir en une piste bigWig à l'aide de l'outil UCSC wigToBigWig si vous avez utilisé tous les DHS)

Les seuils de valeur p contiennent les empreintes à différentes rigueurs - certaines personnes préfèrent cette approche à l'approche FDR, elles sont donc enregistrées ici.


Résultats

Une réticulation légère avant DNase-seq préserve l'accessibilité de la chromatine et génère des empreintes différentielles

Nous avons cherché à évaluer systématiquement les effets de diverses procédures de réticulation sur les empreintes génomiques des TF dynamiques dans le même matériau de chromatine. Pour une source fixe de chromatine, nous avons choisi un état cellulaire dans lequel de nombreux TF interagissent directement avec la chromatine dans une cascade d'actions de régulation des gènes. Étant donné que l'échantillon de chromatine est préparé à partir d'une population cellulaire contenant des instantanés de ces interactions dynamiques, nous avons pensé qu'il s'agirait d'une plate-forme riche pour évaluer simultanément les changements dans les profondeurs d'empreinte de nombreux TF. À cette fin, des cellules RAW264.7 de type macrophage de souris immortalisées ont été utilisées, où de nombreux TF dynamiques, y compris NF-κB et AP-1, sont activés en réponse à des produits bactériens tels que le lipopolysaccharide (LPS). Ce contexte cellulaire permet à un grand nombre de TF d'occuper la chromatine, offrant ainsi une plate-forme idéale pour évaluer les caractéristiques de l'empreinte TF. Nous avons choisi ce système cellulaire également en raison de la richesse des informations sur les réseaux de régulation du TF que les nouvelles données aideront à découvrir dans un type de cellule immunitaire inné physiologiquement important. Les cellules RAW264.7 ont des profils de chromatine similaires à ceux des macrophages primaires (données non présentées) [24], ce qui permet la découverte de mécanismes de régulation des gènes fonctionnellement pertinents [13, 18, 19, 35].

Avec le même matériau de chromatine de RAW264.7 stimulé par LPS, nous avons fait varier la durée et la concentration de l'agent de réticulation formaldéhyde pour déterminer les paramètres de réticulation qui peuvent affecter les caractéristiques d'empreinte des TF dynamiques (Fig. 1). Sur la base de rapports antérieurs sur l'effet dominant de la durée de la réticulation sur la concentration, nous nous sommes concentrés sur la variation de la durée de la réticulation du formaldéhyde. Une concentration de formaldéhyde inférieure de 0,1% a été sondée avec différentes durées de réticulation, car une étude de cinétique de réticulation [27] et notre étude pilote ont indiqué que 1% est une concentration saturante pour la réticulation et peut potentiellement interférer avec les réactions de nucléase.

Nous avons effectué le DNase-seq modifié, appelé cross-link (XL)-DNase-seq et généré un panel de bibliothèques de séquençage. L'enrichissement, la complexité et la qualité de chaque bibliothèque ont été confirmés, et toutes les bibliothèques ont été soumises à un séquençage de lecture appariée ultra-profond (Fichier supplémentaire 1 : Tableau S1). Nous avons d'abord vérifié que le profil d'accessibilité de la chromatine est généré indépendamment de la procédure de réticulation douce, comme observé par la reproductibilité de la densité de fragments de DNase-seq à travers des échantillons provenant de diverses conditions de réticulation (Fig. 1b, c). Il s'agissait d'un premier point de contrôle important, car une réticulation excessive peut induire la capture de trop de facteurs non spécifiques sur la chromatine [2] et entraver l'échantillonnage de la chromatine par la nucléase (DNase). La génération d'un pic de DNase-seq repose sur la capacité de l'enzyme à accéder au site hypersensible de manière préférentielle par rapport à la région flanquante. Notre procédure de réticulation était probablement suffisamment douce pour permettre un échantillonnage suffisamment différentiel de la chromatine, ce qui se reflète dans les profils d'accessibilité bien conservés (Fig. 1b, c).

Le nombre total d'empreintes putatives dépendait de la procédure de réticulation (Figs. 1d, 2a). Alors que les nombres exacts d'empreintes détectées diffèrent entre les résultats des différentes méthodes de correction du biais de la DNase (dimères, tétramères, etc.), l'ordre de classement des divers échantillons de réticulation était invariant. 0,1% 30 s Les empreintes XL-DNase-seq ont produit le plus grand ensemble d'empreintes, tandis que le DNase-seq natif a produit le moins d'empreintes dans les deux ensembles de réplicats biologiques. La réticulation préservait généralement les empreintes observées dans la DNase-seq native et révélait des empreintes supplémentaires (Fichier supplémentaire 2 : Fig. S2A). Étant donné que le nombre d'empreintes peut changer en raison de la détection et de l'absence d'empreintes réelles, il est possible d'obtenir plus d'informations en examinant des empreintes de TF spécifiques par rapport à un ensemble de sites de liaison connus. Parce qu'il est difficile d'attribuer la plupart des empreintes à des TF spécifiques uniquement sur la base de motifs de séquence d'ADN [33], les analyses ultérieures se sont concentrées sur des motifs de TF bien caractérisés et des empreintes sur les sites génomiques de leurs occurrences. Non seulement les différents échantillons XL-DNase-seq ont généré différents nombres d'empreintes, mais les forces et la détectabilité des empreintes dépendaient également de la procédure de réticulation (Fig. 2b, Fichier supplémentaire 2 : Fig. S2).

Nombre total d'empreintes détectées dans les conditions de réticulation. une Le nombre total d'empreintes putatives FDR 1% appelées par DNase2TF a été moyenné sur cinq cycles de sous-échantillonnage. Un sous-échantillonnage des lectures a été effectué pour garder le même nombre de lectures mappées de manière unique dans toutes les conditions pour une comparaison équitable (voir « Méthodes »). b Comparaison du score d'empreinte z dans les conditions des sites de motifs CTCF dans la chromatine ouverte. Voir aussi Fichier complémentaire 2 : Fig. S2

XL-DNase-seq capture plus d'empreintes TF avec une précision améliorée

Nous avons analysé les effets de la réticulation sur l'empreinte de NF-κB/RelA, un TF connu pour avoir un temps de résidence de liaison à l'ADN court sur les éléments d'ADN apparentés [3]. Nous avons évalué ses profondeurs d'empreinte sur des sites de motifs κB individuels à travers la chromatine ouverte dans les macrophages activés par LPS, en utilisant des pics RelA ChIP-seq correspondant à l'état des cellules comme étalon-or pour la liaison de TF. L'analyse des caractéristiques de l'opérateur du récepteur (ROC) a été effectuée pour quantifier la prévisibilité des empreintes putatives de chaque donnée de comptage de coupures cross-link-DNase-seq (Fig. 3a). La comparaison statistique des courbes ROC a révélé que les empreintes de NF-κB obtenues à partir de la réticulation à 0,1% de formaldéhyde 30 s (courbe verte) étaient plus prédictives de la liaison réelle de NF-κB par rapport aux empreintes du protocole DNase-seq natif (Fig. 3b, à gauche). Cette amélioration n'était pas apparente lorsqu'elle était évaluée par les profils de comptage de coupe agrégés (Fichier supplémentaire 2 : Fig. S3), soulignant la nécessité d'évaluer les sites individuels plutôt que les signaux moyens sur des sites hétérogènes [8, 29]. La réticulation de formaldéhyde à 1 % 30 s (courbe violette) a affecté négativement les prédictions de liaison. Fait intéressant, lorsque nous avons examiné un autre TF Ikaros (qui manque de données de microscopie sur les temps de résidence de liaison à l'ADN), tous les XL-DNase-seq, mais l'échantillon de formaldéhyde à 1 % a montré des prédictions améliorées par rapport au DNase-seq natif (Fig. 3b, à droite). Bien que l'amélioration observée de la précision semble faible dans les graphiques ROC, elle est basée sur l'obtention de plusieurs milliers de sites de liaison prédits avec précision parmi 10 4 à 10 5 sites de motifs trouvés dans la chromatine ouverte, donc une amélioration substantielle.

La réticulation améliore la prédiction basée sur l'empreinte DNase-seq de la liaison TF. une Procédure d'évaluation dans l'analyse ROC. b Les courbes ROC pour tous les échantillons de cross-link-DNase-seq sont tracées à l'aide de données de nombre de coupures ajustées aux dimères. La zone sous les valeurs de la courbe ROC (auROC) est affichée avec les valeurs p calculées par le package « pROC » de R Bioconductor. L'ensemble de liaison de référence a été obtenu à partir des données ChIP-seq de macrophages activés par LPS. L'analyse ROC a été réalisée pour NF-κB (gauche : n = 99 089) et Ikaros (droite : n = 165 392). Voir également le fichier supplémentaire 2 : Fig. S3, S4

Dans toutes les analyses ROC, l'ajustement pour le biais de séquence du clivage de la DNase n'a pas amélioré les valeurs auROC ni modifié les résultats globaux (Fichier supplémentaire 2 : Fig. S4). Certaines études ont rapporté une amélioration de la prédiction de la liaison TF en corrigeant le biais de séquence de la DNase [8], tandis que d'autres n'ont observé aucune amélioration [14, 34]. Les résultats divergents sont probablement dus au fait que ces études ont utilisé différentes méthodes de détection informatique pour appeler des empreintes putatives. Certaines méthodes de détection reposent sur des signatures de clivage sujettes aux biais (forme du profil du nombre de coupures) et peuvent voir une amélioration significative après la suppression du biais de séquence. Notre méthode DNase2TF n'utilise pas les signatures de clivage directement pour détecter les empreintes putatives et peut donc ne pas avoir d'amélioration supplémentaire par rapport à la correction des biais.

XL-ATAC-seq n'améliore pas l'empreinte TF par rapport à ATAC-seq natif

Étant donné que l'ATAC-seq largement utilisé peut également générer des données d'empreinte haute résolution [4], nous avons examiné si la réticulation peut avoir des effets similaires à ceux décrits ci-dessus pour la DNase-seq. Alors que l'effet des temps de séjour de liaison à l'ADN courts a été montré dans les données de DNase-seq, il est susceptible de produire des problèmes similaires pour ATAC-seq. En effet, les TF dynamiques permettent des durées de dissociation relativement longues de l'ADN cible qui serait alors vulnérable aux attaques enzymatiques. Nous avons généré un panel de bibliothèques ATAC-seq à partir d'une réticulation douce au formaldéhyde (XL-ATAC-seq) en utilisant le même matériel biologique, des cellules RAW264.7 activées par LPS (Fig. 4a). Encore une fois, nous avons d'abord comparé les profils de densité de fragments ATAC-seq obtenus à partir de tous les échantillons XL-ATAC-seq et confirmé que l'introduction d'une étape de réticulation n'affecte pas négativement le dosage de l'accessibilité de la chromatine, avec seulement une légère réduction de l'intensité du signal de les échantillons réticulés avec du formaldéhyde à 1 % (Fichier supplémentaire 2 : Fig. S5A). Cependant, contrairement à XL-DNase-seq, l'analyse des données du nombre d'insertions a révélé que le plus grand nombre d'empreintes putatives a été détecté à partir des échantillons ATAC-seq natifs, et les nombres ont diminué avec la durée et la concentration de formaldéhyde utilisé pour la réticulation ( 4b). Ce modèle est observé indépendamment du fait que nous ayons ajusté le biais de séquence d'ADN de la transposase Tn5 (utilisée dans ATAC-seq). Comme pour XL-DNase-seq, les analyses du nombre d'insertions globales n'ont pas révélé de différences flagrantes dans la profondeur de l'empreinte (Fichier supplémentaire 2 : Fig. S6A), et la détectabilité et la force de l'empreinte variaient entre les échantillons XL-ATAC-seq (Fichier supplémentaire 2 : Fig. S6B).

Cross-linking hinders ATAC-seq footprint-based prediction of dynamic TF binding. une A browser shot of cross-linked raw insertion count tracks. The top track shows the locations of TF binding motif elements obtained by FIMO. Reference genome: mm 9. b Total number of FDR 1% putative footprints called by ATAC2TF (DNase2TF modified for ATAC-seq) was averaged over five rounds of subsampling. Subsampling of reads was performed to keep the number of uniquely mapped reads the same across conditions for fair comparison (see “Methods”). c ROC curves for all the cross-link-ATAC-seq samples are plotted using unadjusted insertion count data for RelA and Ikaros. Adjusting for the sequence bias of Tn5 insertion did not improve the predictions. The area under the ROC curve (auROC) values are shown along with the p values calculated by the ‘pROC’ package of R Bioconductor. Reference binding set was obtained from RelA ChIP-seq data of primary macrophages. See also Additional file 2: Figs. S5, S6

To gain a more detailed insight, we performed an ROC analysis for NF-κB/RelA and Ikaros with XL-ATAC-seq footprints, in the same manner as for XL-DNase-seq footprints. The prediction accuracy, as indicated by the shape of ROC curves and quantified by auROCs, generally declined with the duration and concentration of formaldehyde (Fig. 4a, Additional file 2: Fig. S6C). Putative footprints detected in the native ATAC-seq data (red curves) produced the most accurate predictions of NF-κB and Ikaros binding to their cognate motif elements in open chromatin. The best-performing ATAC-seq (native) nevertheless had lower auROC values compared to the XL-DNase-seq data (Additional file 2: Fig. S7A). Consistent with this observation, several studies indicated that TF footprinting based on ATAC-seq performs poorly in comparison to DNase-seq [15, 28, 29]. The cross-linking-dependent pattern of poor predictions from XL-ATAC-seq footprints was highly reproducible in technical and biological replicates. These results indicate that even the mild cross-linking conditions may interfere with the ability of Tn5 to sample the nucleotide base pairs with high insertion efficiency.

We chose ROC as our main measure of comparison, because of its wide usage for evaluating predictions from footprints and the simple representation of a random baseline as the diagonal. Another measure, precision-recall (PR) curves may also be useful especially for unbalanced binary outcome data. The PR curves generally preserved the top-performing samples (0.1% 30 s XL-DNase-seq among DNase samples and native among ATAC-seq samples), with the intermediate rankings varying somewhat over different recall ranges (Additional file 2: Fig. S7B).

Construction of TF regulatory networks and reproducibility

An ultimate goal of TF footprinting is to discover novel mechanisms in TF regulatory networks. A large-scale study in constructing such networks solely based on TF footprints and TF binding motif databases revealed intriguing findings [22, 32], but lack of footprints for many TFs and other technical issues raised questions about the significance of such efforts [8, 9, 33, 34]. Given the remaining technical challenges (including assignment of TF identity to motifs), we chose a conservative approach aiming to construct higher-confidence TF regulatory networks. To this end, we generated TF regulatory networks using stringent criteria on TF motifs and footprint detection thresholds. We also focused only on a select set of TFs for footprinting and limited the analysis on TF-encoding genes which have footprints of the select TFs. Each TF network was constructed by compiling putative regulatory edges (Fig. 5a, A → B, i.e., TF A regulates TF B). A regulatory edge indicates that one or more footprints of A were detected within 5 kb of transcription start site of B, from the given XL-DNase-seq sample.

TF regulatory networks from XL-DNase-seq have reproducible connections as well as new connections. une De novo construction of transcriptional regulatory networks. FDR 1% footprints within 5 kb of TSSs were used to obtain regulatory relationships. b TF regulatory network derived from 0.1% formaldehyde 10 min XL-DNase-seq data (MS5 and MS11, merged) after correcting for the dimer bias of DNase. Regulatory connections which were also detected in the network from native DNase-seq are marked in blue. See also Additional file 2: Fig. S8

Comparison of six TF networks from the cross-linking conditions revealed a substantial set of shared regulatory edges (Fig. 5b, Additional file 2: Fig. S8). Such reproducibility in regulatory relationships was surprising, given the variability observed in the footprint Z score profiles and the differential detectability of footprints across the XL-DNase-seq samples (Fig. 3, Additional file 2: Fig. S2). A closer look provided a reason for this robust consensus among the independently constructed TF networks: a shared edge is often supported by multiple redundant footprints and detection of at least one is sufficient for reproducing the edge in a network derived from a given XL-DNase-seq sample. For example, we found reproducible regulatory connections from PU.1 to many macrophage/immune-relevant genes: Ncoa3 (a.k.a. Src-3, involved in defense against bacteria) [5], Hcst (a.k.a. DAP10, which induces osteoclastogenic signaling in myeloid cells) [12], Atrx (a heterochromatin silencer), Mier1 (a HDAC-binding transcriptional corepressor), Arid1a (a.k.a. BAF250a, a component of SWI/SNF). In addition, well-known regulatory targets of RelA/NF-κB such as Nfkbia (a negative feedback gene), Rel (an immune-specific subunit of NF-κB), and Nfkb2 (an alternative dimer subunit of NF-κB) were robustly detected. RelA was also a putative regulator of Tfe3 (involved in macrophage autophagy and cytokine response, also detected as a putative target of PU.1 in multiple networks) [25] and Tal2 (a known target of PU.1) [6]. These regulatory connections were based on footprints detectable in both native and XL-DNase-seq data.

For an overall comparison of all the TF networks constructed separately, we generated a pairwise similarity matrix and found that XL-DNase-seq-derived networks have a stronger consensus, i.e., more regulatory edges were repeatedly detected in multiple cross-linking conditions, than XL-ATAC-seq-derived networks (Fig. 6). Despite the lower consensus among XL-ATAC-seq-derived networks, XL-ATAC-seq networks were still more similar to each other than to TF networks derived from XL-DNase-seq (Fig. 6, lower right square block). Notably, there were recurrent regulatory edges that are reproduced in multiple cross-linking conditions and even between DNase-seq and ATAC-seq protocols, which probably represent highest-confidence TF regulatory events.

Comparison of TF regulatory networks derived from TF footprints in XL-DNase-seq and XL-ATAC-seq data. The similarity between all the pairs of TF regulatory networks was quantified using Jaccard Index (ranging from 0 to 1), and the results are represented in a heatmap. The number in each component indicates the Jaccard Index of the given pair

Importantly, networks derived from footprints in cross-linked samples had more uniquely detected edges (Fig. 5b, black edges) than that from the native DNase-seq (Additional file 2: Fig. S8, black edges), suggesting that cross-linking helps capture novel binding events. Among the connections identified as novel regulatory relationships were: Tln1 (a.k.a. Talin, involved in mechanical responses and EMT) has a Nfkb1 footprint only from XL-DNase. Nfkbie, a known target of NF-κB in a negative feedback loop, has RelA footprint only from XL-DNase. Etv3, induced during macrophage differentiation [31] had RelA and Nfkb1 footprints only in XL-DNase. We note that Tln1, Nfkbie, and Etv3 are all likely direct targets of NF-κB/RelA because their transcripts are immediately induced by LPS treatment in macrophages [24]. Gene ontology analysis indicated that shared as well as distinct functional categories were enriched among the genes found in newly detected regulatory relationships (Additional file 2: Fig. S9). These results suggest that TF regulatory networks constructed from XL-DNase-seq contain both robust regulatory relationships and novel network wiring involving dynamic TFs whose footprints are missed in native DNase-seq.


DNase footprinting assay

UNE DNase footprinting assay [1] is a DNA footprinting technique from molecular biology/biochemistry that detects DNA-protein interaction using the fact that a protein bound to DNA will often protect that DNA from enzymatic cleavage. This makes it possible to locate a protein binding site on a particular DNA molecule. The method uses an enzyme, deoxyribonuclease (DNase, for short), to cut the radioactively end-labeled DNA, followed by gel electrophoresis to detect the resulting cleavage pattern.

For example, the DNA fragment of interest may be PCR amplified using a 32 P 5' labeled primer, with the result being many DNA molecules with a radioactive label on one end of one strand of each double stranded molecule. Cleavage by DNase will produce fragments. The fragments which are smaller with respect to the 32 P-labelled end will appear further on the gel than the longer fragments. The gel is then used to expose a special photographic film.

The cleavage pattern of the DNA in the absence of a DNA binding protein, typically referred to as free DNA, is compared to the cleavage pattern of DNA in the presence of a DNA binding protein. If the protein binds DNA, the binding site is protected from enzymatic cleavage. This protection will result in a clear area on the gel which is referred to as the "footprint".

By varying the concentration of the DNA-binding protein, the binding affinity of the protein can be estimated according to the minimum concentration of protein at which a footprint is observed.

This technique was developed by David Galas and Albert Schmitz at Geneva in 1977 [2]


Scientist George Church Is Auctioning Off His Genome as an NFT

You’ve probably heard the acronym NFT over the last couple months. Non-fungible tokens have been all over the news, seeming to become a sensation—one worth a ton of money—almost overnight. Soon a new NFT will hit the market, and it’s a little different than any that came before it, because it contains the entire genetic sequence of a famous scientist—one who’s famous for genomics, specifically.

Who’s George Church?

George Church. Image Credit: Wyss Institute

In case you’re not familiar with George Church, here’s a list of some of his credentials and contributions to the field. He teaches genetics at Harvard Medical School and MIT, leads synthetic biology at Harvard’s Wyss Institute for Biologically Inspired Engineering, is the director of the US Department of Energy Technology Center and of the National Institutes of Health Center of Excellence in Genomic Science. He developed the first direct genomic sequencing method in 1984 and helped initiate the Human Genome Project that same year, and was among the first people to have his whole genome sequenced. Almost 20 years later, in 2005, Church helped launch the Personal Genome Project and became the first person to publicly release his genomic data and medical records for research purposes.

Church also founded San Francisco-based Nebula Genomics, a company that does whole-genome sequencing, and DigiD8, a dating service that matches users based on their genetic data to minimize the odds of passing genetic disorders on to their offspring.

In short, genomics as a field likely wouldn’t have advanced nearly as quickly as it has without Church. For the record, “genetics” is slightly different than “genomics” the former refers to the study of single genes, including how traits are passed on from one generation to the next. The latter is the study of tous of an organism’s genes taken as a whole, and the way they impact the organism.

What’s an NFT?

NFTs, or non-fungible tokens, are unique virtual tags that are stored on a blockchain and tied to digital files, certifying them as being authentic and one-of-a-kind.

Most digital files sold as NFTs can be downloaded by anyone, but the purchaser of the tag or token owns the work. Some recent NFTs that made headlines include Grimes’ “Death of the Old,” which was one of 10 pieces that sold for a total of $6 million Beeple’s Everydays: the First 5000 Days, which was the first NFT to be offered by a major auction house (Christie’s) and sold for $69.3 million and LeBron James’ “Cosmic Dunk,” a video clip of the basketball player dunking—among many other NFTs that have traded hands recently.

Selling a Genome

The NFT for Church’s genome will encode the digital location of his genomic data, which is hosted on a decentralized server, and will also include an artistic representation of his genome and likeness.

The project’s web page points out the logic behind its idea to sell a human genome as an NFT, saying “The human genome is a unique encoding of an individual. Each human’s genome is a non-changing representation of their most fundamental and personal data, which is inherently non-fungible.” You can’t argue with that.

“The NFT was not my idea, but hopefully it is a good idea,” Church told Le scientifique, “both for the winner of the auction and as an event that increases conversations about the revolution happening in reading and writing DNA.”

It’s hard to say what’s wackier (in terms of feeling like we’re living in a semi-dystopian future): the fact that we can sequence our entire genome for cheap, or that wealthy people are stepping over each other to pay millions for digital “art,” or that highly advanced genetic science, cryptocurrency, and art are now all being rolled into one. It remains to be seen whether Church’s genome will be the first of many auctioned off as an NFT, or if this will be a unique occurrence—but it seems we can’t rule out any possibilities!

The date of the auction hasn’t been set yet, but it will be announced this Sunday, which just happens to be National DNA Day.


Voir la vidéo: Digitaalinen jalanjälki Osa 12 (Février 2023).