Les interactomes des amplificateurs POU5F1 et SOX2 dans les cellules souches embryonnaires humaines

Identification des interactomes des amplificateurs POU5F1 et SOX2

Les régions supposées des amplificateurs POU5F1 et SOX2 sont conservées évolutivement chez les vertébrés (44 espèces), avec des signatures actives d’amplificateurs définies par des marques épigénétiques telles que p300 histone acétyltransférase et H3K27ac mais pas H3K27me3 dans hESCs7 (Fig. supplémentaire. 1 BIS). Nous avons appliqué la technique 4C pour identifier les partenaires en interaction des exhausteurs putatifs « appâts » de POU5F1 et SOX2 dans la lignée cellulaire pluripotente H9. Brièvement, les cellules ont été fixées à des chromosomes de réticulation à proximité. Les chromosomes ont ensuite été fragmentés par sonication. Des fragments de chromatine en interaction ont été ligaturés et les morceaux d’ADN ont été purifiés. Les régions génomiques interagissant avec l' »appât » ont ensuite été amplifiées par PCR imbriquée (Fig. 1B, Tableau supplémentaire 1). Nous avons conçu des amorces PCR inverses pour cibler les améliorateurs putatifs des gènes POU5F1 et SOX2. La bibliothèque 4C construite a pu être visualisée par électrophorèse d’ADN, alors que le témoin sans ligature ne montrait presque aucun produit de PCR (Fig. supplémentaire. 1B), indiquant que la bibliothèque 4C a été amplifiée à partir de produits de ligature.

Nous avons effectué un séquençage de l’ADN de nouvelle génération à l’aide d’un séquenceur Illumina HiSeq et avons classé les interactions 4C identifiées comme des interactions proximales ou distales (voir Méthodes). Les interactions distales comprennent les interactions inter-chromosomiques et les interactions intra-chromosomiques sur des distances génomiques supérieures à 20 kb, tandis que les interactions proximales couvrent des régions intra-chromosomiques avec des distances génomiques comprises entre 300 pb et 20 kb. Conformément aux résultats des études basées sur le 3C, nos lectures d’interaction distale ne représentent qu’une petite partie des interactions totales, environ 10% à 20% pour les bibliothèques 4C (Tableau supplémentaire 2). Nous avons utilisé deux lots différents de cellules H9 pour construire indépendamment les bibliothèques 4C pour POU5F1 et SOX2 pour le séquençage de nouvelle génération. Les deux répliques des interactions distales POU5F1 et SOX2 se chevauchent respectivement de 35 % et 25 %. Ceci est compatible avec le chevauchement modéré observé dans les répliques biologiques des interactomes de chromatine médiés par le CTCF dans les cellules ES de souris 27 et peut refléter la diversité et la dynamique des interactions d’amplification, l’efficacité de la ligature, la complexité de l’amplification par PCR ainsi que la profondeur du séquençage. Pour filtrer les interactions qui résultent probablement d’effets stochastiques, nous avons utilisé un modèle statistique basé sur le taux de fausses découvertes (FDR) pour identifier les domaines d’interaction enrichis dans l’ensemble du génome. Nous avons en outre fusionné les domaines d’interaction enrichis qui se chevauchent entre les répliques biologiques comme étant des domaines d’interaction fréquents à haute confiance. Au total, 23 et 9 domaines d’interaction fréquente à haute confiance ont été identifiés pour les interactomes POU5F1 et SOX2, respectivement (Figure 1, Tableau supplémentaire 3,4) et la plupart d’entre eux sont des interactions inter-chromosomiques impliquant des régions riches en gènes, similaires aux résultats e4c20.

Figure 1
figure1

Les cartes Circos des interactions distales sont présentées à l’aide du logiciel circos52.

L’anneau extérieur bleu représente le profil de densité du gène.

Les interactomes des amplificateurs POU5F1 et SOX2 se chevauchent avec les premiers domaines de réplication de l’ADN, mais pas avec les régions hétérochromatiques

Nous avons ensuite examiné si les domaines en interaction des amplificateurs POU5F1 et SOX2 (taille allant de 1 Mo à 4 Mo, Tableau supplémentaire 3, 4) présentent des caractéristiques épigénétiques uniques. Comme Ryba et coll. montré28, le moment de la réplication de l’ADN est en corrélation avec la proximité spatiale de la chromatine mesurée par l’analyse Hi-C, ce qui suggère que la réplication précoce et tardive de l’ADN se produit dans des compartiments spatialement distincts du noyau. Nous avons remarqué que les loci des gènes POU5F1 et SOX2 se trouvent dans les premiers domaines de réplication de l’ADN dans les CSEH et nous nous sommes demandé si leurs domaines en interaction avaient un timing de réplication de l’ADN similaire. Comme le montre la figure 2A, les domaines d’interaction des amplificateurs POU5F1 et SOX2 se chevauchent principalement avec les domaines de réplication précoce de l’ADN dans les CSEH. La distribution des valeurs de synchronisation de réplication testées dans les régions génomiques entourant les sites d’interaction des amplificateurs POU5F1 et SOX2 identifiés (plage de 50 kb) montre un changement vers des valeurs positives par rapport aux valeurs de réseau à l’échelle du génome (P<2.2 × 10-16 pour les deux, par test de somme de rang de Wilcoxon non apparié; Figure 2B). Cette observation a révélé une caractéristique épigénétique intéressante, à savoir que les structures d’ordre supérieur entourant les amplificateurs POU5F1 et SOX2 ont synchronisé le temps de réplication de l’ADN. Comme les premiers domaines de réplication de l’ADN ont été connectés à la transcription active des gènes dans hESCs28, il est probable que les interactions des amplificateurs POU5F1 et SOX2 avec les régions distales identifiées ont une signification fonctionnelle. Cette observation est cohérente avec ce que nous avons vu dans l’interactome enhancer POU5F1 dans les cellules ES de souris (données non représentées). Également révélés dans la figure 2A, les domaines d’interaction POU5F1 et SOX2 ne se chevauchent pas avec des régions hétérochromatiques marquées par de forts signaux H3K9me3 dans hESCs29, suggérant que les interactomes se trouvent dans une partie active du génome en termes de régulation génique. De plus, nous avons exploré une relation potentielle avec les domaines associés aux lamines nucléaires (LADS) des chromosomes humains30, mais nous n’avons observé aucun lien, peut-être dû au fait que les LADs ont été déterminés dans des fibroblastes humains.

Figure 2
figure2

Relation des interactomes avec les domaines de réplication de l’ADN et les régions hétérochromatiques.

Les sites d’interaction dans les domaines d’interaction fréquents sont présentés en (2A) (seuls Chr1 et Chr2 sont affichés). (2B), Comparaison de la distribution des valeurs du réseau de synchronisation de réplication de l’ADN (RT) pour les régions situées à ± 50 kb des sites en interaction à l’ensemble du génome.

Les interactomes enhancer sont adjacents aux sites de début de transcription et possèdent des caractéristiques épigénétiques actives

Pour explorer la corrélation des interactomes enhancer POU5F1 et SOX2 avec des emplacements de gènes annotés, nous avons analysé la distribution de la distance génomique des sites enhancer interagissant avec le site de début de transcription génique (TSS) le plus proche (Figure 3 BIS). Les diagrammes de densité du noyau des sites interagissant avec l’activateur POU5F1 et SOX2 montrent clairement un pic net centré sur TSS. Par rapport au pic de distribution de sites simulés au hasard dans l’ensemble du génome, les pics observés dans les interactomes d’amplification sont significativement plus élevés dans une fenêtre étroite autour de TSS (P = 0,0018, P = 0,0047, respectivement, test de Kolmogorov-Smirnov). L’enrichissement des sites d’interaction autour du TSS suggère que les amplificateurs POU5F1 et SOX2 préfèrent interagir avec des régions génomiques contenant des gènes. Nous avons étudié plus avant la distribution des sites interagissant avec les activateurs POU5F1 et SOX2 dans différentes régions génomiques31. La figure 3B montre que les séquences de promoteurs de gènes sont l’une des régions enrichies des interactomes d’amplification POU5F1 et SOX2. De plus, la fraction des régions intergéniques distales est constamment réduite pour les deux interactomes. Par conséquent, notre observation suggère que la structure chromosomique d’ordre supérieur entourant les activateurs actifs peut être directement impliquée dans la régulation des gènes. On note également que lorsque des sites aléatoires dans les premières zones de réplication de l’ADN (voir Méthodes pour plus de détails) sont sélectionnés pour comparer la distribution de distance au TSS, les interactomes POU5F1 et SOX2 sont encore plus enrichis autour du TSS, bien que statistiquement non significatifs (P = 0,390, 1 P = 0,2098, respectivement, Test de Kolmogorov-Smirnov, Fig. supplémentaire. 2 ).

Figure 3
figure3

(A) Estimation de la densité du noyau de la distance génomique entre les sites en interaction et les sites TSS les plus proches. Les distances ont été calculées à l’aide du logiciel HOMER34. Des cartes de densité de 100 000 sites aléatoires dans l’ensemble du génome sont également incluses. (B) Analyse d’enrichissement des interactomes dans différentes régions géniques. L’analyse de la distribution a été réalisée à l’aide du logiciel CEAS31.

La modification des histones est connue pour être impliquée dans la régulation transcriptionnelle en décondensant les structures compactes de la chromatine pour la liaison des facteurs de transcription. Des études sur l’interactome à l’échelle du génome basées sur le 3C ont identifié des compartiments de chromatine actifs et inactifs dans le noyau, avec des compartiments actifs enrichis de marques d’histones qui activent la transcription des gènes, tels que H3K9ac32. Nous avons donc demandé si les activateurs de POU5F1 et SOX2 interagissent sélectivement avec les régions distales présentant une transcription génique active. Les profils d’étiquettes ChIP-Seq de H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 et H3K36me3 dans la lignée cellulaire H1 es33 ont été utilisés pour analyser les modèles d’histones associés aux interactomes. Les balises ChIP-Seq autour des sites interagissant avec l’enhancer ont été comptées et normalisées34 et visualisées sous forme de tracés de boîte. Comme indiqué, les interactomes POU5F1 et SOX2 ont des profils d’intensité plus élevés de H3K4me1, H3K4me2 et H4K20me1, qui sont des marques de régulation active des gènes (Figure 4A). Par rapport aux sites aléatoires des premières zones de réplication de l’ADN, les marques d’histones étudiées sont en général plus enrichies dans l’interactome POU5F1 que dans l’interactome SOX2, H3K4me1 et H3K9ac étant les plus enrichies de manière significative dans l’interactome POU5F1 (P<2.2 × 10-16 pour les deux marques, test de somme de rang de Wilcoxon non apparié). Fait intéressant, la marque de silençage génique médiée par Polycomb H3K36me335 n’est enrichie en aucun des interactomes (P = 0,485, P = 0,922, respectivement). Nous avons également étudié la relation des interactomes d’amplificateurs POU5F1 et SOX2 avec les sites de 5-hydroxyméthylcytosine (5-hmC) dans le génome. Comme l’a révélé une étude précédente, les sites génomiques de 5-hmC sont enrichis en activateurs dans hESCs36. Étant donné que les améliorateurs en amont POU5F1 et SOX2 sont adjacents à des sites de 5-hmC (à moins de 5 ko), nous avons demandé si les interactomes d’amplificateurs étaient également enrichis en sites de 5-hmC. Sur la figure 4B, les sites 5-hmC sont enrichis à proximité des interactomes POU5F1 et SOX2 par rapport aux sites aléatoires dans les premières zones de réplication de l’ADN (P< 2,2 × 10-16, P = 0,047, respectivement, test de Kolmogorov-Smirnov). Ainsi, les deux interactomes d’amplificateurs dans les CSEH possèdent des caractéristiques épigénétiques d’amplificateurs actifs, ce qui peut faciliter la régulation active de la transcription des gènes.

Figure 4
figure4

(A) Encadré de différentes marques d’histones autour des sites en interaction et des sites aléatoires. Les balises ChIP-Seq à ± 5 ko d’un site en interaction ont été comptées et normalisées. (B) La distribution de distance des sites en interaction et des sites aléatoires au site 5-hmC le plus proche a été comparée. 100 000 sites aléatoires ont été générés à partir des premières zones de réplication de l’ADN à des fins de comparaison.

Figure 5
figure5

(A) Comparaison des valeurs de RPKM pour les gènes en interaction (gènes avec un TSS ≤ 10 kb des sites en interaction) avec tous les gènes de l’ensemble humain (les valeurs moyennes de RPKM des données de réplication de l’ARN-Seq dans CODE ont été utilisées). (B) L’expression différentielle a été analysée pour comparer les gènes de l’interactome dans les CSEH et les fibroblastes pulmonaires fœtaux.

Statut transcriptionnel des gènes interagissant avec les amplificateurs POU5F1 et SOX2

Pour comprendre le statut transcriptionnel des gènes associés aux amplificateurs POU5F1 et SOX2, nous avons analysé les données du transcriptome ARN-Seq dans les CSEH et les fibroblastes pulmonaires fœtaux 37, en nous concentrant sur les gènes qui ont une TSS à moins de 10 ko des sites interagissant avec l’activateur. Dans les CSEH, l’expression des gènes interagissant avec l’activateur POU5F1 et SOX2 est significativement plus élevée que celle de tous les gènes des CSEH (P = 7,5 × 10-6 et P = 1.2 × 10-6, respectivement, par un test de somme de rang de Wilcoxon non apparié; Figure 5A), indiquant que les interactomes sont enrichis de gènes activement transcrits. Ainsi, les amplificateurs actifs POU5F1 et SOX2 pourraient être impliqués dans la médiation de la transcription des gènes distaux associés. L’analyse du transcriptome ARN-Seq a également révélé que les gènes associés à l’origine aux activateurs POU5F1 et SOX2 dans les CSEH sont régulés à la baisse dans les fibroblastes pulmonaires différenciés (P = 1,2 × 10-5 et P = 0,013, respectivement, par test de somme de rang de Wilcoxon apparié; Figure 5B). Ces résultats indiquent que les renforceurs de ces deux gènes liés à la stemness interagissent avec un groupe de gènes fortement exprimés dans les CSEH mais réprimés dans les fibroblastes.

Les gènes distaux associés à l’activateur POU5F1 sont impliqués dans les circuits de régulation de la pluripotence

Pour déterminer si les gènes interagissant avec l’activateur POU5F1 et SOX2 contribuent à l’auto–renouvellement et à la pluripotence des CSEH, nous avons analysé des données provenant d’un écran d’interférence d’ARN à l’échelle du génome à l’aide d’un test de promoteur rapporteur POU5F1 dans les CSEH38. L’interférence de l’expression transgénique du POU5F1-GFP est quantifiée avec des valeurs de Fav reflétant l’intensité de fluorescence du GFP, qui représente la propension à être liée à la tige (Figure 6A). Par rapport à tous les gènes criblés, les gènes interagissant avec le renforceur POU5F1 (gènes les plus proches des sites d’interaction, avec une distance génomique du TSS aux sites d’interaction inférieure à 10 kb) montrent une tendance à la baisse des valeurs Fav, bien que statistiquement non significatives (P = 0,08, test de somme de rang de Wilcoxon non apparié). Cependant, pour les gènes de ciblage SOX2, les valeurs Fav sont similaires à tous les gènes criblés (P = 0.98, test de somme de rang de Wilcoxon non apparié). Par conséquent, sur la base de ces données, les gènes de l’interactome POU5F1 semblent être plus importants pour la pluripotence des cellules souches que les gènes de l’interactome SOX2.

Figure 6
figure6

(A) Corrélation des gènes de l’interactome avec la pluripotence. Les gènes en interaction criblés dans un test siRNA utilisant le gène rapporteur POU5F1-GFP dans les CSEH ont été inclus pour analyse. La distribution des valeurs de Fav (changement de fluorescence) pour les gènes en interaction est comparée à l’ensemble des 21122 gènes criblés dans l’essai original. (B) Analyse de l’expression différentielle des régulateurs transcriptionnels identifiés dans les CSEH et les fibroblastes pulmonaires fœtaux.

L’analyse de l’ontologie génique39 de 39 gènes interagissant avec POU5F1 et de 20 gènes interagissant avec SOX2 a révélé qu’une partie significative d’entre eux était impliquée dans la régulation transcriptionnelle (30,8% et 35,0% pour les interactomes POU5F1 et SOX2, respectivement; Tableau supplémentaire 5, 6) et répartis dans 8 et 4 domaines d’interaction différents dans les interactomes POU5F1 et SOX2, respectivement, avec pas plus de 3 gènes dans un domaine d’interaction. L’analyse de l’expression différentielle de ces régulateurs transcriptionnels dans les CSEH et les fibroblastes pulmonaires fœtaux a révélé que 9 de ceux de l’interactome POU5F1 (11 des 12 régulateurs transcriptionnels identifiés ont des données ARN-Seq) avaient une expression plus élevée dans les CSEH (Figure 6B), suggérant des rôles actifs pour ces gènes dans le réseau de régulation de la pluripotence dans les CSEH. Pour les régulateurs transcriptionnels de l’interactome SOX2, 3 des 5 ont montré une expression accrue dans les CSEH. Par conséquent, l’interactome enhancer POU5F1 peut jouer un rôle plus important dans la pluripotence des cellules souches que l’interactome enhancer SOX2.

Plusieurs sites de liaison des facteurs de transcription sont enrichis en interactomes d’amplificateurs POU5F1 et SOX2

La liaison des facteurs de transcription est l’une des caractéristiques des amplificateurs et peut faciliter les interactions chromatine–chromatine à longue portée de l’amplificateur avec les gènes distaux. Les exhausteurs putatifs POU5F1 et SOX2 sont des points chauds connus pour l’association de plusieurs protéines de liaison à l’ADN dans les CSEH. Pour comprendre si certains facteurs de transcription sont enrichis dans les régions interagissant avec les amplificateurs POU5F1 et SOX2, nous avons analysé systématiquement les profils ChIP-Seq de 32 protéines de liaison à l’ADN dans les CSEH (voir Méthodes). Le nombre normalisé de balises ChIP-Seq autour du centre des sites d’interaction 4C a été calculé et visualisé à l’aide de boxplot (figure 7A). Comme témoin, les dénombrements autour du centre des sites aléatoires dans les premières zones de réplication de l’ADN ont également été calculés. L’analyse statistique a identifié les sites ATF3, CTCF, GABPA, JUND, NANOG, RAD21 et YY1 étaient les protéines les plus enrichies dans les deux interactomes d’amplification par rapport au contrôle (P< 0,01, test de somme de rang de Wilcox non apparié). Cependant, le facteur de transcription OCT4 lié à la pluripotence n’est enrichi ni dans l’interactome POU5F1 ni dans l’interactome SOX2. Par conséquent, ATF3, CTCF, GABPA, JUND, NANOG, RAD21 et YY1 sont les protéines caractéristiques des interactomes activateurs POU5F1 et SOX2 dans les CSEH et leur présence peut être fonctionnellement importante.

Figure 7
figure7

(A) Boîtes de différentes protéines de liaison à l’ADN autour des sites interagissant avec l’activateur et des sites aléatoires (à partir des premières zones de réplication de l’ADN). Les balises ChIP-Seq à ± 5 ko d’un site en interaction ont été comptées et normalisées. (B) RAD21 co-localise avec d’autres facteurs de transcription dans les interactomes. Les profils d’intensité moyenne autour des sites de pics RAD21 dans les interactomes POU5F1 et SOX2 dans les CSEH sont tracés pour les facteurs de transcription ATF3, CTCF, GABPA, JUND, NANOG et YY1.

RAD21 est potentiellement en complexe avec d’autres facteurs de transcription pour médier les interactomes enhancer

Comme le montre la figure 7A, RAD21 est l’une des protéines enrichies identifiées dans les interactomes enhancer POU5F1 et SOX2 dans les CSEH. RAD21 fait partie d’un complexe de cohésion connu sous le nom de réticulant de chaîne d’ADN. Il a été démontré que la cohésine médie le bouclage de l’activateur distal Pou5f1 avec le promoteur du gène Pou5f1 dans les cellules ES de souris 40. Conformément à un rapport précédent selon lequel Rad21 coopère avec le Ctcf et d’autres facteurs de transcription pour maintenir l’identité des cellules ES de souris 40, les sites RAD21 des interactomes POU5F1 et SOX2 des CSEH sont co-occupés par des facteurs de transcription. Les graphiques d’agrégation illustrent clairement les signaux de crête des profils de liaison ATF3, CTCF, GABPA, JUND, NANOG et YY1 au centre des sites RAD21 dans les interactomes POU5F1 et SOX2 (Figure 7B). Le knockdown du Gabpa dans les cellules ES de souris est connu pour réduire l’expression d’Oct3/4, alors que la surexpression du Gabpa maintient l’expression d’Oct3/4 même sans LIF dans la culture de cellules ES de souris 41. Dans un criblage d’ARNsi à l’échelle du génome dans hESCs38, le knockdown de la plupart des protéines enrichies, telles que RAD21, CTCF, GABPA, JUND, NANOG et YY1, a considérablement réduit l’expression d’un promoteur transgénique POU5F1 lié à un rapporteur GFP, avec des valeurs Fav de -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, respectivement (dans les 25% supérieurs de tous les gènes dépistés). Pour mieux comprendre les interactions chromatine-chromatine, nous avons appliqué l’hybridation in situ fluorescente de l’ADN (FISH) pour visualiser la co-localisation de deux locus génomiques au niveau d’une seule cellule. Le locus du gène RARG sur le chromosome 12 a été identifié dans l’interactome POU5F1 chez les CSEH. Il a été récemment démontré que RARG joue un rôle très important dans la pluripotence et peut améliorer l’induction des cellules iPS de deux grandeurs42. Un autre locus sur le chromosome 12 qui ne fait pas partie de l’interactome POU5F1 a été utilisé comme témoin. La fréquence de co-localisation entre le locus RARG (chr12: 51751589-51956291) et le locus POU5F1 (chr6:31169844-31340561) s’est avéré être 1,67 fois plus élevé que la fréquence entre le locus de contrôle (chr12:80380971-80564119) et le locus POU5F1 (9,35 % contre 5,61 %, P < 0,05, Fig. supplémentaire. 3 BIS). La fréquence de contact plus élevée entre les loci RARG et POU5F1 est cohérente avec nos données de séquençage et suggère que des interactions plus stables se forment entre les deux loci. Examen des loci RARG et de contrôle (Fig. 3B) a révélé qu’il y a plus de sites de liaison au RAD21 et à d’autres sites de liaison au facteur de transcription dans le locus RARG avec une co-localisation fréquente. La coïncidence de la fréquence d’interaction chromosomique avec les sites de liaison contenant RAD21 pour plusieurs facteurs de transcription suggère que RAD21 peut coopérer avec d’autres facteurs de transcription pour organiser des interactions chromatine-chromatine à longue portée. Ainsi, RAD21, associé à de multiples facteurs de transcription, est susceptible de contribuer à la structure chromosomique d’ordre supérieur entourant les améliorateurs POU5F1 et SOX2 dans les CSEH dans le cadre d’un réseau de pluripotence. Cependant, des études moléculaires supplémentaires sont nécessaires pour confirmer cette hypothèse dérivée de l’étude 4C-Seq.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.