interaktomerne af POU5F1 og SOKS2 enhancers i humane embryonale stamceller

identifikation af POU5F1 og SOKS2 enhancer interactomes

de formodede pou5f1 og SOKS2 enhancerregioner er evolutionære konserverede på tværs af hvirveldyr (44 arter), med aktive forstærkersignaturer defineret af epigenetiske mærker som p300 histonacetyltransferase og H3K27AC, men ikke h3k27me3 i Hescs7 ( supplerende fig. 1A). Vi anvendte 4C-teknikken til at identificere de interagerende partnere for de “agn” formodede forstærkere af POU5F1 og SOKS2 i den pluripotente H9-cellelinie. Kort sagt blev cellerne fikseret til tværbindingskromosomer i nærheden. Kromosomerne blev derefter fragmenteret ved sonikering. Interagerende kromatinfragmenter blev ligeret, og DNA-stykkerne blev oprenset. Genomiske regioner, der interagerede med” agn”, blev derefter forstærket af indlejret PCR (supplerende Fig. 1b, supplerende tabel 1). Vi designede inverse PCR-primere til at målrette formodede forstærkere af POU5F1-og SOK2-generne. Det konstruerede 4C-bibliotek kunne visualiseres ved DNA-elektroforese, hvorimod kontrollen uden ligering viste næsten ingen PCR-produkter ( supplerende Fig. 1B), hvilket indikerer, at 4C-biblioteket blev forstærket fra ligeringsprodukter.

Vi udførte næste generations DNA-sekventering ved hjælp af en Illumina-sekvensator og klassificerede de identificerede 4C-interaktioner som enten proksimale eller distale interaktioner (se metoder). Distale interaktioner inkluderer interkromosomale interaktioner og intra-kromosomale interaktioner over genomiske afstande større end 20 kb, mens proksimale interaktioner dækker intra-kromosomale regioner med genomiske afstande mellem 300 bp og 20 kb. I overensstemmelse med resultaterne af 3C–baserede undersøgelser tegner vores distale interaktionslæsninger kun for en lille del af de samlede interaktioner, cirka 10% ~ 20% for 4C-bibliotekerne ( supplerende tabel 2 ). Vi brugte to forskellige partier af H9-celler til at konstruere 4C-bibliotekerne til POU5F1 og SOK2 uafhængigt til næste generations sekventering. De to replikater af pou5f1 og SOKS2 distale interaktioner overlapper med henholdsvis 35% og 25%. Dette er i overensstemmelse med den moderate overlapning, der observeres i biologiske replikater af CTCF–medierede kromatininteractomer i mus ES-celler27 og kan afspejle mangfoldigheden og dynamikken i forstærkerinteraktioner, ligeringseffektivitet, kompleksitet af PCR-amplifikation såvel som sekventeringsdybde. For at filtrere interaktioner, der sandsynligvis skyldes stokastiske effekter, brugte vi en falsk opdagelsesrate (FDR)-baseret statistisk model til at identificere de berigede interagerende domæner på tværs af hele genomet. Vi fusionerede yderligere de berigede interagerende domæner, der overlapper mellem de biologiske replikater som værende hyppige interagerende domæner med høj tillid. I alt blev 23 og 9 hyppige interagerende domæner med høj tillid identificeret for henholdsvis pou5f1-og SOKS2-interaktomerne ( Figur 1, supplerende tabel 3 , 4), og de fleste af dem er interkromosomale interaktioner, der involverer genrige regioner, svarende til E4C-resultaterne20.

Figur 1
figur1

Circos kort over de distale interaktioner præsenteres ved hjælp af Circos programmel52.

den blå ydre ring repræsenterer gentæthedsprofilen.

interaktomerne af pou5f1-og SOK2-forstærkere overlapper hinanden med tidlige DNA-replikationsdomæner, men ikke med heterochromatiske regioner

Vi undersøgte derefter, om pou5f1-og SOK2-forstærkerinteragerende domæner (størrelse fra 1 Mb til 4 Mb, supplerende tabel 3, 4 ) har nogen unikke epigenetiske træk. As Ryba et al. vist28, DNA-replikation timing korrelerer med den rumlige nærhed af kromatin målt ved Hi-C-analyse, hvilket antyder, at tidlig og sen DNA-replikation forekommer i rumligt forskellige rum i kernen. Vi bemærkede, at POU5F1 og SOKS2 gen loci er inden for tidlige DNA replikation domæner i hESCs og spekulerede på, om deres interagerende domæner har en lignende DNA replikation timing. Som vist i figur 2a overlapper pou5f1-og SOKS2-forstærkerinteragerende domæner hovedsageligt med tidlige DNA-replikationsdomæner i hESC ‘ er. Fordelingen af analyserede replikationstimingsværdier inden for de genomiske regioner, der omgiver de identificerede pou5f1-og SOKS2-forstærkerinteragerende steder (50 kb-område) viser et skift mod positive værdier sammenlignet med genom-brede array-værdier (P < 2.2 lot 10-16 For begge, ved uparret rank-sum test; figur 2b). Denne observation afslørede et interessant epigenetisk træk, at højere ordensstrukturer omkring pou5f1-og SOKS2-forstærkere har synkroniseret DNA-replikationstiming. Da tidlige DNA-replikationsdomæner er blevet forbundet med aktiv gentranskription i hESCs28, er det sandsynligt, at interaktionerne mellem POU5F1-og SOKS2-forstærkere med de identificerede distale regioner har funktionel betydning. Denne observation er i overensstemmelse med det, vi har set i POU5F1 enhancer interactome i mus ES celler (data ikke vist). Også afsløret i figur 2a overlapper POU5F1-og SOKS2-interagerende domæner ikke med heterochromatiske regioner mærket med stærke h3k9me3-signaler i hESCs29, hvilket antyder, at interaktomerne er inden for en aktiv del af genomet med hensyn til genregulering. Derudover undersøgte vi et potentielt forhold til de nukleare lamina-associerede domæner (LADs) af humane kromosomer30, men observerede ikke nogen forbindelse, muligvis på grund af det faktum, at gutterne blev bestemt i humane fibroblaster.

figur 2
figur2

forholdet mellem interaktomerne med DNA-replikationsdomæner og heterochromatiske regioner.

interagerende steder inden for de hyppige interagerende domæner præsenteres i (2a) (kun Chr1 og Chr2 vises). (2b), sammenligning af fordeling af DNA-replikation timing (RT) array-værdier for regionerne inden for 50 kb af de interagerende steder til hele genomet.

forstærkerinteraktomerne støder op til transkriptionsstartsteder og har aktive epigenetiske træk

for at undersøge korrelationen mellem pou5f1 og SOKS2-forstærkerinteraktomer med annoterede genplaceringer analyserede vi fordelingen af den genomiske afstand af forstærkerinteraktionsstederne til det nærmeste gentranskriptionsstartsted (TSS) ( I), der er forbundet med figur 3a). Kernetæthedsplotterne for både POU5F1–og SOKS2-forstærkerinteragerende steder viser tydeligt en skarp top centreret ved TSS. Sammenlignet med fordelingstoppen af tilfældigt simulerede steder i hele genomet er de toppe, der observeres i forstærkerinteraktomerne, signifikant højere inden for et smalt vindue omkring TSS (P = 0,0018, P = 0,0047, henholdsvis Kolmogorov-Smirnov test). Berigelse af de interagerende steder omkring TSS antyder, at POU5F1-og SOKS2-forstærkere foretrækker at interagere med genomiske regioner, der indeholder gener. Vi undersøgte yderligere fordelingen af pou5f1 og SOKS2 enhancer-interagerende steder på forskellige genomiske regioner31. Vist i figur 3b er genpromotorsekvenser en af de berigede regioner for både pou5f1-og SOKS2-forstærkerinteraktomerne. Derudover reduceres fraktionen af distale intergeniske regioner konsekvent for de to interactomer. Derfor antyder vores observation, at den højere ordens kromosomstruktur, der omgiver de aktive forstærkere, kan være direkte involveret i genregulering. Også bemærket, når tilfældige steder i de tidlige DNA-replikeringsområder (se metoder for detaljer) er valgt til at sammenligne afstandsfordeling med TSS, pou5f1 og SOKS2 interactomes er stadig mere beriget omkring TSS, selvom statistisk ikke signifikant (P = 0.390,1 P = 0.2098, henholdsvis Kolmogorov-Smirnov test, supplerende Fig. 2 ).

figur 3
figur3

(a) estimering af kernetæthed af genomisk afstand fra de interagerende steder til de nærmeste TSS-steder. Afstande blev beregnet ved hjælp af HOMER programmel34. Tæthedskort på 100.000 tilfældige steder i hele genomet er også inkluderet. B) Berigelsesanalyse af interaktomerne i forskellige genregioner. Distributionsanalyse blev udført ved hjælp af ceas-programmel31.

histonmodifikation er kendt for at være involveret i transkriptionel regulering ved dekondensering af kompakte kromatinstrukturer til transkriptionsfaktorbinding. 3C–baserede genomdækkende interaktomundersøgelser har identificeret aktive og inaktive kromatinrum i kernen med aktive rum beriget med histonmærker, der aktiverer gentranskription, såsom H3K9ac32. Vi spurgte derfor, om aktive forstærkere af POU5F1 og SOKS2 selektivt interagerer med distale regioner, der viser aktiv gentranskription. H3k27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 og H3K36me3 i H1 ES cellelinje33 blev anvendt til analyse af histonmønstre forbundet med interaktomerne. ChIP-sek-tags omkring enhancer-interagerende steder blev talt og normaliseret 34 og visualiseret som boksplot. Som nævnt har pou5f1 og SOKS2 interactomes højere intensitetsprofiler af H3K4me1, H3K4me2 og H4K20me1, som er mærker for genaktiv regulering ( figur 4a ). Sammenlignet med de tilfældige steder i tidlige DNA-replikeringsområder er de undersøgte histonmærker generelt mere beriget i POU5F1-interaktomet end i SOKS2-interaktomet, med H3K4me1 og H3K9ac er de mest signifikant berigede i POU5F1-interaktomet (P < 2.2 lot 10-16 For begge mærker, uparret rank-sum test). Interessant nok er Polycomb-medieret genhæmningsmærke H3K36me335 ikke beriget i hverken interactom (P = 0,485, P = 0,922). Vi undersøgte også forholdet mellem pou5f1 og SOKS2 enhancer interactomes med 5-hydroksymethylcytosin (5-hmC) steder i genomet. Som en tidligere undersøgelse afslørede, genomiske 5-hmC-steder er beriget ved aktive forstærkere i hESCs36. Fordi POU5F1 og SOKS2 opstrømsforstærkere støder op til 5-hmC-steder (inden for 5 kb), spurgte vi, om forstærkerinteraktomerne også er beriget med 5-hmC-steder. Vist i figur 4B er 5-HMC-steder beriget i nærheden af pou5f1 og SOKS2-interactomer sammenlignet med de tilfældige steder i tidlige DNA-replikationsområder (P < 2.2 til 10-16, P = 0.047, henholdsvis Kolmogorov-Smirnov-test). Således har de to forstærkerinteractomer i hESC ‘ er epigenetiske træk ved aktive forstærkere, hvilket kan lette aktiv regulering af gentranskription.

figur 4
figur4

(a) boksplot af forskellige histonmærker omkring de interagerende steder og tilfældige steder. 5 kb fra et interagerende sted blev talt og normaliseret. (B) Afstandsfordeling af de interagerende steder og tilfældige steder til det nærmeste 5-hmC-sted blev sammenlignet. 100.000 tilfældige steder blev genereret fra tidlige DNA-replikeringsområder til sammenligning.

figur 5
figur5
p > (a) sammenligning af rpkm-værdier for de interagerende gener (gener med en TSS-kur 10 KB fra de interagerende steder) med alle humane ensembl-gener (gennemsnitlige rpkm-værdier fra replikere RNA-sekv-data i kode blev anvendt). (B) differentiel ekspression blev analyseret for at sammenligne interaktomgener i hESC ‘ er og føtale lungefibroblaster.

Transkriptionsstatus for pou5f1-og SOK2–forstærkerinteragerende gener

for at forstå transkriptionsstatus for gener associeret med POU5F1-og SOK2-forstærkere analyserede vi RNA-Sekv-transkriptomdata i hESCs og føtale lungefibroblaster37 med fokus på gener, der har en TSS inden for 10 kb af enhancer-interagerende steder. I hESC ‘er er ekspression af pou5f1 og SOKS2–forstærkerinteragerende gener signifikant højere end for alle gener i hESC’ er (P = 7,5 liter 10-6 og P = 1.2 henholdsvis 10-6 ved uparret rank-sum test; figur 5a), hvilket indikerer, at interaktomerne er beriget med aktivt transkriberede gener. Således kunne aktive pou5f1-og SOKS2-forstærkere være involveret i mediering af transkription af de associerede distale gener. TRANSKRIPTOMANALYSE afslørede også, at generne, der oprindeligt var forbundet med aktive POU5F1-og SOK2-forstærkere i hESC ‘ er, er nedreguleret i differentierede lungefibroblaster (P = 1,2-kur 10-5 og P = 0,013, henholdsvis ved parret rank-sum test; figur 5b ). Disse resultater indikerer, at forstærkere af disse to stammerelaterede gener interagerer med en gruppe gener, der er stærkt udtrykt i hESC ‘ er, men undertrykt i fibroblaster.

distale gener associeret med POU5F1–forstærkeren er involveret i reguleringskredsløbet for pluripotens

for at undersøge, om POU5F1-og SOKS2-forstærkerinteragerende gener bidrager til selvfornyelse og pluripotens af hESCs, analyserede vi en data fra en genom-bred RNA-interferensskærm ved hjælp af en POU5F1-promotor reporter-analyse i hESCs38. Interferens af transgen POU5F1-GFP-ekspression kvantificeres med Fav-værdier, der afspejler GFP-fluorescensintensitet, hvilket repræsenterer tilbøjeligheden til at være stammerelateret ( figur 6a ). I sammenligning med alle de screenede gener viser POU5F1 enhancer–interagerende gener (gener tættest på de interagerende steder med genomisk afstand fra TSS til de interagerende steder mindre end 10 kb) en tendens til faldende Fav-værdier, skønt statistisk ikke signifikant (P = 0,08, uparret rank-sum test). For SOKS2–målretningsgener svarer Fav-værdierne imidlertid til alle de screenede gener (P = 0.98, uparret rank-sum test). Baseret på disse data ser gener i pou5f1-interaktomet derfor ud til at være vigtigere for stamcellepluripotens end gener i SOKS2-interaktomet.

figur 6
figur6

(a) korrelation af interaktomgenerne med pluripotens. De interagerende gener screenet i et siRNA-assay ved hjælp af POU5F1-GFP-reportergen i hESCs blev inkluderet til analyse. Fordeling af Fav-værdier (ændring af fluorescens) for de interagerende gener sammenlignes med alle 21122 gener screenet i det originale assay. (B) analyse af differentiel ekspression af identificerede transkriptionsregulatorer i hESC ‘ er og føtale lungefibroblaster.

Gen-ontologianalyse39 af 39 POU5F1-interagerende gener og 20 SOK2–interagerende gener afslørede, at en betydelig del af dem var involveret i transkriptionel regulering (henholdsvis 30,8% og 35,0% for pou5f1-og SOK2-interaktomerne; Supplerende tabel 5, 6) og fordelt til 8 og 4 forskellige interagerende domæner i henholdsvis POU5F1 og SOKS2 interactomer med højst 3 gener i et interagerende domæne. Differentiel ekspressionsanalyse af disse transkriptionsregulatorer i hESC ‘er og føtale lungefibroblaster afslørede 9 af dem i POU5F1-interaktomet (11 af 12 identificerede transkriptionsregulatorer har RNA-Sekv-data) for at have højere ekspression i hESC’ er ( Figur 6b ), hvilket antyder aktive roller for disse gener i pluripotency regulatory netværk i hESC ‘ er. For de transkriptionelle regulatorer i SOKS2-interaktomet viste 3 af 5 øget ekspression i hESCs. Derfor kan pou5f1-forstærkerinteraktomet spille en større rolle i stamcellens pluripotens end SOKS2-forstærkerinteraktomet.

flere transkriptionsfaktorbindingssteder er beriget med pou5f1 og SOKS2 enhancer interactomes

Transkriptionsfaktorbinding er et af de egenskaber, som forstærkere besidder, og det kan lette langtrækkende kromatin–kromatininteraktioner af forstærkeren med distale gener. POU5F1 og SOKS2 formodede forstærkere er kendte hot spots for association af multiple DNA-bindende proteiner i hESC ‘ er. For at forstå, om visse transkriptionsfaktorer er beriget i pou5f1–og SOK2-forstærkerinteragerende regioner, analyserede vi systematisk Chipsekv-profiler af 32 DNA-bindende proteiner i hESC ‘ er (Se metoder). Normaliseret Chip-sek tag tæller omkring midten af 4C interagerende steder blev beregnet og visualiseret ved hjælp af boksplot ( figur 7a ). Som kontrol blev tællingerne omkring midten af de tilfældige steder i de tidlige DNA-replikationsområder også beregnet. Statistisk analyse identificeret atf3 -, CTCF -, GABPA -, JUND -, NANOG -, RAD21-og YY1-steder var de mest berigede proteiner i begge forstærkerinteractomer sammenlignet med kontrollen (P < 0,01, uparret rank-sum test). Pluripotens-relateret transkriptionsfaktor OCT4 er imidlertid ikke beriget i hverken POU5F1 eller SOKS2 interactom. Derfor er atf3, CTCF, GABPA, JUND, NANOG, RAD21 og YY1 de karakteristiske proteiner i pou5f1 og SOKS2 enhancer interactomes i hESCs, og deres tilstedeværelse kan være funktionelt vigtig.

Figur 7
figur7

(a) Boksplotter af forskellige DNA-bindende proteiner omkring de forstærkerinteragerende steder og tilfældige steder (fra tidlige DNA-replikationsområder). 5 kb fra et interagerende sted blev talt og normaliseret. (B) RAD21 lokaliseres sammen med andre transkriptionsfaktorer i interaktomerne. Gennemsnitlige intensitetsprofiler omkring rad21 peak steder i POU5F1 og SOKS2 interactomes i hESCs er afbildet for transkriptionsfaktorer ATF3, CTCF, GABPA, JUND, NANOG og YY1.

RAD21 er potentielt i kompleks med andre transkriptionsfaktorer for at formidle forstærkerinteraktomerne

som vist i figur 7A er RAD21 et af de berigede proteiner identificeret i POU5F1 og SOKS2 enhancer interactomes i hESCs. RAD21 er en del af et samhørighedskompleks kendt som en DNA-kæde tværbinder. Cohesin har vist sig at formidle looping af den distale forstærker Pou5f1 med Pou5f1-genpromotoren i mus ES-celler40. I overensstemmelse med en tidligere rapport om, at Rad21 samarbejder med Ctcf og andre transkriptionsfaktorer for at opretholde musens es-celleidentitet40, er RAD21-steder i både POU5F1 og SOKS2-interactomer i hESC ‘ er co-besat af transkriptionsfaktorer. Aggregeringsplotter illustrerer tydeligt topsignalerne for atf3 -, CTCF -, GABPA -, JUND -, NANOG-og YY1-bindingsprofiler i midten af RAD21-lokaliteterne i pou5f1-og SOKS2-interaktomer ( figur 7b ). Det er kendt, at nedbrydning af Gabpa i mus ES-celler reducerer Oct3/4-ekspression, mens overekspression af Gabpa opretholder ekspression af Oct3/4, selv uden LIF i mus ES-cellekultur41. I en genom–dækkende siRNA-skærm i hESCs38 reducerede nedslag af de fleste af de berigede proteiner, såsom RAD21, CTCF, GABPA, JUND, NANOG og YY1 signifikant ekspressionen af en transgen POU5F1-promotor knyttet til en GFP-reporter med Fav-værdier af -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, henholdsvis (inden for de øverste 25% af alle de screenede gener). For yderligere at forstå kromatin-kromatininteraktionerne anvendte vi DNA fluorescerende in situ hybridisering (fisk) for at visualisere co-lokalisering af to genomiske loci på enkeltcelleniveau. RARG-genlokalet på kromosom 12 er blevet identificeret i POU5F1-interaktomet i hESCs. RARG blev for nylig vist at spille en meget vigtig rolle i pluripotens og kan forbedre IPS-celleinduktion med to størrelser42. Et andet sted på kromosom 12, der ikke er en del af POU5F1-interaktomet, blev brugt som kontrol. Co-lokaliseringsfrekvensen mellem RARG locus (chr12: 51751589-51956291) og POU5F1 locus (chr6: 31169844-31340561) viste sig at være 1,67 gange højere end frekvensen mellem kontrol locus (chr12: 80380971-80564119) og POU5F1 locus (9,35% versus 5,61%, P < 0.05, supplerende fig. 3A). Den højere kontaktfrekvens mellem rarg og POU5F1 loci er i overensstemmelse med vores sekventeringsdata og antyder, at der dannes mere stabile interaktioner mellem de to loci. Undersøgelse af rarg og kontrol loci (supplerende Fig. 3B) afslørede, at der er flere RAD21 og andre transkriptionsfaktorbindingssteder i RARG-locus med hyppig co-lokalisering. Tilfældighed af kromosominteraktionsfrekvens med RAD21-holdige bindingssteder for flere transkriptionsfaktorer antyder, at RAD21 kan samarbejde med andre transkriptionsfaktorer for at organisere langtrækkende kromatin-kromatininteraktioner. Således vil RAD21 sammen med flere transkriptionsfaktorer sandsynligvis bidrage til højere orden kromosomal struktur omkring POU5F1 og SOKS2 forstærkere i hESCs som en del af et pluripotency-netværk. Imidlertid, yderligere molekylære undersøgelser er nødvendige for at bekræfte denne hypotese afledt af 4C-Sekv-undersøgelse.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.