De interactomes van POU5F1 en SOX2-enhancers in menselijke embryonale stamcellen

Identificatie van POU5F1 en SOX2 enhancer interactomes

De vermeende POU5F1 en SOX2 enhancer regio ‘ s zijn evolutief geconserveerd over gewervelde dieren (44 soorten), met actieve versterker handtekeningen gedefinieerd door epigenetische markeringen, zoals p300 histon-acetyltransferase en H3K27ac maar niet H3K27me3 in hESCs7 ( Aanvullende Fig. 1 bis). We hebben de 4C techniek toegepast om de interagerende partners van de “aas” vermeende versterkers van POU5F1 en SOX2 in de pluripotente h9 cellijn te identificeren. Kort, werden de cellen bevestigd aan Crosslink chromosomen binnen nabijheid. De chromosomen werden toen gefragmenteerd door sonication. De chromatinefragmenten die op elkaar inwerken werden ligated en de stukken van DNA werden gezuiverd. De Genomic gebieden die met het “aas” in wisselwerking staan werden toen versterkt door geneste PCR (aanvullende Fig. 1B, aanvullende tabel 1). Wij ontwierpen omgekeerde PCR primers om vermeende versterkers van de pou5f1 en SOX2 genen te richten. De geconstrueerde 4C bibliotheek kon door de elektroforese van DNA worden gevisualiseerd, terwijl de controle zonder afbinding bijna geen PCR-producten ( aanvullende Fig. 1B), wat erop wijst dat de 4C-bibliotheek werd versterkt door afbindingsproducten.

we hebben de volgende generatie DNA-sequencing uitgevoerd met behulp van een Illumina HiSeq-sequencer en de geïdentificeerde 4C-interacties geclassificeerd als proximale of distale interacties (zie methoden). Distale interacties omvatten interchromosomale interacties en intrachromosomale interacties over genomische afstanden groter dan 20 kb, terwijl proximale interacties intrachromosomale gebieden met genomische afstanden tussen 300 bp en 20 kb bestrijken. In overeenstemming met de resultaten van 3C–gebaseerde studies, onze distale interactie leest goed voor slechts een klein deel van de totale interacties, ruwweg 10% ~ 20% voor de 4C-bibliotheken ( aanvullende tabel 2 ). We gebruikten twee verschillende batches van h9 cellen om de 4C bibliotheken voor POU5F1 en SOX2 onafhankelijk te construeren voor de volgende generatie sequencing. De twee replicaten van pou5f1 en sox2 distale interacties overlappen elkaar met respectievelijk 35% en 25%. Dit is consistent met de gematigde overlapping waargenomen in biologische replicaten van CTCF–gemedieerde chromatin interactomes in muiscellen27 en kan de diversiteit en dynamiek van versterkerinteracties, ligation efficiency, complexiteit van PCR-versterking evenals het rangschikken van diepte weerspiegelen. Om interacties te filteren die waarschijnlijk het gevolg waren van stochastische effecten, gebruikten we een op false discovery rate (FDR) gebaseerd statistisch model om de verrijkte interagerende domeinen in het hele genoom te identificeren. We fuseerden verder de verrijkte interagerende domeinen die overlappen tussen de biologische replicaten als hoog-vertrouwen frequente interagerende domeinen. In totaal werden 23 en 9 frequente interagerende domeinen met hoge betrouwbaarheid geïdentificeerd voor respectievelijk de POU5F1 en SOX2 interactomen ( figuur 1, aanvullende tabel 3 , 4 ) en de meeste van hen zijn interchromosomale interacties die gen-rijke gebieden omvatten, vergelijkbaar met de E4C results20.

figuur 1
figure1

Circos-kaarten van de distale interacties worden weergegeven met behulp van Circos-software52.

De Blauwe buitenste ring vertegenwoordigt het gendichtheidsprofiel.

de interactomen van pou5f1-en SOX2-versterkers overlappen met vroege DNA-replicatiedomeinen, maar niet met heterochromatische gebieden

vervolgens hebben we onderzocht of de interacterende domeinen van POU5F1-en SOX2-versterkers (grootte variërend van 1 Mb tot 4 Mb, aanvullende tabel 3, 4 ) unieke epigenetische kenmerken hebben. Zoals Ryba et al. showed28, correleert de replicatietijd van DNA met de ruimtelijke nabijheid van chromatin zoals gemeten door Hi-C analyse, die voorstelt dat de vroege en late replicatie van DNA in ruimtelijk verschillende compartimenten in de kern voorkomen. Wij merkten op dat de pou5f1 en SOX2 genloci binnen vroege DNA-replicatiedomeinen in hESCs zijn en vroegen ons af of hun op elkaar inwerkende domeinen een gelijkaardige DNA-replicatietiming hebben. Zoals getoond in Figuur 2A, overlappen POU5F1 en SOX2 versterker die domeinen op elkaar inwerken hoofdzakelijk met vroege de replicatiedomeinen van DNA in hESCs. De verdeling van de gemeten replicatietimingwaarden binnen de genomische regio ‘ s rond de geïdentificeerde POU5F1-en SOX2-interagerende locaties (50 kb-bereik) toont een verschuiving naar positieve waarden in vergelijking met genoombrede array-waarden (P < 2.2 × 10-16 voor beide, door ongepaarde Wilcoxon rank-sum test; figuur 2B). Deze observatie onthulde een interessante epigenetische eigenschap, dat hoger-ordestructuren die de POU5F1 en SOX2-versterkers omringen de replicatietijd van DNA hebben gesynchroniseerd. Aangezien de vroege de replicatiedomeinen van DNA met actieve gentranscriptie in hESCs28 zijn verbonden, is het waarschijnlijk dat de interactie van POU5F1 en SOX2 versterkers met de geà dentificeerde distale gebieden functionele betekenis hebben. Deze observatie is consistent met wat we hebben gezien in POU5F1 enhancer interactome in muis ES cellen (gegevens niet getoond). Ook geopenbaard in Figuur 2A, overlappen POU5F1 en SOX2 die domeinen op elkaar inwerken niet met heterochromatic gebieden die met sterke h3k9me3 signalen in hescs29 worden geëtiketteerd, die voorstellen dat de interactomes binnen een actief gedeelte van het genoom in termen van genverordening zijn. Daarnaast hebben we een mogelijke relatie onderzocht met de nuclear lamina-associated domains (LADs) van menselijke chromosomen30, maar hebben geen enkele connectie waargenomen, mogelijk omdat de LADs werden bepaald in menselijke fibroblasten.

Figuur 2
figure2

relatie van de interactomen met DNA-replicatiedomeinen en heterochromatische gebieden.

interagerende sites binnen de frequente interagerende domeinen worden weergegeven in (2A) (alleen Chr1 en Chr2 worden weergegeven). (2B), vergelijking van distributie van de replicatie van DNA timing (RT) array waarden voor de gebieden binnen ±50 kb van de interagerende plaatsen aan het gehele genoom.

De versterker interactomes zijn naast de transcriptie start sites en in het bezit zijn actief epigenetische kenmerken

Voor het verkennen van de correlatie van POU5F1 en SOX2 enhancer interactomes met geannoteerde gen locaties, analyseerden we de verdeling van de genetische afstand van de versterker interactie sites naar de dichtstbijzijnde gen transcriptie start site (TSS) ( Figuur 3A ). De kernel density plots van zowel POU5F1 en SOX2 enhancer-interagerende sites tonen duidelijk een scherpe piek gecentreerd op TSS. In vergelijking met de distributiepiek van willekeurig gesimuleerde plaatsen in het gehele genoom, zijn de pieken waargenomen in de interactomen van de versterker significant hoger binnen een smal venster rond TSS (p = 0,0018, p = 0,0047, respectievelijk, Kolmogorov-Smirnov test). De verrijking van de op elkaar inwerkende plaatsen rond TSS stelt voor dat POU5F1 en SOX2 versterkers interactie met genomic gebieden verkiezen die genen bevatten. Wij onderzochten verder de distributie van POU5F1 en SOX2 versterker-interagerende plaatsen in verschillende genomic regio ‘ S31. Getoond in Figuur 3B, zijn de opeenvolgingen van de genpromotor één van de verrijkte gebieden voor zowel POU5F1 als SOX2 versterkerinteractomes. Bovendien, wordt de fractie van distale intergenic gebieden consequent verminderd voor de twee interactomes. Daarom stelt onze observatie voor dat de hogere chromosoomstructuur die de actieve versterkers omringt direct betrokken kan zijn bij genregulatie. Ook opgemerkt, wanneer willekeurige plaatsen in de vroege DNA-replicatie gebieden (zie methoden voor details) worden geselecteerd om afstandsverdeling te vergelijken met TSS, de pou5f1 en SOX2 interactomen zijn nog meer verrijkt rond TSS, hoewel statistisch niet significant (p = 0,390,1 P = 0,2098, respectievelijk, Kolmogorov-Smirnov test, aanvullende Fig. 2 ).

Figuur 3
figure3

(a) kerneldichtheidsschatting van genomische afstand van de interagerende sites tot de dichtstbijzijnde TSS-sites. De afstanden werden berekend met behulp van HOMER software34. Dichtheidskaarten van 100.000 willekeurige plaatsen in het gehele genoom zijn ook inbegrepen. B) Verrijkingsanalyse van de interactomen in verschillende genische gebieden. Distributieanalyse werd uitgevoerd met behulp van CEAS-software31.

Het is bekend dat Histonmodificatie betrokken is bij transcriptionele Regulatie door compacte chromatinestructuren te decondenseren voor transcriptiefactorbinding. 3C-gebaseerde genoom-brede interactome studies hebben actieve en inactieve chromatin compartimenten in de kern geïdentificeerd, met actieve compartimenten verrijkt met histone merken die gen transcriptie, zoals h3k9ac32 activeren. We vroegen ons daarom af of actieve versterkers van POU5F1 en SOX2 selectief interageren met distale regio ‘ s die actieve gen transcriptie tonen. Spaander-Seq markeerprofielen van H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, h4k20me1 en H3K36me3 in de cellijn33 van H1 ES werden gebruikt voor het analyseren van histone patronen geassocieerd met interactomes. Spaander-Seq-markeringen rond de versterker die plaatsen in wisselwerking staan werden geteld en normalised34 en als boxplot gevisualiseerd. Zoals opgemerkt, hebben POU5F1 en SOX2 interactomes hogere intensiteitsprofielen van H3K4me1, H3K4me2 en H4K20me1, die merken voor Gen actieve regelgeving zijn ( figuur 4A ). Vergeleken met de willekeurige plaatsen in vroege DNA-replicatiegebieden zijn de onderzochte histonsporen in het algemeen meer verrijkt in het POU5F1-interactoom dan in het SOX2-interactoom, waarbij H3K4me1 en H3K9ac de meest significant verrijkte zijn in het POU5F1-interactoom (P < 2.2 × 10-16 voor beide merken, ongepaarde Wilcoxon rank-sum test). Interessant, wordt het Polycomb-bemiddelde gen het tot zwijgen brengen teken H3K36me335 niet verrijkt in of interactome (p = 0,485, p = 0,922, respectievelijk). We onderzochten ook de relatie van POU5F1 en SOX2 versterker interactomen met 5-hydroxymethylcytosine (5-hmC) sites in het genoom. Aangezien een vorige studie onthulde, worden genomic 5-HMC plaatsen verrijkt bij actieve versterkers in hESCs36. Omdat POU5F1 en SOX2 upstream versterkers grenzend zijn aan 5-hmC sites (binnen 5 kb), vroegen we of de enhancer interactomen ook verrijkt zijn met 5-hmC sites. In Figuur 4B worden 5-hmC-sites verrijkt in de nabijheid van POU5F1-en SOX2-interactomen in vergelijking met de willekeurige sites in vroege DNA-replicatiegebieden (p < 2,2 × 10-16, p = 0,047, respectievelijk, Kolmogorov-Smirnov-test). Aldus, bezitten de twee versterkerinteractomes in hESCs epigenetische eigenschappen van actieve versterkers, die actieve verordening van gentranscriptie kunnen vergemakkelijken.

Figuur 4
figure4

(A) Boxplot van verschillende histonmarkeringen rond de interagerende sites en willekeurige sites. Spaander-Seq markeringen binnen ±5 kb van een op elkaar inwerkende plaats werden geteld en genormaliseerd. B) de distributie op afstand van de interagerende sites en willekeurige sites naar de dichtstbijzijnde 5-hmC-site werd vergeleken. 100.000 willekeurige plaatsen werden gegenereerd uit vroege DNA-replicatiegebieden voor vergelijking.

Figure 5
figure5

(a) Comparison van rpkm waarden voor de interagerende genen (genen met een TSS ≤ 10 KB van de interagerende plaatsen) met alle menselijke ensembl genen (gemiddelde rpkm waarden van replicate RNA-seq data in encode werden gebruikt). (B) de differentiële uitdrukking werd geanalyseerd om interactome genen in hESCs en foetale longfibroblasten te vergelijken.

transcriptionele status van pou5f1 en SOX2 versterker interacterende genen

om de transcriptionele status van genen geassocieerd met POU5F1 en SOX2 versterkers te begrijpen, analyseerden we RNA-Seq transcriptoomgegevens in hESCs en foetale longfibroblasts37, gericht op genen met een TSS binnen 10 KB van de enhancer–interacting sites. In hESCs is de expressie van POU5F1 en SOX2 versterker–interagerende genen significant hoger dan die van alle genen in hESCs (p = 7,5 × 10-6 en P = 1.2 × 10-6, respectievelijk, door ongepaarde Wilcoxon rank-sum test; figuur 5A), die erop wijst dat de interactomen worden verrijkt met actief getranscribeerde genen. Aldus, zouden de actieve POU5F1 en SOX2 versterkers bij het bemiddelen transcriptie van de geassocieerde distale genen kunnen worden betrokken. RNA-Seq transcriptome analyse toonde ook aan dat de genen oorspronkelijk geassocieerd met actieve POU5F1 en SOX2 versterkers in hESCs down-gereguleerd zijn in gedifferentieerde longfibroblasten (p = 1.2 × 10-5 en P = 0,013, respectievelijk, door gepaarde Wilcoxon rank-sum test; figuur 5B ). Deze resultaten wijzen erop dat de versterkers van deze twee stemness-verwante genen met een groep genen interageren die hoogst in hESCs maar in fibroblasten wordt uitgedrukt.

distale genen geassocieerd met de pou5f1 enhancer zijn betrokken bij het regulerende circuit van pluripotentie

om te onderzoeken of POU5F1 en SOX2 enhancer–interagerende genen bijdragen aan zelfvernieuwing en pluripotentie van hESCs, analyseerden we een data van een genoom-breed RNA interferentie scherm met behulp van een POU5F1 promotor reporter assay in hESCs38. De interferentie van transgene pou5f1-GFP uitdrukking wordt gekwantificeerd met Fav-waarden die de fluorescentieintensiteit van GFP weerspiegelen, die de neiging vertegenwoordigt om stemness-gerelateerd te zijn (figuur 6A ). In vergelijking met alle gescreende genen, tonen POU5F1 enhancer–interagerende genen (genen die het dichtst bij de interagerende plaatsen staan, met genomische afstand van TSS tot de interagerende plaatsen minder dan 10 kb) een trend van dalende Fav-waarden, hoewel statistisch niet significant (p = 0,08, ongepaarde Wilcoxon rank-sum test). Echter, voor SOX2-targeting genen, de Fav waarden zijn vergelijkbaar met alle genen gescreend (P = 0.98, ongepaarde Wilcoxon rank-sum test). Daarom, gebaseerd op deze gegevens, lijken de genen in POU5F1 interactome belangrijker voor pluripotency van de stamcel dan genen in SOX2 interactome te zijn.

Figuur 6
figure6

(a) correlatie van de interactoomgenen met pluripotentie. De op elkaar inwerkende genen die in een siRNA-analyse worden onderzocht gebruikend POU5F1 – GFP verslaggeversgen in hESCs werden inbegrepen voor analyse. De verdeling van Fav-waarden (verandering van fluorescentie) voor de op elkaar inwerkende genen wordt vergeleken met alle 21122 genen die in de originele analyse worden gescreend. (B) analyse van differentiële expressie van geïdentificeerde transcriptionele regulatoren in hESCs en foetale longfibroblasten.

genontologieanalyse39 van 39 POU5F1–interagerende genen en 20 SOX2–interagerende genen bleek dat een significant deel van hen betrokken was bij transcriptionele Regulatie (30,8% en 35,0% voor de pou5f1-en SOX2-interactomen, respectievelijk; Aanvullende tabel 5, 6) en verdeeld over 8 en 4 verschillende interagerende domeinen in de POU5F1 en SOX2 interactomen, respectievelijk, met niet meer dan 3 genen in één interagerende domein. De differentižle uitdrukkingsanalyse van deze transcriptionele regelgevers in hESCs en foetale longfibroblasten onthulde 9 van die in de POU5F1 interactome (11 van 12 geà dentificeerde transcriptionele regelgevers hebben RNA-Seq gegevens) om hogere uitdrukking in hESCs ( figuur 6B) te hebben, die actieve rollen voor deze genen in het pluripotency regelgevend netwerk in hESCs voorstellen. Voor die transcriptional regelgevers in SOX2 interactome, toonden 3 van 5 verhoogde uitdrukking in hESCs. Daarom kan de pou5f1-versterker interactome een grotere rol in pluripotency van de stamcel spelen dan de sox2-versterker interactome.

verschillende bindingsplaatsen voor transcriptiefactoren zijn verrijkt met POU5F1 en SOX2-versterkerinteractomen

transcriptiefactorbinding is een van de kenmerken die versterkers bezitten en het kan lange–afstands chromatine–chromatine interacties van de versterker met distale genen vergemakkelijken. POU5F1 en sox2 veronderstelde versterkers zijn bekende hot spots voor Vereniging van veelvoudige bindende proteã nen van DNA in hESCs. Om te begrijpen of bepaalde transcriptiefactoren in POU5F1 en SOX2 versterker–interagerende gebieden worden verrijkt, analyseerden wij systematisch Spaander-Seq profielen van 32 bindende proteã nen van DNA in hESCs (zie methodes). Genormaliseerde spaander-Seq de tellingen van de markering rond het centrum van de 4C op elkaar inwerkende plaatsen werden berekend en gevisualiseerd gebruikend boxplot ( figuur 7A ). Als controle, werden de tellingen rond het centrum van de willekeurige plaatsen in de vroege replicatiegebieden van DNA ook berekend. Statistische analyse geïdentificeerde ATF3, CTCF, GABPA, JUND, NANOG, RAD21 en YY1 plaatsen waren de meest verrijkte eiwitten in beide enhancer interactomen vergeleken met de controle (P < 0,01, ongepaarde Wilcox rank-sum test). Echter, pluripotency-gerelateerde transcriptiefactor OCT4 is niet verrijkt in POU5F1 of SOX2 interactome. Daarom zijn ATF3, CTCF, GABPA, JUND, NANOG, RAD21 en YY1 de kenmerkende proteã nen in POU5F1 en sox2 versterkerinteractomes in hESCs en hun aanwezigheid kan functioneel belangrijk zijn.

Figure 7
figure7

(a) Boxplots van verschillende DNA-bindende eiwitten rond de enhancer interacting sites en willekeurige sites (van vroege DNA-replicatie gebieden). Spaander-Seq markeringen binnen ±5 kb van een op elkaar inwerkende plaats werden geteld en genormaliseerd. (B) RAD21 Co-lokaliseert met andere transcriptiefactoren in de interactomen. De gemiddelde intensiteitsprofielen rond RAD21 piekplaatsen in POU5F1 en SOX2 interactomes in hESCs worden uitgezet voor transcriptiefactoren ATF3, CTCF, GABPA, JUND, NANOG en YY1.

RAD21 is potentieel in complex met andere transcriptiefactoren om de interactomen van de versterker te bemiddelen

zoals getoond in Figuur 7A , is RAD21 een van de verrijkte eiwitten geïdentificeerd in POU5F1-en SOX2-versterkerinteractomen in hESCs. RAD21 maakt deel uit van een cohesiecomplex dat bekend staat als een DNA chain crosslinker. Het is aangetoond dat cohesine een lus van de pou5f1 distale versterker bemiddelt met de pou5f1 genpromotor in muiscellen40. In overeenstemming met een eerder rapport dat Rad21 samenwerkt met Ctcf en andere transcriptiefactoren bij het handhaven van de identiteit van de ES-cel van de muis 40, worden RAD21-locaties in zowel POU5F1 als SOX2-interactomen in hESCs mede bezet door transcriptiefactoren. Aggregatiepercelen illustreren duidelijk de pieksignalen van ATF3 -, CTCF -, GABPA -, JUND -, NANOG-en YY1-verbindingsprofielen in het centrum van RAD21-locaties in POU5F1-en SOX2-interactomen ( figuur 7B ). Het neerhalen van Gabpa in muizense cellen is gekend om oct3/4 uitdrukking te verminderen, terwijl de overexpressie van Gabpa uitdrukking van Oct3/4 zelfs zonder LIF in muizense celculture41 handhaaft. In een genoom–brede siRNA scherm in hESCs38, demontabele van de meeste verrijkt in eiwitten, zoals RAD21, CTCF, GABPA, DJUNDULLA, NANOG en YY1, aanzienlijk verminderd door de expressie van een transgene POU5F1-promotor gekoppeld aan een GFP-verslaggever, met Fav waarden van -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, respectievelijk (binnen de top 25% van alle genen gescreend). Om de chromatin-chromatin interactie verder te begrijpen, pasten wij fluorescente in-situ hybridisatie van DNA (FISH) toe om co-lokalisatie van twee genomic loci op het ééncellige niveau te visualiseren. De rarg gen locus op chromosoom 12 is geà dentificeerd in POU5F1 interactome in hESCs. RARG werd onlangs getoond om een zeer belangrijke rol in pluripotency te spelen en kan IPS celinductie door twee grootten verbeteren42. Een andere plaats op chromosoom 12 die geen deel uitmaakt van POU5F1 interactome werd gebruikt als controle. De co-lokalisatiefrequentie tussen de rarg-locus (chr12: 51751589-51956291) en de pou5f1 locus (chr6: 31169844-31340561) bleek 1,67 keer hoger te zijn dan de frequentie tussen de controle locus (chr12: 80380971-80564119) en de POU5F1 locus (9.35% versus 5,61%, P < 0,05, aanvullende Fig. 3A). De hogere contactfrequentie tussen de rarg en POU5F1 loci is consistent met onze sequentiegegevens en suggereert dat er stabielere interacties worden gevormd tussen de twee loci. Onderzoek van de RARG – en controleloci ( aanvullend Fig. 3B) onthulde dat er meer RAD21 en andere bindingsplaatsen van de transcriptiefactor in de rarg-locus met frequente co-localisatie zijn. Het samenvallen van de frequentie van de chromosoominteractie met RAD21-bevattende bandplaatsen voor veelvoudige transcriptiefactoren stelt voor dat RAD21 met andere transcriptiefactoren kan samenwerken om chromatin-chromatin interactie over lange afstand te organiseren. Aldus, zal RAD21, samen met veelvoudige transcriptiefactoren, aan hoger-orde chromosomale structuur bijdragen die POU5F1 en SOX2 versterkers in hESCs als deel van een pluripotency netwerk omringen. Nochtans, zijn de extra moleculaire studies nodig om deze hypothese te bevestigen die van 4C-Seq studie wordt afgeleid.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.