- Identifizierung von POU5F1- und SOX2-Enhancer-Interaktomen
- Die Interaktome von POU5F1- und SOX2-Enhancern überlappen sich mit frühen DNA-Replikationsdomänen, jedoch nicht mit heterochromatischen Regionen
- Die Enhancer-Interaktome grenzen an Transkriptionsstartstellen an und besitzen aktive epigenetische Merkmale
- Transkriptionsstatus von POU5F1- und SOX2–Enhancer-assoziierten Genen
- Distale Gene, die mit dem POU5F1–Enhancer assoziiert sind, sind an der regulatorischen Schaltung der Pluripotenz beteiligt
- Mehrere Transkriptionsfaktor–Bindungsstellen sind mit POU5F1– und SOX2-Enhancer-Interaktomen angereichert
- RAD21 steht möglicherweise in Verbindung mit anderen Transkriptionsfaktoren, um die Enhancer-Interaktome zu vermitteln
Identifizierung von POU5F1- und SOX2-Enhancer-Interaktomen
Die mutmaßlichen POU5F1- und SOX2-Enhancer-Regionen sind evolutionär bei Wirbeltieren (44 Arten) konserviert, wobei aktive Enhancer-Signaturen durch epigenetische Markierungen wie p300 definiert sind histonacetyltransferase und H3K27ac aber nicht H3K27me3 in hESCs7 (Ergänzende Abb. 1A ). Wir haben die 4C-Technik angewendet, um die Interaktionspartner der mutmaßlichen „Köder“ -Enhancer von POU5F1 und SOX2 in der pluripotenten H9-Zelllinie zu identifizieren. Kurz gesagt, Die Zellen wurden fixiert, um Chromosomen in der Nähe zu vernetzen. Die Chromosomen wurden dann durch Ultraschall fragmentiert. Die Chromatinfragmente wurden ligiert und die DNA-Stücke gereinigt. Genomische Regionen, die mit dem „Köder“ interagieren, wurden dann durch verschachtelte PCR amplifiziert (Ergänzende Abb. 1B, ergänzende Tabelle 1). Wir haben inverse PCR-Primer entwickelt, um auf mutmaßliche Enhancer der Gene POU5F1 und SOX2 abzuzielen. Die aufgebaute 4C-Bibliothek konnte durch DNA-Elektrophorese sichtbar gemacht werden, während die Kontrolle ohne Ligation fast keine PCR-Produkte zeigte (Ergänzende Abb. 1B), was anzeigt, dass die 4C-Bibliothek aus Ligationsprodukten amplifiziert wurde.
Wir führten DNA-Sequenzierungen der nächsten Generation mit einem Illumina HiSeq-Sequenzer durch und klassifizierten die identifizierten 4C-Interaktionen entweder als proximale oder distale Interaktionen (siehe Methoden). Distale Wechselwirkungen umfassen interchromosomale Wechselwirkungen und intra-chromosomale Wechselwirkungen über genomische Entfernungen von mehr als 20 kb, während proximale Wechselwirkungen intra-chromosomale Regionen mit genomischen Abständen zwischen 300 bp und 20 kb abdecken. In Übereinstimmung mit den Ergebnissen von 3C–basierten Studien machen unsere distalen Interaktionslesungen nur einen kleinen Teil der gesamten Interaktionen aus, ungefähr 10% ~ 20% für die 4C-Bibliotheken (ergänzende Tabelle 2 ). Wir verwendeten zwei verschiedene Chargen von H9-Zellen, um die 4C-Bibliotheken für POU5F1 und SOX2 unabhängig voneinander für die Sequenzierung der nächsten Generation zu konstruieren. Die beiden Replikate der distalen Wechselwirkungen von POU5F1 und SOX2 überlappen sich um 35% bzw. 25%. Dies steht im Einklang mit der moderaten Überlappung, die in biologischen Replikaten von CTCF–vermittelten Chromatin-Interaktomen in Maus-ES-Zellen27 beobachtet wurde, und kann die Vielfalt und Dynamik von Enhancer-Interaktionen, Ligationseffizienz, Komplexität der PCR-Amplifikation sowie Sequenzierungstiefe widerspiegeln. Um Interaktionen herauszufiltern, die wahrscheinlich aus stochastischen Effekten resultierten, verwendeten wir ein False Discovery Rate (FDR) -basiertes statistisches Modell, um die angereicherten interagierenden Domänen im gesamten Genom zu identifizieren. Wir haben die angereicherten wechselwirkenden Domänen, die sich zwischen den biologischen Replikaten überlappen, weiter als hochkonfidente häufige wechselwirkende Domänen zusammengeführt. Insgesamt wurden für die POU5F1- bzw. SOX2-Interaktome 23 bzw. 9 häufig wechselwirkende Domänen mit hoher Konfidenz identifiziert (Abbildung 1, ergänzende Tabelle 3, 4), und die meisten von ihnen sind interchromosomale Wechselwirkungen, die genreiche Regionen betreffen, ähnlich den E4C-Ergebnissen20.
Die Interaktome von POU5F1- und SOX2-Enhancern überlappen sich mit frühen DNA-Replikationsdomänen, jedoch nicht mit heterochromatischen Regionen
Als nächstes untersuchten wir, ob die wechselwirkenden POU5F1- und SOX2-Enhancer-Domänen (Größe von 1 MB bis 4 MB, ergänzende Tabelle 3, 4) einzigartige epigenetische Merkmale aufweisen. Wie Ryba et al. dargestellt28 korreliert der Zeitpunkt der DNA-Replikation mit der räumlichen Nähe des Chromatins, gemessen durch Hi-C-Analyse, was darauf hindeutet, dass die frühe und späte DNA-Replikation in räumlich unterschiedlichen Kompartimenten im Zellkern stattfindet. Wir haben festgestellt, dass sich die POU5F1- und SOX2-Genorte in frühen DNA-Replikationsdomänen in hESCs befinden, und uns gefragt, ob ihre interagierenden Domänen einen ähnlichen DNA-Replikationszeitpunkt haben. Wie in Abbildung 2A gezeigt, überlappen sich die wechselwirkenden POU5F1- und SOX2-Enhancer-Domänen hauptsächlich mit frühen DNA-Replikationsdomänen in hESCs. Die Verteilung der untersuchten Replikationszeitpunktwerte innerhalb der genomischen Regionen, die die identifizierten POU5F1- und SOX2-Enhancer-Interaktionsstellen umgeben (50 kb-Bereich), zeigt eine Verschiebung in Richtung positiver Werte im Vergleich zu genomweiten Array-Werten (P < 2.2 × 10-16 für beide durch ungepaarten Wilcoxon-Rangsummentest; Abbildung 2B). Diese Beobachtung ergab ein interessantes epigenetisches Merkmal, dass Strukturen höherer Ordnung, die die POU5F1- und SOX2-Enhancer umgeben, ein synchrones DNA-Replikations-Timing aufweisen. Da frühe DNA-Replikationsdomänen mit aktiver Gentranskription in hESCs28 verbunden wurden, ist es wahrscheinlich, dass die Wechselwirkungen von POU5F1- und SOX2-Enhancern mit den identifizierten distalen Regionen funktionelle Bedeutung haben. Diese Beobachtung stimmt mit dem überein, was wir im POU5F1-Enhancer-Interaktom in Maus-ES-Zellen gesehen haben (Daten nicht gezeigt). 2A , POU5F1 und SOX2 wechselwirkende Domänen überlappen sich nicht mit heterochromatischen Regionen, die mit starken H3K9ME3-Signalen in hESCs29 markiert sind, was darauf hindeutet, dass sich die Interaktome in Bezug auf die Genregulation innerhalb eines aktiven Teils des Genoms befinden. Darüber hinaus untersuchten wir eine mögliche Beziehung zu den nuklearen lamina-assoziierten Domänen (LADs) menschlicher Chromosomen30, beobachteten jedoch keinen Zusammenhang, möglicherweise aufgrund der Tatsache, dass die LADs in menschlichen Fibroblasten bestimmt wurden.
Die Enhancer-Interaktome grenzen an Transkriptionsstartstellen an und besitzen aktive epigenetische Merkmale
Um die Korrelation von POU5F1- und SOX2-Enhancer-Interaktomen mit annotierten Genorten zu untersuchen, analysierten wir die Verteilung der genomischen Entfernung der Enhancer-Interaktionsstellen zur nächstgelegenen Gentranskriptionsstartstelle (TSS) ( Abbildung 3A). Die Kerndichte-Plots der beiden POU5F1- und SOX2-Enhancer-Interaktionsstellen zeigen deutlich einen scharfen Peak, der bei TSS zentriert ist. Im Vergleich zum Verteilungspeak zufällig simulierter Stellen im gesamten Genom sind die in den Enhancer-Interaktomen beobachteten Peaks innerhalb eines engen Fensters um TSS signifikant höher (P = 0,0018 bzw. P = 0,0047, Kolmogorov-Smirnov-Test). Die Anreicherung der interagierenden Stellen um TSS herum legt nahe, dass POU5F1- und SOX2-Enhancer die Interaktion mit genomischen Regionen, die Gene enthalten, bevorzugen. Wir untersuchten weiter die Verteilung von POU5F1- und SOX2-Enhancer-Interaktionsstellen in verschiedenen genomischen Regionen31. In Abbildung 3B sind Genpromotorsequenzen eine der angereicherten Regionen sowohl für die POU5F1- als auch für die SOX2-Enhancer-Interaktome. Zusätzlich wird der Anteil distaler intergener Regionen für die beiden Interaktome konsequent reduziert. Unsere Beobachtung legt daher nahe, dass die Chromosomenstruktur höherer Ordnung, die die aktiven Enhancer umgibt, direkt an der Genregulation beteiligt sein kann. Wenn zufällige Stellen in den frühen DNA-Replikationsbereichen (siehe Methoden für Details) ausgewählt werden, um die Entfernungsverteilung mit TSS zu vergleichen, sind die POU5F1- und SOX2-Interaktome um TSS herum noch stärker angereichert, obwohl statistisch nicht signifikant (P = 0,390, 1 P = 0,2098, Kolmogorov-Smirnov-Test, Ergänzende Abb. 2 ).
Es ist bekannt, dass die Histonmodifikation an der Transkriptionsregulation beteiligt ist, indem kompakte Chromatinstrukturen für die Transkriptionsfaktorbindung dekondensiert werden. 3C-basierte genomweite Interaktomstudien haben aktive und inaktive Chromatinkompartimente im Zellkern identifiziert, wobei aktive Kompartimente mit Histonmarkierungen angereichert sind, die die Gentranskription wie H3K9ac32 aktivieren. Wir fragten daher, ob aktive Enhancer von POU5F1 und SOX2 selektiv mit distalen Regionen interagieren, die eine aktive Gentranskription zeigen. ChIP-Seq-Tag-Profile von H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 und H3K36ME3 in der H1 ES-Zelllinie33 wurden zur Analyse von Histonmustern verwendet, die mit den Interaktomen assoziiert sind. ChIP-Seq-Tags um die Enhancer-Interaktionsstellen wurden gezählt und normalisiert34 und als Boxplot visualisiert. Wie bereits erwähnt, haben POU5F1- und SOX2-Interaktome höhere Intensitätsprofile von H3K4me1, H3K4me2 und H4K20me1, die Markierungen für die genaktive Regulation sind ( Abbildung 4A ). Im Vergleich zu den zufälligen Stellen in frühen DNA-Replikationsbereichen sind die untersuchten Histonmarken im POU5F1-Interaktom im Allgemeinen stärker angereichert als im SOX2-Interaktom, wobei H3K4me1 und H3K9ac die am deutlichsten angereicherten im POU5F1-Interaktom sind (P < 2.2 × 10-16 für beide Marken, ungepaarter Wilcoxon-Rangsummentest). Interessanterweise ist die Polycomb-vermittelte Gen-Silencing-Marke H3K36me335 in keinem der beiden Interaktome angereichert (P = 0,485 bzw. P = 0,922). Wir untersuchten auch die Beziehung von POU5F1- und SOX2-Enhancer-Interaktomen mit 5-Hydroxymethylcytosin (5-hmC) -Stellen im Genom. Wie eine frühere Studie ergab, sind genomische 5-hmC-Stellen an aktiven Enhancern in hESCs36 angereichert. Da POU5F1- und SOX2-Upstream-Enhancer an 5-hmC-Stellen (innerhalb von 5 kb) angrenzen, fragten wir, ob die Enhancer-Interaktome auch mit 5-hmC-Stellen angereichert sind. In Abbildung 4B sind 5-hmC-Stellen in der Nähe von POU5F1- und SOX2-Interaktomen im Vergleich zu den zufälligen Stellen in frühen DNA-Replikationsbereichen angereichert (P < 2,2 × 10-16, P = 0,047, Kolmogorov-Smirnov-Test). Somit besitzen die beiden Enhancer-Interaktome in hESCs epigenetische Merkmale aktiver Enhancer, die eine aktive Regulation der Gentranskription erleichtern können.
Transkriptionsstatus von POU5F1- und SOX2–Enhancer-assoziierten Genen
Um den Transkriptionsstatus von Genen zu verstehen, die mit POU5F1- und SOX2-Enhancern assoziiert sind, analysierten wir RNA-Seq-Transkriptomdaten in hESCs und fötalen Lungenfibroblasten37, wobei wir uns auf Gene konzentrierten, die ein TSS innerhalb von 10 kb des enhancer-interagierende Websites. In hESCs ist die Expression von POU5F1– und SOX2-Enhancer-interagierenden Genen signifikant höher als die aller Gene in hESCs (P = 7,5 × 10-6 und P = 1.2 × 10-6 jeweils durch ungepaarten Wilcoxon-Rangsummentest; Abbildung 5A), was darauf hinweist, dass die Interaktome mit aktiv transkribierten Genen angereichert sind. Somit könnten aktive CYP5F1- und SOX2-Enhancer an der Vermittlung der Transkription der assoziierten distalen Gene beteiligt sein. Die RNA-Seq-Transkriptomanalyse ergab auch, dass die Gene, die ursprünglich mit aktiven POU5F1- und SOX2-Enhancern in hESCs assoziiert waren, in differenzierten Lungenfibroblasten herunterreguliert sind (P = 1,2 × 10-5 bzw. P = 0,013 durch gepaarten Wilcoxon-Rangsummentest; Abbildung 5B). Diese Ergebnisse deuten darauf hin, dass die Enhancer dieser beiden stammzellbezogenen Gene mit einer Gruppe von Genen interagieren, die in hESCs stark exprimiert, aber in Fibroblasten unterdrückt werden.
Distale Gene, die mit dem POU5F1–Enhancer assoziiert sind, sind an der regulatorischen Schaltung der Pluripotenz beteiligt
Um zu untersuchen, ob POU5F1- und SOX2-Enhancer-interagierende Gene zur Selbsterneuerung und Pluripotenz von hESCs beitragen, analysierten wir Daten aus einem genomweiten RNA-Interferenzbildschirm unter Verwendung eines POU5F1-Promotor-Reporter-Assays in hESCs38. Die Interferenz der transgenen POU5F1-GFP-Expression wird mit Fav-Werten quantifiziert, die die GFP-Fluoreszenzintensität widerspiegeln, die die Neigung darstellt, stammbezogen zu sein ( Abbildung 6A ). Im Vergleich zu allen untersuchten Genen zeigen POU5F1–Enhancer-wechselwirkende Gene (Gene, die den wechselwirkenden Stellen am nächsten liegen, mit einem genomischen Abstand von TSS zu den wechselwirkenden Stellen von weniger als 10 kb) einen Trend abnehmender Fav-Werte, wenn auch statistisch nicht signifikant (P = 0,08, ungepaarter Wilcoxon-Rangsummentest). Für SOX2-Targeting-Gene sind die Fav-Werte jedoch allen gescreenten Genen ähnlich (P = 0.98, ungepaarter Wilcoxon-Rangsummentest). Basierend auf diesen Daten scheinen daher Gene im POU5F1-Interaktom für die Pluripotenz von Stammzellen wichtiger zu sein als Gene im SOX2-Interaktom.
Genontologische Analyse39 von 39 POU5F1-interagierenden Genen und 20 SOX2–interagierenden Genen ergab, dass ein signifikanter Teil von ihnen an der Transkriptionsregulation beteiligt ist (30,8% und 35,0% für die Interaktome POU5F1 bzw. SOX2; Ergänzende Tabelle 5, 6) und verteilt auf 8 und 4 verschiedene wechselwirkende Domänen in den POU5F1- bzw. SOX2-Interaktomen mit nicht mehr als 3 Genen in einer wechselwirkenden Domäne. Die differentielle Expressionsanalyse dieser Transkriptionsregulatoren in hESCs und fetalen Lungenfibroblasten ergab, dass 9 von denen im POU5F1-Interaktom (11 von 12 identifizierten Transkriptionsregulatoren haben RNA-Seq-Daten) eine höhere Expression in hESCs aufweisen (Abbildung 6B), was auf eine aktive Rolle dieser Gene im Pluripotenzregulationsnetzwerk in hESCs hindeutet. Für diese Transkriptionsregulatoren im SOX2-Interaktom zeigten 3 von 5 eine erhöhte Expression in hESCs. Daher kann das POU5F1-Enhancer-Interaktom eine größere Rolle bei der Pluripotenz von Stammzellen spielen als das SOX2-Enhancer-Interaktom.
Mehrere Transkriptionsfaktor–Bindungsstellen sind mit POU5F1– und SOX2-Enhancer-Interaktomen angereichert
Die Transkriptionsfaktor-Bindung ist eine der Eigenschaften, die Enhancer besitzen, und sie kann Langstrecken-Chromatin-Chromatin-Interaktionen des Enhancers mit distalen Genen erleichtern. POU5F1 und SOX2 mutmaßliche Enhancer sind bekannte Hotspots für die Assoziation mehrerer DNA-Bindungsproteine in hESCs. Um zu verstehen, ob bestimmte Transkriptionsfaktoren in POU5F1– und SOX2-Enhancer-wechselwirkenden Regionen angereichert sind, analysierten wir systematisch ChIP-Seq-Profile von 32 DNA-Bindungsproteinen in hESCs (siehe Methoden). Normalisierte ChIP-Seq-Tag-Zählungen um die Mitte der 4C-Interaktionsstellen wurden berechnet und mit Boxplot visualisiert (Abbildung 7A). Als Kontrolle wurden auch die Zählungen um das Zentrum der zufälligen Stellen in den frühen DNA-Replikationsbereichen berechnet. Statistische Analysen ergaben, dass ATF3-, CTCF-, GABPA-, JUND-, NANOG-, RAD21- und YY1-Stellen die am stärksten angereicherten Proteine in beiden Enhancer-Interaktomen im Vergleich zur Kontrolle waren (P < 0.01, ungepaarter Wilcox Rank-Sum-Test). Der pluripotenzbezogene Transkriptionsfaktor OCT4 ist jedoch weder im POU5F1- noch im SOX2-Interaktom angereichert. Daher sind ATF3, CTCF, GABPA, JUND, NANOG, RAD21 und YY1 die charakteristischen Proteine in POU5F1- und SOX2-Enhancer-Interaktomen in hESCs, und ihre Anwesenheit kann funktionell wichtig sein.
RAD21 steht möglicherweise in Verbindung mit anderen Transkriptionsfaktoren, um die Enhancer-Interaktome zu vermitteln
Wie in Abbildung 7A gezeigt, ist RAD21 eines der angereicherten Proteine, die in POU5F1- und SOX2-Enhancer-Interaktomen in hESCs identifiziert wurden. RAD21 ist Teil eines Kohäsionskomplexes, der als DNA-Kettenvernetzer bekannt ist. Es wurde gezeigt, dass Cohesin das Looping des distalen Enhancers Pou5f1 mit dem Genpromotor Pou5f1 in Maus-ES-Zellen vermittelt40. In Übereinstimmung mit einem früheren Bericht, dass Rad21 mit Ctcf und anderen Transkriptionsfaktoren bei der Aufrechterhaltung der ES-Zellidentität von Mäuse40 zusammenarbeitet, sind RAD21-Stellen sowohl in POU5F1- als auch in SOX2-Interaktomen in hESCs von Transkriptionsfaktoren gemeinsam besetzt. Aggregationsdiagramme veranschaulichen deutlich die Peaksignale von ATF3-, CTCF-, GABPA-, JUND-, NANOG- und YY1-Bindungsprofilen im Zentrum von RAD21-Stellen in POU5F1- und SOX2-Interaktomen ( Abbildung 7B ). Es ist bekannt, dass der Knockdown von Gabpa in Maus-ES-Zellen die Oct3 / 4-Expression verringert, während die Überexpression von Gabpa die Expression von Oct3 / 4 auch ohne LIF in Maus-ES-Zellkultur aufrechterhält41. In einem genomweiten siRNA-Bildschirm in hESCs38 reduzierte der Knockdown der meisten angereicherten Proteine wie RAD21, CTCF, GABPA, JUND, NANOG und YY1 die Expression eines transgenen POU5F1-Promotors, der an einen GFP-Reporter gebunden war, signifikant mit Fav-Werten von -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, jeweils (innerhalb der oberen 25% aller untersuchten Gene). Um die Chromatin-Chromatin-Wechselwirkungen weiter zu verstehen, haben wir die DNA-Fluoreszenz-In-situ-Hybridisierung (FISH) angewendet, um die Kolokalisierung von zwei genomischen Loci auf Einzelzellebene zu visualisieren. Der RARG-Genlocus auf Chromosom 12 wurde im POU5F1-Interaktom in hESCs identifiziert. Es wurde kürzlich gezeigt, dass RARG eine sehr wichtige Rolle bei der Pluripotenz spielt und die Induktion von iPS-Zellen um zwei Größen verbessern42. Ein anderer Locus auf Chromosom 12, der nicht Teil des POU5F1-Interaktoms ist, wurde als Kontrolle verwendet. Die Kolokalisierungsfrequenz zwischen dem RARG-Locus (chr12: 51751589-51956291) und der POU5F1-Locus (chr6: 31169844-31340561) war 1,67-fach höher als die Frequenz zwischen dem Kontrolllocus (chr12: 80380971-80564119) und dem POU5F1-Locus (9,35% versus 5,61%, P < 0,05, Ergänzende Abb. 3A ). Die höhere Kontaktfrequenz zwischen den RARG- und POU5F1-Loci stimmt mit unseren Sequenzierungsdaten überein und deutet darauf hin, dass stabilere Wechselwirkungen zwischen den beiden Loci gebildet werden. Untersuchung der RARG- und Kontrollloci ( Ergänzende Abb. 3B) zeigten, dass es mehr RAD21- und andere Transkriptionsfaktor-Bindungsstellen im RARG-Locus mit häufiger Kolokalisierung gibt. Die Übereinstimmung der Chromosomeninteraktionshäufigkeit mit RAD21-haltigen Bindungsstellen für mehrere Transkriptionsfaktoren legt nahe, dass RAD21 mit anderen Transkriptionsfaktoren zusammenarbeiten kann, um langreichweitige Chromatin-Chromatin-Wechselwirkungen zu organisieren. So trägt RAD21 zusammen mit mehreren Transkriptionsfaktoren wahrscheinlich zur chromosomalen Struktur höherer Ordnung bei, die POU5F1- und SOX2-Enhancer in hESCs als Teil eines Pluripotenznetzwerks umgibt. Es sind jedoch zusätzliche molekulare Studien erforderlich, um diese aus der 4C-Seq-Studie abgeleitete Hypothese zu bestätigen.