Il interactomes di POU5F1 e SOX2 esaltatori in cellule staminali embrionali umane

Identificazione di POU5F1 e SOX2 enhancer interactomes

putativo POU5F1 e SOX2 enhancer regioni evolutivo conservato tra i vertebrati (44 specie), con l’enhancer firme definito da marchi epigenetici come p300 istone acetiltransferasi e H3K27ac ma non H3K27me3 hESCs7 ( Complementare Fig. 1 BIS). Abbiamo applicato la tecnica 4C per identificare i partner interagenti degli esaltatori putativi “bait” di POU5F1 e SOX2 nella linea cellulare H9 pluripotente. In breve, le cellule sono state fissate ai cromosomi reticolari nelle vicinanze. I cromosomi sono stati poi frammentati dalla sonicazione. I frammenti interagenti della cromatina sono stati ligati ed i pezzi del DNA sono stati purificati. Le regioni genomiche che interagiscono con l ‘”esca” sono state poi amplificate da PCR annidate (Fig. 1B, Tabella supplementare 1). Abbiamo progettato primer per PCR inversi per indirizzare gli stimolatori putativi dei geni POU5F1 e SOX2. La libreria 4C costruita poteva essere visualizzata mediante elettroforesi del DNA, mentre il controllo senza legatura non mostrava quasi prodotti PCR ( Fig. 1B), indicando che la libreria 4C è stata amplificata dai prodotti di legatura.

Abbiamo eseguito il sequenziamento del DNA di nuova generazione utilizzando un sequencer Illumina HiSeq e classificato le interazioni 4C identificate come interazioni prossimali o distali (vedi Metodi). Le interazioni distali comprendono interazioni inter-cromosomiche e interazioni intra-cromosomiche su distanze genomiche superiori a 20 kb, mentre le interazioni prossimali coprono regioni intra-cromosomiche con distanze genomiche comprese tra 300 bp e 20 kb. Coerentemente con i risultati degli studi basati su 3C, le nostre letture di interazione distale rappresentano solo una piccola parte delle interazioni totali, circa il 10% ~ 20% per le librerie 4C ( Tabella supplementare 2 ). Abbiamo utilizzato due diversi lotti di celle H9 per costruire le librerie 4C per POU5F1 e SOX2 in modo indipendente per il sequenziamento di nuova generazione. Le due repliche delle interazioni distali POU5F1 e SOX2 si sovrappongono rispettivamente del 35% e del 25%. Ciò è coerente con la sovrapposizione moderata osservata nelle repliche biologiche degli interattomi di cromatina mediati da CTCF nelle cellule ES di muro27 e può riflettere la diversità e la dinamica delle interazioni del potenziatore, l’efficienza di legatura, la complessità dell’amplificazione della PCR e la profondità di sequenziamento. Per filtrare le interazioni che probabilmente derivavano da effetti stocastici, abbiamo usato un modello statistico basato su false discovery rate (FDR) per identificare i domini interagenti arricchiti in tutto il genoma. Abbiamo inoltre unito i domini interagenti arricchiti che si sovrappongono tra le repliche biologiche come domini interagenti frequenti ad alta fiducia. In totale, sono stati identificati 23 e 9 domini interagenti frequenti ad alta confidenza per gli interattomi POU5F1 e SOX2, rispettivamente (Figura 1 , Tabella supplementare 3, 4 ) e la maggior parte di essi sono interazioni inter-cromosomiche che coinvolgono regioni ricche di geni, simili ai risultati e4c20.

Figura 1
figure1

Le mappe Circos delle interazioni distali sono presentate utilizzando il software circos52.

L’anello esterno blu rappresenta il profilo di densità genica.

Gli interattomi degli enhancer POU5F1 e SOX2 si sovrappongono ai domini di replicazione precoce del DNA ma non alle regioni eterocromatiche

Successivamente abbiamo esaminato se i domini interagenti degli enhancer POU5F1 e SOX2 (dimensioni che vanno da 1 Mb a 4 Mb, Tabella supplementare 3, 4 ) hanno caratteristiche epigenetiche uniche. Come Ryba et al. mostrato28, i tempi di replicazione del DNA sono correlati alla vicinanza spaziale della cromatina misurata mediante analisi Hi-C, suggerendo che la replicazione precoce e tardiva del DNA si verifica in compartimenti spazialmente distinti nel nucleo. Abbiamo notato che i loci del gene POU5F1 e SOX2 si trovano all’interno dei primi domini di replicazione del DNA negli HESC e ci siamo chiesti se i loro domini interagenti abbiano una tempistica di replicazione del DNA simile. Come mostrato nella Figura 2A, i domini interagenti del potenziatore POU5F1 e SOX2 si sovrappongono principalmente ai domini di replicazione del DNA precoce negli HESC. La distribuzione dei valori di temporizzazione di replicazione analizzati all’interno delle regioni genomiche che circondano i siti interagenti con il potenziatore POU5F1 e SOX2 identificati (intervallo di 50 kb) mostra uno spostamento verso valori positivi rispetto ai valori dell’array genome-wide (P < 2.2 × 10-16 per entrambi, da spaiato Wilcoxon rank-sum test; Figura 2B). Questa osservazione ha rivelato un’interessante caratteristica epigenetica, che le strutture di ordine superiore che circondano gli esaltatori POU5F1 e SOX2 hanno sincronizzato i tempi di replicazione del DNA. Poiché i primi domini di replicazione del DNA sono stati collegati alla trascrizione genica attiva in hESCs28, è probabile che le interazioni dei potenziatori POU5F1 e SOX2 con le regioni distali identificate abbiano un significato funzionale. Questa osservazione è coerente con ciò che abbiamo visto in POU5F1 enhancer interactome nelle cellule ES di topo (dati non mostrati). Rivelato anche nella Figura 2A, i domini interagenti POU5F1 e SOX2 non si sovrappongono alle regioni eterocromatiche etichettate con forti segnali H3K9me3 in hESCs29, suggerendo che gli interattomi si trovano all’interno di una porzione attiva del genoma in termini di regolazione genica. Inoltre, abbiamo esplorato una potenziale relazione con i domini associati alla lamina nucleare (LADs) dei cromosomi umani30, ma non abbiamo osservato alcuna connessione, probabilmente dovuta al fatto che i LADs sono stati determinati nei fibroblasti umani.

Figura 2
figure2

Relazione degli interattomi con i domini di replicazione del DNA e le regioni eterocromatiche.

I siti interagenti all’interno dei domini interagenti frequenti sono presentati in (2A) (solo Chr1 e Chr2 sono mostrati). (2B), Confronto della distribuzione dei valori dell’array di replicazione del DNA (RT) per le regioni entro ±50 kb dei siti interagenti con l’intero genoma.

L’enhancer interactomes sono adiacenti a siti di inizio trascrizione e possedere attivo epigenetici caratteristiche

Per esplorare la correlazione di POU5F1 e SOX2 enhancer interactomes con annotata gene posizioni, abbiamo analizzato la distribuzione della genomica distanza del rinforzatore di interagire siti più vicino a gene sito di inizio trascrizione (TSS) ( Figura 3A ). I diagrammi di densità del kernel di entrambi i siti interagenti con i potenziatori POU5F1 e SOX2 mostrano chiaramente un picco acuto centrato su TSS. Rispetto al picco di distribuzione di siti simulati casualmente nell’intero genoma, i picchi osservati negli interattomi enhancer sono significativamente più alti all’interno di una finestra stretta attorno a TSS (P = 0,0018, P = 0,0047, rispettivamente, test di Kolmogorov-Smirnov). L’arricchimento dei siti interagenti attorno a TSS suggerisce che gli esaltatori POU5F1 e SOX2 preferiscono interagire con regioni genomiche contenenti geni. Abbiamo ulteriormente studiato la distribuzione di siti interagenti con potenziatori POU5F1 e SOX2 in diverse regioni genomiche31. Mostrato in Figura 3B, sequenze di promotore genico sono una delle regioni arricchite sia per il POU5F1 e SOX2 enhancer interactomes. Inoltre, la frazione delle regioni intergeniche distali è costantemente ridotta per i due interattomi. Pertanto, la nostra osservazione suggerisce che la struttura cromosomica di ordine superiore che circonda i potenziatori attivi può essere direttamente coinvolta nella regolazione genica. Inoltre, quando i siti casuali nelle prime aree di replicazione del DNA (vedi Metodi per i dettagli) sono selezionati per confrontare la distribuzione a distanza con TSS, gli interattomi POU5F1 e SOX2 sono ancora più arricchiti attorno a TSS, anche se statisticamente non significativi (P = 0.390, 1 P = 0.2098, rispettivamente, Test Kolmogorov-Smirnov, Fig supplementare. 2 ).

Figura 3
figure3

(A) Stima della densità del kernel della distanza genomica dai siti interagenti ai siti TSS più vicini. Le distanze sono state calcolate utilizzando il software HOMER34. Sono incluse anche mappe di densità di 100.000 siti casuali in tutto il genoma. B) Analisi di arricchimento degli interattomi nelle diverse regioni geniche. L’analisi della distribuzione è stata eseguita utilizzando il software CEAS31.

La modifica dell’istone è nota per essere coinvolta nella regolazione trascrizionale decondensando le strutture compatte della cromatina per il legame con il fattore di trascrizione. Gli studi genome-wide interactome basati su 3C hanno identificato i compartimenti attivi e inattivi della cromatina nel nucleo, con i compartimenti attivi arricchiti con i segni dell’istone che attivano la trascrizione del gene, quale H3K9ac32. Abbiamo quindi chiesto se i potenziatori attivi di POU5F1 e SOX2 interagiscono selettivamente con le regioni distali che mostrano la trascrizione genica attiva. I profili di tag chip-Seq di H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 e H3K36me3 in H1 ES cell line33 sono stati utilizzati per analizzare i modelli di istoni associati agli interattomi. Tag chip-Seq intorno ai siti interagenti enhancer sono stati contati e normalizzati34 e visualizzati come boxplot. Come notato, gli interattomi POU5F1 e SOX2 hanno profili di intensità più elevata di H3K4me1, H3K4me2 e H4K20me1, che sono marchi per la regolazione attiva del gene ( Figura 4A ). Rispetto ai siti casuali nelle prime aree di replicazione del DNA, i segni degli istoni studiati sono in generale più arricchiti nell’interattoma POU5F1 che nell’interattoma SOX2, con H3K4me1 e H3K9ac sono i più significativamente arricchiti nell’interattoma POU5F1 (P < 2.2 × 10-16 per entrambi i marchi, spaiato Wilcoxon rank-sum test). È interessante notare che il marchio di silenziamento genico mediato da Polycomb H3K36me335 non è arricchito in entrambi gli interattomi (P = 0,485, P = 0,922, rispettivamente). Abbiamo anche studiato la relazione tra gli interattomi POU5F1 e SOX2 enhancer con i siti 5-idrossimetilcitosina (5-hmC) nel genoma. Come un precedente studio ha rivelato, i siti genomici 5-hmC sono arricchiti con potenziatori attivi in hESCs36. Poiché gli enhancer upstream POU5F1 e SOX2 sono adiacenti ai siti 5-hmC (entro 5 kb), abbiamo chiesto se gli interattomi enhancer sono anche arricchiti con siti 5-hmC. Mostrato nella figura 4B, i siti 5-hmC sono arricchiti in prossimità degli interattomi POU5F1 e SOX2 rispetto ai siti casuali nelle prime aree di replicazione del DNA(P < 2.2 × 10-16, P = 0.047, rispettivamente, test di Kolmogorov-Smirnov). Pertanto, i due interattomi enhancer in hESCs possiedono caratteristiche epigenetiche di enhancers attivi, che possono facilitare la regolazione attiva della trascrizione genica.

Figura 4
figure4

(A) Boxplot di diversi segni istonici intorno ai siti interagenti e siti casuali. Tag chip-Seq entro ±5 kb da un sito interagente sono stati contati e normalizzati. (B) La distribuzione a distanza dei siti interagenti e dei siti casuali al sito 5-hmC più vicino è stata confrontata. 100.000 siti casuali sono stati generati dalle prime aree di replicazione del DNA per il confronto.

Figura 5
figure5

(A) Confronto di RPKM valori per l’interazione geni (geni con un TSS ≤ 10 kb dalla interazione dei siti), con tutte le umane Ensembl geni (media RPKM valori da replicare dati di RNA-Seq nel CODIFICARE sono stati utilizzati). (B) L’espressione differenziale è stata analizzata per confrontare i geni interactome in hESCs e fibroblasti polmonari fetali.

Stato trascrizionale dei geni interagenti con enhancer POU5F1 e SOX2

Per comprendere lo stato trascrizionale dei geni associati con enhancer POU5F1 e SOX2, abbiamo analizzato i dati del trascrittoma RNA-Seq in hESCs e fibroblasti polmonari fetali37, concentrandosi su geni che hanno 10 kb dei siti che interagiscono con enhancer. In hESCs, espressione di POU5F1 e SOX2 enhancer-interagenti geni è significativamente superiore a quella di tutti i geni in hESCs (P = 7,5 × 10-6 e P = 1.2 × 10-6, rispettivamente, dal test di Wilcoxon rank-sum spaiato; Figura 5A), indicando che gli interattomi sono arricchiti con geni trascritti attivamente. Pertanto, gli enhancer attivi POU5F1 e SOX2 potrebbero essere coinvolti nella mediazione della trascrizione dei geni distali associati. L’analisi del trascrittoma RNA-Seq ha anche rivelato che i geni originariamente associati agli enhancer POU5F1 e SOX2 attivi negli HESC sono down-regolati nei fibroblasti polmonari differenziati (P = 1,2 × 10-5 e P = 0,013, rispettivamente, mediante test di Wilcoxon rank-sum accoppiato; Figura 5B ). Questi risultati indicano che i potenziatori di questi due geni correlati allo stelo interagiscono con un gruppo di geni altamente espressi in HESC ma repressi nei fibroblasti.

I geni distali associati all’enhancer POU5F1 sono coinvolti nei circuiti regolatori della pluripotenza

Per esplorare se i geni interagenti con l’enhancer POU5F1 e SOX2 contribuiscono all’auto-rinnovamento e alla pluripotenza di hESCs, abbiamo analizzato i dati di uno schermo di interferenza RNA a livello genomico utilizzando un saggio POU5F1 promoter reporter in hESCs38. L’interferenza dell’espressione transgenica di POU5F1-GFP è quantificata con i valori di Fav che riflettono l’intensità della fluorescenza di GFP, che rappresenta la propensione ad essere stemness-related (figura 6A). Rispetto a tutti i geni sottoposti a screening, i geni interagenti con enhancer POU5F1 (geni più vicini ai siti interagenti, con distanza genomica da TSS ai siti interagenti inferiore a 10 kb) mostrano un trend di diminuzione dei valori Fav, sebbene statisticamente non significativo (P = 0.08, test di Wilcoxon rank-sum spaiato). Tuttavia, per i geni SOX2-targeting, i valori Fav sono simili a tutti i geni sottoposti a screening (P = 0.98, spaiato Wilcoxon rank-sum test). Pertanto, sulla base di questi dati, i geni nell’interattoma POU5F1 sembrano essere più importanti per la pluripotenza delle cellule staminali rispetto ai geni nell’interattoma SOX2.

Figura 6
figure6

(A) Correlazione dei geni dell’interattoma con la pluripotenza. I geni interagenti sottoposti a screening in un test siRNA utilizzando il gene reporter POU5F1-GFP in hESCs sono stati inclusi per l’analisi. Distribuzione dei valori Fav (cambiamento di fluorescenza) per i geni interagenti sono confrontati con tutti i 21122 geni proiettati nel test originale. (B) Analisi dell’espressione differenziale dei regolatori trascrizionali identificati in hESCs e fibroblasti polmonari fetali.

Gene ontology analysis39 di 39 geni interagenti POU5F1 e 20 geni interagenti SOX2 hanno rivelato che una parte significativa di essi è coinvolta nella regolazione trascrizionale (30,8% e 35,0% per gli interattomi POU5F1 e SOX2, rispettivamente; Tabella supplementare 5, 6) e distribuiti a 8 e 4 diversi domini interagenti negli interattomi POU5F1 e SOX2, rispettivamente, con non più di 3 geni in un dominio interagente. L’analisi dell’espressione differenziale di questi regolatori trascrizionali in hESCs e fibroblasti polmonari fetali ha rivelato che 9 di quelli nell’interattoma POU5F1 (11 dei 12 regolatori trascrizionali identificati hanno dati RNA-Seq) hanno un’espressione più alta in hESCs ( Figura 6B), suggerendo ruoli attivi per questi geni nella rete regolatrice di pluripotenza in hESCs. Per quei regolatori trascrizionali nell’interactome SOX2, 3 di 5 hanno mostrato una maggiore espressione in hESCs. Pertanto, il POU5F1 enhancer interactome può svolgere un ruolo maggiore nella pluripotenza delle cellule staminali rispetto al SOX2 enhancer interactome.

Diversi siti di legame del fattore di trascrizione sono arricchiti negli interattomi del potenziatore POU5F1 e SOX2

Il legame del fattore di trascrizione è una delle caratteristiche che possiedono gli esaltatori e può facilitare le interazioni cromatina–cromatina a lungo raggio del potenziatore con i geni distali. I potenziatori putativi POU5F1 e SOX2 sono noti punti caldi per l’associazione di più proteine leganti il DNA in hESCs. Per capire se alcuni fattori di trascrizione sono arricchiti in regioni POU5F1 e SOX2 enhancer–interagenti, abbiamo analizzato sistematicamente i profili ChIP-Seq di 32 proteine leganti il DNA in hESCs (vedi Metodi). I conteggi di tag CHIP-Seq normalizzati attorno al centro dei siti interagenti 4C sono stati calcolati e visualizzati utilizzando boxplot (Figura 7A ). Come controllo, sono stati calcolati anche i conteggi attorno al centro dei siti casuali nelle prime aree di replicazione del DNA. L’analisi statistica ha identificato che i siti ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 erano le proteine più arricchite in entrambi gli interattomi enhancer rispetto al controllo (P < 0.01, test di rank-sum Wilcox spaiato). Tuttavia, il fattore di trascrizione relativo a pluripotenza OCT4 non è arricchito in interactome di SOX2 o di POU5F1. Pertanto, ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 sono le proteine caratteristiche in POU5F1 e SOX2 enhancer interactomes in hESCs e la loro presenza può essere funzionalmente importante.

Figura 7
figure7

(A) Scatole di diverse proteine leganti il DNA attorno ai siti interagenti del potenziatore e ai siti casuali (dalle prime aree di replicazione del DNA). Tag chip-Seq entro ±5 kb da un sito interagente sono stati contati e normalizzati. (B) RAD21 co-localizza con altri fattori di trascrizione negli interattomi. I profili medi di intensità intorno ai siti di picco RAD21 negli interattomi POU5F1 e SOX2 in hESCs sono tracciati per i fattori di trascrizione ATF3, CTCF, GABPA, JUND, NANOG e YY1.

RAD21 è potenzialmente in complesso con altri fattori di trascrizione per mediare l’enhancer interactomes

Come mostrato in Figura 7A , RAD21 è uno dei arricchito proteine identificate in POU5F1 e SOX2 enhancer interactomes nelle hesc. RAD21 fa parte di un complesso di coesione noto come reticolato a catena del DNA. La coesina ha dimostrato di mediare il loop del potenziatore distale Pou5f1 con il promotore del gene Pou5f1 nelle cellule ES del muro40. Coerentemente con un precedente rapporto secondo cui Rad21 collabora con Ctcf e altri fattori di trascrizione nel mantenere l’identità delle cellule ES di muro40, i siti RAD21 negli interattomi POU5F1 e SOX2 negli HESC sono co-occupati da fattori di trascrizione. I grafici di aggregazione illustrano chiaramente i segnali di picco dei profili di legame ATF3, CTCF, GABPA, JUND, NANOG e YY1 al centro dei siti RAD21 negli interattomi POU5F1 e SOX2 ( Figura 7B ). L’abbattimento di Gabpa nelle cellule ES del topo è noto per ridurre l’espressione di Oct3/4, mentre la sovraespressione di Gabpa mantiene l’espressione di Oct3/4 anche senza LIF nella cultura delle cellule ES del muro41. In un genome–wide schermo di siRNA in hESCs38, atterramento di più arricchito di proteine, come RAD21, CTCF, GABPA, JUND, NANOG e YY1, ha ridotto significativamente l’espressione di un transgenici POU5F1-promotore collegato a un reporter GFP, con Fav valori di -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, (rispettivamente, entro il 25% di tutti i geni schermato). Per comprendere ulteriormente le interazioni cromatina-cromatina, abbiamo applicato DNA fluorescent in-situ hybridization (FISH) per visualizzare la co-localizzazione di due loci genomici a livello di singola cellula. Il locus del gene RARG sul cromosoma 12 è stato identificato nell’interattoma POU5F1 in hESCs. RARG è stato recentemente dimostrato di svolgere un ruolo molto importante nella pluripotenza e può migliorare l’induzione delle cellule iPS di due grandezze42. Un altro locus sul cromosoma 12 che non fa parte dell’interactome POU5F1 è stato usato come controllo. La frequenza di co-localizzazione tra il locus RARG (chr12: 51751589-51956291) e il locus POU5F1 (chr6: 31169844-31340561) è risultato essere 1,67 volte superiore alla frequenza tra il locus di controllo (chr12: 80380971-80564119) e il locus POU5F1 (9,35% contro 5,61%, P < 0.05, supplementare Fig. 3 BIS). La frequenza di contatto più elevata tra i loci RARG e POU5F1 è coerente con i nostri dati di sequenziamento e suggerisce che si formano interazioni più stabili tra i due loci. Esame del RARG e dei loci di controllo (Fig. 3B) ha rivelato che ci sono più RAD21 e altri siti di legame del fattore di trascrizione nel locus RARG con frequente co-localizzazione. La coincidenza della frequenza di interazione cromosomica con i siti di legame contenenti RAD21 per più fattori di trascrizione suggerisce che RAD21 può cooperare con altri fattori di trascrizione per organizzare interazioni cromatina-cromatina a lungo raggio. Pertanto, RAD21, insieme a più fattori di trascrizione, è probabile che contribuisca alla struttura cromosomica di ordine superiore che circonda i potenziatori POU5F1 e SOX2 in hESCs come parte di una rete di pluripotenza. Tuttavia, sono necessari ulteriori studi molecolari per confermare questa ipotesi derivata dallo studio 4C-Seq.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.