Los interacomas de los potenciadores POU5F1 y SOX2 en células madre embrionarias humanas

Identificación de los interacomas potenciadores POU5F1 y SOX2

Las regiones potenciadoras putativas POU5F1 y SOX2 se conservan evolutivamente en vertebrados (44 especies), con firmas potenciadoras activas definidas por marcas epigenéticas como p300 histona acetiltransferasa y H3K27ac pero no H3K27me3 en hESCs7 ( Suplemento Fig. 1A). Aplicamos la técnica 4C para identificar a los socios interactuantes de los potenciadores putativos «cebo» de POU5F1 y SOX2 en la línea celular pluripotente H9. En pocas palabras, las células se fijaron a cromosomas de reticulación cercanos. Los cromosomas se fragmentaron por sonicación. Se ligaron fragmentos de cromatina que interactuaban y se purificaron las piezas de ADN. Las regiones genómicas que interactuaban con el» cebo » se amplificaron mediante PCR anidada (Suplemento Fig. 1B, Cuadro Complementario 1). Diseñamos cebadores de PCR inversos para apuntar a potenciadores putativos de los genes POU5F1 y SOX2. La biblioteca 4C construida se pudo visualizar mediante electroforesis de ADN, mientras que el control sin ligadura casi no mostró productos de PCR (Suplemento Fig. 1B), indicando que la biblioteca 4C fue amplificada a partir de productos de ligadura.

Realizamos secuenciación de ADN de próxima generación utilizando un secuenciador Illumina HiSeq y clasificamos las interacciones 4C identificadas como interacciones proximales o distales (ver Métodos). Las interacciones distales incluyen interacciones entre cromosomas e interacciones intracromosómicas a distancias genómicas mayores de 20 kb, mientras que las interacciones proximales cubren regiones intracromosómicas con distancias genómicas entre 300 bp y 20 kb. De acuerdo con los resultados de los estudios basados en 3C, nuestras lecturas de interacción distal representan solo una pequeña porción de las interacciones totales, aproximadamente 10% ~ 20% para las bibliotecas 4C ( Tabla Suplementaria 2 ). Utilizamos dos lotes diferentes de celdas H9 para construir las bibliotecas 4C para POU5F1 y SOX2 de forma independiente para la secuenciación de próxima generación. Las dos réplicas de interacciones distales POU5F1 y SOX2 se superponen en un 35% y un 25%, respectivamente. Esto es consistente con la superposición moderada observada en réplicas biológicas de interacomas de cromatina mediados por CTCF en células ES de ratón27 y puede reflejar la diversidad y la dinámica de las interacciones de potenciadores, la eficiencia de la ligadura, la complejidad de la amplificación de la PCR y la profundidad de secuenciación. Para filtrar las interacciones que probablemente resultaron de efectos estocásticos, utilizamos un modelo estadístico basado en la tasa de descubrimiento falso (FDR) para identificar los dominios de interacción enriquecidos en todo el genoma. Además, fusionamos los dominios de interacción enriquecidos que se superponen entre las réplicas biológicas como dominios de interacción frecuente de alta confianza. En total, se identificaron 23 y 9 dominios de interacción frecuente de alta confianza para los interacomas POU5F1 y SOX2, respectivamente (Figura 1, Tabla Suplementaria 3, 4 ) y la mayoría de ellos son interacciones cromosómicas que involucran regiones ricas en genes, similares a los resultados de E4C20.

Figura 1
figura 1.

Circos mapas de la porción distal de las interacciones se presentan con los Circos software52.

El anillo exterior azul representa el perfil de densidad génica.

Los interacomas de los potenciadores POU5F1 y SOX2 se superponen con los dominios de replicación temprana del ADN, pero no con regiones heterocromáticas

A continuación, examinamos si los dominios que interactúan con los potenciadores POU5F1 y SOX2 (tamaño que varía de 1 Mb a 4 Mb, Tabla Suplementaria 3, 4 ) tienen características epigenéticas únicas. Como Ryba et al. mostrado28, el tiempo de replicación del ADN se correlaciona con la proximidad espacial de la cromatina medida por el análisis Hi-C, lo que sugiere que la replicación temprana y tardía del ADN ocurre en compartimentos espacialmente distintos en el núcleo. Nos dimos cuenta de que los loci de los genes POU5F1 y SOX2 se encuentran dentro de los dominios de replicación temprana del ADN en hESCs y nos preguntamos si sus dominios interactivos tienen un tiempo de replicación del ADN similar. Como se muestra en la Figura 2A, los dominios que interactúan con el potenciador POU5F1 y SOX2 se superponen principalmente con los dominios de replicación temprana del ADN en los hESCs. La distribución de los valores de tiempo de replicación ensayados dentro de las regiones genómicas que rodean los sitios identificados de interacción con potenciadores POU5F1 y SOX2 (rango de 50 kb) muestra un cambio hacia valores positivos en comparación con los valores de matriz amplia del genoma (P < 2.2 × 10-16 para ambos, mediante prueba de suma de rangos de Wilcoxon no emparejada; Figura 2B). Esta observación reveló una característica epigenética interesante, que las estructuras de orden superior que rodean a los potenciadores POU5F1 y SOX2 tienen un tiempo de replicación de ADN sincronizado. Como los dominios de replicación de ADN tempranos se han conectado a la transcripción activa de genes en hESCs28, es probable que las interacciones de los potenciadores POU5F1 y SOX2 con las regiones distales identificadas tengan importancia funcional. Esta observación es consistente con lo que hemos visto en el interactoma potenciador POU5F1 en células ES de ratón (datos no mostrados). También se revela en la Figura 2A, los dominios de interacción POU5F1 y SOX2 no se superponen con regiones heterocromáticas marcadas con señales H3K9me3 fuertes en hESCs29, lo que sugiere que los interacomas están dentro de una porción activa del genoma en términos de regulación génica. Además, exploramos una relación potencial con los dominios asociados a la lámina nuclear (LADs) de los cromosomas humanos30, pero no observamos ninguna conexión, posiblemente debido al hecho de que los LADs se determinaron en fibroblastos humanos.

Figura 2
figura2

la Relación de la interactomes con la replicación del ADN dominios y regiones heterocromáticas.

Los sitios que interactúan dentro de los dominios que interactúan con frecuencia se presentan en (2A) (solo se muestran Chr1 y Chr2). (2B), Comparación de los valores de la matriz de distribución del tiempo de replicación del ADN (RT) para las regiones dentro de ±50 kb de los sitios que interactúan con todo el genoma.

Los interacomas potenciadores son adyacentes a los sitios de inicio de transcripción y poseen características epigenéticas activas

Para explorar la correlación de los interacomas potenciadores POU5F1 y SOX2 con ubicaciones de genes anotadas, analizamos la distribución de la distancia genómica de los sitios de interacción potenciadores al sitio de inicio de 3A). Las gráficas de densidad del núcleo de los sitios que interactúan con potenciadores POU5F1 y SOX2 muestran claramente un pico agudo centrado en TSS. En comparación con el pico de distribución de sitios simulados aleatoriamente en todo el genoma, los picos observados en los interacomas potenciadores son significativamente más altos dentro de una ventana estrecha alrededor del TSS (P = 0.0018, P = 0.0047, respectivamente, prueba de Kolmogorov-Smirnov). El enriquecimiento de los sitios que interactúan alrededor del TSS sugiere que los potenciadores POU5F1 y SOX2 prefieren interactuar con regiones genómicas que contienen genes. Investigamos más a fondo la distribución de sitios que interactúan con potenciadores POU5F1 y SOX2 en diferentes regiones genómicas31. Como se muestra en la Figura 3B, las secuencias promotoras de genes son una de las regiones enriquecidas para los interacomas potenciadores POU5F1 y SOX2. Además, la fracción de regiones intergénicas distales se reduce consistentemente para los dos interacomas. Por lo tanto, nuestra observación sugiere que la estructura cromosómica de orden superior que rodea a los potenciadores activos puede estar directamente involucrada en la regulación génica. También se observa que cuando se seleccionan sitios aleatorios en las áreas de replicación temprana del ADN (ver Métodos para detalles) para comparar la distribución de distancia con el SST, los interacomas POU5F1 y SOX2 están aún más enriquecidos alrededor del SST, aunque estadísticamente no significativos (P = 0.390,1 P = 0.2098, respectivamente, prueba de Kolmogorov-Smirnov, Suplemento Fig. 2 ).

Figura 3
figura 3

(A) Estimación de la densidad del núcleo de la distancia genómica desde los sitios que interactúan hasta los sitios TSS más cercanos. Las distancias se calcularon utilizando el software HOMER34. También se incluyen mapas de densidad de 100.000 sitios aleatorios en todo el genoma. B) Análisis de enriquecimiento de los interacomas en diferentes regiones genéticas. El análisis de distribución se realizó utilizando el software CEAS 31.

Se sabe que la modificación de histonas está involucrada en la regulación transcripcional al descondensar estructuras de cromatina compactas para la unión de factores de transcripción. Los estudios de interacomas de todo el genoma basados en 3C han identificado compartimentos de cromatina activos e inactivos en el núcleo, con compartimentos activos enriquecidos con marcas de histonas que activan la transcripción de genes, como H3K9ac32. Por lo tanto, nos preguntamos si los potenciadores activos de POU5F1 y SOX2 interactúan selectivamente con regiones distales que muestran transcripción génica activa. Los perfiles de etiquetas ChIP-Seq de H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 y H3K36me3 en la línea de células ES H133 se utilizaron para analizar los patrones de histonas asociados con los interacomas. Se contaron y normalizaron las etiquetas ChIP-Seq alrededor de los sitios que interactuaban con el potenciador34 y se visualizaron como diagrama de caja. Como se ha señalado, los interacomas POU5F1 y SOX2 tienen perfiles de mayor intensidad de H3K4me1, H3K4me2 y H4K20me1, que son marcas para la regulación activa de genes ( Figura 4A ). En comparación con los sitios aleatorios en las áreas de replicación temprana del ADN, las marcas de histonas investigadas están en general más enriquecidas en el interactoma POU5F1 que en el interactoma SOX2, con H3K4me1 y H3K9ac los más significativamente enriquecidos en el interactoma POU5F1 (P < 2.2 × 10-16 para ambas marcas, prueba de suma de rango de Wilcoxon no emparejada). Curiosamente, la marca de silenciamiento génico mediada por Polycomb H3K36me335 no está enriquecida en ninguno de los dos interactomas (P = 0,485, P = 0,922, respectivamente). También investigamos la relación de los interacomas potenciadores POU5F1 y SOX2 con los sitios de 5-hidroximetilcitosina (5-hmC) en el genoma. Como reveló un estudio anterior, los sitios genómicos 5-hmC están enriquecidos con potenciadores activos en los hESCs36. Debido a que los potenciadores de flujo ascendente POU5F1 y SOX2 están adyacentes a los sitios 5-hmC (dentro de 5 kb), preguntamos si los interacomas de potenciadores también están enriquecidos con sitios 5-hmC. Como se muestra en la Figura 4B, los sitios 5-hmC se enriquecen en la proximidad de los interacomas POU5F1 y SOX2 en comparación con los sitios aleatorios en las áreas de replicación temprana del ADN (P < 2,2 × 10-16, P = 0,047, respectivamente, prueba de Kolmogorov-Smirnov). Por lo tanto, los dos interacomas potenciadores en hESCs poseen características epigenéticas de potenciadores activos, que pueden facilitar la regulación activa de la transcripción de genes.

Figura 4
figura 4

(A) Boxplot de las diferentes marcas de histonas alrededor de la interacción de los sitios y de sitios al azar. Las etiquetas ChIP-Seq dentro de ±5 kb de un sitio que interactúa se contaron y normalizaron. B) Se comparó la distribución a distancia de los sitios que interactuaban y los sitios aleatorios con el sitio 5-hmC más cercano. se generaron 100.000 sitios aleatorios a partir de las primeras áreas de replicación del ADN para su comparación.

Figura 5
figura 5

(A) Comparación de los valores de RPKM para los genes que interactúan (genes con un TSS ≤ 10 kb de los sitios que interactúan) con todos los genes del Ensembl humano (se utilizaron valores promedio de RPKM de los datos de RNA-Seq replicados en ENCODE). B) Se analizó la expresión diferencial para comparar los genes del interactoma en las ESCH y los fibroblastos pulmonares fetales.

Estado transcripcional de los genes que interactúan con potenciadores POU5F1 y SOX2

Para comprender el estado transcripcional de los genes asociados con potenciadores POU5F1 y SOX2, analizamos los datos del transcriptoma de RNA-Seq en HESC y fibroblastos pulmonares fetales37, centrándose 10 kb de los sitios que interactúan con el potenciador. En los HESC, la expresión de genes que interactúan con potenciadores POU5F1 y SOX2 es significativamente mayor que la de todos los genes en los HESC (P = 7,5 × 10-6 y P = 1.2 × 10-6, respectivamente, por prueba de suma de rangos de Wilcoxon no emparejada; Figura 5A), lo que indica que los interacomas están enriquecidos con genes transcritos activamente. Por lo tanto, los potenciadores activos de POU5F1 y SOX2 podrían estar involucrados en la mediación de la transcripción de los genes distales asociados. El análisis del transcriptoma de ARN-Seq también reveló que los genes originalmente asociados con potenciadores activos de POU5F1 y SOX2 en hESCs están regulados a la baja en fibroblastos pulmonares diferenciados (P = 1,2 × 10-5 y P = 0,013, respectivamente, mediante la prueba de suma de rango de Wilcoxon pareada; Figura 5B ). Estos resultados indican que los potenciadores de estos dos genes relacionados con el tallo interactúan con un grupo de genes altamente expresados en hESCs pero reprimidos en fibroblastos.

Los genes distales asociados con el potenciador POU5F1 están involucrados en el circuito regulador de pluripotencia

Para explorar si los genes que interactúan con el potenciador POU5F1 y SOX2 contribuyen a la autorrenovación y pluripotencia de los hESCs, analizamos datos de una pantalla de interferencia de ARN en todo el genoma utilizando un ensayo de reportero promotor POU5F1 en hESCs38. La interferencia de la expresión transgénica de POU5F1-GFP se cuantifica con valores Fav que reflejan la intensidad de fluorescencia de GFP, lo que representa la propensión a estar relacionada con el tallo ( Figura 6A ). En comparación con todos los genes examinados, los genes que interactúan con potenciadores de POU5F1 (genes más cercanos a los sitios que interactúan, con una distancia genómica de TSS a los sitios que interactúan de menos de 10 kb) muestran una tendencia de valores Fav decrecientes, aunque estadísticamente no significativos (P = 0,08, prueba de suma de rangos de Wilcoxon no emparejada). Sin embargo, para los genes dirigidos a SOX2, los valores Fav son similares a todos los genes examinados (P = 0.98, prueba de suma de rango de Wilcoxon no emparejada). Por lo tanto, en base a estos datos, los genes en el interactoma POU5F1 parecen ser más importantes para la pluripotencia de las células madre que los genes en el interacoma SOX2.

Figura 6
figura 6

(A) Correlación del interactoma de los genes de pluripotencia. Los genes que interactúan examinados en un ensayo de ARNip utilizando el gen reportero POU5F1-GFP en hESCs se incluyeron para su análisis. La distribución de los valores Fav (cambio de fluorescencia) de los genes que interactúan se compara con los 21122 genes examinados en el ensayo original. B) Análisis de la expresión diferencial de reguladores transcripcionales identificados en hESCs y fibroblastos pulmonares fetales.

El análisis de ontología génica39 de 39 genes que interactúan con POU5F1 y 20 genes que interactúan con SOX2 reveló que una parte significativa de ellos está involucrada en la regulación transcripcional (30,8% y 35,0% para los interacomas POU5F1 y SOX2, respectivamente; Tablas suplementarias 5, 6) y distribuidas a 8 y 4 dominios interactuantes diferentes en los interacomas POU5F1 y SOX2, respectivamente, con no más de 3 genes en un dominio interactuante. El análisis de expresión diferencial de estos reguladores transcripcionales en HESC y fibroblastos pulmonares fetales reveló que 9 de los del interactoma POU5F1 (11 de los 12 reguladores transcripcionales identificados tienen datos ARN-Seq) tenían una mayor expresión en hESC ( Figura 6B ), lo que sugiere roles activos para estos genes en la red reguladora de pluripotencia en hESC. Para aquellos reguladores transcripcionales en el interactoma SOX2, 3 de 5 mostraron una mayor expresión en los hESCs. Por lo tanto, el interacoma potenciador POU5F1 puede desempeñar un papel más importante en la pluripotencia de células madre que el interacoma potenciador SOX2.

Varios sitios de unión de factores de transcripción están enriquecidos en interacomas potenciadores POU5F1 y SOX2

La unión de factores de transcripción es una de las características que poseen los potenciadores y puede facilitar las interacciones cromatina–cromatina de largo alcance del potenciador con genes distales. Los potenciadores putativos POU5F1 y SOX2 son puntos calientes conocidos por la asociación de múltiples proteínas de unión al ADN en hESCs. Para entender si ciertos factores de transcripción están enriquecidos en regiones que interactúan con potenciadores POU5F1 y SOX2, analizamos sistemáticamente los perfiles ChIP-Seq de 32 proteínas de unión al ADN en hESCs (ver Métodos). Los recuentos normalizados de etiquetas ChIP-Seq alrededor del centro de los sitios de interacción 4C se calcularon y visualizaron utilizando un diagrama de caja (Figura 7A ). Como control, también se calcularon los recuentos alrededor del centro de los sitios aleatorios en las áreas de replicación temprana del ADN. El análisis estadístico identificó que los sitios ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 fueron las proteínas más enriquecidas en ambos interacomas potenciadores en comparación con el control (P < 0.01, prueba de suma de rango de Wilcox no emparejada). Sin embargo, el factor de transcripción relacionado con pluripotencia OCT4 no está enriquecido en el interactoma POU5F1 o SOX2. Por lo tanto, ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 son las proteínas características en los interacomas potenciadores POU5F1 y SOX2 en las ESCH y su presencia puede ser funcionalmente importante.

Figura 7
figura 7

(A) Cuadros de diferentes proteínas de unión al ADN alrededor de los sitios que interactúan con el potenciador y los sitios aleatorios (de las áreas de replicación temprana del ADN). Las etiquetas ChIP-Seq dentro de ±5 kb de un sitio que interactúa se contaron y normalizaron. B) RAD21 se co-localiza con otros factores de transcripción en los interacomas. Los perfiles de intensidad media alrededor de los sitios de pico de RAD21 en los interacomas POU5F1 y SOX2 en los hESCs se trazan para los factores de transcripción ATF3, CTCF, GABPA, JUND, NANOG y YY1.

La RAD21 es potencialmente compleja con otros factores de transcripción para mediar los interacomas potenciadores

Como se muestra en la Figura 7A , la RAD21 es una de las proteínas enriquecidas identificadas en los interacomas potenciadores POU5F1 y SOX2 en los HESC. RAD21 es parte de un complejo de cohesión conocido como reticulador de cadena de ADN. Se ha demostrado que la cohesina media el bucle del potenciador distal Pou5f1 con el promotor del gen Pou5f1 en células ES de ratón 40. En consonancia con un informe anterior de que Rad21 coopera con Ctcf y otros factores de transcripción en el mantenimiento de células madre EMBRIONARIAS de ratón identity40, RAD21 sitios en tanto POU5F1 y SOX2 interactomes en hESCs son co-ocupado por factores de transcripción. Las gráficas de agregación ilustran claramente las señales de pico de los perfiles de unión ATF3, CTCF, GABPA, JUND, NANOG y YY1 en el centro de los sitios RAD21 en los interacomas POU5F1 y SOX2 ( Figura 7B ). Se sabe que el derribo de Gabpa en células ES de ratón reduce la expresión de Oct3/4, mientras que la sobreexpresión de Gabpa mantiene la expresión de Oct3/4 incluso sin LIF en la cultura de células ES de ratón 41. En un análisis de siRNA de todo el genoma en hESCs38, el derribo de la mayoría de las proteínas enriquecidas, como RAD21, CTCF, GABPA, JUND, NANOG e YY1, redujo significativamente la expresión de un promotor de POU5F1 transgénico vinculado a un reportero de GFP, con valores Fav de -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, respectivamente (dentro del 25% superior de todos los genes examinados). Para comprender mejor las interacciones cromatina–cromatina, aplicamos hibridación fluorescente in situ de ADN (FISH) para visualizar la co-localización de dos loci genómicos a nivel de una sola célula. El locus del gen RARG en el cromosoma 12 se ha identificado en el interactoma POU5F1 en las ESCH. Recientemente se ha demostrado que RARG desempeña un papel muy importante en la pluripotencia y puede mejorar la inducción de células iPS en dos magnitudes 42. Se utilizó como control otro locus en el cromosoma 12 que no forma parte del interactoma POU5F1. Frecuencia de co-localización entre el locus RARG (chr12: 51751589-51956291) y el locus POU5F1 (chr6: 31169844-31340561) se encontró que era 1,67 veces mayor que la frecuencia entre el locus de control (chr12: 80380971-80564119) y el locus POU5F1 (9,35% versus 5,61%, P < 0,05, Fig.suplementaria 3A). La mayor frecuencia de contacto entre los loci RARG y POU5F1 es consistente con nuestros datos de secuenciación y sugiere que se forman interacciones más estables entre los dos loci. Examen de los loci RARG y de control (Suplemento Fig. 3B) reveló que hay más RAD21 y otros sitios de unión de factores de transcripción en el locus RARG con co-localización frecuente. La coincidencia de la frecuencia de interacción cromosómica con los sitios de unión que contienen RAD21 para múltiples factores de transcripción sugiere que RAD21 puede cooperar con otros factores de transcripción para organizar interacciones cromatina-cromatina de largo alcance. Por lo tanto, es probable que RAD21, junto con múltiples factores de transcripción, contribuya a la estructura cromosómica de orden superior que rodea a los potenciadores POU5F1 y SOX2 en los ESCH como parte de una red de pluripotencia. Sin embargo, se necesitan estudios moleculares adicionales para confirmar esta hipótesis derivada del estudio 4C-Seq.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.