Identificación de los interacomas potenciadores POU5F1 y SOX2
Las regiones potenciadoras putativas POU5F1 y SOX2 se conservan evolutivamente en vertebrados (44 especies), con firmas potenciadoras activas definidas por marcas epigenéticas como p300 histona acetiltransferasa y H3K27ac pero no H3K27me3 en hESCs7 ( Suplemento Fig. 1A). Aplicamos la técnica 4C para identificar a los socios interactuantes de los potenciadores putativos «cebo» de POU5F1 y SOX2 en la línea celular pluripotente H9. En pocas palabras, las células se fijaron a cromosomas de reticulación cercanos. Los cromosomas se fragmentaron por sonicación. Se ligaron fragmentos de cromatina que interactuaban y se purificaron las piezas de ADN. Las regiones genómicas que interactuaban con el» cebo » se amplificaron mediante PCR anidada (Suplemento Fig. 1B, Cuadro Complementario 1). Diseñamos cebadores de PCR inversos para apuntar a potenciadores putativos de los genes POU5F1 y SOX2. La biblioteca 4C construida se pudo visualizar mediante electroforesis de ADN, mientras que el control sin ligadura casi no mostró productos de PCR (Suplemento Fig. 1B), indicando que la biblioteca 4C fue amplificada a partir de productos de ligadura.
Realizamos secuenciación de ADN de próxima generación utilizando un secuenciador Illumina HiSeq y clasificamos las interacciones 4C identificadas como interacciones proximales o distales (ver Métodos). Las interacciones distales incluyen interacciones entre cromosomas e interacciones intracromosómicas a distancias genómicas mayores de 20 kb, mientras que las interacciones proximales cubren regiones intracromosómicas con distancias genómicas entre 300 bp y 20 kb. De acuerdo con los resultados de los estudios basados en 3C, nuestras lecturas de interacción distal representan solo una pequeña porción de las interacciones totales, aproximadamente 10% ~ 20% para las bibliotecas 4C ( Tabla Suplementaria 2 ). Utilizamos dos lotes diferentes de celdas H9 para construir las bibliotecas 4C para POU5F1 y SOX2 de forma independiente para la secuenciación de próxima generación. Las dos réplicas de interacciones distales POU5F1 y SOX2 se superponen en un 35% y un 25%, respectivamente. Esto es consistente con la superposición moderada observada en réplicas biológicas de interacomas de cromatina mediados por CTCF en células ES de ratón27 y puede reflejar la diversidad y la dinámica de las interacciones de potenciadores, la eficiencia de la ligadura, la complejidad de la amplificación de la PCR y la profundidad de secuenciación. Para filtrar las interacciones que probablemente resultaron de efectos estocásticos, utilizamos un modelo estadístico basado en la tasa de descubrimiento falso (FDR) para identificar los dominios de interacción enriquecidos en todo el genoma. Además, fusionamos los dominios de interacción enriquecidos que se superponen entre las réplicas biológicas como dominios de interacción frecuente de alta confianza. En total, se identificaron 23 y 9 dominios de interacción frecuente de alta confianza para los interacomas POU5F1 y SOX2, respectivamente (Figura 1, Tabla Suplementaria 3, 4 ) y la mayoría de ellos son interacciones cromosómicas que involucran regiones ricas en genes, similares a los resultados de E4C20.
Los interacomas de los potenciadores POU5F1 y SOX2 se superponen con los dominios de replicación temprana del ADN, pero no con regiones heterocromáticas
A continuación, examinamos si los dominios que interactúan con los potenciadores POU5F1 y SOX2 (tamaño que varía de 1 Mb a 4 Mb, Tabla Suplementaria 3, 4 ) tienen características epigenéticas únicas. Como Ryba et al. mostrado28, el tiempo de replicación del ADN se correlaciona con la proximidad espacial de la cromatina medida por el análisis Hi-C, lo que sugiere que la replicación temprana y tardía del ADN ocurre en compartimentos espacialmente distintos en el núcleo. Nos dimos cuenta de que los loci de los genes POU5F1 y SOX2 se encuentran dentro de los dominios de replicación temprana del ADN en hESCs y nos preguntamos si sus dominios interactivos tienen un tiempo de replicación del ADN similar. Como se muestra en la Figura 2A, los dominios que interactúan con el potenciador POU5F1 y SOX2 se superponen principalmente con los dominios de replicación temprana del ADN en los hESCs. La distribución de los valores de tiempo de replicación ensayados dentro de las regiones genómicas que rodean los sitios identificados de interacción con potenciadores POU5F1 y SOX2 (rango de 50 kb) muestra un cambio hacia valores positivos en comparación con los valores de matriz amplia del genoma (P < 2.2 × 10-16 para ambos, mediante prueba de suma de rangos de Wilcoxon no emparejada; Figura 2B). Esta observación reveló una característica epigenética interesante, que las estructuras de orden superior que rodean a los potenciadores POU5F1 y SOX2 tienen un tiempo de replicación de ADN sincronizado. Como los dominios de replicación de ADN tempranos se han conectado a la transcripción activa de genes en hESCs28, es probable que las interacciones de los potenciadores POU5F1 y SOX2 con las regiones distales identificadas tengan importancia funcional. Esta observación es consistente con lo que hemos visto en el interactoma potenciador POU5F1 en células ES de ratón (datos no mostrados). También se revela en la Figura 2A, los dominios de interacción POU5F1 y SOX2 no se superponen con regiones heterocromáticas marcadas con señales H3K9me3 fuertes en hESCs29, lo que sugiere que los interacomas están dentro de una porción activa del genoma en términos de regulación génica. Además, exploramos una relación potencial con los dominios asociados a la lámina nuclear (LADs) de los cromosomas humanos30, pero no observamos ninguna conexión, posiblemente debido al hecho de que los LADs se determinaron en fibroblastos humanos.
Los interacomas potenciadores son adyacentes a los sitios de inicio de transcripción y poseen características epigenéticas activas
Para explorar la correlación de los interacomas potenciadores POU5F1 y SOX2 con ubicaciones de genes anotadas, analizamos la distribución de la distancia genómica de los sitios de interacción potenciadores al sitio de inicio de 3A). Las gráficas de densidad del núcleo de los sitios que interactúan con potenciadores POU5F1 y SOX2 muestran claramente un pico agudo centrado en TSS. En comparación con el pico de distribución de sitios simulados aleatoriamente en todo el genoma, los picos observados en los interacomas potenciadores son significativamente más altos dentro de una ventana estrecha alrededor del TSS (P = 0.0018, P = 0.0047, respectivamente, prueba de Kolmogorov-Smirnov). El enriquecimiento de los sitios que interactúan alrededor del TSS sugiere que los potenciadores POU5F1 y SOX2 prefieren interactuar con regiones genómicas que contienen genes. Investigamos más a fondo la distribución de sitios que interactúan con potenciadores POU5F1 y SOX2 en diferentes regiones genómicas31. Como se muestra en la Figura 3B, las secuencias promotoras de genes son una de las regiones enriquecidas para los interacomas potenciadores POU5F1 y SOX2. Además, la fracción de regiones intergénicas distales se reduce consistentemente para los dos interacomas. Por lo tanto, nuestra observación sugiere que la estructura cromosómica de orden superior que rodea a los potenciadores activos puede estar directamente involucrada en la regulación génica. También se observa que cuando se seleccionan sitios aleatorios en las áreas de replicación temprana del ADN (ver Métodos para detalles) para comparar la distribución de distancia con el SST, los interacomas POU5F1 y SOX2 están aún más enriquecidos alrededor del SST, aunque estadísticamente no significativos (P = 0.390,1 P = 0.2098, respectivamente, prueba de Kolmogorov-Smirnov, Suplemento Fig. 2 ).