- a Identificação de POU5F1 e SOX2 enhancer interactomes
- O interactomes de POU5F1 e SOX2 potenciadores de sobreposição com o início da replicação do DNA domínios, mas não com heterochromatic regiões
- O enhancer interactomes são adjacentes a transcrição iniciar sites e possuem ativos epigenética possui
- Transcricional de estado de POU5F1 e SOX2 potenciador de interação genes
- Distal genes associados com a POU5F1 enhancer estão envolvidas na regulamentação circuitos de pluripotency
- vários locais de ligação do factor de transcrição são enriquecidos em POU5F1 e os interactomas do potenciador SOX2
- RAD21 é, potencialmente, em um complexo com outros fatores de transcrição para mediar o enhancer interactomes
a Identificação de POU5F1 e SOX2 enhancer interactomes
O putativo POU5F1 e SOX2 enhancer regiões são evolutiva conservadas em vertebrados (44 espécies), com o intensificador de assinaturas definido por marcas epigenéticas, como p300 histona acetyltransferase e H3K27ac mas não H3K27me3 em hESCs7 ( Complementar Fig. 1A). Aplicamos a técnica 4C para identificar os parceiros interagindo dos potenciadores putativos “isca” do POU5F1 e SOX2 na linha celular H9 pluripotente. Brevemente,as células foram fixadas para cruzar cromossomas na proximidade. Os cromossomas foram então fragmentados por sonicação. Fragmentos de cromatina interagindo foram ligados e as peças de DNA foram purificadas. As regiões genômicas interagindo com o” isco ” foram então amplificadas pela PCR aninhada (Fig. suplementar. 1b, quadro suplementar 1). Nós projetamos iniciadores de PCR inversos para atingir potenciadores putativos dos genes POU5F1 e SOX2. A biblioteca 4C construída poderia ser visualizada pela eletroforese do DNA, enquanto o Controle Sem ligação mostrava quase nenhum produto PCR (Fig suplementar. 1B ), indicando que a biblioteca 4C foi amplificada a partir de produtos de ligação.
realizamos sequenciação de DNA de próxima geração usando um sequenciador Illumina HiSeq e classificamos as interações 4C identificadas como interações proximais ou distais (ver Métodos). As interações distais incluem inter-cromossômicas e inter-cromossômicas em distâncias genômicas superiores a 20 kb, enquanto interações proximais cobrem regiões intra-cromossômicas com distâncias genômicas entre 300 bp e 20 kb. Consistente com os resultados de estudos baseados em 3C, nossa interação distal explica apenas uma pequena parte das interações totais, cerca de 10% ~ 20% para as bibliotecas 4C ( tabela suplementar 2 ). Nós usamos dois lotes diferentes de células H9 para construir as bibliotecas 4C para POU5F1 e SOX2 de forma independente para sequenciamento de próxima geração. As duas réplicas das interacções distais POU5F1 e SOX2 sobrepõem-se em 35% e 25%, respectivamente. Isto é consistente com a sobreposição moderada observada em réplicas biológicas de interactomas cromatínicos mediados por CTCF em células ES27 do rato e pode refletir a diversidade e dinâmica das interações potenciadoras, eficiência de ligação, complexidade da amplificação PCR, bem como profundidade de sequenciação. Para filtrar interações que provavelmente resultaram de efeitos estocásticos, usamos um modelo estatístico baseado em falsa taxa de descoberta (FDR) para identificar os domínios de interação enriquecidos em todo o genoma. Fundiu-se ainda mais os domínios de interação enriquecidos que se sobrepõem entre as réplicas biológicas como sendo domínios de interação freqüentes de alta confiança. No total, 23 e 9 domínios de interação frequente de alta confiança foram identificados para os interactomas POU5F1 e SOX2, respectivamente ( Figura 1 , Tabela suplementar 3, 4 ) e a maioria deles são inter-cromossomas que envolvem regiões ricas em genes, semelhantes aos resultados e4c20.
O interactomes de POU5F1 e SOX2 potenciadores de sobreposição com o início da replicação do DNA domínios, mas não com heterochromatic regiões
Nós seguinte, examinar-se se o POU5F1 e SOX2 potenciador de interagir domínios (tamanho que varia desde 1 Mb, 4 Mb, Quadro Suplementar 3, 4 ) tem nenhum exclusivo epigenéticos recursos. Como Ryba et al. showed28, DNA replication timing correlates with the spatial proximity of chromatin as measured by Hi-C analysis, suggesting that early and late DNA replication occur in spatially distinct compartments in the nucleus. Notamos que os loci de genes POU5F1 e SOX2 estão dentro dos primeiros domínios de replicação de DNA em hESCs e nos perguntamos se seus domínios interagindo têm um tempo similar de replicação de DNA. Como mostrado na figura 2A, os domínios de interação enhancer POU5F1 e SOX2 sobrepõem-se principalmente com os primeiros domínios de replicação de DNA em hESCs. A distribuição de valores de tempo de replicação assayed dentro das regiões genômicas em torno dos locais identificados de interação com potenciador POU5F1 e SOX2 (intervalo de 50 kb) mostra uma mudança para valores positivos em comparação com os valores de matriz genômica ampla (P < 2.2 × 10-16 para ambos, por teste Wilcoxon rank-sum não emparelhado; figura 2B). Esta observação revelou uma característica epigenética interessante, que estruturas de ordem superior em torno dos potenciadores POU5F1 e SOX2 têm sincronizado o tempo de replicação do DNA. Como os primeiros domínios de replicação de ADN foram ligados à transcrição genética activa em hESCs28, é provável que as interacções dos potenciadores POU5F1 e SOX2 com as regiões distais identificadas tenham significado funcional. Esta observação é consistente com o que vimos no interactoma potenciador POU5F1 em células ES do rato (os dados não são mostrados). Também revelado na figura 2A, os domínios de interação POU5F1 e SOX2 não se sobrepõem com regiões heterocromáticas rotuladas com fortes sinais H3K9me3 em hESCs29, sugerindo que os interactomas estão dentro de uma porção ativa do genoma em termos de regulação genética. Além disso, exploramos uma relação potencial com os domínios associados à lâmina nuclear (LADs) dos cromossomas humanos 30, mas não observamos qualquer conexão, possivelmente devido ao fato de que os rapazes foram determinados em fibroblastos humanos.
O enhancer interactomes são adjacentes a transcrição iniciar sites e possuem ativos epigenética possui
Para explorar a correlação de POU5F1 e SOX2 enhancer interactomes com anotada gene locais, analisamos a distribuição de genômica distância do intensificador de interagir sites para o próximo gene transcrição local de início (TSS) ( Figura 3A ). Os gráficos de densidade de kernel de ambos POU5F1 e sox2 enhancer–interacting sites claramente mostram um pico nítido centrado em TSS. Quando comparado com a distribuição de pico da aleatoriamente simulado sites em todo o genoma, os picos observados no enhancer interactomes são significativamente mais elevados dentro de uma janela estreita, em torno de TSS (P = 0.0018, P = 0.0047, respectivamente, o teste de Kolmogorov-Smirnov). O enriquecimento dos locais de interacção em torno da TSS sugere que os potenciadores POU5F1 e SOX2 preferem interagir com as regiões genómicas que contêm genes. Investigámos ainda a distribuição do POU5F1 e dos locais de interacção enhancer SOX2 em diferentes regiões genómicas 31. Mostrados na figura 3B , as sequências de promotores de genes são uma das regiões enriquecidas para os interactomas potenciadores POU5F1 e SOX2. Além disso, a fração das regiões intergênicas distais é consistentemente reduzida para os dois interactomas. Portanto, a nossa observação sugere que a estrutura cromossómica de maior ordem em torno dos potenciadores activos pode estar directamente envolvida na regulação genética. Também observou, quando sites aleatórios no início da replicação do DNA áreas (ver Métodos para detalhes) são selecionados para comparar a distribuição de distância para TSS, o POU5F1 e SOX2 interactomes são ainda mais enriquecidas em torno de TSS, apesar de estatisticamente não significativa (P = 0.390,1 P = 0.2098, respectivamente, o teste de Kolmogorov-Smirnov, Complementar Fig. 2 ).
Histona modificação é conhecido por estar envolvido na regulação transcricional por decondensing compacto cromatina estruturas para o fator de transcrição ligação. 3C-Base de todo o genoma interactome estudos têm identificado ativo e inativo da cromatina compartimentos no núcleo, com o compartimentos enriquecido com histona marcas que ativar o gene de transcrição, tais como H3K9ac32. Portanto, perguntamos se os potenciadores ativos do POU5F1 e SOX2 interagem seletivamente com regiões distais mostrando transcrição genética ativa. Os perfis de marcas ChIP-Seq de H3K27me3, H3K4me1, H3K4me2, H3K27ac, H3K9ac, H4K20me1 e H3K36me3 em H1 ES cell line33 foram usados para analisar os padrões de histonas associados com os interactomas. Chip-Seq tags em torno dos sites de interação do potenciador foram contados e normalizados34 e visualizados como boxplot. Como observado, os interactomas POU5F1 e SOX2 têm perfis de intensidade mais elevada de H3K4me1, H3K4me2 e H4K20me1, que são marcas para a regulação activa dos genes ( figura 4A ). Comparado com os sites aleatórios no início da replicação do DNA áreas, o investigado histona marcas são, em geral, mais enriquecido no POU5F1 interactome que no SOX2 interactome, com H3K4me1 e H3K9ac são os mais significativamente enriquecido queridos POU5F1 interactome (P < 2.2 × 10-16 para ambas as marcas, teste Wilcoxon rank-sum não emparelhado). Curiosamente, a marca de silenciamento do gene mediado por Policomb H3K36me335 não é enriquecida em nenhum dos interactomas (P = 0, 485, P = 0, 922, respectivamente). Também investigamos a relação dos interactomas potenciadores POU5F1 e SOX2 com 5-hidroximetilcitosina (5-hmC) no genoma. Como um estudo anterior revelou, os locais genômicos 5-hmC são enriquecidos em potenciadores ativos em hESCs36. Como o POU5F1 e o SOX2 upstream enhancers são adjacentes a sites de 5-hmC (dentro de 5 kb), nós perguntamos se os interactomos potenciadores também são enriquecidos com sites de 5-hmC. Ilustrados na figura 4B, os locais de 5-hmC são enriquecidos na proximidade dos interactomas POU5F1 e SOX2 em comparação com os locais aleatórios em áreas de replicação precoce do ADN (P < 2.2 × 10-16, P = 0.047, respectivamente, teste de Kolmogorov-Smirnov). Assim, os dois interactomas potenciadores em hESCs possuem características epigenéticas de potenciadores ativos, o que pode facilitar a regulação ativa da transcrição genética.
Transcricional de estado de POU5F1 e SOX2 potenciador de interação genes
Para compreender o estado de transcrição de genes associados com POU5F1 e SOX2 potenciadores, analisamos RNA-Seq transcriptoma de dados em hESCs e pulmonar fetal fibroblasts37, com foco em genes que têm um TSS, no prazo de 10 kb de potenciador de interagir sites. Em hESCs, a expressão de genes que interagem potenciadores POU5F1 e SOX2 é significativamente maior do que a de todos os genes em hESCs (P = 7.5 × 10-6 e P = 1.2 × 10-6, respectivamente, por teste unpaired Wilcoxon rank-sum; figura 5A ), indicando que os interactomas são enriquecidos com genes transcritos ativamente. Assim, Active POU5F1 and SOX2 enhancers could be involved in mediating transcription of the associated distal genes. A análise RNA-Seq transcriptome também revelou que os genes originalmente associados com Active POU5F1 e sox2 enhancers em hESCs são pouco regulamentados em fibroblastos pulmonares diferenciados (P = 1.2 × 10-5 E P = 0.013, respectivamente, pelo teste emparelhado Wilcoxon rank-sum; figura 5B ). Estes resultados indicam que os potenciadores destes dois genes relacionados com a stemness interagem com um grupo de genes que é altamente expresso em hESCs, mas reprimido em fibroblastos.
Distal genes associados com a POU5F1 enhancer estão envolvidas na regulamentação circuitos de pluripotency
Para explorar se POU5F1 e SOX2 potenciador de interação genes contribuem para a auto-renovação e pluripotency de hESCs, foram analisados dados de um todo o genoma de RNA de interferência de tela usando uma POU5F1 promotor repórter ensaio em hESCs38. A interferência da expressão de POU5F1-GFP transgênica é quantificada com valores Fav refletindo a intensidade de fluorescência GFP, que representa a propensão a estar relacionada com o estado do tronco (figura 6A ). Em comparação com todos os genes rastreados, os genes potenciadores–interagindo POU5F1 (genes mais próximos dos locais interagindo, com distância genômica de TSS para os locais interagindo menos de 10 kb) mostram uma tendência de diminuição dos valores Fav, embora estatisticamente não significantes (P = 0.08, teste unpaired Wilcoxon rank-sum). No entanto, para os genes de alvo SOX2, os valores Fav são semelhantes a todos os genes rastreados (P = 0.98, unpaired Wilcoxon rank-sum test). Portanto, com base nestes dados, os genes no interactoma POU5F1 parecem ser mais importantes para a pluripotência das células estaminais do que os genes no interactoma SOX2.
Gene ontology analysis39 de 39 POU5F1–interação de genes e 20 SOX2–interação genes revelou que uma parcela significativa deles para ser envolvido na regulação transcricional (30,8% e de 35,0% para o POU5F1 e SOX2 interactomes, respectivamente; Tabela suplementar 5, 6 ) e distribuídos para 8 e 4 diferentes domínios interagindo nos interactomas POU5F1 e SOX2, respectivamente, com não mais de 3 genes em um domínio interagindo. Expressão diferencial análise transcricional reguladores de hESCs e pulmonar fetal fibroblastos revelado 9 de a POU5F1 interactome (11 de 12 identificado reguladores de transcrição de RNA-Seq) os dados têm maior expressão no hESCs ( Figura 6B ), sugerindo um papel activo para esses genes no pluripotency de regulamentação da rede no hESCs. Para esses reguladores transcritionais no interactoma de SOX2, 3 de 5 mostraram expressão aumentada em hESCs. Portanto, o interactoma potenciador POU5F1 pode desempenhar um papel maior na pluripotência das células estaminais do que o interactoma potenciador SOX2.
vários locais de ligação do factor de transcrição são enriquecidos em POU5F1 e os interactomas do potenciador SOX2
a ligação do factor de transcrição é uma das características que os potenciadores possuem e pode facilitar as interacções cromatina–cromatina de longo alcance do potenciador com genes distais. Os potenciadores putativos POU5F1 e SOX2 são pontos quentes conhecidos para a associação de múltiplas proteínas de ligação do DNA em hESCs. Para entender se certos fatores de transcrição são enriquecidos em regiões de interação realçador POU5F1 e SOX2, analisamos sistematicamente perfis ChIP-Seq de 32 proteínas de ligação ao DNA em hESCs (ver Métodos). As contagens normalizadas de chips-Seq em torno do centro dos sites de interação 4C foram calculadas e visualizadas usando boxplot ( figura 7A ). Como um controle, as contagens em torno do centro dos locais aleatórios nas primeiras áreas de replicação de DNA também foram calculadas. A análise estatística identificou ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 sites foram mais enriquecido com proteínas em ambos os enhancer interactomes em relação ao controle (P < 0.01, sem par Wilcox rank-sum test). Contudo, o factor de transcrição OCT4 relacionado com a pluripotência não é enriquecido nem no INTERACTOMA POU5F1 nem no interactoma SOX2. Portanto, ATF3, CTCF, GABPA, JUND, NANOG, RAD21 e YY1 são característicos de proteínas em POU5F1 e SOX2 enhancer interactomes em hESCs, e a sua presença pode ser funcionalmente importantes.
RAD21 é, potencialmente, em um complexo com outros fatores de transcrição para mediar o enhancer interactomes
Como mostrado na Figura 7A , RAD21 é um dos enriquecido com proteínas identificadas em POU5F1 e SOX2 enhancer interactomes em hESCs. RAD21 é parte de um complexo de coesão conhecido como uma cadeia de DNA crosslinker. Coesina demonstrou mediar o lacete do potenciador distal Pou5f1 com o promotor do gene Pou5f1 nas células ES40 do Ratinho. Consistente com um relatório anterior que o Rad21 coopera com o Ctcf e outros factores de transcrição na manutenção da identidade da célula de Es do rato 40, os sítios de RAD21 em ambos os interactomas do POU5F1 e SOX2 no hESCs são co-ocupados por factores de transcrição. Os gráficos de agregação ilustram claramente os sinais de pico dos interactomas ATF3, CTCF, GABPA, JUND, NANOG e YY1 no centro de rad21 em POU5F1 e SOX2 ( figura 7B ). Knockdown of Gabpa in mouse ES cells is known to reduce Oct3 / 4 expression, whereas overexpression of Gabpa maintains expression of Oct3 / 4 even without LIF in mouse ES cell culture41. Em todo o genoma de siRNA tela em hESCs38, queda da maioria dos enriquecido com proteínas, tais como RAD21, CTCF, GABPA, JUND, NANOG e YY1, reduziu significativamente a expressão de um transgênico POU5F1-promotor ligado a um repórter GFP, com Fav valores de -1.50421, -1.05828, -1.44161, -1.07731, -1.82749, -2.57204, respectivamente (dentro dos 25% de todos os genes selecionados). Para compreender melhor as interações cromatina-cromatina, aplicamos hibridização in situ de DNA fluorescente (FISH) para visualizar a co-localização de dois loci genômicos no nível de uma única célula. O locus genético RARG no cromossoma 12 foi identificado no interactoma POU5F1 no hESCs. RARG foi recentemente mostrado para desempenhar um papel muito importante na pluripotência e pode aumentar a indução de células iPS por duas magnitudes 42. Outro locus no cromossomo 12 que não faz parte do interactoma POU5F1 foi usado como um controle. A frequência de co-localização entre o locus RARG (chr12: 51751589-51956291) e o POU5F1 locus (chr6: 31169844-31340561) foi encontrado para ser de 1,67 vezes maior do que a frequência entre o locus de controle (chr12: 80380971-80564119) e o POU5F1 locus (9.35% versus 5.61%, P < 0.05, Complementar Fig. 3A). A maior frequência de contato entre o RARG e o POU5F1 loci é consistente com os nossos dados de sequenciação e sugere que interações mais estáveis são formadas entre os dois loci. Análise da RARG e dos loci de controlo (Fig. complementar. 3B) revelou que há mais rad21 e outros sites de ligação de fator de transcrição no local RARG com co-localização frequente. Coincidência da frequência de interacção cromossómica com locais de ligação contendo RAD21 para múltiplos factores de transcrição sugere que RAD21 pode cooperar com outros factores de transcrição para organizar interacções cromatinas-cromatinas de longo alcance. Assim, RAD21, juntamente com vários fatores de transcrição, é provável que contribua para a estrutura cromossômica de maior ordem em torno de POU5F1 e realçadores de SOX2 em hESCs como parte de uma rede de pluripotência. No entanto, são necessários estudos moleculares adicionais para confirmar esta hipótese derivada do estudo 4C-Seq.