- Analyses statistiques
- Génération d’un génome personnalisé pour BALB/cJ
- L’analyse des pics ChIP-seq
- Formation au modèle TBA
- Quantification de la colinéarité multiple
- Regroupement et fusion de motifs
- Évaluation de la signification des motifs pour le TBA
- Comparaison avec d’autres méthodes
- Prédire les changements de liaison à l’AP-1 après un traitement d’une heure de KLA
- Prédire la liaison spécifique à une souche avec TBA
- Formation au modèle TBA-2
- Protocole ChIP
- Isolement et fragmentation de l’ARN PolyA
- Protocole de préparation de la bibliothèque
- GRO-seq
- Western blot
- Animaux et culture cellulaire
- Production de lentivirus
- Production de CRISPR KO IBMDM
- Résumé des rapports
- Disponibilité du code
Analyses statistiques
Sur la Fig. 1c, les différences d’expression génique ont été testées à l’aide du test T indépendant (degré de liberté = 1, à deux queues) sur deux expériences répliquées (n = 2). Gènes exprimés différentiellement sur la Fig. 1b ont été identifiés en utilisant EdgeR55 avec des paramètres par défaut et en utilisant les seuils FDR <0.05 et changement de pli log2 ≥2. Sur la Fig. 2c, les différences entre chaque groupe (Veh, Partagé et KLA 1 h) ont été examinées à l’aide d’un test T indépendant (degré de liberté = 1, à deux queues); le nombre de loci dans chaque groupe pour chaque monomère est le suivant ATF3 (Veh = 1447, Partagé = 7460, KLA = 6997), Jun (2390, 3751, 3401), JunD (1351, 5976, 6422). Signification pour les motifs de la Fig. 4a a été calculé en utilisant le test du rapport de vraisemblance (degré de liberté = 1) en comparant les prédictions faites par le modèle TBA complet et le modèle TBA perturbé à tous les loci liés dans les macrophages traités par Veh pour Atf3 (n = 23 160), Jun (n = 15 548) et JunD (n = 19 653). Signification pour les motifs de la Fig. 4C a été calculé en utilisant le test du rapport de vraisemblance (degré de liberté = 1) en comparant les prédictions faites par le modèle TBA complet et le modèle TBA perturbé à tous les loci liés par JunD dans GM12878 (n = 7451), H1-hESC (n = 12 931), HepG2 (n = 41 318), K562 (n = 47 477) et SK-N-SH (38 960). Signification pour les motifs de la Fig. 5b, Fig. supplémentaire. 5B, et la Fig. 5C a été calculé à l’aide du test du rapport de vraisemblance (degré de liberté = 1) en comparant les prédictions faites par le modèle TBA complet et le modèle TBA perturbé à tous les loci liés dans les macrophages traités par l’UCK pour Atf3 (n = 36 745), Jun (n = 17 481), JunD (n = 31 641), Fos (n = 24 365), Fosl2 (n = 10 619) et JunB (n = 13 376) . Valeurs de signification pour la Fig. 6f et S6F ont été calculés à l’aide du test F; le nombre de loci analysés pour les monomères dans les macrophages traités par véhicule est ATF3 (n = 4163), Jun (n = 3004) et JunD (n = 4148); le nombre de loci analysés pour les monomères dans les macrophages traités par KLA sont : Atf3 (n = 4577), Jun (n = 3232), JunD (n = 4366), Fos (n = 4477) et JunB (n = 3616).
Génération d’un génome personnalisé pour BALB/cJ
Un génome personnalisé pour BALB/cJ en remplaçant les positions invariantes du génome mm10 par des allèles rapportés par le projet sur les génomes de souris (fichier VCF version 3)43. Pour C57BL/6J, le génome de référence mm10 de l’UCSC genome browser a été utilisé. Pour permettre des comparaisons entre BALB/cJ et C57BL/6J pendant l’analyse, les coordonnées du génome personnalisé pour BALB/cJ ont été décalées pour correspondre aux positions du génome de référence mm10 en utilisant MARGE34. Nous n’avons analysé aucune lecture relevant des suppressions dans BALB/cJ. Les lectures qui se chevauchaient avec une insertion ont été affectées à la dernière position de chevauchement dans la déformation de référence.
L’analyse des pics ChIP-seq
Les lectures de séquençage des expériences ChIP-seq ont été mappées à l’assemblage mm10 du génome de référence de la souris (ou du génome personnalisé BALBc/J) en utilisant la dernière version de Bowtie2 avec des paramètres par défaut56. ChIP-seq lit pour identifier les sites de liaison TF putatifs avec la commande HOMER57 findPeaks (avec parameters-size 200-L 0-C 0-fdr 0.9), en utilisant l’expérience de puce d’entrée correspondant à la condition de traitement. Afin de réduire le nombre de pics de faux positifs, nous avons calculé l’IDR à chaque pic (en utilisant la version 2.0.3 du programme idr) avec le score de crête de HOMER calculé pour chaque expérience reproduite comme entrée à IDR, puis filtré tous les pics qui avaient IDR ≥ 0,0558. Les motifs de novo ont été calculés avec l’HOMÈRE findMotifsGenome.pl commande avec les paramètres par défaut. L’enrichissement des motifs de novo a été calculé en utilisant le findKnownMotifs.pl programme dans HOMER avec les paramètres par défaut.
La quantification des lectures d’expression de l’ARN générées par les expériences RNA-seq a été alignée sur le génome de référence de la souris mm10 (ou le génome personnalisé BALBc/J) à l’aide d’un alignement d’ÉTOILES avec des paramètres par défaut59. Pour quantifier le niveau d’expression de chaque gène, nous avons calculé le RPKM avec les lectures qui se trouvaient dans un exon. Des lectures de séquençage non normalisées ont été utilisées pour identifier des gènes exprimés différentiellement avec EdgeR55; nous avons considéré des gènes avec FDR < 0,05 et un changement d’expression entre deux conditions expérimentales deux fois ou plus exprimées différentiellement. Pour quantifier l’expression des ARN naissants, nous avons annoté nos pics ChIP-seq avec le nombre de lectures GRO-seq (normalisées à 10 millions) qui se trouvaient à moins de 500 bps du centre du pic en utilisant l’HOMER annotatePeaks.pl commande.
Formation au modèle TBA
Pour chaque monomère AP-1 dans chaque condition de traitement, nous avons formé un modèle pour distinguer les sites de liaison pour chaque monomère à partir d’un ensemble de loci génomiques sélectionnés au hasard. L’ensemble des loci d’arrière-plan aléatoires utilisés pour entraîner chaque modèle a été sélectionné selon les critères suivants : (1) la distribution de la teneur en GC des loci d’arrière-plan correspond à la teneur en GC des sites de liaison pour un monomère donné, (2) ne contient aucune position ambiguë ou non applicable, et (3) le nombre de séquences d’arrière-plan correspond au nombre de sites de liaison k. Pour chacune des séquences de l’ensemble combiné des sites de liaison et des loci d’arrière-plan, nous avons calculé le score de cotes log le plus élevé (également appelé score de motif) pour chacun des n motifs qui seront inclus dans le modèle60 Correspondances de motifs dans les deux orientations ont été prises en compte. Les scores Log-odds inférieurs à 0 ont été fixés à 0. Selon les procédures de prétraitement standard avant de former un modèle linéaire, nous avons normalisé les scores de cotes log pour chaque motif, en mettant à l’échelle l’ensemble des scores pour chaque motif de sorte que la valeur moyenne soit 0 et la variance soit 1. La normalisation met à l’échelle les scores de tous les motifs sur la même plage (les motifs plus longs ont un score maximum plus élevé) et contribue également à réduire l’effet de la multi-colinéarité sur l’entraînement du modèle. Ainsi, les fonctionnalités utilisées pour l’entraînement de notre modèle sont une matrice n par 2k de scores de cotes log normalisés sur chaque ligne. Pour générer le tableau d’étiquettes correspondant, nous avons attribué à chaque site de liaison une étiquette de 1 et à chaque lieu d’arrière-plan une étiquette de 0. À l’aide de cette matrice de caractéristiques et de ce tableau d’étiquettes, nous avons formé des poids pour chaque motif à l’aide d’un modèle de régression logistique pénalisé L1 tel qu’implémenté par le package61 scikit-learn Python. Les poids de motif indiqués dans notre analyse sont les valeurs moyennes sur cinq cycles de validation croisée, en utilisant 80% des données pour l’entraînement et 20% pour les tests à chaque cycle. Des modèles ont été formés pour les CHIP-seq générés dans cette étude ainsi que des données téléchargées à partir du NCBI Gene Expression Omnibus (numéro d’accession GSE46494) et du portail de données ENCODE (https://www.encodeproject.org).
Quantification de la colinéarité multiple
Pour évaluer l’étendue de la multi-colinéarité dans les caractéristiques de score de motif que nous avons utilisées pour entraîner nos modèles, nous avons pris chaque matrice de caractéristiques correspondant à chaque expérience et calculé le VIF pour chaque motif38. Pour calculer le VIF, nous déterminons d’abord le coefficient de détermination, R2, pour chaque motif en régressant les scores de cotes log pour un motif par rapport aux scores de cotes log des motifs restants. Ensuite, en utilisant le coefficient de détermination, la tolérance pour chaque motif peut être calculée comme la différence entre 1 et le coefficient de détermination (1−R2). Le VIF est l’inverse de la tolérance \(\frac{1}{{1-R^2}} \). Nous avons utilisé le module linear_model du package Python sklearn pour calculer le coefficient de détermination.
Regroupement et fusion de motifs
Nous avons évalué la similitude de toutes les paires de motifs de séquences d’ADN en calculant la corrélation de Pearson des matrices de probabilité de position alignées (PPMs) correspondant à une paire de motifs données62. La corrélation de Pearson pour une paire de motifs A et B de longueur i est calculée à l’aide de la formule:
Les PPM ont d’abord été alignés à l’aide de l’algorithme d’alignement de Smith–Waterman 63. Les motifs plus courts sont rembourrés avec des valeurs de fréquence d’arrière-plan avant l’alignement. Les écarts dans l’alignement n’ont pas été autorisés et chaque position dans l’alignement a été notée avec la corrélation de Pearson. La corrélation de Pearson a ensuite été calculée en utilisant l’alignement optimal. Ensuite, des ensembles de motifs ayant des PPMs avec une corrélation de Pearson de 0,9 ou plus ont été fusionnés en alignant itérativement chaque PPM dans l’ensemble, puis en faisant la moyenne des fréquences nucléotidiques à chaque position.
Évaluation de la signification des motifs pour le TBA
les valeurs de p pour le TBA ont été calculées à l’aide du test du rapport log-vraisemblance. Chaque motif a été retiré de l’ensemble des caractéristiques utilisées pour entraîner un modèle TBA perturbé (en utilisant une validation croisée à cinq reprises). Nous avons ensuite utilisé le modèle complet (contenant tous les motifs) et le modèle perturbé pour calculer la probabilité d’observer la liaison sur tous les sites de liaison et les séquences de fond pour un monomère donné et toutes les régions de fond. La différence entre les probabilités calculées par le modèle complet et le modèle perturbé a ensuite été utilisée pour effectuer le test du chi carré pour chaque motif. Le test du chi carré a été réalisé à l’aide du package64 de scipy python.
Comparaison avec d’autres méthodes
BaMM motif et gkm-SVM ont tous deux été exécutés avec des paramètres par défaut. Nous avons utilisé la dernière version du gkm-SVM à plus grande échelle, LS-GKM (compilé à partir du code source téléchargé depuis https://github.com/Dongwon-Lee/lsgkm le 25/8/16), et BaMM motif; v1.0 téléchargé depuis https://github.com/soedinglab/BaMMmotif39, 65. Les deux modèles ont été formés à l’aide de cinq validations croisées. Les performances du modèle ont été notées à l’aide des fonctions roc_auc_score et precision_score du module metrics de sklearn.
Prédire les changements de liaison à l’AP-1 après un traitement d’une heure de KLA
Pour prédire le changement de liaison après un traitement d’KLA, nous avons exploité les poids de motifs appris pour chacun des n motifs (wn) par un modèle TBA entraîné sur les données traitées par Véhicule (Wveh=) et un modèle TBA entraîné sur les données traitées par KLA 1-h (Wkla=) pour chaque monomère AP-1. Le changement de liaison prédit pour chaque séquence est alors la différence entre le produit scalaire des scores de motifs normalisés calculés pour la séquence chacun des k sites de liaison (Sk =) avec les poids de motifs KLA et le produit scalaire des scores de motifs et des poids de motifs Veh (Δkla-veh, k = Wkla-Sk-Wveh-Sk). Des prédictions ont été faites pour tous les loci génomiques qui se croisaient avec un pic pour l’un des monomères AP-1 dans l’état de traitement du véhicule ou de l’UCK.
Prédire la liaison spécifique à une souche avec TBA
Pour prédire la liaison spécifique à une souche, nous avons exploité les poids de motifs appris pour chacun des n motifs (wn) par un modèle TBA (W=) pour chaque monomère AP-1 en utilisant les données C57BL/ 6J, et les scores de motifs calculés pour chacun des k sites de liaison en utilisant la séquence génomique pour C57BL/6J et BALBc/J (SC57, k =, SBAL, k =). Ensuite, nous avons calculé la différence des scores de motif pour C57BL6 / J et BALBc / J (Dn =), puis normalisé les différences de score pour chaque motif sur tous les k sites de liaison ayant une mutation en comparant BALBc / J à C57BL / 6J, ce qui donne des différences de score de motif standardisées pour chaque site de liaison (Zn = standardiser (Dn) =). Enfin, nous avons ensuite fait une prédiction de liaison spécifique à la souche en calculant le produit scalaire des poids de motifs et la différence normalisée des scores de motifs entre C57BL6/EiJ et BALBc/J pour le kème site de liaison muté (ΔC57−BAL = W⋅).
Formation au modèle TBA-2
Pour chaque loci génomique qui a croisé un pic pour l’un des monomères AP-1, en C57BL/6J ou en BALBc/J, nous avons calculé le score de log-odds le plus élevé pour chacun des n motifs qui seront inclus dans le modèle, en utilisant la séquence génomique des deux souches, ce qui donne deux ensembles de scores de motifs pour chacun des sites de liaison k (SC57, k =, SBAL, k =). Des correspondances de motifs dans les deux orientations ont été envisagées. Les scores Log-odds inférieurs à 0 ont été fixés à 0. En utilisant les scores de motif, nous calculons la différence standardisée des scores de motif entre les deux souches comme décrit dans la section ci-dessus (Zn =). Ainsi, les fonctionnalités utilisées pour l’entraînement de notre modèle sont une matrice n par k de scores de cotes log normalisés sur chaque ligne. Ensuite, nous avons calculé le rapport de pli log2 du nombre de lectures ChIP-seq en C57BL / 6J par rapport à BALBc / J pour représenter l’étendue de la liaison spécifique à la souche. En utilisant cette matrice de caractéristiques et en définissant le rapport de pli log2 de liaison entre les deux souches comme variable dépendante, nous avons formé des poids pour chaque motif en utilisant la régression linéaire implémentée par le package Python scikit-learn. Les poids de motif indiqués dans notre analyse sont les valeurs moyennes sur cinq cycles de validation croisée, en utilisant 80% des données pour l’entraînement et 20% pour les tests à chaque cycle. Les prédictions pour la liaison spécifique à la souche peuvent être faites en utilisant les poids calculés en suivant la procédure de la section précédente.
Protocole ChIP
Le mélange de protéines A et G Dynabeads 50/50 d’Invitrogen est poursuivi pour ChIP (10001D, 10003D). Le mélange IP se compose de billes de 20 µL / 2 µg d’anticorps par puce de 2 millions de cellules. Des anticorps dirigés contre des membres de la famille AP-1 ont été choisis pour cibler des régions non conservées afin de minimiser le potentiel de liaison non spécifique. Les anticorps sont répertoriés dans le tableau supplémentaire 3. Pour la préparation, les billes ont été lavées avec 2× 0,5% de BSA-PBS, puis les billes-anticorps ont été incubées avec 0,5% de BSA–PBS pendant au moins 1 h sur rotateur (4 °C). Laver 2× avec 0.5% de BSA-PBS, puis remis en suspension dans du tampon de dilution (1% de Triton, 2 mm d’EDTA, 150 mm de NaCl, 20 mm de Tris–HCl (pH 7,4), 1× Inhibiteurs de protéase). Double réticulation pour puce: Le milieu a été décanté des cellules dans des plaques de 10 cm, laver une fois brièvement avec du PBS (RT). Le glutarate de disuccinimidyle (Pierce Cat #20593) (dilué dans du DMSO à 200 mM)/PBS (RT) a été utilisé pendant 10 min. Ensuite, du formaldéhyde a été ajouté à une concentration finale de 1% pendant 10 min supplémentaires. La réaction a été éteinte avec du Tris 1: 10 1 M pH 7,4 sur glace. Les cellules ont été collectées et lavées deux fois avec du PBS froid, en filant à 1000 × g pendant 5 min. Isolation et sonication des noyaux: Remettre en suspension les pastilles cellulaires dans 1 mL de tampon d’isolation des noyaux (50 mm Tris-pH 8,0, 60 mm KCl, 0,5% NP40) + PI et incuber sur glace pendant 10 min. Centrifuger 2000 ×g pendant 3 min à 4 °C. Remettre les noyaux en suspension dans 200 µL de tampon de lyse fraîche (SDS 0,5%, EDTA 10 mM, EGTA 0,5 mM, Tris–HCl 50 mM (pH 8)) + PI. Sonication : Les noyaux ont ensuite été soniqués (10 millions de cellules) pendant 25 min dans un Biorupteur (réglages = 30 s = Activé, 30 s = Désactivé, Moyen) à l’aide de tubes à paroi mince (Diagénode Cat #C30010010). Après sonication, vitesse maximale de rotation pendant 10 min à 4 ° C. Configuration de la puce: L’ADN soniqué a été dilué 5× avec un Tampon de dilution 800 (Triton 1%, EDTA 2 mM, NaCl 150 mm, Tris–HCl 20 mM (pH 7,4), inhibiteurs de protéase 1 ×). Une aliquote est supprimée pour les échantillons d’entrée (5%). Échantillons allumés à 4 °C pendant la rotation. Lavage: Les copeaux sont lavés 1 × avec TSE I (20 mm Tris–HCl pH 7,4, 150 mm NaCl, 0,1% SDS, 1% Triton X-100, 2 mm EDTA), 2 × avec TSE III (10 mm Tris–HCl pH 7,4, 250 mm LiCl, 1% IGEPAL, 1% désoxycholate, 1 MM EDTA), 1 × avec TE + 0,1% Triton X-100, transférer dans un nouveau tube puis laver un autre temps avec TE + 0,1% Triton X-100. Élution: Éluer avec un tampon d’élution de 200 µL (1% SDS, 10 mm Tris pH 7,5) pendant 20 min à TA, en agitant sur le vortex ou un nutateur ou un rotateur. Dé-réticulation : Ajouter 10 µL de NaCl 5 M et incuber à 65 °C (ou au moins 8 h). Nettoyez les échantillons à l’aide du Zymo ChIP DNA Clean et du concentrateur. Éluer dans 100 µL. Prenez 40 µL et passez au protocole de préparation de la bibliothèque.
Isolement et fragmentation de l’ARN PolyA
Isolement de l’ARN: L’ARN a été isolé à l’aide du réactif TRIZOL (Ambion cat #15596018) et du mini-kit de préparation de l’ARN DIRECT-ZOL (cat #11-330MB). Isolement de l’ARN Poly-A: Utilisez 0.2 ARN total comme matériau de départ pour une efficacité de cartographie idéale et une clonalité minimale. Prélever 10 µL de billes d’oligo (dT) (NEB cat #S1419S) par échantillon d’ARN. Les billes ont été lavées deux fois avec 1× DTBB (20 mm Tris–HCl pH 7,5, 1 M LiCl, 2 mm EDTA, 1% LDS, 0,1% Triton X-100). Les billes ont été remises en suspension dans 50 µL de 2× DTBB. 50 µL de billes ont été mélangés à 50 µL d’ARN et chauffés à 65 °C pendant 2 min. Les billes d’ARN ont ensuite été incubées pendant 10 min à TA en tournant. Des billes d’ARN ont ensuite été collectées sur un aimant et lavées 1× chacune avec de l’ARN WB1 (10 mm Tris–HCl pH 7,5, 0,12 M LiCl, 1 Mm EDTA, 0,1% LDS, 0.1% Triton X-100) et WB3 (10 mm Tris–HCl pH 7,5, 0,5 M LiCl, 1 Mm EDTA). Ajouter 50 µL de Tris-HCl pH 7,5 et chauffer à 80 °C pendant 2 min pour éluer. Recueillir l’ARN et effectuer une deuxième collecte de billes Oligo-dT. Après lavage de la deuxième collection, au lieu d’éluer était 1 × avec 1 × tampon premier brin; 250 mm Tris–HCl (pH 8,3), 375 mm KCl, 15 mm MgCl2 (kit Thermofisseuse SSIII Cat # 18080093). Fragmentation : Ajoutez ensuite 10 µL de tampon 2× premier brin plus 10 mm de TNT et fragmentez l’ADN à 94 °C pendant 9 min. Recueillir des billes sur l’aimant et transférer l’éluat contenant de l’ARNm fragmenté sur une nouvelle bande PCR. Devrait récupérer 10 µL d’ARN fragmenté. Synthèse du premier brin : Nous avons mélangé de l’ARN fragmenté avec 0,5 µL d’amorce aléatoire (3 µg/µL) Life Tech #48190-011, 0,5 µL d’oligo-dT (50 µM du kit SSIII), 1 µL de dNTPs (10 mm Life Tech, cat 18427088) et 0,5 µL de SUPERase-In (ThermoFisher Cat #AM2696) et chauffons 50 °C pendant 1 min. Placer immédiatement sur la glace. Nous avons ensuite ajouté 5,8 µL de ddH2O, 0,1 µL d’actinomycine (2 µg/µL Sigma cat #A1410), 1 µL de DTT (100 mm Life Tech cat #P2325), 0,2 µL de Tween à 1% et 0,5 µL d’Exposant III et incubé à 25 °C pendant 10 min, puis 50 °C pendant 50 min. Nettoyage des perles: Nous avons ajouté 36 µL de RNAClean XP (Ampure XP) et mélangé, en incubant pendant 15 min sur glace. Les billes ont ensuite été collectées sur un aimant et lavées 2× avec de l’éthanol à 75%. Les billes sont ensuite séchées à l’air pendant 10 min et éluées avec 10 µL de H2O sans nucléase. Synthèse du deuxième brin. 10 µL d’ADNc/ ARN ont été mélangés avec 1,5 µL de Tampon Bleu 10× (Enzymatique cat # B0110L), 1 µL de mélange dUTP/ dNTP (10 Mm Affymetrix cat # 77330), 0,1 µL dUTP (100 mm Affymetrix cat # 77206), 0,2 µL de RNase H (5 U/ µL Enzymatique cat # Y9220L), 1 µL d’ADN polymérase I (10 U/ µL µL Enzymatiques cat # P7050L), 0,15 µL 1% Tween-20 et 1.05 µL d’eau sans nucléase. La réaction a été incubée à 16 °C pendant 2,5 h. Nettoyage des billes : L’ADN a été purifié en ajoutant 1 µL de SpeedBeads Seradyn 3 EDAC (Thermo 6515-2105-050250) par réaction dans 28 µL de PEG8000 à 20% / NaCl 2,5 M (concentration finale à 13%) et en incubant à TA pendant 10 min. Les billes ont ensuite été collectées sur un aimant et lavées 2× avec de l’éthanol à 80%. Les billes ont été séchées à l’air pendant 10 min et éluées dans 40 µL d’eau sans nucléase. L’ADN est prêt pour la préparation de la bibliothèque.
Protocole de préparation de la bibliothèque
Réparation de l’extrémité de l’ADND : Nous avons mélangé 40 µL d’ADN provenant de protocoles à puce ou à ARN avec 2,9 µL de H2O,0.5 µL de Tween-20 à 1 %, 5 µL de tampon ligase 10× T4 (Enzymatique cat #L6030-HC-L), 1 µL de mélange dNTP (Affymetrix 77119 de 10 mM), 0,3 µL d’ADN T4 pol (Enzymatique P7080L), 0,3 µL de PNK T4 (Enzymatique Y9040L), 0,06 µL de Klenow (Enzymatique P7060L) et incubé pour 30 min à 20 °C. 1 µL de SpeedBeads Seradyn 3 EDAC (Thermo 6515-2105-050250) dans 93 µL de PEG8000 à 20%/NaCl 2,5 M (13% final) a été ajouté et incubé pendant 10 min. Nettoyage des billes: Les billes ont été collectées sur un aimant et lavées 2× avec de l’éthanol à 80%. Les billes ont été séchées à l’air pendant 10 min puis éluées dans 15 µL de ddH2O.dA-Tailing. L’ADN a été mélangé avec 10.8 µL de ddH2O, 0,3 µL de Tween-20 à 1%, 3 µL de Tampon Bleu (Enzymatique cat# B0110L), 0,6 µL de dATP (10 mm Tech 10216-018), 0,3 µL de Klenow 3-5 Exo (Enzymatique P7010-LC-L) et incubé pendant 30 min à 37 °C. 55,8 µL de PEG8000 à 20% / NaCl 2,5 M 13% de finale) a été ajouté et incubé pendant 10 min. Ensuite, le nettoyage des perles a été fait. Les billes ont été éluées dans 14 µL. Ligature de l’adaptateur en forme de Y. L’échantillon a été mélangé avec 0,5 µL d’un adaptateur de code-barres BIOO (BIOO Scientific cat # 514104), 15 µL de Tampon de Ligature Rapide (Enzymatique cat @ L603-LC-L), 0,33 µL 1% Tween-20 et 0.5 µL d’ADN ligase T4 HC (Enzymatique L6030-HC-L) et incubés pendant 15 min à TA. 7 µL de NaCl PEG8000/2,5 M à 20% ont été ajoutés et incubés pendant 10 min à TA. Un nettoyage des billes a été effectué et des billes ont été éluées dans 21 µL. 10 µL ont ensuite été utilisés pour l’amplification par PCR (14 cycles) avec des amorces IGA et IGB (AATGATACGGCGACCACCGA, CAAGCAGAAGACGGCATACGA).
GRO-seq
La transcription naissante a été capturée par séquençage nucléaire global (GRO-seq). Des noyaux ont été isolés à partir de TGEMs par lyse hypotonique (Tris-HCl 10 mM (pH 7,5), MgCl2 2 mm, CaCl2 3 mM; 0.1% D’IGÉPAL CA-630) et surgelés en tampon de congélation (Tris-HCl 50 mM (pH 7,8), MgCl2 5 mM, Glycérol 40%). Course-poursuite. Des noyaux BMDM 3-5 × 106 ont été exécutés avec des NTP marqués par BrUTP avec un tampon 3 × NRO (15 mm Tris-Cl (pH 8,0), 7,5 mm MgCl2, 1,5 mm DTT, 450 mm KCl, 0,3 U / µL de SUPERase In, 1,5% Sarkosyl, 366 µM ATP, GTP (Roche), Br-UTP (Sigma 40 Aldrich) et 1,2 µM CTP (Roche, pour limiter le rodage longueur à ~ 40 nucléotides)). Les réactions ont été arrêtées après 5 min par addition de réactif Trizol LS de 500 µL (Invitrogen), vortexées pendant 5 min et l’ARN extrait et précipité comme décrit par le fabricant. Des pastilles d’ARN ont été remises en suspension dans 18 µL de Tween ddH2O + 0,05% (dH2O+ T) et un mélange de fragmentation de 2 µL (100 mMZnCL2, 10 mm Tris–HCl (pH 7,5)), puis incubées à 70 °C pendant 15 min. La fragmentation a été stoppée par addition de 2,5 µL d’EDTA de 100 mM. Enrichissement BrdU. L’enrichissement en BrdU a été réalisé à l’aide d’anticorps BrdU (IIB5) et de billes AC (Santa Cruz, sc-32323 AC, lot # A0215 et #C1716). Les billes ont été lavées une fois avec un tampon de liaison GRO (0,25 × tampon salin-phosphate de sodium-EDTA (SSPE), Tween 0,05% (vol / vol), NaCl 37,5 mM, EDTA 1 mM) + NaCl 300 mm suivi de trois lavages dans un tampon de liaison GRO et remis en suspension sous forme de suspension à 25% (vol / vol) avec une SUPERase-in de 0,1 U / µL. Pour fragmenter l’ARN, 50 µL de tampon de liaison GRO à froid et 40 µL de billes d’anticorps BrdU équilibrées ont été ajoutés et les échantillons ont tourné lentement à 4 ° C pendant 80 min. Les billes ont ensuite été filées à 1000 × g pendant 15 s, le surnageant a été éliminé et les billes ont été transférées dans une colonne MC Ultrafree Millipore (UFC30HVNB; Millipore) dans un tampon de liaison GRO de 2 × 200 µL. La réaction IP a été lavée deux fois avec 400 µL de tampon de liaison GRO avant que l’ARN ne soit élué par incubation dans 200 µL de Trizol LS (ThermoFisher) sous agitation douce pendant 3 min. L’élution a été répétée une seconde fois, 120 µL de dH2O+T ajoutés pour augmenter le surnageant et extraits comme décrit par le fabricant. Réparation en bout et décapage : Pour la réparation en bout et le décapage, des pastilles d’ARN ont été dissoutes dans 8 µL de TET (10 mm de Tris-HCl (pH 7,5), 1 mm d’EDTA, 0,05% de Tween 20) par vortexage vigoureux, chauffées à 70 ° C pendant 2 min et placées sur de la glace. Après un essorage rapide, un mélange maître de réparation de 22 µL (3 µL de tampon 10× PNK, 15,5 µL de dH2O + T, 0,5 µL d’inhibiteur de la SUPERase-In RNase (10 U), 2 µL de PNK (20U), 1 µL de RppH (5U)) a été ajouté, mélangé et incubé à 37 ° C pendant 1 h. Pour phosphoryler le 5 ‘, 0,5 µL d’ATP de 100 mM a ensuite été ajouté et les réactions ont été incubées pendant encore 45 min à 37 °C (la forte concentration d’ATP désaltère l’activité de la RppH). Après réparation finale, 2,5 µL d’EDTA de 50 mM ont été ajoutés, les réactions mélangées puis chauffées à 70 °C pendant 2 min avant d’être placées sur de la glace. Un deuxième enrichissement BrdU a été effectué comme détaillé ci-dessus. Des pastilles d’ARN ont été dissoutes dans 2,75 µL de TET + 0,25 µL d’Illumina TruSeq 3’adaptateur (10 µM), chauffées à 70 °C pendant 2 min et placées sur de la glace. 7 de mélange 3’master (4,75 µL 50% de PEG8000, 1 µL tampon ARN ligase 10× T4, 0,25 µL SUPERase-In, 1 µL ARN Ligase 2 T4 tronquée (200U; NEB)) ont été ajoutés, bien mélangés et les réactions incubées à 20 ° C pendant 1 h. Les réactions ont été diluées par addition de 10 µL TET + 2 µL 50 mm EDTA, chauffées à 70 ° C pendant 2 min, placées sur de la glace et un troisième tour de L’enrichissement BrUTP a été effectué. Des pastilles d’ARN ont été transférées sur des bandes de PCR pendant le lavage à 75% d’éthanol et séchées. Les échantillons ont été dissous dans 4 µL de TET (Tris–HCl 10 mM (pH 7,5), EDTA 0,1 mM, Tween 20 0,05%) + 1 µL d’amorce de transcription inverse (RT) 10 µM. Pour recuire le RTprimer, le mélange a été incubé à 75 °C pendant 5 min, 37 °C pendant 15 min et 25 °C pendant 10 min. Pour ligaturer l’adaptateur Illumina TruSeq 5’, 10 µL de mélange 5’master (1,5 µL dH2O + 0,2% Tween 20, 0,25 µL d’adaptateur 5’TruSeq dénaturé (10 µM), 1,5 µL de tampon de ligase d’ARN 10× T4, 0,25 µL de SUPERase-In, 0,2 µL d’ATP 10 mM, 5,8 µL de PEG8000 à 50%, 0,5 µL d’ARN T4 ligase 1 (5U ; NEB)) a été ajouté et les réactions ont été incubées à 25 °C pendant 1 h. La transcription inverse a été réalisée à l’aide de Protoscript II (NEB) (tampon de premier brin de 4 µL 5 × NEB (NEB; E7421AA), 0,25 µL de SUPERase-In, 0,75 µL de Protoscript II (150U; NEB)) à 50 ° C pendant 1 h. Après addition de 30 µL de mélange maître PCR (25 µL 2 × LongAmp Taq 2 × Mélange maître (NEB), 0,2 µL d’amorce avant 100 µM, 2,8 µL 5 M bétaïne et 2 µL d’apprêt de code-barres individuel de 10 µM), les mélanges ont été amplifiés (95 °C pendant 3 min, (95 °C pendant 60 s, 62 °C pendant 30 s, 72 °C pendant 15 s) x13, 72 °C pendant 3 min). Les réactions de PCR ont été nettoyées à l’aide de 1,5 volume de SpeedBeads (GE Healthcare) dans du NaCl 2,5 M / PEG8000 à 20%. La taille des bibliothèques a été sélectionnée sur les gels PAGE / TBE à 160-225 paires de bases. Des tranches de gel ont été déchiquetées par filage à travers un tube PCR perforé de 0,5 mL placé sur un tube de 1,5 mL. 150 µL de gel EB (0,1% de LDS, 1 M de LiCl, 10 mm de Tris-HCl (pH 7,8)) ont été ajoutés et la suspension incubée sous agitation pendant une nuit. Pour purifier l’ADN élué, 700 µL de tampon de liaison à l’ADN des puces Zymogen ont été ajoutés dans le tube de 1,5 mL contenant la tranche de gel déchiquetée et le Gel EB, mélangés par pipetage et la suspension transférée dans une colonne de ZymoMiniElute. Les échantillons ont d’abord été filés à 1000 × g pendant 3 min, puis à 10 000×g pendant 30 s. L’écoulement a été éliminé et les échantillons ont été lavés avec un tampon de lavage Zymo de 200 µl (avec EtOH). Les restes de gel ont été éliminés par effleurement et les colonnes lavées par addition d’un autre tampon de lavage Zymo de 200 µL (avec EtOH). L’écoulement a été éliminé, les colonnes filées à sec par centrifugation à 14 000 × g pendant 1 min et l’ADN élué par addition de 20 µL de TET de séquençage préchauffé (Tris-HCl 10 mM (pH 8,0), EDTA 0,1 mM, Tween 20 0,05%). Les bibliothèques ont été séquencées.
Western blot
Les cellules ont été lysées avec du tampon de lyse Igépal (50 mm Tris pH 8,0, 150 mm NaCl, 0.5% d’Igepal) et les concentrations en protéines ont été déterminées avec le réactif de dosage des protéines BioRad en utilisant BSA comme étalon. Les protéines ont été séparées sur des gels à gradient Bis–Tris NuPage 4-12% (Invitrogen) et transférées sur une membrane de nitrocellulose (Amersham). Les membranes ont été bloquées dans le SCT avec 0,1% de Tween-20 et 5% de BSA. Les membranes ont été épongées avec le primaire indiqué pendant une nuit à 4 ° C. Des anticorps secondaires conjugués à la peroxydase de raifort ont été détectés à l’aide du système de détection par épongement ECL plus western (Amersham).
Animaux et culture cellulaire
Des TGEMs ont été collectés 3 jours après l’injection sur des souris mâles C57Bl/6J de 8 semaines ou BALB/cJ, et plaqués à 20 × 106 cellules par boîte de Pétri de 15 cm dans du DMEM plus 10% de FBS et 1 × pénicilline-streptomycine. Un jour après le placage, les cellules ont été complétées par des milieux frais et traitées avec du PBS (Veh) ou 100 ng/mL KLA pendant 1 h, puis directement utilisées pour les analyses en aval. Les iBMDM sont produits par infection du BMDM par un rétrovirus contenant myc et Braf V600E66. Les cellules immortalisées sont ensuite développées sur plusieurs semaines. Toutes les expériences sur les animaux ont été réalisées conformément aux normes éthiques établies par le Comité institutionnel annuel des Soins et de l’utilisation de l’Université de Californie à San Diego (UICAC).
Production de lentivirus
pLentiguide a été modifié pour contenir un échafaudage U6-bsmbi-spgRNA et un promoteur du CMV entraînant tagBFP2. 2 guides CRISPR ont été insérés pour chaque cible par amplification PCR avec le promoteur H1 (site bsmbi/guide1/échafaudage / promoteur H1 /guide 2/site bsmb1) pour un total de 2 guides par virus (pilotés par U6 et H1) (Tableau supplémentaire 4). Le virus a été créé avec le système pVSVg / ppAX2. Deux jours après la transfection, le milieu a été recueilli et centrifugé à 4 °C pendant 2 h à 20 000 ×g. Le culot cellulaire a été reconstitué pendant une nuit à 4 °C en OPTI-MEM et stocké à -80 °C.
Production de CRISPR KO IBMDM
KO IBMDM ont été produits par infection lentivirale. Les iBMDM-CAS9-IRES-EGFP ont été infectés par MOI 100, tel que mesuré sur des cellules 293T, avec du lentiblaste (OZ biosciences) (5 µL chaque réactif) dans OPTI-MEM. Celui-ci a ensuite été centrifugé à 1300g pendant 1 h à température ambiante. Les milieux ont ensuite été retirés et les cellules ont été complétées dans des milieux de moelle osseuse (30% de cellules L, 20% de FBS, 1% de pénicilline / streptomycine dans le DMEM) pendant 2 jours. Les cellules ont ensuite été triées pour l’infection par expression d’un transgène sur la séquence virale (tagBFP2).
Résumé des rapports
De plus amples informations sur la conception expérimentale sont disponibles dans le Résumé des rapports de recherche sur la nature lié à cet article.