Molteplici origini dei procarioti ed eucarioti single-stranded DNA virus batterica e archaeal plasmidi | Nature Communications

rete Globale di EH replicons
La diversità delle ripetizioni virali nei genomi batterici
Caratteristiche conservate delle ripetizioni batteriche e del virus del CRESS-DNA
Origine del dominio SF3 helicase
Origini dei virus CRESS-DNA da plasmidi batterici

rete Globale di EH replicons

Per esplorare la storia evolutiva del EH replicons, abbiamo raccolto un set di dati di EH endonucleasi—l’unica proteina codificata da tutti questi replicons—in rappresentanza di ogni famiglia di virus, plasmidi, e trasposoni associati con i padroni di casa in tutti e tre i cellulari domains16,27,28,29,30. In questa analisi, non abbiamo considerato le relaxasi Mob coinvolte nella coniugazione plasmidica. Gli enzimi di questa famiglia comprendono motivi conservati circolarmente permutati che complicano il loro confronto basato sulla sequenza con le endonucleasi HUH coinvolte nella replicazione o trasposizione16,19 del DNA. Il set di dati risultante includeva 8764 sequenze. Questi sono stati raggruppati in base alla somiglianza a coppie e i cluster sono stati identificati utilizzando un algoritmo di clustering convesso (soglia del valore p di 1e-08) con CLANS35. Questa analisi ha rivelato 33 cluster di dimensioni variabili da 7 a 2711 sequenze (dati supplementari 1). A seguito di un’ispezione della connettività tra cluster (Fig. 1), abbiamo definito 2 cluster orfani e 2 superclusters, che mostravano nessuna o pochissime connessioni tra loro (dati supplementari 1). Tuttavia, il confronto delle strutture ad alta risoluzione disponibili per i rappresentanti di entrambi i cluster orfani e dei 2 supercluster16, 36 conferma inequivocabilmente la loro origine comune.