Múltiples orígenes de virus de ADN monocatenario procariótico y eucariótico a partir de plásmidos bacterianos y arqueales

Red global de replicones HUH

Para explorar la historia evolutiva de los replicones HUH, recolectamos un conjunto de datos de endonucleasas HUH, la única proteína codificada por todos estos replicones, que representan cada familia de virus,plásmidos y transposones asociados con huéspedes en los tres dominios celulares16,27,28,29, 30. En este análisis, no se consideraron las relaxasas Mob implicadas en la conjugación plásmida. Las enzimas de esta familia abarcan motivos conservados permutados circularmente que complican su comparación basada en secuencias con las endonucleasas HUH involucradas en la replicación o transposición16,19. El conjunto de datos resultante incluía 8764 secuencias. Estos se agruparon en función de la similitud en pares, y los clústeres se identificaron utilizando un algoritmo de clústeres convexos (umbral de valor p de 1e-08) con CLANS35. Este análisis reveló 33 grupos que variaban en tamaño de 7 a 2711 secuencias (datos complementarios 1). Tras una inspección de la conectividad entre clústeres (Fig. 1), definimos 2 clústeres huérfanos y 2 supercúmulos, que mostraban muy pocas o ninguna conexión entre sí (Datos suplementarios 1). No obstante,la comparación de las estructuras de alta resolución disponibles para los representantes de los clústeres huérfanos y de los 2 superclusteres16, 36 confirma inequívocamente su origen común.

Fig. 1
figura 1

Representantes de superfamilia HUH agrupados por su similitud de secuencia en pares. Las líneas conectan secuencias con un valor de P ≤ 1e-08. Los grupos fueron nombrados por plásmidos bien caracterizados, virus o taxones más frecuentes

El cluster huérfano 1 incluye una sola familia de transposones IS200/IS605 que están muy extendidos en bacterias y archaeas37. Las endonucleasas HUH de las secuencias de inserción IS200/IS605 han sido ampliamente estudiadas estructural y bioquímicamente, resultando en una comprensión integral de sus funciones16,38. Aunque las transposasas IS200 / IS605 tienen un pliegue estructural común al de otras endonucleasas HUH y contienen los 3 motivos de firma, no mostraron una similitud de secuencia apreciable con ningún otro grupo de endonucleasas HUH y, por lo tanto, permanecieron desconectadas de las secuencias en otros grupos. Sin embargo, la diversidad de secuencias dentro del grupo IS200/IS605 es comparable a la de otros grupos.

El grupo huérfano 2 incluye proteínas Rep que se conservan en virus arqueales hipertermofílicos de la familia Rudiviridae 39. Los estudios estructurales de la proteína Rep del rudivirus SIRV1 revelaron el pliegue canónico de la endonucleasa HUH y la caracterización bioquímica de la proteína confirmó las actividades de unión y unión esperadas en vitro36. Al igual que las transposasas IS200/IS605, el cúmulo de Reptiles rudivirales no se conecta a otras endonucleasas HUH, incluidos los homólogos de otras familias de virus arqueales y plásmidos.

Posiblemente, la singularidad de los 2 clústeres huérfanos está vinculada a los mecanismos inusuales de transposición y replicación empleados por los elementos respectivos. De hecho, las secuencias de inserción IS200/IS605 se transponen mediante un mecanismo único de pelado y pegado38, mientras que los rudivirus, a diferencia de la mayoría de los otros virus y plásmidos que se replican mediante el mecanismo de círculo rodante, contienen genomas dsDNA lineales relativamente grandes (~35 kb) con terminales covalentemente cerrados40.

El Supercluster 1 es, con mucho, el conjunto HUH más grande y diverso que incluye 24 clústeres (Datos suplementarios 1). De estos 24 grupos, 15 contienen Representantes de plásmidos extracromosómicos de buena fe, de los cuales 7 grupos también incluyen representantes de diversos ADNss (Microvíridos, Inovíridos y Pleolipovíridos) y / o ADNds (Myoviridos y Corticoviridos) de virus de bacterias y arqueas. Tres grupos consisten en Reps codificadas por microvirus de las subfamilias Gokushovirinae y Bullavirinae, y Xanthomonas inovirus Cf1 (familia Inoviridae), respectivamente. Notablemente, los microvirus similares a phiX174 (Bullavirinae) muestran similitud exclusivamente con los microvirus de la subfamilia Gokushovirinae, indicativo de la monofilia de Rep en las dos subfamilias de los Microvíridos, a pesar de la alta divergencia de secuencias. Los transposones bacterianos IS91 (incluyendo la subfamilia ISCR) y la familia de helitrones eucarióticos, respectivamente, forman dos grupos distintos. Los dos grupos de transposones no están directamente conectados entre sí, sino que están vinculados a distintos grupos de plásmidos bacterianos y, en el caso de IS91, de plásmidos arqueales, lo que sugiere orígenes independientes de replicones extracromosómicos bacterianos. Se ha sugerido anteriormente que los helitrones podrían representar un eslabón perdido entre los virus de ADN de BERROS eucarióticos, a saber, los geminivirus y los replicones bacterianos HUH41, o que los helitrones evolucionaron a partir de geminivirus 42. Sin embargo, en nuestro análisis, los helitrones no se conectan a ninguno de los grupos de virus de ADN-BERRO, lo que sugiere trayectorias evolutivas independientes, consistentes con los hallazgos recientes43.

Los 5 grupos restantes no incluyen secuencias de plásmidos, virales o transposones reconocibles y, por lo tanto, es probable que representen nuevas familias de MGE integrado. Cuatro de estos grupos se encuentran predominantemente en bacterias de los taxones Clostridiales, Actinobacterias, Neisseriales y Bacteroidetes, respectivamente (etiquetados en consecuencia en la Fig. 1), mientras que el quinto grupo es específico de la división candidata MSBL1 (Lagos de Salmuera del Mar Mediterráneo 1)44, un grupo de arqueas no cultivadas que se encuentran en diferentes ambientes hipersalinos. La mayoría de los clústeres muestran uniformidad taxonómica a nivel de dominio, es decir, los clústeres incluyen secuencias bacterianas, arqueas o eucariotas (incluidos los virus y plásmidos correspondientes), lo que sugiere que las transferencias horizontales de virus o plásmidos entre dominios hospedantes son infrecuentes. Las dos excepciones incluyen los grupos dominados por bacterias tipo pUB110 y tipo IS91, que incluyen un puñado de secuencias arqueales. En el caso de los transposones IS91, la transferencia horizontal de bacterias se ha determinado mediante análisis filogenéticos45. Además, algunos de los conglomerados incluyen secuencias esporádicas anotadas como eucariotas; sin embargo, el análisis de los contigs correspondientes sugiere que estos son probablemente contaminantes bacterianos.

De particular interés son los 7 grupos que incluyen tanto virus como plásmidos. Por ejemplo, el cúmulo similar a pEC316_KPC, además de plásmidos, contiene virus evolutivamente no relacionados de 3 familias, Myoviridae, Corticoviridae e Inoviridae, lo que sugiere una extensa diseminación horizontal de los genes rep. En particular, las repeticiones de inovirus se distribuyen en 5 grupos. Dada la escasez de secuencias inovirales en los grupos similares a pVT736-1 y pUB110, que incluyen solo el fago Pf3 de Pseudomonas y el fago B5 de Propionibacterium, respectivamente, la direccionalidad de la transferencia génica, de plásmidos a los virus correspondientes, parece obvia. Además, muchos inovirus no codifican endonucleasas HUH, sino que codifican iniciadores de replicación de una superfamilia no relacionada evolutivamente, Rep_trans (Pfam id: PF02486)15, que también abunda en plásmidos bacteriales30, mientras que los inovirus del género Vespertiliovirus carecen de Reps y en su lugar se replican por transposición utilizando transposasas de familias IS3 e IS30 derivadas de las secuencias de inserción correspondientes46. En conjunto, estas observaciones indican que los módulos de replicación de inovirus se han intercambiado con módulos de replicación lejanos e incluso no homólogos de varias familias de plásmidos y transposones. De manera similar, los pleolipovirus arqueales se dividen en dos grupos que corresponden a diferentes familias de plásmidos arqueales, similares a pGRB1 y pTP2, respectivamente, lo que sugiere que el intercambio de genes asociados a la replicación es común en virus bacterianos y arqueales con genomas pequeños del tamaño de plásmidos. ¶En algunos casos, es difícil determinar la pertenencia viral versus plásmida de los Rep codificados en los cromosomas celulares porque ambos tipos de MGE pueden integrarse en los genomas del huésped. Por ejemplo, el cúmulo similar a XacF1 incluye 62 secuencias Rep, 2 de las cuales están codificadas por fagos filamentosos, mientras que el resto proviene de genomas bacterianos. El análisis de los vecindarios genómicos sugiere que solo 6 de las 60 repeticiones restantes representan profecías. Además, el cluster tipo pAS28 incluye un plásmido, pAS28 (ref. 47); sin embargo, se han identificado previamente repeticiones relacionadas en profages48, pero no en virus caracterizados, dando la impresión errónea de que el Rep similar al pAS28 es exclusivo de plásmidos. ¶Para caracterizar aún más las relaciones evolutivas entre los Representantes codificados por diferentes tipos de MGE, construimos árboles filogenéticos de máxima verosimilitud para los 7 grupos que incluían Representantes de virus y plásmidos (Fig. 2a a g). Los resultados de los análisis filogenéticos sugieren la transferencia horizontal de los genes rep entre plásmidos y virus, con secuencias virales típicamente anidadas entre homólogos codificados en plásmidos.

El Supercluster 2 (SC2) consta de 7 grupos (Datos suplementarios 1) que incluyen todos los virus de ADN de berros eucarióticos clasificados y no clasificados conocidos, parvovirus, un grupo de plásmidos del alga roja Pyropia pulchra49 y 4 grupos que contienen secuencias de bacterias Rep. La gran mayoría de las repeticiones bacterianas en los grupos similares a pCPa y p4M están codificadas en genomas bacterianos en lugar de en plásmidos y no se han caracterizado previamente. En nuestra red, los virus ADN de BERROS están conectados a cúmulos similares a pCPa, p4M, pPAPh2 y P. pulchra, mientras que el cúmulo similar a pE194/pMV158 no forma conexiones directas con los virus ADN de BERROS, sino que se une a SC2 a través del cúmulo similar a pCPa (Fig. 1). En particular, los geminivirus y los genomovirus forman un subgrupo con plásmidos de fitoplasma (cúmulo similar a pPAPh2) y P. pulchra, que está separado de otros virus de ADN de BERRO. El cúmulo de Parvoviridae, que incluye parvovirus y virus endógenos derivados integrados en varios genomas eucarióticos, está vagamente conectado directamente a los virus ADN-BERRO, lo que sugiere que los parvovirus con genomas lineales de ADNss comparten ascendencia común con los virus ADN-BERRO que, por definición, tienen genomas circulares. Intrigados por la conexión evolutiva aparentemente estrecha entre los virus de ADN de BERROS eucarióticos y los representantes de bacterias y algas, investigamos estas relaciones con mayor detalle, como se informa en las siguientes secciones.

La diversidad de repeticiones similares a virus en genomas bacterianos

Para investigar el grado de similitud entre las repeticiones de virus de ADN de BERRO eucariótico y replicones no virales de SC2, comparamos sus organizaciones de dominio. Con la excepción de los plásmidos de la familia pE194/pMV158, que contienen solo el dominio nucleasa, los representantes SC2 de bacterias y algas tenían la misma organización de dominio nucleasa-helicasa que los virus ADN-BERRO. La misma organización de dos dominios también es característica de los representantes de parvovirus 2. Por lo tanto, el análisis de la organización del dominio corrobora los resultados de la agrupación de secuencias e indica además que las repeticiones bacterianas SC2 están más estrechamente relacionadas con las repeticiones de virus eucarióticos que con las de otros plásmidos y virus procarióticos.

Luego buscamos obtener información adicional sobre la diversidad y distribución taxonómica de las repeticiones de SC2 similares a virus que están codificadas en genomas bacterianos. El análisis filogenético de máxima verosimilitud reveló 9 clados bien apoyados (Fig. 2a). El agrupamiento y el posterior análisis de detección de la comunidad validaron los 9 grupos de repeticiones bacterianas (Fig. 2b), donde los grupos 1-3 corresponden al cúmulo tipo p4M que se muestra en la Fig. 1, grupos 4-8 al cúmulo similar a pCPa, y grupo 9 al cúmulo similar a pPAPh2. Para enfatizar su similitud con las Repeticiones de virus de ADN de BERRO, nos referimos a los 9 grupos como pCRESS1 a pCRESS9. Estos grupos mostraron distribuciones taxonómicas parcialmente superpuestas pero distintas, cubriendo varias clases dentro de 4 filos bacterianos(Fig. 1 y Cuadro complementario 1).

Fig. 2
figura 2

Diversidad de proteínas de tipo viral en bacterias. a Phylogenetic tree of bacterial Rep proteins and their homologs in P. pulchra. Las secuencias estrechamente relacionadas se colapsan en triángulos, cuyas longitudes laterales son proporcionales a las distancias entre los nodos foliares más cercanos y más lejanos. grupos de CLANES b de proteínas bacterianas de reptiles y sus homólogos. Los nodos indican secuencias de proteínas. Las líneas representan relaciones de secuencia (valor de P de CLANES ≤ 1e-05). Los nodos que pertenecen al mismo grupo están coloreados con los mismos colores, correspondientes a los clados que se muestran en el panel A. c Mapas genómicos de plásmidos integrados y extracromosómicos que representan los grupos 1-9. Los genes homólogos se representan con el mismo color y sus funciones se enumeran en el lado derecho de la figura

La mayoría de las repeticiones de pCRESS7 y pCRESS9 están codificadas por plásmidos extracromosómicos (Tabla Suplementaria 1). Por el contrario, la gran mayoría (97.5%) de las repeticiones encontradas en otros grupos están codificadas dentro de elementos genéticos móviles integrados específicamente en cromosomas bacterianos (Tabla Suplementaria 1; Fig. 2c; Suplemento Fig. 3; Nota complementaria 1). En particular, ninguno de los elementos codificó ningún homólogo de proteínas estructurales virales conocidas actualmente (Nota complementaria 1). Colectivamente, estas observaciones indican que las repeticiones similares a los virus en las bacterias están codificadas por diversos plásmidos extracromosómicos e integrados.

Características conservadas de repeticiones de virus bacterianos y de ADN de BERROS

El análisis de secuencias mostró que, a pesar de la considerable divergencia general de secuencias, las repeticiones de pCRESS4 a 8 contienen motivos de secuencias muy similares dentro de los dominios nucleasa y helicasa (Fig. 3), consistente con los resultados de los análisis de agrupamiento y filogenéticos (Fig. 2). En particular, estos 5 grupos de pCRESS comparten una firma específica, YLxH (x, cualquier aminoácido) dentro del motivo III del dominio nucleasa, que no se observó en las repeticiones de pCRESS1–3 y 9 (Fig. 3). Por lo tanto, nos referimos a pCRESS4–8 colectivamente como el supergrupo YLxH (en lugar del clúster similar a pCPa), para enfatizar esta característica compartida. La firma YLxH también se conservó en las repeticiones del cúmulo similar a pE194 / pMV158, lo que sugiere una relación evolutiva más estrecha entre los dos cúmulos, a pesar del hecho de que las repeticiones similares a pE194/pMV158 carecen del dominio helicasa. Además, pCRESS9 muestra motivos similares a los de los plásmidos de P. pulchra y, por lo tanto, podría unificarse con estos plásmidos en un ensamblaje común. Por el contrario, pCRESS1, -2 y -3 (cluster similar a p4M) muestran conjuntos distintivos de motivos (Fig. 3; Nota complementaria 1).

Fig. 3
figura 3

secuencia Conservada de motivos de proteínas Rep. Los grupos de reptiles bacterianos se representan en fondo gris. Los residuos son coloreados por sus propiedades químicas (polar, verde; básico, azul; ácido, rojo; hidrófobo, negro; neutro, púrpura). Los grupos de Rep se ordenaron manualmente de acuerdo con la similitud de pares en los motivos alineados. Los dominios de endonucleasa HUH y helicasa SF3 están delineados en la parte superior de la figura

Origen del dominio helicasa SF3

Los análisis de secuencia sugieren que las repeticiones de plásmidos que contienen dominio helicasa SF3, especialmente las de pCRESS2, pCRESS3 y pCRESS9, y P. pulchra, están estrechamente relacionadas con las repeticiones de virus de ADN de BERROS. Sin embargo, la direccionalidad de la evolución, es decir, si los representantes de plásmidos evolucionaron de los de los virus de ADN de BERRO o viceversa, no es obvia. Aunque es tentador tomar la ausencia del dominio helicasa en el cúmulo similar a pE194/pMV158 como una indicación de que este grupo es ancestral a los Rep que contienen helicasa, no se puede descartar que el dominio helicasa se haya perdido por estos plásmidos. Por lo tanto, nos propusimos investigar la procedencia del dominio helicasa SF3 en los representantes plásmidos y virales. Las búsquedas de secuencias sensibles con HMMER en la base de datos nr30 mostraron que los dominios helicasa de los representantes virales de plásmidos y ADN de BERRO están más estrechamente relacionados con los de los virus eucarióticos de ARN de sentido positivo (orden Picornavirales y familia Caliciviridae), así como la superfamilias de ATPasa AAA+ 50, 51. En este análisis, también se incluyeron las secuencias SF3 de parvovirus, poliomavirus y papilomavirus que se cree que están evolutivamente relacionadas con los virus del ADN del BERRO 2,25. Se descartaron varios grupos de helicasas SF3 más distantes de virus con genomas grandes de dsDNA 52. Debido a la alta divergencia de secuencias y la longitud relativamente corta, los análisis filogenéticos de los dominios de helicasa SF3 no fueron informativos, lo que resultó en topologías de árboles en forma de estrella, independientemente de los modelos evolutivos o el muestreo taxonómico utilizado. Sin embargo, el análisis de agrupamiento basado en similitudes en pares proporcionó información sobre las relaciones entre las diferentes familias de ATPasas (Fig. 4a). En particular, se apoyó claramente la estrecha relación entre los dominios helicasa SF3 de las REP bacterianas y los virus ADN de BERROS. Ambos grupos se conectan a los virus ARN, pero solo las repeticiones bacterianas, particularmente las del supergrupo YLxH, muestran conexiones con las ATPasas de la superfamilia AAA+, a saber, la cargadora de helicasas bacterianas DnaC y, en menor medida, las ATPasas similares a dnaA y Cdc48 (Fig. 4a). La similitud más estrecha entre el supergrupo YLxH y las ATPasas bacterianas AAA+ se apoya en la comparación de los motivos catalíticos que revelaron varios caracteres derivados compartidos, con exclusión de otros grupos (Fig. 4). En el mismo umbral de agrupamiento, ni el ADN eucariótico ni los virus de ARN se vinculan a ningún grupo de ATPasas que no sean los de plásmidos bacterianos. Las helicasas SF3 de parvovirus ligadas a las de virus ADN-BERRO, consistentes con el análisis de secuencias de Rep de longitud completa (Fig. 1). Los papilomavirus y los poliomavirus formaron 2 grupos que se conectaron entre sí y con parvovirus.

Fig. 4
figura 4

Relaciones entre las helicasas de la Superfamilia 3 y las ATPasas AAA+. una Superfamilia 3 dominios helicasa y AAA + ATPasa agrupados por su similitud en parejas usando CLANES. En total, 3854 secuencias se agruparon con CLANES (valor de P de CLANES ≤ 5e-09). Los grupos de virus ADN-BERRO no clasificados se denominan CRESSV1 a CRESSV6 (ref. 53). b Un escenario evolutivo propuesto para el origen y la evolución de las helicasas de la Superfamilia 3 viral. Abreviaturas: SF3, dominio de la helicasa de la superfamilia 3; dominio de la nucleasa de la superfamilia HUH, HUH; DAB, dominio de unión al origen; TGH, transferencia horizontal de genes; RHR, replicación de horquilla rodante

Este patrón de conectividad sugiere un vector específico de evolución y parece ser mejor compatible con el siguiente escenario. El dominio helicasa SF3 de plásmidos bacterianos evolucionó a partir de una ATPasa similar a DnaC bacteriana; este dominio helicasa se anexó al dominio nucleasa de las repeticiones de plásmidos similares a pE194/pMV158, dando lugar al antepasado del supergrupo YLxH; las repeticiones de plásmidos bacterianos se transmitieron a los virus ADN de BERRO; la helicasa SF3 de los virus ARN se adquirió horizontalmente a partir de plásmidos bacterianos o, más probablemente, a partir de virus eucarióticos de ADN-BERRO; los virus de ADN-BERRO han engendrado parvovirus que a su vez dieron lugar a poliomavirus y papilomavirus (Fig. 4b). El escenario alternativo, bajo el cual las helicasas SF3 de los virus del ARN eucariótico dieron lugar a las proteínas bacterianas universales DnaC y dnaA, a través de plásmidos bacterianos, parece no parsimonioso y extremadamente improbable. De hecho, el dnaA es omnipresente y esencial en las bacterias50,51, por lo que la captura de la helicasa de un plásmido tendría que ocurrir en el origen mismo del dominio bacteriano de la vida. En particular, los plásmidos de pCRESS9 y P. pulchra no están vinculados con otros plásmidos, sino que están más bien conectados con el resto de las secuencias a través de los virus de ADN de CRESS. Este último patrón también se ha observado en el análisis de agrupamiento global de las REP de HUH (Fig. 1) así como en la agrupación de los dominios de la nucleasa solamente.

Orígenes de los virus ADN de BERROS a partir de plásmidos bacterianos

El análisis de los dominios helicasa SF3 sugiere que las repeticiones de plásmidos similares a pE194/pMV158 son formas ancestrales en lugar de formas derivadas. La posibilidad alternativa, a saber, que las repeticiones de plásmidos similares a pE194/pMV158 hayan perdido el dominio helicasa, no se puede descartar actualmente. Sin embargo, el hecho de que el dominio helicasa no se haya perdido en ninguno de los numerosos grupos conocidos de virus ADN-BERRO o en plásmidos de pCRESS1 a pCRESS9, sugiere que, una vez adquirido, el dominio helicasa se vuelve importante para la replicación eficiente del plásmido/genoma viral. Por lo tanto, la estrecha similitud entre las Rep de tipo pE194/pMV158 y las del supergrupo YLxH, lo que resulta en la conectividad directa de los dos grupos en la red global (Fig. 1), implica que el primer grupo es un grupo externo adecuado para la filogenia de Representantes de plásmidos bacterianos y virus de ADN de BERROS. Para los análisis filogenéticos, se utilizó un conjunto de datos de repeticiones SC2, excluyendo las repeticiones de virus Parvoviridae y ADN de BERRO que anteriormente se consideraban quiméricas con respecto a sus dominios de nucleasa y helicasa 53, para evitar artefactos potenciales resultantes de señales filogenéticas conflictivas. El conjunto de datos incluía representantes de todas las familias clasificadas de virus ADN del BERRO, así como 6 grupos de virus ADN del BERRO no clasificados provisionalmente etiquetados como CRESSV1-6 (ref. 53), así como un pequeño grupo de virus similares al GasCSV, que se ha observado previamente que codifican a los representantes con una similitud significativa con los representantes bacteriales54. En el árbol filogenético de máxima verosimilitud, bien apoyado, construido con PhyML y enraizado con Repeticiones similares a pE194 / pMV158, el supergrupo YLxH (pCRESS4-8) está en la base de un conjunto que incluye todos los virus de ADN de BERRO, pCRESS1-3 y pCRESS9, así como plásmidos de P. pulchra. Este conjunto se divide en dos clados (Fig. 5). El clado 1 incluye dos subclados, uno de los cuales consiste en geminivirus y genomovirus que unen plásmidos pCRESS9 de fitoplasma, y el otro incluye plásmidos CRESSV6 y P. pulchra. Notablemente, los plásmidos de P. pulchra parecen emerger directamente de dentro de la diversidad de CRESSV6, con la relación más cercana a la subclada de virus CRESSV6 secuenciada de muestras de aguas residuales. La relación entre geminivirus/genomovirus y plásmidos de pCRESS9 no se resuelve en la filogenia. Sin embargo, los análisis de agrupamiento sugieren fuertemente que las repeticiones de plásmidos de pCRESS9 evolucionaron de geminivirus-genomovirus (Figs. 1 y 4). De acuerdo con este escenario, los plásmidos fitoplasmales pCRESS7 y pCRESS9, a pesar de codificar Rep filogenéticamente distintas, comparten el contenido de genes, a saber, la proteína de control del número de copias, la proteína SSB similar a PRK06752 y la proteína hipotética conservada (Suplemento Fig. 3g, i). Además, los geminivirus y el CRESSV6 codifican proteínas de la cápside homóloga, lo que sugiere que evolucionaron a partir de un ancestro viral común en lugar de converger a partir de dos grupos de plásmidos mediante la captura de genes de proteínas de la cápside homóloga. El clado 2 incluye las repeticiones bacterianas de pCRESS1 – 3 y, como grupo hermano, los virus ADN del BERRO de las familias Nanoviridae/Alphasatellitidae, Smacoviridae y Circoviridae, así como los virus CRESSV1 no clasificados a través de CRESSV5, mientras que los virus similares al GasCSV están anidados dentro de la pCRESS2 bacteriana.

Fig. 5
figura 5

de Máxima verosimilitud árbol filogenético de proteínas Rep. Virus ssDNA circular asociado a GasCSV-Gasterópodo. El árbol fue construido con PhyML78. Las ramas con valores de soporte inferiores a 70 se contraen

La robustez del árbol PhyML se validó mediante análisis adicionales (Nota complementaria 1), incluidos i) análisis filogenéticos de máxima verosimilitud utilizando RAxML y IQ-Tree, con métodos alternativos de soporte de ramas (Figura S5); ii) reconstrucción filogenética utilizando el modelo de mezcla de 20 perfiles (Figura S5); iii) análisis estadístico de las tres topologías de árboles restringidas y no restringidas (Cuadro suplementario 2). En conjunto, estos resultados indican que la topología de árboles obtenida es altamente robusta y es probable que refleje con precisión la historia evolutiva de los Representantes codificados por virus de ADN de BERRO y plásmidos.

Cabe destacar el análisis de los motivos conservados (Fig. 3) sugiere una asociación específica entre las repeticiones de virus en el clado 1 y la pCRESS3 bacteriana (en lugar de la pCRESS1–3 colectivamente), lo que implica que la ubicación filogenética podría verse afectada por eventos de recombinación antiguos. Además, los baciladnavirus se omitieron del árbol filogenético global porque sus representantes mostraban una posición inestable en la filogenia dependiendo del muestreo de taxones(Fig. 6), posiblemente, debido al pequeño número de secuencias disponibles, su alta divergencia y quimerismo potencial. En cualquier caso, el análisis filogenético sugiere fuertemente que la mayoría de los virus ADN del BERRO, incluidos los circovirus, smacovirus, nanovirus y CRESSV1-5, evolucionaron de un ancestro común con las repeticiones bacterianas de pCRESS1–3, mientras que los virus similares a GasCSV no cultivados emergen directamente de las repeticiones bacterianas de pCRESS2 (Fig. 5). La procedencia del conjunto que incluye geminivirus, genomovirus y CRESSV6 es menos clara, pero podría ser anterior a la aparición de los otros grupos de virus de ADN de CRESS y posiblemente involucrara a un ancestro común con el supergrupo YLxH. Las repeticiones de las bacterias pCRESS9 y P. es probable que los plásmidos de pulchra se hayan adquirido horizontalmente más recientemente a partir de los virus de ADN de BERRO correspondientes.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.