originile Multiple ale virusurilor ADN monocatenare procariote și eucariote din plasmidele bacteriene și arhaice

rețeaua globală a repliconilor HUH

pentru a explora istoria evolutivă a repliconilor HUH, am colectat un set de date de endonucleaze HUH-singura proteină codificată de toți acești repliconi-reprezentând fiecare familie de viruși, plasmide și transpozonii asociați cu gazdele din toate cele trei domenii celulare16, 27,28,29,30. În această analiză, nu am luat în considerare relaxazele Mob implicate în conjugarea plasmidelor. Enzimele din această familie cuprind motive conservate permutate circular care complică comparația lor bazată pe secvență cu endonucleazele HUH implicate în replicarea sau transpunerea ADN-ului16,19. Setul de date rezultat a inclus 8764 secvențe. Acestea au fost grupate pe baza similitudinii perechilor, iar clusterele au fost identificate folosind un algoritm convex de clustering (pragul valorii p de 1e-08) cu CLANS35. Această analiză a relevat 33 de clustere care au variat ca mărime de la 7 la 2711 secvențe (date suplimentare 1). În urma unei inspecții a conectivității dintre clustere (Fig. 1), am definit 2 clustere orfane și 2 superclustere, care au afișat fie nu, fie foarte puține conexiuni între ele (date suplimentare 1). Cu toate acestea,compararea structurilor de înaltă rezoluție disponibile atât pentru reprezentanții grupurilor orfane, cât și pentru cei 2 superclusteri16, 36 confirmă fără echivoc originea lor comună.

Fig. 1
figure1

reprezentative repetari superfamiliei huh grupate de similitudinea lor secvență pereche. Liniile conectează secvențele cu valoarea P 1E−08. Grupurile au fost numite după plasmide bine caracterizate, viruși sau taxonii cei mai frecvenți

grupul orfan 1 include o singură familie de transpozoni IS200/IS605 care sunt răspândiți în bacterii și arhea37. Endonucleazele HUH ale secvențelor de inserție IS200 / IS605 au fost studiate extensiv structural și biochimic, rezultând o înțelegere cuprinzătoare a funcțiilor lor16,38. Deși transpozazele IS200 / IS605 au un pliu structural comun cu cel al altor endonucleaze HUH și conțin toate cele 3 motive de semnătură, acestea nu au prezentat o similitudine apreciabilă a secvenței cu niciun alt grup de endonucleaze HUH și au rămas astfel deconectate de secvențele din alte clustere. Cu toate acestea, diversitatea secvențelor din clusterul IS200/IS605 este comparabilă cu cea din alte clustere.

grupul orfan 2 include proteine Rep care sunt conservate în virusurile arhaice hipertermofile din familia Rudiviridae39. Studiile structurale ale proteinei Rep din rudivirus SIRV1 au relevat pliul canonic al ENDONUCLEAZEI HUH și caracterizarea biochimică a proteinei a confirmat activitățile așteptate de tăiere și îmbinare în vitro36. La fel ca transpozazele IS200/IS605, clusterul rudiviral Rep nu se conectează la alte endonucleaze HUH, inclusiv omologi din alte familii de viruși arhaici și plasmide.

Teoretic, unicitatea celor 2 clustere orfane este legată de mecanismele neobișnuite de transpunere și replicare folosite de elementele respective. Într-adevăr, secvențele de inserție IS200/IS605 se transpun printr-un mecanism unic de decojire și lipire38, în timp ce rudivirusurile, spre deosebire de majoritatea celorlalte virusuri și plasmide care se reproduc prin mecanismul cercului de rulare, conțin genomi dsDNA liniari relativ mari (~35 kb) cu terminale închise covalent40.

Superclusterul 1 este de departe cel mai mare și mai divers ansamblu HUH care include 24 de clustere (date suplimentare 1). Dintre aceste 24 de clustere, 15 conțin repetări din plasmide extrachromozomale de bună credință, dintre care 7 clustere includ, de asemenea, repetări din diverse ssDNA (Microviridae, Inovidae, și Pleolipoviridae) și/sau dsDNA (Myoviridae și Corticoviridae) viruși de bacterii și archaea. Trei clustere constau din repetări codificate de microvirusuri din subfamiliile Gokushovirinae și Bullavirinae, și Xanthomonas inovirus Cf1 (familia Inoviridae), respectiv. În special, microvirusurile asemănătoare phiX174 (Bullavirinae) prezintă similitudine exclusiv cu microvirusurile din subfamilia Gokushovirinae, indicativ al Rep monophyly în cele două subfamilii ale Microviridae, în ciuda divergenței de secvență ridicate. Bacteria IS91 (inclusiv subfamilia ISCR) și, respectiv, transpozonii familiei helitronice eucariote formează două clustere distincte. Cele două grupuri de transpozoni nu sunt conectate direct între ele, ci sunt legate de grupuri distincte de plasmide bacteriene și, în cazul IS91, arhaice, sugerând origini independente din repliconii extracromozomali bacterieni. S-a sugerat anterior că helitronii ar putea reprezenta o legătură lipsă între virusurile eucariote creson-ADN, și anume, geminivirusurile și repliconii bacterieni huh41 sau că helitronii au evoluat din geminiviruse42. Cu toate acestea, în analiza noastră, helitronii nu se conectează la niciunul dintre grupurile de virusuri CRESS-ADN, sugerând traiectorii evolutive independente, în concordanță cu descoperirile recente43.

cele 5 clustere rămase nu includ secvențe de plasmide, virale sau transpozon recunoscute și, prin urmare, sunt susceptibile de a reprezenta noi familii de MGE integrate. Patru dintre aceste grupuri se găsesc predominant în bacteriile taxonilor Clostridiales, Actinobacteria, Neisseriales și, respectiv, Bacteroidetes (etichetate corespunzător în Fig. 1), în timp ce al cincilea grup este specific diviziei candidate MSBL1 (lacurile cu saramură din Marea Mediterană 1) 44, un grup de archaea necultivate găsite în diferite medii hipersaline. Majoritatea clusterelor prezintă uniformitate taxonomică la nivel de domeniu, adică clusterele au inclus fie secvențe bacteriene, fie arhaice, fie eucariote (inclusiv virusurile și plasmidele corespunzătoare), sugerând că transferurile orizontale de viruși sau plasmide între domeniile gazdă sunt rare. Cele două excepții includ clusterele dominate de bacterii asemănătoare pUB110 și IS91, care includ o mână de secvențe arhaice. În cazul transpozonilor IS91, transferul orizontal din bacterii a fost stabilit prin analize filogenetice45. În plus, unele dintre clustere includ secvențe sporadice adnotate ca fiind eucariote; cu toate acestea, analiza contigilor corespunzători sugerează că aceștia sunt probabil contaminanți bacterieni.

de interes deosebit sunt cele 7 clustere care includ atât viruși, cât și plasmide. De exemplu, clusterul asemănător pEC316_KPC, pe lângă plasmide, conține viruși fără legătură evolutivă din 3 familii, Myoviridae, Corticoviridae și Inoviridae, sugerând o răspândire orizontală extinsă a genelor rep. În special, repetările inovirusurilor sunt distribuite între 5 clustere. Având în vedere deficitul de secvențe inovirale în clusterele pVT736-1 și pUB110, care includ doar Pseudomonas phage Pf3 și Propionibacterium phage B5, direcția transferului de gene, de la plasmide la virusurile corespunzătoare, pare evidentă. Mai mult, multe inovirusuri nu codifică ENDONUCLEAZELE HUH, ci mai degrabă codifică inițiatorii de replicare ai unei superfamilii fără legătură evolutivă, Rep_trans (Pfam id: PF02486)15, care abundă și în plasmide bacteriene30, în timp ce inovirusurile din genul Vespertiliovirus nu au repetări și, în schimb, se reproduc prin transpunere folosind transpozazele familiei IS3 și IS30 derivate din secvențele de inserție corespunzătoare46. În mod colectiv, aceste observații indică faptul că modulele de replicare ale inovirusurilor au fost schimbate cu module de replicare înrudite la distanță și chiar neomoloage din diferite familii de plasmide și transpozoni. În mod similar, pleolipovirusurile arhaeale sunt împărțite între două clustere corespunzătoare diferitelor familii de plasmide arhaeale, pgrb1-like și, respectiv, pTP2-like, sugerând că schimbul de gene asociate replicării este frecvent în virusurile bacteriene și arhaeale cu genomi mici, de dimensiuni plasmide. În unele cazuri, este dificil să se stabilească apartenența virală versus plasmidă a repetărilor codificate în cromozomii celulari, deoarece ambele tipuri de MGE se pot integra în genomul gazdă. De exemplu, clusterul asemănător XacF1 include 62 de secvențe Rep, dintre care 2 sunt codificate de fagi filamentoși, în timp ce restul provin din genomi bacterieni. Analiza cartierelor genomice sugerează că doar 6 din cele 60 de repetări rămase reprezintă profage. Mai mult, clusterul asemănător pAS28 include o plasmidă, pAS28 (ref. 47); cu toate acestea, repetările înrudite au fost identificate anterior în profeții 48, dar nu și în virusurile caracterizate, dând impresia eronată că Rep-ul asemănător pAS28 este exclusiv plasmidic. Pentru a caracteriza în continuare relațiile evolutive dintre repetările codificate de diferite tipuri de MGE, am construit arbori filogenetici cu probabilitate maximă pentru cele 7 clustere care au inclus repetări atât de la viruși, cât și de la plasmide (Fig suplimentar. 2a-g). Rezultatele analizelor filogenetice sugerează transferul orizontal al genelor rep între plasmide și viruși, secvențele virale fiind de obicei imbricate printre omologii codificați de plasmide.

Superclusterul 2 (SC2) este format din 7 clustere (date suplimentare 1) care includ toate virusurile eucariote-ADN clasificate și neclasificate cunoscute, parvovirusurile, un grup de plasmide din alga roșie pyropia pulchra49 și 4 clustere care conțin secvențe de REP bacteriene. Marea majoritate a repetărilor bacteriene din clusterele asemănătoare pCPa și p4M sunt codificate mai degrabă în genomii bacterieni decât în plasmide și nu au fost caracterizate anterior. În rețeaua noastră, virusurile CRESS-ADN sunt conectate la clustere asemănătoare pCPa, P4M, pPAPh2 și P. pulchra, în timp ce clusterul asemănător pE194/pMV158 nu formează conexiuni directe cu virusurile cress-ADN, ci se alătură SC2 prin clusterul asemănător pCPa (Fig. 1). În special, geminivirusurile și genomovirusurile formează un subcluster cu plasmide de fitoplasma (cluster asemănător pPAPh2) și P. pulchra, care este separat de alte virusuri CRESS-ADN. Clusterul Parvoviridae, inclusiv parvovirusurile și virusurile endogene derivate integrate în diferite genomuri eucariote, este slab conectat direct la virusurile ADN-creson, sugerând că parvovirusurile cu genomi liniari ssDNA împărtășesc strămoși comuni cu virusurile ADN-creson care, prin definiție, au genomi circulari. Intrigați de legătura evolutivă aparent strânsă dintre virusurile eucariote creson-ADN și repetările bacteriene și algale, am investigat aceste relații mai detaliat, după cum se raportează în secțiunile următoare.

diversitatea repetărilor de tip viral în genomii bacterieni

pentru a investiga gradul de similitudine dintre repetările virusurilor eucariote de creson-ADN și repliconii non-virali din SC2, am comparat organizațiile lor de domeniu. Cu excepția plasmidelor din familia pE194 / pMV158, care conțin numai domeniul nucleazei, repetările SC2 bacteriene și algale au avut aceeași organizare a domeniului nucleaz-helicază ca și virusurile CRESS-ADN. Aceeași organizație cu două domenii este, de asemenea, caracteristică Reps parvovirus 2. Astfel, analiza organizării domeniului coroborează rezultatele grupării secvențelor și indică în continuare că repetările bacteriene SC2 sunt mai strâns legate de repetările virusurilor eucariote decât de cele ale altor plasmide procariote și viruși.

am căutat apoi să obținem informații suplimentare despre diversitatea și distribuția taxonomică a repetărilor SC2 de tip viral care sunt codificate în genomii bacterieni. Analiza filogenetică cu probabilitate maximă a relevat 9 clade bine susținute (Fig. 2a). Clustering și analiza ulterioară de detectare comunitară au validat cele 9 grupe de repetări bacteriene (Fig. 2b), unde grupele 1-3 corespund clusterului de tip p4M prezentat în Fig. 1, grupurile 4-8 la clusterul asemănător pCPa și grupul 9 la clusterul asemănător pPAPh2. Pentru a sublinia asemănarea lor cu repetările virusurilor CRESS-ADN, ne referim la cele 9 grupuri ca pCRESS1 până la pCRESS9. Aceste grupuri au prezentat distribuții taxonomice parțial suprapuse, dar distincte, acoperind mai multe clase în cadrul a 4 filuri bacteriene (Fig suplimentar. 1 și tabelul suplimentar 1).

Fig. 2
figure2

diversitatea proteinelor Rep asemănătoare virusului în bacterii. un arbore filogenetic de proteine Rep bacteriene și omologii lor în P. pulchra. Secvențele strâns legate sunt prăbușite la triunghiuri, ale căror lungimi laterale sunt proporționale cu distanțele dintre cele mai apropiate și cele mai îndepărtate noduri de frunze. b CLANEAZĂ grupuri de proteine Rep bacteriene și omologii lor. Nodurile indică secvențe de proteine. Liniile reprezintă relații de secvență(clanuri p-valoare 1E-05). Nodurile aparținând aceluiași cluster sunt colorate cu aceleași culori, corespunzătoare cladelor prezentate în panoul A. C hărți genomice ale plasmidelor integrate și extracromozomale reprezentând grupele 1-9. Genele omoloage sunt reprezentate folosind aceeași culoare și funcțiile lor sunt listate în partea dreaptă a figurii

majoritatea repetărilor din pCRESS7 și pCRESS9 sunt codificate de plasmide extracromozomale (tabelul suplimentar 1). În schimb, marea majoritate (97.5%) din repetările găsite în alte grupuri sunt codificate în situsul elementelor genetice mobile-integrate în mod specific în cromozomii bacterieni (tabelul suplimentar 1; Fig. 2c; suplimentar Fig. 3; Nota Suplimentară 1). În special, niciunul dintre elemente nu a codificat Niciun omolog al proteinelor structurale virale cunoscute în prezent (nota suplimentară 1). În mod colectiv, aceste observații indică faptul că repetările asemănătoare virale din bacterii sunt codificate de diverse plasmide extrachromozomale și integrate.

caracteristicile conservate ale repetărilor bacteriene și ale virusului creson-ADN

analiza secvenței a arătat că, în ciuda divergenței generale considerabile a secvenței, repetările pCRESS4 până la 8 conțin motive de secvență strâns similare în domeniile nucleazei și helicazei (Fig. 3), în concordanță cu rezultatele analizelor de grupare și filogenetică (Fig. 2). În special, aceste 5 grupuri pCRESS au o semnătură specifică, YLxH (x, orice aminoacid) în motivul III al domeniului nucleazei, care nu a fost observat în repetările din pCRESS1–3 și 9 (Fig. 3). Astfel, ne referim la pcress4-8 colectiv ca supergrup YLxH (mai degrabă decât clusterul asemănător pCPa), pentru a sublinia această caracteristică partajată. Semnătura YLxH a fost, de asemenea, conservată în repetări din clusterul asemănător pE194/pMV158, sugerând o relație evolutivă mai strânsă între cele două clustere, în ciuda faptului că repetările asemănătoare pE194/pMV158 nu au domeniul helicazei. De asemenea, pCRESS9 afișează motive similare cu cele ale plasmidelor P. pulchra și astfel ar putea fi unificate cu aceste plasmide într-un ansamblu comun. În schimb, pcress1, -2 și -3 (cluster asemănător p4M) afișează seturi distincte de motive (Fig. 3; Nota Suplimentară 1).

Fig. 3
figure3

motive de secvență conservate ale proteinelor Rep. Grupurile de reprezentanți bacterieni sunt reprezentate în fundal gri. Reziduurile sunt colorate prin proprietățile lor chimice (polar, verde; bazic, albastru; acid, roșu; hidrofob, negru; neutru, violet). Grupurile de reprezentanți au fost ordonate manual în funcție de similitudinea perechilor din motivele aliniate. Domeniile helicazei HUH endonuclează și SF3 sunt delimitate în partea de sus a figurii

originea domeniului helicazei SF3

analizele secvenței sugerează că repetările plasmidelor care conțin domeniul helicazei SF3, în special cele din pCRESS2, pCRESS3 și pCRESS9 și P. pulchra, sunt strâns legate între ele la repetările virusurilor cress-ADN. Cu toate acestea, direcționalitatea evoluției, adică dacă repetările plasmidelor au evoluat din cele ale virusurilor CRESS-ADN sau invers, nu este evidentă. Deși este tentant să luăm absența domeniului helicazei în clusterul asemănător pE194 / pMV158 ca o indicație că acest grup este ancestral pentru repetările care conțin helicază, nu se poate exclude faptul că domeniul helicazei a fost pierdut de aceste plasmide. Astfel, ne-am propus să investigăm proveniența domeniului helicazei SF3 în plasmidă și repetări virale. Căutările de secvențe sensibile cu HMMER împotriva bazei de date nr30 au arătat că domeniile helicazei repetărilor virale plasmidice și CRESS-ADN sunt cel mai strâns legate de cele ale virusurilor ARN cu sens pozitiv eucariot (ordinul Picornavirales și familia Caliciviridae), precum și superfamilia AAA+ ATPase 50, 51. În această analiză, am inclus și secvențele SF3 ale parvovirusurilor, poliomavirusurilor și papilomavirusurilor despre care se crede că sunt legate evolutiv de virusurile ADN-CRESON2,25. Mai multe grupuri de helicaze SF3 mai îndepărtate de viruși cu genomuri dsDNA mari52 au fost ignorate. Datorită divergenței mari a secvenței și a lungimii relativ scurte, analizele filogenetice ale domeniilor helicazei SF3 nu au fost informative, rezultând topologii de arbori în formă de stea, indiferent de modelele evolutive sau eșantionarea taxonomică utilizată. Cu toate acestea, analiza de grupare bazată pe asemănări în perechi a oferit informații despre relațiile dintre diferitele familii ATPase (Fig. 4a). În special, relația strânsă dintre domeniile helicazei SF3 ale repetărilor bacteriene și virusurile CRESS-ADN a fost susținută în mod clar. Ambele grupuri se conectează la virusurile ARN, dar numai repetările bacteriene, în special cele ale supergrupului YLxH, prezintă conexiuni la Atpazele superfamiliei AAA+, și anume, încărcătorul helicazei bacteriene DnaC și, într-o măsură mai mică, DnaA și Atpazele asemănătoare Cdc48 (Fig. 4a). Similitudinea mai strânsă dintre supergrupul YLxH și atpazele bacteriene AAA+ este susținută de compararea motivelor catalitice care au dezvăluit mai multe caractere derivate partajate, cu excluderea altor grupuri (Fig suplimentar. 4). La același prag de grupare, nici ADN-ul eucariot, nici virusurile ARN nu sunt legate de niciun grup de Atpaze, altele decât cele din plasmidele bacteriene. Helicazele SF3 ale parvovirusurilor legate de cele ale virusurilor CRESS-ADN, în concordanță cu analiza secvențelor Rep de lungime întreagă (Fig. 1). Papilomavirusurile și poliomavirusurile au format 2 clustere care s-au conectat între ele și la parvovirusuri.

Fig. 4
figure4

relațiile dintre superfamilia 3 helicaze și AAA+ Atpaze. o superfamilie 3 helicase și AAA+ ATPase domenii grupate prin similitudinea lor pereche folosind clanuri. În total, 3854 de secvențe au fost grupate cu clanuri(clanuri p-valoare 5e-09). Grupurile de virusuri cress-ADN neclasificate sunt denumite CRESSV1 prin CRESSV6 (ref. 53). B un scenariu evolutiv propus pentru originea și evoluția superfamiliei virale 3 helicaze. Abrevieri: SF3, superfamilia 3 domeniul helicazei; HUH, huh superfamilia domeniul nucleazei; OBD, domeniu de legare a originii; HGT, transfer orizontal de gene; RHR, rolling-ac de păr replicare

acest model de conectivitate sugerează un vector specific de evoluție și pare a fi cel mai bine compatibil cu următorul scenariu. Domeniul helicazei SF3 al plasmidelor bacteriene a evoluat dintr-o ATPază bacteriană asemănătoare DnaC; acest domeniu helicazei a fost anexat domeniului nucleazei repetărilor plasmidelor asemănătoare pE194/pMV158, producând strămoșul supergrupului YLxH; repetările plasmidelor bacteriene au fost transmise virusurilor ADN-creson; helicaza SF3 a virusurilor ARN a fost dobândită orizontal fie din plasmide bacteriene, fie, mai probabil, din virusuri eucariote CRESS-ADN; virusurile cress-ADN au generat parvovirusuri care la rândul lor au dat naștere la poliomavirusuri și papilomavirusuri (Fig. 4b). Scenariul alternativ, în care helicazele SF3 ale virusurilor ARN eucariote au dat naștere proteinelor bacteriene universale DnaC și DnaA, prin plasmide bacteriene, pare neparsimonios și extrem de puțin probabil. Într-adevăr,DnaA este omniprezent și esențial în bacterii50, 51, astfel încât captarea helicazei dintr-o plasmidă ar trebui să aibă loc chiar la originea domeniului bacterian al vieții. În special, plasmidele pCRESS9 și P. pulchra nu sunt legate de alte plasmide, ci sunt mai degrabă conectate la restul secvențelor prin virusurile CRESS-ADN. Ultimul model a fost observat și în analiza globală de grupare a repetărilor HUH (Fig. 1) precum și în gruparea domeniilor nucleazei singure.

originile virusurilor ADN-creson din plasmidele bacteriene

analiza domeniilor helicazei SF3 sugerează că repetările plasmidelor asemănătoare pE194 / pMV158 sunt mai degrabă forme ancestrale decât derivate. Posibilitatea alternativă, și anume, că repetările plasmidelor asemănătoare pE194/pMV158 au pierdut domeniul helicazei, nu poate fi exclusă în prezent. Cu toate acestea, faptul că domeniul helicazei nu a fost pierdut în niciunul dintre numeroasele grupuri cunoscute de virusuri CRESS-ADN sau în pcress1 la pcress9 plasmide, sugerează că, odată dobândit, domeniul helicazei devine important pentru replicarea eficientă a genomului plasmidic/viral. Astfel, similitudinea strânsă dintre repetările de tip pE194 / pMV158 și cele ale supergrupului YLxH, rezultând conectivitatea directă a celor două grupuri în rețeaua globală (Fig. 1), implică faptul că fostul grup este un grup adecvat pentru filogenia repetărilor din plasmidele bacteriene și virusurile CRESS-ADN. Pentru analizele filogenetice, am folosit un set de date de repetări SC2, excluzând repetările virusurilor Parvoviridae și cress-ADN care au fost considerate anterior a fi himerice în ceea ce privește domeniile lor nuclează și helicază53, pentru a evita potențialele artefacte rezultate din semnale filogenetice conflictuale. Setul de date a inclus reprezentanți ai tuturor familiilor clasificate de virusuri CRESS-ADN, precum și 6 grupe de virusuri cress-ADN neclasificate etichetate provizoriu CRESSV1–6 (ref. 53), precum și un grup mic de virusuri asemănătoare GasCSV, care au fost observate anterior pentru a codifica repetari cu similitudine semnificativă cu repetari bacteriene54. În arborele filogenetic cu probabilitate maximă bine susținut, construit cu PhyML și înrădăcinat cu repetări asemănătoare pE194/pMV158, supergrupul YLxH (pCRESS4-8) se află la baza unui ansamblu care include toate virusurile ADN–CRESS, pCRESS1-3 și pCRESS9, precum și plasmidele P. pulchra. Acest ansamblu se împarte în două clade (Fig. 5). Clada 1 include două subclade, dintre care una constă din geminivirusuri și genomovirusuri care unesc plasmidele pcress9 ale fitoplasmei, iar cealaltă include plasmidele CRESSV6 și P. pulchra. În special, plasmidele P. pulchra par să apară direct din diversitatea CRESSV6, cu cea mai strânsă relație cu SUBCLADA CRESSV6 a virusurilor secvențiate din probele de apă uzată. Relația dintre geminivirusuri/genomovirusuri și plasmidele pCRESS9 nu este rezolvată în filogenie. Cu toate acestea, analizele de grupare sugerează cu tărie că repetările plasmidelor pCRESS9 au evoluat din geminivirusuri-genomovirusuri (Fig. 1 și 4). În concordanță cu acest scenariu, plasmidele fitoplasmatice pcress7 și pCRESS9, în ciuda codificării repetărilor distincte filogenetic, împărtășesc conținutul genei, și anume, proteina de control a numărului de copii, proteina SSB asemănătoare PRK06752 și proteina ipotetică conservată (Fig suplimentar. 3g, i). Mai mult, geminivirusurile și CRESSV6 codifică proteine omoloage de capsidă sugerând că au evoluat dintr-un strămoș viral comun, mai degrabă decât convergente din două grupuri de plasmide prin captarea genelor proteice omoloage de capsidă. Clada 2 include repetări bacteriene ale pCRESS1-3 și, ca grup suror, virusurile ADN-CRESS din familiile Nanoviridae/Alphasatellitidae, Smacoviridae și Circoviridae, precum și cressv1 neclasificat prin CRESSV5, în timp ce virusurile asemănătoare GasCSV sunt imbricate în pcress2 bacterian.

Fig. 5
figure5

probabilitatea maximă arborele filogenetic al proteinelor Rep. GasCSV-virusul ssdna circular asociat Gastropodului. Arborele a fost construit cu PhyML78. Ramurile cu valori suport Sub 70 sunt contractate

robustețea arborelui PhyML a fost validată prin analize suplimentare( nota suplimentară 1), inclusiv (i) analize filogenetice cu probabilitate maximă utilizând RAxML și IQ-Tree, cu metode alternative de susținere a ramurilor (figura S5); (ii) reconstrucția filogenetică utilizând modelul amestecului cu profil 20 (figura S5); (iii) analiza statistică a topologiilor arborelui neconstrâns și 3 constrâns (tabelul suplimentar 2). În mod colectiv, aceste rezultate indică faptul că topologia arborelui obținut este foarte robustă și este probabil să reflecte cu exactitate istoria evolutivă a repetărilor codificate de virusurile și plasmidele ADN-CRESS.

în special, analiza motivelor conservate (Fig. 3) sugerează o asociere specifică între reprezentanții virusului din clada 1 și pcress3 bacterian (mai degrabă decât pcress1–3 colectiv), ceea ce înseamnă că plasarea filogenetică ar putea fi afectată de evenimente antice de recombinare. În plus, baciladnavirusurile au fost omise din arborele filogenetic global, deoarece repetările lor au prezentat o poziție instabilă în filogenie în funcție de eșantionarea taxonului (Fig suplimentar. 6), posibil, datorită numărului mic de secvențe disponibile, divergenței lor ridicate și chimerismului potențial. Indiferent, analiza filogenetică sugerează cu tărie că majoritatea virusurilor CRESS-ADN, inclusiv circovirusurile, smacovirusurile, nanovirusurile și CRESSV1–5, au evoluat dintr–un strămoș comun cu repetări bacteriene ale pCRESS1-3, în timp ce virusurile asemănătoare gascsv necultivate apar direct din repetările bacteriene pcress2 (Fig. 5). Proveniența ansamblului, inclusiv geminivirusuri, genomovirusuri și CRESSV6 este mai puțin clară, dar ar putea preceda apariția celorlalte grupuri de virus CRESS-ADN și, eventual, a implicat un strămoș comun cu supergrupul YLxH. Repetările pcress9 bacteriene și P. plasmidele pulchra au fost probabil dobândite orizontal mai recent de la virusurile ADN-creson corespunzătoare.

Lasă un răspuns

Adresa ta de email nu va fi publicată.