Multiple oprindelser af prokaryote og eukaryote enkeltstrengede DNA-vira fra bakterielle og arkaeale plasmider

globalt netværk af HUH—replikonerne

for at udforske HUH—replikonernes evolutionære historie indsamlede vi et datasæt af HUH endonukleaser-det eneste protein kodet af alle disse replikoner-der repræsenterer hver familie af vira, plasmider og transposoner forbundet med værter på tværs af alle tre cellulære domæner16, 27, 28,29,30. I denne analyse overvejede vi ikke Mobafslapninger involveret i plasmidkonjugering. I denne familie omfatter cirkulært permuterede konserverede motiver,som komplicerer deres sekvensbaserede sammenligning med de HUH-endonukleaser, der er involveret i DNA-replikation eller transposition16, 19. Det resulterende datasæt omfattede 8764 sekvenser. Disse blev grupperet baseret på parvis lighed, og klynger blev identificeret ved hjælp af en konveks klyngealgoritme (p-værdi tærskel på 1e−08) med CLANS35. Denne analyse afslørede 33 klynger, der varierede i størrelse fra 7 til 2711 sekvenser (supplerende data 1). Efter en inspektion af forbindelsen mellem klynger (Fig. 1), definerede vi 2 forældreløse klynger og 2 superklynger, som viste enten ingen eller meget få forbindelser til hinanden (supplerende data 1). Ikke desto mindre bekræfter sammenligning af de tilgængelige højopløsningsstrukturer for repræsentanter for både forældreløse klynger og de 2 superhober16,36 utvetydigt deres fælles oprindelse.

Fig. 1
figur1

repræsentant HUH superfamilier reps grupperet af deres parvis sekvens lighed. Linjer forbinder sekvenser med p−værdi, der er lig med 1e-08. Grupper blev opkaldt efter velkarakteriserede plasmider, vira eller hyppigste takson

Orphan cluster 1 inkluderer en enkelt familie af IS200/IS605 transposoner, der er udbredt i bakterier og archaea37. HUH-endonukleaserne i is200 / IS605-indsættelsessekvenserne er blevet grundigt undersøgt strukturelt og biokemisk, hvilket resulterer i en omfattende forståelse af deres funktioner16,38. Selvom IS200 / IS605 transposaser har en strukturel fold, der er fælles for andre HUH endonukleaser og indeholder alle 3 signaturmotiver, viste de ikke mærkbar sekvenslighed med nogen anden klynge af HUH endonukleaser og forblev således afbrudt fra sekvenser i andre klynger. Ikke desto mindre er sekvensdiversitet inden for is200/IS605-klyngen sammenlignelig med den inden for andre klynger.

Orphan cluster 2 inkluderer Rep-proteiner, der er konserveret i hypertermofile arkaeale vira fra familien Rudiviridae39. Strukturelle undersøgelser af Rep-proteinet fra rudivirus SIRV1 afslørede den kanoniske HUH endonukleasefold og biokemisk karakterisering af proteinet bekræftede de forventede nicking-og sammenføjningsaktiviteter i vitro36. Ligesom IS200 / IS605 transposaser forbinder den rudivirale Rep-klynge ikke med andre HUH-endonukleaser, herunder homologer fra andre familier af arkæale vira og plasmider.

tænkeligt er det unikke ved de 2 forældreløse klynger knyttet til de usædvanlige transponerings-og replikationsmekanismer, der anvendes af de respektive elementer. Faktisk transponerer IS200/IS605 indsættelsessekvenser med en unik peel-and-paste-mekanisme38, hvorimod rudivira, i modsætning til de fleste andre vira og plasmider, der replikeres af rullende cirkelmekanisme, indeholder relativt store (~35 kb) lineære dsDNA-genomer med kovalent lukket termini40.

Supercluster 1 er langt den største og mest forskelligartede HUH-samling, der inkluderer 24 klynger (supplerende data 1). Af disse 24 klynger indeholder 15 Reps fra bona fide ekstrachromosomale plasmider, hvoraf 7 klynger også inkluderer Reps fra forskellige ssdna (Microviridae, Inoviridae og Pleolipoviridae) og/eller dsDNA (Myoviridae og Corticoviridae) vira af bakterier og archaea. De tre klynger består af Reps kodet af mikrovirus af underfamilierne Gokushovirinae og Bullavirinae, og Ksanthomonas Inovirus Cf1 (familie Inoviridae), hhv. Især phiks174-lignende mikrovirus (Bullavirinae) viser lighed udelukkende med mikrovirus fra underfamilien Gokushovirinae, hvilket indikerer Rep monofyly i de to underfamilier af Mikroviridae, på trods af høj sekvensdivergens. Den bakterielle IS91 (inklusive ISCR-underfamilie) og eukaryote Helitronfamilietransposoner danner henholdsvis to forskellige klynger. De to grupper af transposoner er ikke direkte forbundet med hinanden, men er knyttet til forskellige grupper af bakterielle og i tilfælde af IS91 arkaeale plasmider, hvilket antyder uafhængig oprindelse fra bakterielle ekstrachromosomale replikoner. Det er tidligere blevet foreslået, at helitroner kan repræsentere en manglende forbindelse mellem eukaryote karse-DNA-vira, nemlig geminiviruser og bakterielle HUH-replikoner41, eller at helitroner udviklede sig fra geminiviruser42. I vores Analyse forbinder helitroner imidlertid ikke nogen af grupperne af CRESS-DNA-vira, hvilket antyder uafhængige evolutionære baner i overensstemmelse med de nylige fund43.

de resterende 5 klynger inkluderer ikke genkendelige plasmid -, virale eller transposon-sekvenser og repræsenterer således sandsynligvis nye familier af integreret MGE. Fire af disse grupper findes overvejende i bakterier af clostridiales, Actinobacteria, Neisseriales og Bacteroidetes (mærket i overensstemmelse hermed i Fig. 1), mens den femte gruppe er specifik for kandidatdivisionen MSBL1 (Mediterranean Sea Brine Lakes 1) 44, en gruppe ukulturerede arkæer, der findes i forskellige hypersalinmiljøer. De fleste af klyngerne viser taksonomisk ensartethed på domæneniveau, dvs.klynger omfattede enten bakterielle eller arkaeale eller eukaryote sekvenser (inklusive de tilsvarende vira og plasmider), hvilket antyder, at vandrette overførsler af vira eller plasmider mellem værtsdomæner er sjældne. De to undtagelser inkluderer pUB110-lignende og IS91-lignende bakteriedominerede klynger, som inkluderer en håndfuld arkaeale sekvenser. I tilfælde af IS91-transposoner er horisontal overførsel fra bakterier blevet konstateret ved fylogenetiske analyser45. Derudover inkluderer nogle af klyngerne sporadiske sekvenser, der er kommenteret som eukaryote; imidlertid antyder analyse af de tilsvarende contigs, at disse sandsynligvis er bakterielle forurenende stoffer.

af særlig interesse er de 7 klynger, der omfatter både vira og plasmider. For eksempel indeholder pEC316_KPC-lignende klynge udover plasmider evolutionært uafhængige vira fra 3 familier, Myoviridae, Corticoviridae og Inoviridae, hvilket tyder på omfattende vandret spredning af rep-generne. Især er Reps af inovirus fordelt på 5 klynger. I betragtning af manglen på inovirale sekvenser i pVT736-1-lignende og pUB110-lignende klynger, der kun inkluderer Pseudomonas-fag Pf3 og Propionibacterium-fag B5, synes retningen af genoverførsel fra plasmider til de tilsvarende vira åbenlyst. Desuden koder Mange inovirus ikke HUH endonukleaser, men koder snarere replikationsinitiatorer af en evolutionært uafhængig superfamilie, Rep_trans (Pfam id: PF02486)15, som også bugner af bakterielle plasmider30, hvorimod inovirus af slægten Vespertiliovirus mangler Reps og i stedet replikerer ved transposition ved hjælp af IS3 og IS30 familie transposaser afledt af de tilsvarende indsættelsessekvenser46. Samlet indikerer disse observationer, at replikationsmodulerne af inovirus er blevet udvekslet med fjernt beslægtede og endda ikke-homologe replikationsmoduler fra forskellige plasmid-og transposonfamilier. Tilsvarende er arkaeale pleolipovirus opdelt mellem to klynger svarende til forskellige familier af arkaeale plasmider, henholdsvis pGRB1-lignende og pTP2-lignende, hvilket antyder, at udveksling af replikationsassocierede gener er almindelig i bakterielle og arkaeale vira med små genomer i plasmidstørrelse. I nogle tilfælde er det vanskeligt at fastslå det virale versus plasmidmedlemskab af Reps kodet i cellulære kromosomer, fordi begge typer MGE kan integreres i værtsgenomerne. For eksempel omfatter den Ksacf1-lignende klynge 62 Rep-sekvenser, hvoraf 2 er kodet af filamentøse fager, mens resten kommer fra bakterielle genomer. Analyse af de genomiske kvarterer antyder, at kun 6 af de resterende 60 Reps repræsenterer profager. Desuden omfatter den pAS28-lignende klynge et plasmid, pAS28 (ref. 47); imidlertid er relaterede Reps tidligere blevet identificeret i prophages48, men ikke i karakteriserede vira, hvilket giver det fejlagtige indtryk af, at den pAS28-lignende Rep er plasmid-eksklusiv. For yderligere at karakterisere de evolutionære forhold mellem Reps kodet af forskellige typer MGE konstruerede vi maksimal sandsynlighed fylogenetiske træer til de 7 klynger, der omfattede Reps fra både vira og plasmider (supplerende Fig. 2a-g). Resultaterne af fylogenetiske analyser antyder vandret overførsel af rep-generne mellem plasmider og vira, hvor virale sekvenser typisk er indlejret blandt plasmidkodede homologer.

Supercluster 2 (SC2) består af 7 klynger (supplerende data 1), som inkluderer alle kendte klassificerede og uklassificerede eukaryote karse-DNA-vira, parvovirus, en klynge af plasmider fra den røde alge Pyropia pulchra49 og 4 klynger indeholdende bakterielle Rep-sekvenser. Langt størstedelen af de bakterielle Reps i de pCPa-lignende og p4M-lignende klynger er kodet i bakterielle genomer snarere end i plasmider og er ikke tidligere blevet karakteriseret. I vores netværk er CRESS-DNA-vira forbundet til pCPa-lignende, p4M-lignende, pPAPh2-lignende og P. pulchra-lignende klynger, mens den pE194/pMV158-lignende klynge ikke danner direkte forbindelser til CRESS-DNA-vira, men forbinder SC2 gennem pCPa-lignende klynge (Fig. 1). Geminivirus og genomovirus danner især en subkluster med plasmider af fytoplasma (pPAPh2-lignende klynge) og P. pulchra, som er adskilt fra andre CRESS-DNA-vira. Parvoviridae-klyngen, inklusive parvovirus og afledte endogene vira integreret i forskellige eukaryote genomer, er løst forbundet direkte til CRESS-DNA-vira, hvilket antyder, at parvovirus med lineære ssDNA-genomer deler fælles herkomst med CRESS-DNA-vira, som pr.definition har cirkulære genomer. Fascineret af den tilsyneladende tætte evolutionære forbindelse mellem eukaryote karse-DNA-vira og bakterie-og algerepræsentanter, vi undersøgte disse forhold mere detaljeret, som rapporteret i de følgende afsnit.

mangfoldigheden af viral-lignende Reps i bakterielle genomer

for at undersøge omfanget af lighed mellem Reps af eukaryote CRESS-DNA-vira og ikke-virale replikoner fra SC2 sammenlignede vi deres domæneorganisationer. Med undtagelse af pe194 / pMV158-familieplasmider, der kun indeholder nuklease-domænet, havde bakterielle og algale SC2-Reps den samme Nuclease-helicase-domæneorganisation som CRESS-DNA-vira. Den samme to-domæne organisation er også karakteristisk for parvovirus Reps2. Således bekræfter domæneorganisationsanalyse resultaterne af sekvensklyngning og indikerer yderligere, at de bakterielle SC2-Reps er tættere beslægtede med Reps af eukaryote vira end dem fra andre prokaryote plasmider og vira.

Vi forsøgte derefter at få yderligere oplysninger om mangfoldigheden og taksonomisk fordeling af de viruslignende SC2-Reps, der er kodet i bakterielle genomer. Maksimal sandsynlighed fylogenetisk analyse afslørede 9 velunderstøttede klader (Fig. 2a). Klyngedannelse og efterfølgende samfundsdetekteringsanalyse validerede de 9 grupper af bakterielle Reps (Fig. 2b), hvor grupperne 1-3 svarer til den p4M-lignende klynge vist i Fig. 1, grupper 4-8 til pCPa – lignende klynge, og gruppe 9 til pPAPh2-lignende klynge. For at understrege deres lighed med Reps af CRESS-DNA-vira henviser vi til de 9 grupper som pCRESS1 gennem pCRESS9. Disse grupper viste delvist overlappende, men tydelige taksonomiske fordelinger, der dækkede flere klasser inden for 4 bakteriefyler (supplerende Fig. 1 og supplerende tabel 1).

Fig. 2
figur2

mangfoldighed af viral-lignende rep proteiner i bakterier. et fylogenetisk træ af bakterielle Rep proteiner og deres homologer i P. pulchra. Nært beslægtede sekvenser kollapses til trekanter, hvis sidelængder er proportionale med afstandene mellem nærmeste og fjerneste bladknuder. B klaner grupper af bakterielle Rep proteiner og deres homologer. Noder angiver proteinsekvenser. Linjer repræsenterer sekvensrelationer (klaner P-værdi kur 1e−05). Knudepunkterne, der hører til den samme klynge, er farvet med de samme farver, svarende til kladerne vist i panel A. c Genomkort over integrerede og ekstrachromosomale plasmider, der repræsenterer grupper 1-9. Homologe gener er afbildet ved hjælp af samme farve, og deres funktioner er angivet på højre side af figuren

størstedelen af Reps fra pCRESS7 og pCRESS9 er kodet af ekstrachromosomale plasmider (supplerende tabel 1). I modsætning hertil er det store flertal (97.5%) af Reps fundet i andre grupper er kodet inden for mobile genetiske elementer site-specifikt integreret i bakterielle kromosomer (supplerende tabel 1; Fig. 2C; supplerende Fig. 3; Supplerende Note 1). Navnlig kodede ingen af elementerne nogen homologer af aktuelt kendte virale strukturelle proteiner (supplerende Note 1). Samlet set indikerer disse observationer, at viral-lignende Reps i bakterier er kodet af forskellige ekstrachromosomale og integrerede plasmider.

konserverede træk ved bakterie-og karse-DNA-Virusreps

sekvensanalyse viste, at på trods af betydelig samlet sekvensdivergens indeholder Reps af pCRESS4 til 8 tæt lignende sekvensmotiver inden for nuklease-og helicase-domænerne (Fig. 3), i overensstemmelse med resultaterne af klyngeanalyser og fylogenetiske analyser (Fig. 2). Især deler disse 5 pCRESS-grupper en specifik signatur, Ylksh (enhver aminosyre) inden for motiv III af nuklease-domænet, som ikke blev observeret i Reps fra pCRESS1–3 og 9 (Fig. 3). Således henviser vi til pCRESS4 – 8 kollektivt som supergroup (snarere end pCPa-lignende klynge) for at understrege denne delte funktion. Signaturen blev også bevaret i Reps fra den pE194/pMV158-lignende klynge, hvilket tyder på et tættere evolutionært forhold mellem de to klynger, på trods af at pE194 / pMV158-lignende Reps mangler helicase-domænet. PCRESS9 viser også motiver, der ligner dem fra P. pulchra-plasmiderne og kunne således forenes med disse plasmider i en fælles samling. Derimod viser pCRESS1, -2 og -3 (p4M-lignende klynge) karakteristiske sæt motiver (Fig. 3; Supplerende Note 1).

Fig. 3
figur3

konserverede sekvensmotiver af Rep-proteiner. Bakterielle Rep grupper er afbildet i grå baggrund. Rester er farvet af deres kemiske egenskaber (polar, grøn; grundlæggende, blå; sur, rød; hydrofob, sort; neutral, lilla). Rep-grupperne blev manuelt bestilt i henhold til den parvise lighed i de justerede motiver. Huh-endonuklease-og SF3-helicase-domænerne er afgrænset øverst på figuren

oprindelsen af SF3-helicase-domænet

Sekvensanalyser antyder, at SF3-helicase-domæneholdige plasmid-Reps, især dem fra pCRESS2, pCRESS3 og pCRESS9 og P. pulchra, er tæt beslægtet med SF3-helicase-domænet, der indeholder plasmid-Reps, især dem fra pCRESS2, pCRESS3 og pCRESS9 og P. pulchra, er tæt forbundet med reps af Cress-DNA-vira. Imidlertid er udviklingsretningen, dvs.om plasmidreps udviklede sig fra CRESS-DNA-vira eller omvendt, ikke indlysende. Selvom det er fristende at tage fraværet af helicase-domænet i den pE194/pMV158-lignende klynge som en indikation af, at denne gruppe er forfædre til de helicase-holdige Reps, kan det ikke udelukkes, at helicase-domænet gik tabt af disse plasmider. Således satte vi os for at undersøge oprindelsen af SF3 helicase-domænet i plasmidet og viral Reps. Følsomme sekvenssøgninger med HMMER mod NR30-databasen viste,at helicase-domænerne af plasmid-og CRESS-DNA-virale Reps er mest nært beslægtede med dem af eukaryote positive-sense RNA-vira (orden Picornavirales og familie Caliciviridae) såvel som AAA+ ATPase superfamily50, 51. I denne analyse inkluderede vi også SF3-sekvenserne af parvovirus, polyomavirus og papillomavirus,der menes at være evolutionært relateret til CRESS-DNA-viruser2, 25. Flere grupper af fjernere SF3-helikaser fra vira med store dsDNA-genomer52 blev ignoreret. På grund af den høje sekvensdivergens og relativt korte længde, fylogenetiske analyser af SF3-helicase-domænerne var ikke informative, hvilket resulterede i stjerneformede trætopologier, uanset de anvendte evolutionære modeller eller taksonomisk prøveudtagning. Klyngeanalyse baseret på parvise ligheder gav imidlertid indsigt i forholdet mellem de forskellige ATPase-familier (Fig. 4a). Især blev det tætte forhold mellem SF3 helicase-domænerne af bakterielle Reps og CRESS-DNA-vira tydeligt understøttet. Begge grupper forbinder til RNA-vira, men kun bakterielle Reps, især dem fra supergruppen, viser forbindelser til AAA+ superfamilie Atpaser, nemlig bakteriel helicase loader DnaC og i mindre grad DnaA og Cdc48-lignende atpaser (Fig. 4a). Den tættere lighed mellem supergruppen og bakterielle AAA+ Atpaser understøttes ved sammenligning af de katalytiske motiver, der afslørede flere delte afledte tegn, med udelukkelse af andre grupper (supplerende Fig. 4). Ved den samme klyngetærskel er hverken eukaryot DNA eller RNA-vira knyttet til nogen gruppe af Atpaser bortset fra dem fra bakterielle plasmider. SF3-helikaser af parvovirus knyttet til dem af CRESS-DNA-vira, i overensstemmelse med analysen af Rep-sekvenser i fuld længde (Fig. 1). Papillomavirus og polyomavirus dannede 2 klynger, der forbandt hinanden og parvovirus.

Fig. 4
figur4

forhold mellem superfamilie 3 helicaser og AAA+ Atpaser. en superfamilie 3 helicase og AAA+ ATPase domæner grupperet af deres parvise lighed ved hjælp af klaner. I alt blev 3854 sekvenser grupperet med klaner (klaner P-værdi Kurt 5e−09). Grupper af uklassificerede CRESS-DNA-vira kaldes CRESSV1 gennem CRESSV6 (ref. 53). b et foreslået evolutionært scenario for oprindelsen og udviklingen af viral superfamilie 3 helikaser. Forkortelser: SF3, superfamilie 3 helicase domæne; HUH, HUH superfamilie nuklease domæne; OBD, oprindelsesbindende domæne; HGT, vandret genoverførsel; RHR, rolling-hairpin replication

dette forbindelsesmønster antyder en specifik evolutionsvektor og ser ud til at være bedst kompatibel med følgende scenarie. SF3-helicase-domænet for bakterielle plasmider udviklede sig fra en bakteriel DnaC-lignende ATPase; dette helicase-domæne blev tilføjet til nuklease-domænet for Reps af pE194 / pMV158-lignende plasmider, hvilket gav forfader til YL-supergruppen; bakterielle plasmid-Reps blev videregivet til CRESS-DNA-vira; SF3-helikasen af RNA-vira blev vandret erhvervet enten fra bakterielle plasmider eller mere sandsynligt fra eukaryote CRESS-DNA-vira; CRESS-DNA-vira har skabt parvovirus, som igen gav anledning til polyomavirus og papillomavirus (Fig. 4b). Det alternative scenarie, hvorunder SF3-helikaser af eukaryote RNA-vira gav anledning til de universelle bakterielle DnaC-og DnaA-proteiner gennem bakterielle plasmider, forekommer ikke-parsimoniske og ekstremt usandsynlige. Faktisk er DnaA allestedsnærværende og essentiel i bakterier50,51, så indfangningen af helikasen fra et plasmid skulle forekomme ved selve oprindelsen af livets bakterielle domæne. Især er pcress9-og P. pulchra-plasmider ikke forbundet med andre plasmider, men er snarere forbundet med resten af sekvenserne gennem CRESS-DNA-vira. Sidstnævnte mønster er også blevet observeret i den globale klyngeanalyse af HUH Reps (Fig. 1) såvel som i klyngningen af nuklease-domænerne alene.

Oprindelse af CRESS-DNA-vira fra bakterielle plasmider

analyse af SF3-helicase-domænerne antyder, at Reps af pE194 / pMV158-lignende plasmider er forfædre snarere end afledte former. Den alternative mulighed, nemlig at Reps af pE194 / pMV158-lignende plasmider har mistet helicase-domænet, kan ikke i øjeblikket udelukkes. Det faktum, at helicase-domænet ikke er gået tabt i nogen af de mange kendte grupper af CRESS-DNA-vira eller i pCRESS1 til pCRESS9-plasmider, antyder imidlertid, at helicase-domænet, når det først er erhvervet, bliver vigtigt for effektiv plasmid/viral genomreplikation. Således er den tætte lighed mellem pE194 / pMV158-lignende Reps og dem fra Ylh supergroup, hvilket resulterer i direkte forbindelse mellem de to grupper i det globale netværk (Fig. 1), indebærer, at den tidligere gruppe er en passende udgruppe til fylogeni af Reps fra bakterielle plasmider og CRESS-DNA-vira. Til fylogenetiske analyser, vi brugte et datasæt af SC2 Reps, eksklusive Reps af Parvoviridae og CRESS-DNA-vira, som tidligere blev vurderet til at være kimære med hensyn til deres nuklease-og helicase-domæner53, for at undgå potentielle artefakter som følge af modstridende fylogenetiske signaler. Datasættet omfattede repræsentanter for alle klassificerede familier af CRESS-DNA-vira samt 6 grupper af uklassificerede CRESS–DNA-vira, der foreløbigt var mærket CRESSV1-6 (ref. 53) samt en lille gruppe GasCSV-lignende vira, som tidligere er blevet bemærket for at kode Reps med signifikant lighed med bakterielle Reps54. I det velunderstøttede fylogenetiske træ med maksimal sandsynlighed konstrueret med PhyML og rodfæstet med pE194 / pMV158-lignende Reps er supergruppen (pCRESS4–8) i bunden af en samling, der inkluderer alle CRESS-DNA–vira, pCRESS1-3 og pCRESS9 samt P. pulchra plasmider. Denne samling opdeles i to klader (Fig. 5). Clade 1 omfatter to underklasser, hvoraf den ene består af geminivirus og genomovirus, der forbinder pcress9 plasmider af fytoplasma, og den anden omfatter cressv6 og P. pulchra plasmider. Især ser P. pulchra-plasmider ud til at dukke op direkte inde fra cressv6-mangfoldigheden, med det nærmeste forhold til CRESSV6-underklassen af vira sekventeret fra spildevandsprøver. Forholdet mellem geminivirus/genomovirus og pcress9 plasmider er ikke løst i fylogeni. Klyngeanalyser antyder imidlertid stærkt, at Reps af pCRESS9-plasmider udviklede sig fra geminivirus-genomovirus (Fig. 1 og 4). I overensstemmelse med dette scenario deler fytoplasmale pCRESS7-og pCRESS9-plasmider på trods af kodning af fylogenetisk forskellige Reps genindholdet, nemlig kopinummerkontrolproteinet, PRK06752-lignende SSB-protein og konserveret hypotetisk protein (supplerende Fig. 3g, i). Desuden, geminivirus og CRESSV6 koder for homologe kapsidproteiner, der antyder, at de udviklede sig fra en fælles viral forfader snarere end konvergeret fra to grupper af plasmider ved at fange homologe kapsidproteingener. Clade 2 inkluderer bakterielle Reps af pCRESS1 – 3 og som søstergruppe CRESS-DNA-vira fra familierne Nanoviridae/Alphasatellitidae, Smacoviridae og Circoviridae såvel som uklassificeret CRESSV1 gennem CRESSV5, mens GasCSV-lignende vira er indlejret i bakteriel pCRESS2.

Fig. 5
figur5

maksimal sandsynlighed fylogenetisk træ af Rep proteiner. GasCSV-Gastropod-associeret cirkulær ssdna-virus. Træet blev bygget med PhyML78. Grene med støtteværdier Under 70 er kontraheret

phyml-træets robusthed blev valideret ved yderligere analyser (supplerende Note 1), herunder (i) maksimal sandsynlighed fylogenetiske analyser ved hjælp af; (ii) fylogenetisk rekonstruktion ved hjælp af 20-profilblandingsmodellen (figur S5); (iii) statistisk analyse af de ubegrænsede og 3 begrænsede trætopologier (supplerende tabel 2). Kollektivt, disse resultater indikerer, at den opnåede trætopologi er meget robust og sandsynligvis nøjagtigt afspejler den evolutionære historie af Reps kodet af CRESS-DNA-vira og plasmider.

især analyse af de konserverede motiver (Fig. 3) foreslår en specifik sammenhæng mellem virusreps i clade 1 og bakteriel pCRESS3 (snarere end pCRESS1–3 samlet), hvilket antyder, at den fylogenetiske placering kan blive påvirket af gamle rekombinationshændelser. Desuden blev bacilladnavirus udeladt fra det globale fylogenetiske træ, fordi deres Reps viste ustabil position i fylogeni afhængigt af taksonprøveudtagningen (supplerende Fig. 6) muligvis på grund af det lille antal tilgængelige sekvenser, deres høje divergens og potentielle kimærisme. Uanset hvad antyder fylogenetisk analyse stærkt, at størstedelen af CRESS-DNA–vira, herunder circovirus, smacovirus, nanovirus og CRESSV1–5, udviklede sig fra en fælles forfader med bakterielle Reps af pCRESS1-3, hvorimod de ukultiverede GasCSV-lignende vira kommer direkte ud af de bakterielle pCRESS2-Reps (Fig. 5). Samlingens herkomst inklusive geminivirus, genomovirus og CRESSV6 er mindre klar, men kan gå forud for fremkomsten af de andre CRESS-DNA-virusgrupper og muligvis involveret en fælles forfader med YL-supergruppen. Reps af bakteriel pCRESS9 og P. pulchra plasmider er sandsynligvis vandret erhvervet for nylig fra de tilsvarende CRESS-DNA-vira.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.