Meerdere oorsprong van prokaryotische en eukaryotische single-stranded DNA van virussen bacteriën en archaea plasmiden

Wereldwijde netwerk van de HE replicons

Voor het verkennen van de evolutionaire geschiedenis van de HE replicons, hebben we verzameld een dataset van HUH endonucleases—alleen de eiwitten gecodeerd door al deze replicons—voor elke familie van virussen, plasmiden, en springende genen geassocieerd met de hosts over alle drie de mobiele domains16,27,28,29,30. In deze analyse hebben we geen Mob relaxases betrokken bij plasmide conjugatie overwogen. De enzymen in deze familie omvatten circulair gepermuteerde behouden motieven die hun opeenvolging-gebaseerde vergelijking met de huh endonucleases betrokken bij de replicatie of transposition16,19 van DNA compliceren. De resulterende dataset bevatte 8764 sequenties. Deze werden gegroepeerd gebaseerd op paarsgewijze gelijkenis, en clusters werden geà dentificeerd gebruikend een convex clustering algoritme (p-waarde drempel van 1e−08) met CLANS35. Deze analyse toonde 33 clusters aan die in grootte varieerden van 7 tot 2711 opeenvolgingen (aanvullende gegevens 1). Na een inspectie van de connectiviteit tussen clusters (Fig. 1), hebben we 2 orphan clusters en 2 superclusters gedefinieerd, die ofwel geen of zeer weinig verbindingen met elkaar vertonen (aanvullende gegevens 1). Een vergelijking van de beschikbare hoge-resolutiestructuren voor vertegenwoordigers van zowel orphan clusters als de 2 superclusters 16,36 bevestigt echter ondubbelzinnig hun gemeenschappelijke oorsprong.

Fig. 1
figure1

representatieve HUH Superfamilierep ‘ s geclusterd door hun paarsgewijze sequentie-overeenkomst. Lijnen verbinden sequenties met P-waarde ≤ 1e-08. Groepen werden genoemd naar goed gekarakteriseerde plasmiden, virussen of het meest voorkomende taxon

Orphan cluster 1 omvat één familie van is200/IS605 transposons die wijdverspreid zijn in bacteriën en archaea37. De huh endonucleases van de is200/IS605 insertieopeenvolgingen zijn uitgebreid structureel en biochemisch bestudeerd, resulterend in een uitgebreid begrip van hun functies16,38. Hoewel is200 / IS605 transposases een structurele vouw gemeenschappelijk aan dat van andere HUH endonucleases hebben en alle 3 signatuurmotieven bevatten, toonden zij geen merkbare opeenvolgingsgelijkenis aan om het even welke andere cluster van HUH ENDONUCLEASES en zo bleven losgekoppeld van opeenvolgingen in andere clusters. Niettemin, is de opeenvolgingsdiversiteit binnen de cluster is200 / is605 vergelijkbaar met die binnen andere clusters.

Orphan cluster 2 bevat Rep-eiwitten die bewaard worden in hyperthermofiele archaeale virussen van de familie Rudiviridae39. De structurele studies van de rep proteã ne van het RUDIVIRUS SIRV1 onthulden de canonical HUH endonuclease vouw en de biochemische karakterisering van de proteã ne bevestigde de verwachte het snijden en het toetreden activiteiten in vitro36. Als transposases is200 / is605, verbindt de Rudiviral Rep cluster niet met andere HUH endonucleases, met inbegrip van homologen van andere families van archaeal virussen en plasmiden.

Het is denkbaar dat het unieke karakter van de twee orphan clusters verband houdt met de ongebruikelijke transpositie-en replicatiemechanismen die door de respectieve elementen worden gebruikt. Inderdaad, is200/IS605 insertie sequenties transponeren door een unieke peel-and-paste mechanism38, terwijl rudivirussen, in tegenstelling tot de meeste andere virussen en plasmiden repliceren door het rolling-circle mechanisme, bevatten relatief grote (~35 kb) lineaire dsDNA genomen met covalent gesloten termini40.

Supercluster 1 is verreweg de grootste en meest diverse HUH assemblage die 24 clusters omvat (aanvullende gegevens 1). Van deze 24 clusters, bevatten 15 vertegenwoordigers van bonafide extrachromosomale plasmiden waarvan 7 clusters ook vertegenwoordigers van diverse ssdna (Microviridae, Inoviridae, en Pleolipoviridae) en/of dsDNA (Myoviridae en Corticoviridae) virussen van bacteriën en archaea omvatten. Drie clusters bestaan uit vertegenwoordigers gecodeerd door microvirussen van de subfamilies Gokushovirinae en Bullavirinae, en Xanthomonas Inovirus Cf1 (familie Inoviridae), respectievelijk. De phiX174-achtige microvirussen (Bullavirinae) vertonen een gelijkenis met microvirussen van de subfamilie Gokushovirinae, wat wijst op de Rep monofylie in de twee subfamilies van de Microviridae, ondanks hoge sequentie-divergentie. De bacteriële is91 (met inbegrip van iscr subfamilie) en eukaryotische Helitron familie transposons, respectievelijk, vormen twee verschillende clusters. De twee groepen transposons zijn niet direct met elkaar verbonden, maar zijn verbonden met verschillende groepen van bacteriële en, in het geval van IS91, archaeale plasmiden, die onafhankelijke oorsprong van bacteriële extrachromosomale replicons suggereren. Men heeft eerder voorgesteld dat helitrons een ontbrekende verbinding tussen eukaryotic CRESS-DNA virussen, namelijk, geminiviruses, en bacteriële HUH replicons41 zouden kunnen vertegenwoordigen of dat helitrons uit geminiviruses42 geëvolueerd zijn. Nochtans, in onze Analyse, verbinden helitrons niet met om het even welke groepen van CRESS-DNA virussen, die onafhankelijke evolutionaire trajecten suggereren, consistent met de recente vondsten43.

de overige 5 clusters bevatten geen herkenbare plasmide -, virale of transposonsequenties en vertegenwoordigen dus waarschijnlijk nieuwe families van geïntegreerde MGE. Vier van deze groepen worden voornamelijk gevonden in bacteriën van de taxa Clostridiales, Actinobacteria, Neisseriales, en Bacteroidetes, respectievelijk (dienovereenkomstig geëtiketteerd in Fig. 1), terwijl de vijfde groep specifiek is voor de kandidaatdivisie MSBL1 (Mediterranean Sea Brine Lakes 1)44, een groep van niet-gekweekte archaea gevonden in verschillende hypersalineomgevingen. De meeste clusters tonen taxonomische uniformiteit op het domeinniveau, d.w.z., omvatten clusters of bacteriële, of archaeal, of eukaryotic opeenvolgingen (met inbegrip van de overeenkomstige virussen en plasmiden), die voorstellen dat horizontale overdrachten van virussen of plasmiden tussen gastheerdomeinen zeldzaam zijn. De twee uitzonderingen omvatten de pUB110-als en is91-als bacteriën-gedomineerde clusters, die een handvol archaeal opeenvolgingen omvatten. In het geval van IS91 transposons, horizontale overdracht van bacteriën is vastgesteld door fylogenetische analyses45. Bovendien omvatten sommige clusters sporadische opeenvolgingen die als eukaryotic worden geannoteerd; nochtans, stelt de analyse van overeenkomstige contigs voor dat dit waarschijnlijk bacteriële contaminanten zijn.

van bijzonder belang zijn de 7 clusters die zowel virussen als plasmiden bevatten. Bijvoorbeeld, bevat pEC316_KPC – als cluster, naast plasmiden, evolutionarily-niet verwante virussen van 3 families, Myoviridae, Corticoviridae, en Inoviridae, die uitgebreide horizontale verspreiding van de rep genen voorstellen. Met name, herhalingen van inovirussen zijn verdeeld over 5 clusters. Gezien de schaarste van inoviral opeenvolgingen in pVT736-1-als en pUB110-als clusters, die slechts Pseudomonasfaag Pf3 en Propionibacteriumfaag B5 omvatten, respectievelijk, lijkt de richting van genoverdracht, van plasmiden aan de overeenkomstige virussen, duidelijk. Bovendien coderen veel inovirussen geen HUH endonucleases, maar coderen ze replicatieinitiatoren van een evolutionair ongerelateerde superfamilie, Rep_trans (Pfam id: PF02486)15, die ook rijk is aan bacteriële plasmiden 30, terwijl inovirussen van het geslacht Vespertiliovirus geen Reps hebben en in plaats daarvan repliceren door transposasen van de IS3-en IS30-familie te gebruiken die zijn afgeleid van de overeenkomstige insertiesequences46. Gezamenlijk wijzen deze waarnemingen erop dat de replicatiemodules van inovirussen zijn uitgewisseld met ver verwante en zelfs niet-homologe replicatiemodules van verschillende plasmide-en transposonfamilies. Evenzo, worden archaeal pleolipoviruses verdeeld tussen twee clusters die aan verschillende families van archaeal plasmiden, pgrb1-als en ptp2-als beantwoorden, respectievelijk, die voorstellen dat de uitwisseling van replicatie-geassocieerde genen gemeenschappelijk in bacteriële en archaeal virussen met kleine, plasmid-sized genomen is. ¶In sommige gevallen, is het moeilijk om het virale versus plasmidlidmaatschap van vertegenwoordigers vast te stellen die in cellulaire chromosomen worden gecodeerd omdat beide types van MGE in het gastheergenoom kunnen integreren. Bijvoorbeeld, omvat de xacf1-als cluster 62 Rep opeenvolgingen, waarvan 2 door filamentous Fagen worden gecodeerd, terwijl de rest van bacteriële genomen komt. Analyse van de genomische buurten suggereert dat slechts 6 van de resterende 60 herhalingen profages vertegenwoordigen. Verder bevat de pAS28-achtige cluster één plasmide, pAS28 (ref. 47); echter, verwante vertegenwoordigers zijn eerder geà dentificeerd in profeten48, maar niet in gekarakteriseerde virussen, het geven van de onjuiste indruk dat de pAS28-achtige Rep is plasmide-exclusief. ¶Om de evolutionaire relaties tussen vertegenwoordigers verder te karakteriseren gecodeerd door verschillende soorten MGE, construeerden we maximale waarschijnlijkheid fylogenetische bomen voor de 7 clusters die herhalingen van zowel virussen als plasmiden opgenomen (aanvullende Fig. 2a-g). De resultaten van fylogenetische analyses suggereren horizontale overdracht van de rep genen tussen plasmiden en virussen, met virale opeenvolgingen die typisch onder plasmide-gecodeerde homologen worden genest.

Supercluster 2 (SC2) bestaat uit 7 clusters (aanvullende gegevens 1) die alle bekende en niet-geclassificeerde eukaryotische tuinkers-DNA-virussen, parvovirussen, een cluster plasmiden van de rode alg Pyropia pulchra49, en 4 clusters met bacteriële Rep-sequenties bevatten. De overgrote meerderheid van de bacteriële Reps in de pcpa-als en p4M-als clusters worden gecodeerd in bacteriële genomen eerder dan in plasmiden en zijn niet eerder gekenmerkt. In ons netwerk zijn de tuinkers-DNA virussen verbonden met pcpa-achtige, p4M-achtige, ppaph2-achtige en P. pulchra-achtige clusters, terwijl de pe194/pmv158-achtige cluster geen directe verbindingen vormt met de tuinkers-DNA virussen, maar SC2 verbindt via de pcpa-achtige cluster (Fig. 1). Geminivirussen en genomovirussen vormen een subcluster met plasmiden van fytoplasma (ppaph2-achtige cluster) en P. pulchra, dat gescheiden is van andere tuinkers-DNA virussen. De parvoviridae-cluster, met inbegrip van parvovirussen en afgeleide endogene virussen die in diverse eukaryotic genomen worden geïntegreerd, is losjes rechtstreeks verbonden met de tuinkers-DNA-virussen, die voorstellen dat parvovirussen met lineaire ssdna-genomen gemeenschappelijke voorouders met tuinkers-DNA-virussen delen die, per definitie, cirkelvormige genomen hebben. Geïntrigeerd door de schijnbaar nauwe evolutionaire verbinding tussen eukaryotische tuinkers-DNA virussen en bacteriële en algen reptielen, hebben we deze relaties in meer detail onderzocht, zoals gerapporteerd in de volgende secties.

de diversiteit van virale-achtige Reps in bacteriële genomen

om de mate van gelijkenis te onderzoeken tussen de Reps van eukaryotische tuinkers-DNA virussen en niet-virale replicons van SC2, hebben we hun domein organisaties vergeleken. Met uitzondering van pe194 / pmv158-familie plasmiden, die alleen het nucleasedomein bevatten, hadden bacteriële en algen SC2 Reps dezelfde nuclease-helicase domeinorganisatie als CRESS-DNA virussen. Dezelfde twee-domein organisatie is ook kenmerkend voor de parvovirus Reps2. Aldus, bevestigt de analyse van de domeinorganisatie de resultaten van opeenvolging het clusteren en wijst verder erop dat de bacteriële SC2 herhalingen nauwer verwant zijn aan de herhalingen van eukaryotic virussen dan aan die van andere prokaryotic plasmiden en virussen.

We zochten vervolgens naar aanvullende informatie over de diversiteit en taxonomische distributie van de virale-achtige SC2 Reps die gecodeerd zijn in bacteriële genomen. Maximale waarschijnlijkheid fylogenetische analyse bleek 9 goed ondersteunde clades (Fig. 2 bis). Clustering en daaropvolgende communautaire detectie analyse gevalideerd de 9 groepen van bacteriële Reps (Fig. 2b), waarbij groepen 1-3 overeenkomen met de p4m-achtige cluster getoond in Fig. 1, groepen 4-8 aan de pcpa-als cluster, en groep 9 aan de ppaph2-als cluster. Om hun gelijkenis met herhalingen van tuinkers-DNA virussen te benadrukken, verwijzen we naar de 9 groepen als pCRESS1 tot en met pCRESS9. Deze groepen vertoonden gedeeltelijk overlappende maar verschillende taxonomische distributies, die verschillende klassen binnen 4 bacteriële Fyla (aanvullende Fig. 1 en aanvullende tabel 1).

Fig. 2
figure2

diversiteit van virale-achtige Rep-eiwitten in bacteriën. een fylogenetische boom van bacteriële Rep proteïnen en hun homologen in P. pulchra. Nauw verwante sequenties worden samengevouwen tot driehoeken, waarvan de zijlengtes evenredig zijn met de afstanden tussen de dichtstbijzijnde en verste bladknopen. b CLANS groepen van bacteriële Rep eiwitten en hun homologen. Knooppunten wijzen op eiwitsequenties. Lijnen vertegenwoordigen sequentieverhoudingen (CLANS P-waarde ≤ 1e-05). De knooppunten die tot dezelfde cluster behoren zijn gekleurd met dezelfde kleuren, overeenkomend met de clades getoond in Paneel A. c Genoomkaarten van geïntegreerde en extrachromosomale plasmiden die groepen 1-9 vertegenwoordigen. Homologe genen worden weergegeven met dezelfde kleur en hun functies worden weergegeven aan de rechterkant van de figuur

de meerderheid van de herhalingen van pCRESS7 en pCRESS9 worden gecodeerd door extrachromosomale plasmiden (aanvullende tabel 1). De overgrote meerderheid daarentegen (97.5%) van Reps gevonden in andere groepen worden gecodeerd binnen mobiele genetische elementen site-specifiek geïntegreerd in bacteriële chromosomen (aanvullende tabel 1; Fig. 2c; aanvullende Fig. 3; Aanvullende Aantekening 1). Met name, geen van de elementen gecodeerd om het even welke homologen van momenteel bekende virale structurele proteã nen (aanvullende Noot 1). Collectief, wijzen deze waarnemingen erop dat viraal-als vertegenwoordigers in bacteriën door diverse extrachromosomal en geïntegreerde plasmiden worden gecodeerd.

geconserveerde kenmerken van bacteriële en CRESS-DNA virus Reps

Sequentieanalyse toonde aan dat, ondanks aanzienlijke totale sequentiedivergentie, Reps van pCRESS4 tot en met 8 zeer vergelijkbare sequentiemotieven bevatten binnen de nuclease-en helicasedomeinen (Fig. 3), in overeenstemming met de resultaten van de clustering en fylogenetische analyses (Fig. 2). In het bijzonder delen deze 5 pcressgroepen een specifieke signatuur, YLxH (X, om het even welk aminozuur) binnen motief III van het nucleasedomein, die niet werd waargenomen in herhalingen van pCRESS1–3 en 9 (Fig. 3). Dus, we verwijzen naar pcress4–8 collectief als de YLxH supergroep (in plaats van de pcpa-achtige cluster), om deze gedeelde functie te benadrukken. De ylxh-handtekening werd ook bewaard in herhalingen van de pe194 / pmv158-achtige cluster, wat een nauwere evolutionaire relatie tussen de twee clusters suggereert, ondanks het feit dat pE194/pmv158-achtige herhalingen het helicasedomein missen. Ook toont pCRESS9 motieven die vergelijkbaar zijn met die van de P. pulchra plasmiden en dus kunnen worden verenigd met deze plasmiden in een gemeenschappelijke assemblage. Daarentegen vertonen pcress1, -2 en -3 (p4m-achtige cluster) onderscheidende reeksen motieven (Fig. 3; Aanvullende Aantekening 1).

Fig. 3
figure3

behouden sequentiemotieven van Rep-eiwitten. Bacteriële Rep groepen worden afgebeeld in grijze achtergrond. Residuen worden gekleurd door hun chemische eigenschappen (polair, groen; basisch, blauw; zuur, rood; hydrofoob, zwart; neutraal, paars). De Rep groepen werden handmatig geordend volgens de paarsgewijze gelijkenis in de uitgelijnde motieven. De HUH endonuclease en SF3 helicasedomeinen worden gedefinieerd aan de bovenkant van de figuur

oorsprong van het SF3 helicasedomein

Sequentieanalyses suggereren dat de SF3 helicasedomein bevattende plasmiderep ‘ s, vooral die van pCRESS2, pCRESS3, en pCRESS9, en P. pulchra, nauw verwant zijn met de herhalingen van tuinkers-DNA virussen. Nochtans, is de directionaliteit van evolutie, d.w.z., of plasmide Reps geëvolueerd van die van CRESS-DNA virussen of vice versa, niet duidelijk. Hoewel het verleidelijk is om de afwezigheid van het helicasedomein in de pe194/pmv158-achtige cluster als een aanwijzing te nemen dat deze groep voorouderlijk is aan de Helicasebevattende Reps, kan niet worden uitgesloten dat het helicasedomein door deze plasmiden verloren ging. Zo gingen we op zoek naar de herkomst van het SF3 helicase domein in de plasmide en virale reps. Gevoelige sequentieonderzoeken met HMMER tegen de nr30 database toonden aan dat de helicasedomeinen van plasmide en CRESS-DNA virale reptielen het meest nauw verwant zijn met die van eukaryotische positief-zintuig RNA virussen (orde Picornavirales en familie Caliciviridae) evenals de AAA+ ATPase superfamily50,51. In deze analyse hebben we ook de SF3-sequenties van parvovirussen, polyomavirussen en papillomavirussen opgenomen waarvan wordt aangenomen dat ze evolutionair gerelateerd zijn aan CRESS-DNA virus2, 25. Verscheidene groepen van verder verwijderde SF3 helicases van virussen met grote dsDNA genomes52 werden buiten beschouwing gelaten. Vanwege de hoge sequentie divergentie en relatief korte lengte, fylogenetische analyses van de SF3 helicase domeinen waren niet informatief, resulterend in stervormige boom topologieën, ongeacht de evolutionaire modellen of taxonomische bemonstering gebruikt. Echter, clustering analyse gebaseerd op paarsgewijze gelijkenissen verschaft inzicht in de relaties tussen de verschillende ATPase families (Fig. 4a). In het bijzonder werd de nauwe relatie tussen de SF3 helicasedomeinen van bacteriële Reps en tuinkers-DNA virussen duidelijk ondersteund. Beide groepen verbinden met de virussen van RNA, maar slechts bacteriële vertegenwoordigers, in het bijzonder die van de YLxH-supergroep, tonen verbindingen met AAA+ superfamily ATPases, namelijk, bacteriële helicaselader DnaC en, in mindere mate, DnaA en Cdc48-als ATPases (Fig. 4a). De nauwere gelijkenis tussen de YLxH supergroep en bacteriële AAA+ ATPases wordt ondersteund door vergelijking van de katalytische motieven die verschillende gedeelde afgeleide karakters openbaarden, met uitsluiting van andere groepen (aanvullende Fig. 4). Bij dezelfde clustering drempel, noch eukaryotic DNA noch RNA virussen verbonden aan om het even welke groep van ATPases buiten die van bacteriële plasmiden. De SF3 helicases van parvovirussen gekoppeld aan die van tuinkers-DNA virussen, consistent met de analyse van full-length Rep sequenties (Fig. 1). Papillomaviruses en polyomaviruses vormden 2 clusters die met elkaar en met parvoviruses verbonden.

Fig. 4
figure4

relaties tussen Superfamily 3 helicases en AAA+ ATPases. een superfamily 3 helicase en AAA+ ATPase domeinen geclusterd door hun paarsgewijze gelijkenis met behulp van CLANS. In totaal werden 3854 sequenties geclusterd met CLANS (CLANS P-waarde ≤ 5e-09). Groepen van niet-geclassificeerde tuinkers-DNA virussen worden aangeduid als TUINKERSV1 tot en met TUINKERSV6 (ref. 53). b een voorgesteld evolutionair scenario voor de oorsprong en evolutie van virale superfamily 3 helicases. Afkortingen: SF3, superfamily 3 helicase domein; HUH, HUH superfamily nuclease domein; OBD, oorsprong-bindend domein; HGT, horizontale genoverdracht; RHR, rolling-hairpin replicatie

Dit verbindingspatroon suggereert een specifieke evolutievector en lijkt het best compatibel met het volgende scenario. Het SF3 helicasedomein van bacteriële plasmiden evolueerde uit een bacterieel DnaC-als ATPase; dit helicasedomein werd toegevoegd aan het nucleasedomein van Reps van pE194 / pmv158-als plasmiden die de voorouder van de YLxH supergroep opleveren; bacteriële plasmidereps werden doorgegeven aan de tuinkers – DNA virussen; de SF3 helicase van RNA virussen werd horizontaal verkregen uit bacteriële plasmiden of, waarschijnlijker, uit eukaryotische tuinkers-DNA virussen; tuinkers-DNA virussen hebben parvovirussen voortgebracht die op hun beurt aanleiding gaven tot polyomavirussen en papillomavirussen (Fig. 4b). Het alternatieve scenario, waaronder SF3 helicases van eukaryotische RNA virussen leidde tot de universele bacteriële dnac en dnaa proteã nen, door bacteriële plasmiden, lijkt niet-spaarzaam en uiterst onwaarschijnlijk. Inderdaad, DnaA is alomtegenwoordig en essentieel in bacteria50, 51, dus de vangst van de helicase van een plasmide zou moeten plaatsvinden bij de oorsprong van het bacteriële domein van het leven. In het bijzonder, zijn pcress9 en P. pulchra plasmiden niet verbonden met andere plasmiden maar eerder verbonden met de rest van de opeenvolgingen door de CRESS-DNA virussen. Dit laatste patroon is ook waargenomen in de Globale clustering analyse van de HUH Reps (Fig. 1) evenals in de clustering van de nucleasedomeinen alleen.

oorsprong van tuinkers-DNA-virussen uit bacteriële plasmiden

analyse van de SF3 helicasedomeinen suggereert dat Reps van pe194/pmv158-achtige plasmiden eerder voorouderlijke dan afgeleide vormen zijn. De alternatieve mogelijkheid, namelijk dat Reps van pe194 / pmv158-achtige plasmiden het helicasedomein hebben verloren, kan op dit moment niet worden uitgesloten. Echter, het feit dat het helicasedomein niet verloren is gegaan in een van de talrijke bekende groepen van tuinkers-DNA virussen of in pcress1 aan pcress9 plasmiden, suggereert dat, eenmaal verworven, het helicasedomein belangrijk wordt voor efficiënte plasmide/virale genoomreplicatie. Zo is de nauwe overeenkomst tussen de Pe194/pMV158-achtige vertegenwoordigers en die van de YLxH-supergroep, resulterend in directe connectiviteit van de twee groepen in het wereldwijde netwerk (Fig. 1), impliceert dat de vroegere groep een adequate outgroep voor de fylogenie van herhalingen van bacteriële plasmiden en tuinkers-DNA virussen is. Voor fylogenetische analyses, gebruikten we een dataset van SC2 Reps, met uitzondering van Reps van Parvoviridae en CRESS-DNA virussen die eerder werden beoordeeld als chimerisch met betrekking tot hun nuclease en helicase domains53, om potentiële artefacten als gevolg van conflicterende fylogenetische signalen te vermijden. De dataset omvatte vertegenwoordigers van alle geclassificeerde families van tuinkers-DNA-virussen evenals 6 groepen van niet-geclassificeerde tuinkers-DNA-virussen voorlopig gelabeld TUINKERSV1-6 (ref. 53)evenals een kleine groep GasCSV-achtige virussen, die eerder zijn opgemerkt om Reps te coderen met significante gelijkenis met bacteriële Reps54. De YLxH supergroep (pCRESS4-8) ligt aan de basis van een assemblage die alle tuinkers-DNA virussen, pCRESS1–3 en pCRESS9 en P. pulchra plasmiden omvat. Dit assemblage splitst in twee klades (vijg. 5). Clade 1 omvat twee subkladen, waarvan één bestaat uit geminivirussen en genomovirussen die pCRESS9-plasmiden van fytoplasma verbinden, en de andere bestaat uit CRESSV6-en P. pulchra-plasmiden. Met name P. pulchra plasmiden lijken direct uit te komen binnen de CRESSV6 diversiteit, met de nauwste relatie met de CRESSV6 subclade van virussen gesequenced uit afvalwatermonsters. De relatie tussen geminivirussen / genomovirussen en pcress9 plasmiden is niet opgelost in de fylogenie. Echter, clustering analyses sterk suggereren dat herhalingen van pcress9 plasmiden geëvolueerd uit geminiviruses-genomoviruses(Fig. 1 en 4). In overeenstemming met dit scenario delen fytoplasmale pcress7-en pcress9-plasmiden, ondanks het coderen van fylogenetisch verschillende Reps, het gengehalte, namelijk het copy number control-eiwit, PRK06752-achtige SSB-eiwit en geconserveerd hypothetisch eiwit (aanvullende Fig. 3g, i). Voorts coderen geminiviruses en CRESSV6 homologe capsideproteã nen die voorstellen dat zij van een gemeenschappelijke virale voorouder eerder dan geconvergeerde van twee groepen plasmiden door homologe capsideproteã negenen te vangen evolueerden. Clade 2 omvat bacteriële herhalingen van pCRESS1–3 en, als zustergroep, CRESS – DNA virussen van de families Nanoviridae/Alphasatellitidae, Smacoviridae, en Circoviridae evenals niet geclassificeerd CRESSV1 door CRESSV5, terwijl GasCSV-als virussen binnen bacteriële pCRESS2 worden genest.

Fig. 5
figure5

maximale waarschijnlijkheid fylogenetische boom van Rep-eiwitten. GasCSV-Buikpotig geassocieerd circulair ssdna virus. De boom werd gebouwd met PhyML78. Takken met steunwaarden lager dan 70 worden gecontracteerd

de robuustheid van de PhyML-boom werd gevalideerd door aanvullende analyses( aanvullende Noot 1), waaronder (I)maximale waarschijnlijkheid fylogenetische analyses met behulp van RAxML en IQ-boom, met alternatieve vertakkingsondersteuningsmethoden (figuur S5); – fylogenetische reconstructie met behulp van het mengmodel van 20 profielen (figuur S5);-statistische analyse van de onbelemmerde en 3 beperkte boomtopologieën (aanvullende tabel 2). Collectief, wijzen deze resultaten erop dat de verkregen boomtopologie hoogst robuust is en waarschijnlijk de evolutionaire geschiedenis van herhalingen nauwkeurig zal weergeven die door tuinkers-DNA virussen en plasmiden worden gecodeerd.

met name analyse van de geconserveerde motieven (Fig. 3) suggereert een specifieke associatie tussen de virusvertegenwoordigers in clade 1 en bacteriële pCRESS3 (eerder dan pcress1–3 collectief), wat impliceert dat de fylogenetische plaatsing door oude recombinatiegebeurtenissen kan worden beà nvloed. Verder werden bacilladnavirussen uit de Globale fylogenetische boom weggelaten omdat hun vertegenwoordigers onstabiele positie in de fylogenie vertoonden, afhankelijk van de taxonbemonstering (aanvullende Fig. 6), mogelijk, als gevolg van het kleine aantal beschikbare sequenties, hun hoge divergentie en potentiële chimerisme. Ongeacht, stelt de phylogenetic analyse sterk voor dat de meerderheid van de virussen van CRESS-DNA, met inbegrip van circoviruses, smacoviruses, nanoviruses, en CRESSV1-5, van een gemeenschappelijke voorouder met bacteriële herhalingen van pCRESS1–3 evolueerde, terwijl de niet gecultiveerde GasCSV-als virussen direct uit de bacteriële Pcress2 herhalingen (Fig. 5). De herkomst van de assemblage met inbegrip van geminivirussen, genomovirussen en CRESSV6 is minder duidelijk, maar kan de opkomst van de andere CRESS-DNA-virusgroepen en mogelijk betrokken een gemeenschappelijke voorouder met de YLxH supergroep. De vertegenwoordigers van bacteriële pCRESS9 en P. pulchra plasmiden zijn waarschijnlijk horizontaal verkregen meer recent van de overeenkomstige tuinkers-DNA virussen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.