Global network of the HUH replikons
tutkiaksemme HUH—replikonien evoluutiohistoriaa keräsimme aineiston HUH—endonukleaaseista-ainoasta näiden replikonien koodaamasta proteiinista-joka edustaa kutakin virusten ryhmää, plasmideja.ja transposonit, jotka liittyvät isäntiin kaikilla kolmella solutaajuudella 16, 27,28,29,30. Tässä analyysissä emme ottaneet huomioon plasmidikonjugaatioon osallistuvia mob-relaksaaseja. Tämän perheen entsyymit sisältävät ympyränmuotoisia säilyneitä motiiveja, jotka vaikeuttavat niiden sekvenssipohjaista vertailua DNA: n replikaatioon tai transpositioon osallistuviin HUH-endonukleaaseihin 16,19. Tuloksena saatu aineisto sisälsi 8764 sekvenssiä. Nämä ryhmiteltiin pairwisen samankaltaisuuden perusteella, ja klusterit tunnistettiin käyttäen kuperaa klusterointialgoritmia (p-arvon kynnysarvo 1e−08) klaani35: llä. Tämä analyysi paljasti 33 klusteria, joiden koko vaihteli 7: stä 2711: een sekvenssiin (lisätiedot 1). Klusterien välisen yhteyden tarkastuksen jälkeen (kuva. 1), määritimme 2 Orpo klustereita ja 2 superclusters, jotka näyttivät joko ei tai hyvin vähän yhteyksiä toisiinsa (lisätietoja 1). Kuitenkin sekä orpojen klustereiden että 2 superklusterin edustajien käytettävissä olevien korkean resoluution rakenteiden Vertailu vahvistaa yksiselitteisesti niiden yhteisen alkuperän.
orpojen klusteri 1 sisältää yhden IS200 / IS605 transposonien perheen, jotka ovat yleisiä bakteereissa ja archaea37: ssä. IS200/IS605-insertiosekvenssien HUH-endonukleaaseja on tutkittu laajasti rakenteellisesti ja biokemiallisesti, mikä on johtanut kattavaan ymmärrykseen niiden toiminnoista16,38. Vaikka IS200 / IS605 transposaaseilla on rakenteellinen kertainen sama kuin muilla HUH-endonukleaaseilla ja ne sisältävät kaikki 3 signature-motiivia, ne eivät osoittaneet huomattavaa sekvenssien samankaltaisuutta minkään muun HUH-endonukleaasien klusterin kanssa ja pysyivät siten irrallisina sekvensseistä muissa klustereissa. IS200/IS605-klusterin sekvenssien moninaisuus on kuitenkin verrattavissa muihin klustereihin.
Orpon klusteri 2 sisältää Rep-proteiineja, jotka säilyvät rudiviridae39-heimoon kuuluvissa hypertermofiilisissä arkaaisissa viruksissa39. Rudivirus SIRV1: n Rep-proteiinin rakenteelliset tutkimukset paljastivat kanonisen HUH-endonukleaasikertymän ja proteiinin biokemiallinen Luonnehdinta vahvisti vitro36: n odotetut nipistys-ja liittymisaktiviteetit. Kuten IS200 / IS605 transposaasit, rudiviraalinen Rep-klusteri ei ole yhteydessä muihin HUH-endonukleaaseihin, mukaan lukien muiden arkaaisten virusten ja plasmidien perheiden homologeihin.
on mahdollista, että kahden orvon klusterin ainutlaatuisuus liittyy niiden käyttämiin epätavallisiin transpositio-ja replikointimekanismeihin. Itse asiassa IS200 / IS605 insertiosekvenssit transponoituvat ainutlaatuisella kuori-ja pastamekanismilla38, kun taas rudivirukset, toisin kuin useimmat muut virukset ja plasmidit, jotka monistuvat vierintäympäristömekanismilla, sisältävät suhteellisen suuria (~35 kb) lineaarisia dsDNA-genomeja, joissa on kovalenttisesti suljettu termini40.
Supercluster 1 on ylivoimaisesti suurin ja monipuolisin HUH-kokonaisuus, joka sisältää 24 klusteria (lisätiedot 1). Näistä 24 klusterista 15 sisältää reppejä bona fide: n ekstrakromosomaalisista plasmideista, joista 7 klusteriin kuuluu myös erilaisten ssDNA: n (Microviridae, Inoviridae ja Pleolipoviridae) ja/tai dsDNA: n (Myoviridae ja Corticoviridae) bakteeri-ja arkaaivirusten Reps. Kolme klusteria koostuvat alaheimojen gokushovirinae ja Bullavirinae Mikrovirusten koodaamista Repseistä ja Xanthomonas Inovirus Cf1 (heimo inoviridae) vastaavasti. Erityisesti phiX174: n kaltaiset mikrovirukset (Bullavirinae) muistuttavat yksinomaan Gokushovirinae-alaheimon mikroviruksia, mikä on osoitus Mikroviridae-alaheimon Reppumonofyleisyydestä huolimatta suuresta sekvenssierosta. Bakteeri-IS91 (myös ISCR-alaheimo) ja eukaryoottiset Helitroniperheen transposonit muodostavat kaksi erillistä rykelmää. Transposonien kaksi ryhmää eivät ole suoraan yhteydessä toisiinsa, vaan ne liittyvät erillisiin bakteeriryhmiin ja is91: n tapauksessa arkaaisiin plasmideihin, mikä viittaa itsenäiseen alkuperään bakteerien ekstrakromosomaalisista replikoneista. Aiemmin on esitetty, että helitronit saattaisivat edustaa puuttuvaa linkkiä eukaryoottisten Krassi-DNA-virusten eli geminivirusten ja bakteerin häh-replikons41: n välillä tai että helitronit kehittyivät geminiviruses42: sta. Analyysimme mukaan helitronit eivät kuitenkaan liity mihinkään Krassi-DNA-virusten ryhmään, mikä viittaa itsenäisiin evoluutioratoihin, jotka ovat yhdenmukaisia viimeaikaisten löytöjen 43 kanssa.
jäljellä olevat 5 klusteria eivät sisällä tunnistettavia plasmidi -, virus-tai transposonisekvenssejä, joten ne todennäköisesti edustavat integroitujen MGE: iden uusia perheitä. Neljä näistä ryhmistä esiintyy pääasiassa taxa Clostridiales, Actinobacteria, Neisseriales, ja Bacteroidetes, vastaavasti (merkitty vastaavasti Kuvassa. 1), kun taas viides ryhmä on spesifinen alue MSBL1 (Mediterranean Sea Brine Lakes 1) 44, ryhmä viljelemättömiä arkaaeja, joita esiintyy erilaisissa hypersaliinisissa ympäristöissä. Useimmat klusterit ovat taksonomisesti yhteneväisiä toimialueen tasolla, eli klusterit sisältävät joko bakteeri -, arkaali-tai eukaryoottisia sekvenssejä (mukaan lukien vastaavat virukset ja plasmidit), mikä viittaa siihen, että virusten tai plasmidien horisontaaliset siirrot isäntäalueiden välillä ovat harvinaisia. Poikkeuksena ovat pUB110-tyyppiset ja IS91-tyyppiset bakteerien hallitsemat ryppäät, joihin kuuluu kourallinen arkaaisia sekvenssejä. Is91 transposonin tapauksessa horisontaalinen siirtyminen bakteereista on varmistettu fylogeneettisillä analyyseillä45. Lisäksi osa klustereista sisältää satunnaisia sekvenssejä, jotka on merkitty eukaryoottisiksi; kuitenkin vastaavien kontigien analyysi viittaa siihen, että nämä ovat todennäköisesti bakteerikontaminantteja.
erityisen kiinnostavia ovat 7 klusteria, jotka sisältävät sekä viruksia että plasmideja. Esimerkiksi pec316_kpc-kaltainen klusteri sisältää plasmidien lisäksi evoluutioon liittymättömiä viruksia 3 suvusta, Myoviridae, Corticoviridae ja Inoviridae, mikä viittaa REP-geenien laajaan horisontaaliseen leviämiseen. Erityisesti Inovirusten Reps jaetaan 5 klusteriin. Koska pVT736-1: n kaltaisissa ja pUB110: n kaltaisissa klustereissa, joihin kuuluvat ainoastaan Pseudomonas phage Pf3 ja Propionibacterium phage B5, inovirussekvenssit vaikuttavat ilmeisiltä. Lisäksi monet inovirukset eivät koodaa HUH-endonukleaaseja, vaan pikemminkin koodaavat replikaation alullepanijoita evolutionaarisesti toisiinsa liittymättömästä superperheestä, Rep_trans (pfam id: PF02486)15, jossa on myös runsaasti bakteeriplasmideja30, kun taas Vespertiliovirus-suvun inovirukset puuttuvat Repsistä ja sen sijaan replikoituvat saattamalla ne osaksi kansallista lainsäädäntöä käyttäen IS3-ja IS30-perheen transposaaseja, jotka on johdettu vastaavasta insertiosekvenssistä46. Yhdessä nämä havainnot osoittavat, että inovirusten replikaatiomoduulit on vaihdettu kaukaisiin sukulaisuussuhteisiin ja jopa ei-homologisiin replikaatiomoduuleihin eri plasmidi-ja transposoniperheistä. Vastaavasti arkaaiset pleolipovirukset jakautuvat kahteen ryppääseen, jotka vastaavat arkaaisten plasmidien eri perheitä, pGRB1-kaltaisia ja pTP2-kaltaisia, mikä viittaa siihen, että replikaatioon liittyvien geenien vaihto on yleistä bakteeri-ja arkaaiaviruksissa, joilla on pieniä, plasmidikokoisia genomeja. ¶Joissakin tapauksissa, se on vaikea selvittää virus vs. plasmid jäsenyys Reps koodattu solukromosomeissa koska molemmat tyypit MGE voi integroida isäntä genomit. Esimerkiksi XacF1: n kaltaisessa klusterissa on 62 Rep-sekvenssiä, joista 2 on filamenttifaagien koodaamia, kun taas loput tulevat bakteerien genomeista. Genomilähiöiden analyysi viittaa siihen, että jäljelle jäävistä 60 toistosta vain 6 edustaa ennustuksia. Lisäksi pAS28: n kaltaiseen klusteriin kuuluu yksi plasmidi, pAS28 (ref. 47); kuitenkin related Rep on aiemmin tunnistettu prophages48, mutta ei tunnettu viruksia, antaa virheellisen vaikutelman, että pAS28-kuten Rep on plasmid-exclusive. ¶Luonnehtiaksemme edelleen eri MGE-tyyppien koodaamien Reps: ien välisiä evoluutiosuhteita, rakensimme maksimitodennäköisyyden fylogeneettisiä puita 7 klusterille, jotka sisälsivät reps: iä sekä viruksista että plasmideista (täydentävä Kuva. 2a-g). Fylogeneettisten analyysien tulokset viittaavat REP-geenien horisontaaliseen siirtymiseen plasmidien ja virusten välillä, ja virussekvenssit ovat tyypillisesti pesiytyneet plasmidikoodattujen homologien joukkoon.
Supercluster 2 (SC2) koostuu 7 klusterista (lisätiedot 1), joihin kuuluvat kaikki tunnetut luokitellut ja luokittelemattomat eukaryoottiset Krassi-DNA-virukset, parvovirukset, punalevä Pyropia pulchra49: n plasmidien klusteri sekä 4 bakteerien Rep-sekvenssejä sisältävää klusteria. Valtaosa pcpa: n ja p4M: n kaltaisten ryppäiden bakteerien Repseistä on koodattu bakteerien genomeihin eikä plasmideihin, eikä niitä ole aiemmin luonnehdittu. Verkostossamme Krassi-DNA-virukset ovat yhteydessä pCPa: n kaltaisiin, p4M: n kaltaisiin, pPAPh2: n kaltaisiin ja P. pulchran kaltaisiin klustereihin, kun taas pE194/pMV158: n kaltainen klusteri ei muodosta suoria yhteyksiä Krassi-DNA: n viruksiin, vaan liittyy SC2: een pCPa: n kaltaisen klusterin kautta (kuva. 1). Erityisesti geminivirukset ja genomovirukset muodostavat alalustan kasviplasman (pPAPh2-kaltainen klusteri) ja P: n plasmidien kanssa. pulchra, joka on erotettu muista Krassi-DNA-viruksista. Parvoviridae-klusteri, johon kuuluvat parvovirukset ja erilaisiin eukaryoottisiin genomeihin integroituneet endogeeniset virukset, on löyhästi yhteydessä suoraan Krassi-DNA-viruksiin, mikä viittaa siihen, että parvoviruksilla, joilla on lineaarinen ssDNA-genomi, on yhteinen esi-isä Krassi-DNA-virusten kanssa, joilla määritelmän mukaan on kehämäinen genomi. Kiinnostuneina eukaryoottisten Krassi-DNA-virusten ja bakteeri-ja leväesiintymien näennäisen läheisestä evoluutioyhteydestä tutkimme näitä suhteita yksityiskohtaisemmin, kuten seuraavissa jaksoissa kerrotaan.
virusten kaltaisten Reps: ien monimuotoisuus bakteerien genomeissa
tutkiaksemme eukaryoottisten Krassi-DNA-virusten Reps: ien ja SC2: n ei-viruksellisten replikonien samankaltaisuuden laajuutta vertailimme niiden domeeniorganisaatioita. Lukuun ottamatta pE194/pMV158-perheen plasmideja, jotka sisältävät vain nukleaasi-domeenin, bakteerien ja levien SC2-Reps: llä oli sama nukleaasi-helikaasi-domeenin organisaatio kuin Krassi-DNA-viruksilla. Sama kahden verkkotunnuksen organisaatio on ominaista myös parvovirus Reps2. Näin ollen toimialueen organisaatioanalyysi vahvistaa sekvenssiklusteroinnin tulokset ja osoittaa edelleen, että bakteerien SC2 Reps ovat läheisempää sukua eukaryoottisten virusten Reps: lle kuin muiden prokaryoottisten plasmidien ja virusten Reps: lle.
tämän jälkeen pyrittiin saamaan lisätietoa bakteerien genomeihin koodattujen virusmaisten SC2-repien monimuotoisuudesta ja taksonomisesta jakaumasta. Suurin todennäköisyys fylogeneettinen analyysi paljasti 9 hyvin tuettua kladia(Kuva. 2 a). Ryhmittely ja sitä seurannut yhteisön toteamisanalyysi validoivat 9 bakteerien Reps-ryhmää (Kuva. 2b), jossa ryhmät 1-3 vastaavat kuvassa esitettyä P4M: n kaltaista klusteria. 1, ryhmät 4-8 pCPa: n kaltaiseen klusteriin ja ryhmä 9 pPAPh2: n kaltaiseen klusteriin. Korostaaksemme niiden samankaltaisuutta Krassi-DNA-virusten Reps: n kanssa viittaamme 9-ryhmiin nimellä pCRESS1 kautta pCRESS9. Nämä ryhmät näkyvät osittain päällekkäisiä mutta erillisiä taksonominen jakaumia, jotka kattavat useita luokkia sisällä 4 bakteeri fyla (Supplementary Fig. 1 ja täydentävä Taulukko 1).
suurin osa Pcress7: n ja pCRESS9: n Repseistä on koodattu ekstrakromosomaalisilla plasmideilla (täydentävä Taulukko 1). Sen sijaan suuri enemmistö (97.5%) muissa ryhmissä esiintyvistä Reps: istä on koodattu liikkuviin geneettisiin elementteihin, jotka on erityisesti integroitu bakteerikromosomeihin (täydentävä Taulukko 1; kuva. 2C; täydentävä Kuva. 3; Lisähuomautus 1). Mikään alkuaineista ei koodannut tällä hetkellä tunnettujen virusten rakenneproteiinien homologeja (lisähuomautus 1). Yhdessä nämä havainnot osoittavat, että bakteerien virusmaisia Reps-yhdisteitä koodaavat erilaiset ekstrakromosomaaliset ja integroidut plasmidit.
bakteerien ja Krassi-DNA-viruksen Reps: n säilyneet ominaisuudet
Sekvenssianalyysi osoitti, että huolimatta huomattavasta kokonaissekvenssien eroista, pCRESS4-8: n Reps: t sisältävät hyvin samanlaisia sekvenssimotiiveja nukleaasi-ja helikaasialueilla (Kuva. 3), yhtäpitävästi klusteroinnin ja fylogeneettisten analyysien tulosten kanssa (kuva. 2). Erityisesti näillä 5 pCRESS-ryhmillä on erityinen allekirjoitus, Yylxh (x, mikä tahansa aminohappo) nukleaasidomeenin motif III: ssa, jota ei havaittu Pcress1–3: n ja 9: n Reps: issä (Kuva. 3). Näin ollen kutsumme pCRESS4-8: aa yhteisesti YLxH-superryhmäksi (pCPa: n kaltaisen klusterin sijaan) korostaaksemme tätä jaettua ominaisuutta. YLxH-allekirjoitus säilyi myös Pe194/pMV158: n kaltaisessa klusterissa, mikä viittaa näiden kahden klusterin läheisempään evoluutiosuhteeseen, vaikka pE194 / pMV158: n kaltaisilta Klustereilta puuttuu helikaasi-domeeni. Myös pCRESS9: ssä on samanlaisia motiiveja kuin P. pulchran plasmideissa, joten se voitiin yhdistää näiden plasmidien kanssa yhteiseksi kokoonpanoksi. Sen sijaan pCRESS1, -2 ja -3 (p4M: n kaltainen klusteri) näyttävät tunnusomaiset kuva-aiheet (Kuva. 3; Lisähuomautus 1).
SF3-helikaasidomeenin alkuperä
Sekvenssianalyysit viittaavat siihen, että SF3-helikaasidomeenin sisältävät Plasmidireseptit, erityisesti pcress2 -, pCRESS3-ja pCRESS9-sekä P. pulchra-yhdisteet, ovat läheistä sukua Krassi-DNA-virusten reps: ille. Evoluution suunnasta eli siitä, kehittyivätkö plasmidireseptorit Krassi-DNA-virusten vastaavista vai päinvastoin, ei kuitenkaan ole selvää tietoa. Vaikka onkin houkuttelevaa pitää helikaasi-domeenin puuttumista pE194 / pMV158: n kaltaisesta klusterista osoituksena siitä, että tämä ryhmä on esivanhempi helikaasia sisältävälle Reps: lle, ei voida sulkea pois sitä mahdollisuutta, että nämä plasmidit menettivät helikaasi-domeenin. Niinpä lähdimme tutkimaan SF3: n helikaasi-domeenin alkuperää plasmidin ja virusten Repsissä. Herkät sekvenssihaut HMMER: llä NR30-tietokantaan osoittivat,että plasmidin ja Krassi-DNA: n Virusreseptien helikaasidomeenit ovat läheisintä sukua eukaryoottisten positiiviaististen RNA-virusten (lahko Picornavirales ja suku Caliciviridae) sekä AAA+ atpase superfamily50, 51-viruksille. Tähän analyysiin otettiin mukaan myös PARVOVIRUSTEN, polyomavirusten ja papilloomavirusten SF3-sekvenssit, joiden arvellaan olevan evolutiivisesti sukua Krassi-DNA-viruksille2, 25. Useita kaukaisempien SF3-helikaasien ryhmiä viruksista, joilla oli suuri dsDNA-genomi52, ei otettu huomioon. Suuren sekvenssieron ja suhteellisen lyhyen pituuden vuoksi SF3-helikaasialueiden fylogeneettiset analyysit eivät olleet informatiivisia, ja tuloksena oli tähden muotoisia puun topologioita riippumatta käytetyistä evoluutiomalleista tai taksonomisista näytteenotoista. Kuitenkin ryhmittely analyysi perustuu pairwise yhtäläisyyksiä tarjosi oivalluksia suhteita eri ATPase perheet (Kuva. 4 A). Erityisesti bakteerien Reps-ja Krassi-DNA-virusten SF3-helikaasi-domeenien läheinen suhde sai selvän tuen. Molemmat ryhmät kytkeytyvät RNA-viruksiin, mutta vain bakteerien Reps, erityisesti YLxH-superryhmän, osoittavat yhteyksiä AAA+ – superperheen Atpaaseihin, eli bakteerien helikaasukuormaajaan DnaC: iin ja vähäisemmässä määrin DNAa: n ja Cdc48: n kaltaisiin Atpaaseihin (Kuva. 4 A). YLxH-superryhmän ja bakteerien AAA+ – Atpaasien läheisempää samankaltaisuutta tukee katalyyttisten motiivien vertailu, joka paljasti useita jaettuja johdettuja merkkejä, muiden ryhmien poissulkemiseksi (täydentävä Kuva. 4). Samalla ryhmittelykynnyksellä eukaryoottiset DNA – tai RNA-virukset eivät ole liittyneet mihinkään muuhun atpaasiryhmään kuin bakteeriplasmideihin. PARVOVIRUSTEN SF3-helikaasit, jotka liittyvät Krassi-DNA-viruksiin, ovat yhdenmukaisia täyspitkien Rep-sekvenssien analyysin kanssa (kuva. 1). Papilloomavirukset ja polyomavirukset muodostivat 2 klusteria, jotka liittyivät toisiinsa ja parvoviruksiin.
tämä yhteyskuvio viittaa tiettyyn evoluutiovektoriin ja näyttää olevan parhaiten yhteensopiva seuraavan skenaarion kanssa. SF3 helikaasi domeeni bakteerien plasmidien kehittynyt bakteerien dnac-kaltainen ATPase; tämä helikaasi domeeni liitettiin nukleaasi domeeni Reps pe194 / pMV158-kaltainen plasmidien tuottaa esi ylxh superryhmä; bakteeri plasmid Reps siirrettiin Krassi-DNA-virukset; RNA-virusten SF3-helikaasi hankittiin vaakatasossa joko bakteeriplasmideista tai todennäköisemmin eukaryoottisista Krassi-DNA-viruksista; Krassi-DNA-virukset ovat synnyttäneet parvoviruksia, jotka puolestaan synnyttivät polyomaviruksia ja papilloomaviruksia (Kuva. 4b). Vaihtoehtoinen skenaario, jossa eukaryoottisten RNA-virusten SF3-helikaasit synnyttivät bakteerien dnac-ja DnaA-proteiinit bakteerien plasmidien kautta, näyttää ei-parsimoniselta ja erittäin epätodennäköiseltä. DNAa On todellakin kaikkialla ja välttämätön bakteriassa50, 51, joten helikaasin sieppauksen plasmidista olisi tapahduttava juuri elämän bakteerikunnan alkulähteellä. Pcress9 – ja P. pulchra-plasmidit eivät ole yhteydessä muihin plasmideihin, vaan ne ovat pikemminkin kytköksissä muihin sekvensseihin Krassi-DNA-virusten kautta. Jälkimmäinen kuvio on havaittu myös globaalissa RYHMITTELYANALYYSISSÄ HUH Reps (Kuva. 1) sekä yksistään nukleaasidomeenien ryhmittelyssä.
bakteeriplasmideista peräisin olevien Krassi-DNA-virusten alkuperä
SF3: n helikaasidomeenien analyysi viittaa siihen, että pE194 / pMV158: n kaltaisten plasmidien Reps on esi-eikä johdettuja muotoja. Vaihtoehtoista mahdollisuutta eli sitä, että pE194/pMV158: n kaltaisten plasmidien Reps on menettänyt helikaasi-domeenin, ei voida tällä hetkellä sulkea pois. Kuitenkin se, että helicase domain ei ole hävinnyt missään lukuisista tunnetuista ryhmistä Krassi-DNA-viruksia tai pCRESS1-pCRESS9 plasmideja, viittaa siihen, että hankittuaan, helicase domain tulee tärkeä tehokas plasmidi/virus genomin replikointi. Näin ollen pe194/pMV158: n kaltaisten Reps: ien ja YLxH: n superryhmän Reps: n läheinen samankaltaisuus, mikä johtaa näiden kahden ryhmän suoriin yhteyksiin maailmanlaajuisessa verkossa (Kuva. 1), viittaa siihen, että edellinen ryhmä on riittävä outryhmä bakteerien plasmidien ja Krassi-DNA-virusten Reps: n fylogenialle. Fylogeneettisissä analyyseissä käytimme SC2-Reps-aineistoa, lukuun ottamatta Parvoviridae-ja Krassi-DNA-virusten Reps-aineistoja, joiden aiemmin arvioitiin olevan kimeerisiä nukleaasi-ja helikaasi-domains53: n suhteen, välttääksemme mahdollisia artefakteja, jotka johtuvat ristiriitaisista fylogeneettisistä signaaleista. Aineistossa oli edustajia kaikista CRESS-DNA-virusten luokitelluista perheistä sekä 6 luokittelematonta Cress-DNA–virusten ryhmää, jotka on alustavasti merkitty cressv1-6: ksi (viite. 53) sekä pieni ryhmä GasCSV: n kaltaisia viruksia, joiden on aiemmin havaittu koodaavan Reps: ää, joka muistuttaa huomattavasti bakteerien Reps54: ää. Hyvin tuetussa suurimmalla todennäköisyydellä fylogeneettisessä puussa, joka on rakennettu PhyML: llä ja juurtunut pE194/pMV158: n kaltaisilla Repseillä, YLxH-superryhmä (pCRESS4–8) on sellaisen kokoonpanon pohjalla, joka sisältää kaikki Krassi-DNA–virukset, pCRESS1-3 ja pCRESS9 sekä P. pulchra plasmidit. Tämä kokoonpano jakautuu kahteen kladiin (Kuva. 5). Clade 1: een kuuluu kaksi alaluokkaa, joista toinen koostuu kasviplasman pCRESS9-plasmideihin yhdistyvistä geminiviruksista ja genomoviruksista ja toinen sisältää cressv6-ja P. pulchra-plasmidit. P. pulchra-plasmidit näyttävät tulevan suoraan cressv6-monimuotoisuudesta, ja ne ovat lähimpänä jätevesinäytteistä sekvensoitujen virusten cressv6-alaluokkaa. Geminivirusten/genomovirusten ja pCRESS9-plasmidien välinen suhde ei ratkea fylogeniassa. Ryhmittelyanalyysit viittaavat kuitenkin vahvasti siihen, että pCRESS9-plasmidien Repsit kehittyivät geminiviruksista-genomoviruksista (viikunat. 1 ja 4). Tämän skenaarion mukaisesti fytoplasmaiset pCRESS7 – ja pCRESS9-plasmidit, huolimatta fylogeneettisesti erillisten Reps-yhdisteiden koodaamisesta, jakavat geenisisällön, nimittäin kopionumeron kontrolliproteiinin, PRK06752: n kaltaisen SSB-proteiinin ja säilyneen hypoteettisen proteiinin (täydentävä Kuva. 3g, i). Lisäksi geminivirukset ja CRESSV6 koodaavat homologisia kapsidiproteiineja, mikä viittaa siihen, että ne ovat kehittyneet yhteisestä viruksen kantamuodosta sen sijaan, että ne olisivat Yhtyneet kahdesta plasmidiryhmästä sieppaamalla homologisia kapsidiproteiinigeenejä. Clade 2 sisältää pcress1–3: n bakteerien Repsit ja sisarryhmänä heimoihin Nanoviridae/Alphasatellitidae, Smacoviridae ja Circoviridae kuuluvat Krassi-DNA-virukset sekä luokittelemattomat CRESSV1-cressv5 kuuluvat virukset, kun taas gascsv: n kaltaiset virukset pesiytyvät bakteerien pCRESS2: een.
PhyML-puun kestävyys on validoitu lisäanalyyseillä (lisähuomautus 1), mukaan lukien i) suurin todennäköisyys fylogeneettisille analyyseille käyttäen RAxML: ää ja IQ-Tree: tä vaihtoehtoisilla haaratukimenetelmillä (Kuva S5); (ii) fylogeneettinen rekonstruktio käyttäen 20-profiilista sekoitusmallia (Kuva S5); (III) rajoittamattomien ja 3 rajoitetun puun topologioiden tilastollinen analyysi (täydentävä Taulukko 2). Yhdessä nämä tulokset osoittavat, että saatu puun topologia on erittäin vankka ja todennäköisesti kuvastaa tarkasti Krassi-DNA-virusten ja plasmidien koodaamien Reps-yhdisteiden evoluutiohistoriaa.
erityisesti säilyneiden kuvioiden analyysi (Kuva. 3) viittaa erityinen yhteys viruksen Reps clade 1 ja bakteeri pCRESS3 (eikä pCRESS1–3 kollektiivisesti), mikä tarkoittaa, että fylogeneettinen sijoitus saattaa vaikuttaa antiikin rekombinaatio tapahtumia. Lisäksi bacilladnavirukset jätettiin pois globaalista fylogeneettisestä puusta, koska niiden Repsissä näkyi epävakaa asema fylogeniassa taksoninäytteen mukaan (täydentävä Kuva. 6), mahdollisesti, koska pieni määrä saatavilla sekvenssejä, niiden suuri eroavuus ja mahdollinen kimeerisyys. Riippumatta, fylogeneettinen analyysi viittaa vahvasti siihen, että suurin osa CRESS-DNA-viruksista, mukaan lukien circovirukset, smakovirukset, nanovirukset ja CRESSV1–5, kehittyivät yhteisestä esi–isästä, jossa on pcress1-3: n bakteerien Reps, kun taas viljelemättömät GasCSV: n kaltaiset virukset tulevat suoraan bakteerien pCRESS2 Reps (Kuva. 5). Kokoonpano, mukaan lukien geminivirukset, genomovirukset ja CRESSV6, on vähemmän selvä, mutta saattaa edeltää muiden Kressin DNA-virusryhmien syntymistä ja mahdollisesti kyseessä on yhteinen esi-isä YLxH-superryhmän kanssa. Bakteerien pCRESS9 ja P. pulchra-plasmideja on todennäköisesti saatu viime aikoina vaakatasossa vastaavista Krassi-DNA-viruksista.