a prokarióta és eukarióta egyszálú DNS-vírusok több eredete bakteriális és archeális plazmidokból

A HUH replikonok globális hálózata

a HUH replikonok evolúciós történetének feltárásához összegyűjtöttük a HUH endonukleázok—az egyetlen fehérje, amelyet ezek a replikonok kódolnak—adatkészletét, amely minden víruscsaládot, plazmidot képvisel,és transzpozonok,amelyek mindhárom celluláris domainhez kapcsolódnak,16,27, 28, 29, 30. Ebben az elemzésben nem vettük figyelembe a plazmid konjugációban részt vevő Mob relaxázokat. Ebben a családban az enzimek körkörösen permutált konzervált motívumokat foglalnak magukban, amelyek bonyolítják szekvenciaalapú összehasonlításukat a DNS replikációjában vagy transzpozíciójában részt vevő HUH endonukleázokkal16,19. A kapott adatkészlet 8764 szekvenciát tartalmazott. Ezeket páronkénti hasonlóság alapján csoportosítottuk, és a klasztereket konvex klaszterezési algoritmussal (p-érték küszöb 1e−08) AZONOSÍTOTTUK35. Ez az elemzés 33 klasztert tárt fel, amelyek mérete 7-től 2711-ig változott szekvenciák (kiegészítő adatok 1). A klaszterek közötti kapcsolat vizsgálatát követően (ábra. 1), definiáltunk 2 árva klasztert és 2 szuperklasztert, amelyek vagy nem, vagy csak nagyon kevés kapcsolatot mutattak egymással (kiegészítő adatok 1). Mindazonáltal a rendelkezésre álló nagy felbontású struktúrák összehasonlítása mind az árva klaszterek,mind a 2 szuperklaszter képviselői16, 36 egyértelműen megerősítik közös eredetüket.

ábra. 1
figure1

reprezentatív HUH szupercsalád ismétlések csoportosítva azok páronkénti sorrend hasonlóság. A vonalak p−értékű szekvenciákat kapcsolnak össze 6e-08. A csoportokat jól jellemzett plazmidokról, vírusokról vagy a leggyakoribb taxonokról nevezték el

az Orphan cluster 1 az IS200/IS605 transzpozonok egyetlen családját tartalmazza, amelyek széles körben elterjedtek a baktériumokban és az archaea37-ben. Az IS200/IS605 inszerciós szekvenciák HUH endonukleázait strukturálisan és biokémiailag alaposan tanulmányozták, ami a funkcióik átfogó megértését eredményezte16, 38. Bár az IS200 / IS605 transzpozázok szerkezeti hajtása közös a többi HUH endonukleázéval, és tartalmazzák mind a 3 aláírási motívumot, nem mutattak észrevehető szekvenciahasonlóságot a HUH endonukleázok bármely más klaszterével, így leválasztva maradtak más klaszterek szekvenciáitól. Ennek ellenére az is200/IS605 klaszteren belüli szekvencia-sokféleség összehasonlítható a többi klaszteren belüli sokféleséggel.

az Orphan cluster 2 olyan Rep fehérjéket tartalmaz, amelyek a Rudiviridae39 család hipertermofil archeális vírusaiban konzerválódnak. A rudivirus SIRV1 Rep fehérje szerkezeti vizsgálata feltárta a kanonikus HUH endonukleáz redőt és a fehérje biokémiai jellemzése megerősítette a vitro36 várható nicking és joining aktivitását. Az IS200 / IS605 transzpozázokhoz hasonlóan a rudivirális Rep klaszter nem kapcsolódik más HUH endonukleázokhoz, beleértve az archeális vírusok és plazmidok más családjainak homológjait is.

elképzelhető, hogy a 2 árva klaszter egyedisége összefügg az egyes elemek által alkalmazott szokatlan transzponálási és replikációs mechanizmusokkal. Valójában az IS200 / IS605 inszerciós szekvenciák egyedülálló peel-and-paste mechanizmussal transzponálnak38, míg a rudivírusok, ellentétben a legtöbb más vírussal és a gördülő kör mechanizmusával replikáló plazmidokkal, viszonylag nagy (~35 kb) lineáris dsDNS genomokat tartalmaznak kovalensen zárt terminálissal40.

az 1.Szuperklaszter messze a legnagyobb és legváltozatosabb HUH assemblage, amely 24 klasztert tartalmaz (1. kiegészítő adat). Ebből a 24 klaszterből 15 jóhiszemű extrachromosomalis plazmidokból származó Reps-t tartalmaz, amelyek közül 7 klaszter tartalmaz különböző ssdns (Microviridae, Inoviridae és Pleolipoviridae) és/vagy dsDNS (Myoviridae és Corticoviridae) baktériumok és archaea vírusok Reps-jét is. Három klaszter a gokushovirinae és a Bullavirinae alcsalád mikrovírusai által kódolt ismétlésekből, illetve a Xanthomonas Inovirus Cf1 (inoviridae család). Nevezetesen, a phiX174-szerű mikrovírusok (Bullavirinae) kizárólag a gokushovirinae alcsalád mikrovírusaival mutatnak hasonlóságot, ami a Mikroviridae két alcsaládjának Monofilikus Rep-jére utal, annak ellenére, hogy nagy a szekvencia divergencia. Az is91 baktérium (beleértve az ISCR alcsaládot is) és az eukarióta Helitron család transzpozonjai két különálló klasztert alkotnak. A transzpozonok két csoportja nem kapcsolódik közvetlenül egymáshoz, hanem a bakteriális és az is91 esetében az archeális plazmidok különálló csoportjaihoz kapcsolódnak, ami a bakteriális extrakromoszomális replikonokból származó független eredetre utal. Korábban felvetődött, hogy a helitronok hiányzó láncszemet jelenthetnek az eukarióta zsázsa-DNS vírusok, nevezetesen a geminivírusok és a bakteriális HUH replikonok között41 vagy hogy a helitronok geminivirusokból fejlődtek42. Elemzésünkben azonban a helitronok nem kapcsolódnak a zsázsa-DNS vírusok egyik csoportjához sem, ami független evolúciós pályákra utal, összhangban a legutóbbi megállapításokkal43.

a fennmaradó 5 klaszter nem tartalmaz felismerhető plazmid -, vírus-vagy transzpozonszekvenciákat, így valószínűleg az integrált MGE új családjait képviselik. Ezen csoportok közül négy túlnyomórészt a taxa Clostridiales, Actinobacteria, Neisseriales és Bacteroidetes baktériumokban található meg (ennek megfelelően jelölve az ábrán. 1), míg az ötödik csoport az MSBL1 jelölt divízióra (földközi-tengeri sós tavak 1)44, a nem tenyésztett archeák csoportja, amely különböző hipersalin környezetben található. A klaszterek többsége rendszertani egységességet mutat a domén szintjén, vagyis a klaszterek bakteriális vagy archeális vagy eukarióta szekvenciákat (beleértve a megfelelő vírusokat és plazmidokat) tartalmaztak, ami arra utal, hogy a vírusok vagy plazmidok horizontális transzferje a gazdadomének között ritka. A két kivétel közé tartoznak a pUB110-szerű és IS91-szerű baktériumok által dominált klaszterek, amelyek egy maroknyi archeális szekvenciát tartalmaznak. Az IS91 transzpozonok esetében filogenetikai elemzésekkel sikerült megállapítani a baktériumok horizontális átvitelét45. Ezenkívül a klaszterek egy része szórványos szekvenciákat tartalmaz, amelyek eukariótaként vannak megjelölve; a megfelelő összefüggések elemzése azonban arra utal, hogy ezek valószínűleg bakteriális szennyeződések.

különösen érdekes a 7 klaszter, amelyek mind vírusokat, mind plazmidokat tartalmaznak. Például a pEC316_KPC-szerű klaszter a plazmidok mellett 3 család, a Myoviridae, a Corticoviridae és az Inoviridae evolúciós szempontból független vírusait tartalmazza, ami a rep gének kiterjedt horizontális elterjedésére utal. Nevezetesen az inovírusok ismétlése 5 klaszter között oszlik meg. Tekintettel a pVT736-1-szerű és pUB110-szerű klaszterek inovirális szekvenciáinak szűkösségére, amelyek csak a Pseudomonas Pf3 fágot és a Propionibacterium B5 fágot tartalmazzák, a géntranszfer iránya a plazmidoktól a megfelelő vírusokig nyilvánvalónak tűnik. Ezenkívül sok inovírus nem kódolja a HUH endonukleázokat, hanem egy evolúciósan független szupercsalád, a Rep_trans (Pfam id: PF02486)15 replikációs iniciátorait kódolja, amely szintén bővelkedik bakteriális plazmidokban30, míg a Vespertiliovírus nemhez tartozó inovírusok nem replikálnak, ehelyett átültetéssel replikálódnak a megfelelő beillesztési szekvenciákból származó IS3 és IS30 család transzpozázok felhasználásával46. Ezek a megfigyelések együttesen azt mutatják, hogy az inovírusok replikációs moduljait távoli rokonokkal, sőt nem homológ replikációs modulokkal cserélték különböző plazmid-és transzpozoncsaládokból. Hasonlóképpen, az archeális pleolipovírusok két klaszter között oszlanak meg, amelyek az archeális plazmidok különböző családjainak felelnek meg, pGRB1-szerű és pTP2-szerű, ami arra utal, hogy a replikációhoz kapcsolódó gének cseréje gyakori a bakteriális és archeális vírusokban kis, plazmid méretű genomokkal. Bizonyos esetekben nehéz megállapítani a sejtes kromoszómákban kódolt ismétlések vírus kontra plazmid tagságát, mert mindkét típusú MGE integrálódhat a gazdagenomokba. Például az XacF1-szerű klaszter 62 Rep szekvenciát tartalmaz, amelyek közül 2-et fonalas fágok kódolnak, míg a többi bakteriális genomokból származik. A genomi szomszédságok elemzése azt sugallja, hogy csak 6 a fennmaradó 60 ismétlések képviselik a prófétákat. Ezenkívül a pAS28-szerű klaszter tartalmaz egy plazmidot, pAS28 (ref. 47); a rokon ismétléseket azonban korábban azonosították a prófétákban48, de nem jellemzett vírusokban, téves benyomást keltve, hogy a pAS28-szerű Rep plazmid-exkluzív. A különböző típusú MGE-k által kódolt ismétlések közötti evolúciós kapcsolatok további jellemzésére a maximális valószínűségű filogenetikai fákat építettük fel a 7 klaszter számára, amelyek mind a vírusok, mind a plazmidok ismétlését tartalmazták (kiegészítő ábra. 2a-g). A filogenetikai elemzések eredményei a rep gének horizontális átvitelére utalnak a plazmidok és a vírusok között, a vírusszekvenciák jellemzően a plazmid által kódolt homológok közé ágyazódnak.

a 2. Szuperklaszter (SC2) 7 klaszterből áll (kiegészítő adatok 1), amelyek magukban foglalják az összes ismert Osztályozott és nem osztályozott eukarióta zsázsa-DNS vírust, parvovírusokat, a vörös alga pyropia pulchra49 plazmidcsoportját, valamint 4 bakteriális Rep szekvenciát tartalmazó klasztert. A pCPa-szerű és p4M-szerű klaszterek bakteriális ismétléseinek túlnyomó többsége bakteriális genomokban van kódolva, nem pedig plazmidokban, és korábban nem jellemezték őket. Hálózatunkban a zsázsa-DNS vírusok pCPa-szerű, p4M-szerű, pPAPh2-szerű és P. pulchra-szerű klaszterekhez kapcsolódnak, míg a pE194 / pMV158-szerű klaszter nem képez közvetlen kapcsolatot a zsázsa-DNS vírusokkal, hanem a pCPa-szerű klaszteren keresztül csatlakozik az SC2-hez (ábra. 1). A geminivírusok és a genomovírusok egy szubklúziót alkotnak a fitoplazma plazmidjaival (pPAPh2-szerű klaszter) és a P-vel. pulchra, amely el van választva más zsázsa-DNS vírusoktól. A parvoviridae klaszter, beleértve a parvovírusokat és a különböző eukarióta genomokba integrált endogén vírusokat, lazán kapcsolódik közvetlenül a zsázsa-DNS vírusokhoz, ami arra utal, hogy a lineáris ssdns genomokkal rendelkező parvovírusok közös ősökkel rendelkeznek a zsázsa-DNS vírusokkal, amelyek definíció szerint kör alakú genomokkal rendelkeznek. Érdeklődve az eukarióta zsázsa-DNS vírusok és a bakteriális és algák Ismétlődései közötti látszólag szoros evolúciós kapcsolat iránt, részletesebben megvizsgáltuk ezeket a kapcsolatokat, amint arról a következő szakaszokban beszámoltunk.

a vírusszerű ismétlések sokfélesége a bakteriális genomokban

az eukarióta zsázsa-DNS vírusok és az SC2 nem vírusos replikonjai közötti hasonlóság mértékének vizsgálatához összehasonlítottuk doménszervezeteiket. A pE194/pMV158 családba tartozó plazmidok kivételével, amelyek csak a nukleáz domént tartalmazzák, a bakteriális és alga SC2 Reps-nek ugyanolyan nukleáz-helikáz domén szervezete volt, mint a zsázsa-DNS vírusoknak. Ugyanez a kétdoménes szervezet jellemző a parvovírus Reps2-re is. Így a tartományszervezési elemzés megerősíti a szekvenciacsoportosítás eredményeit, és azt is jelzi, hogy a bakteriális SC2 ismétlések szorosabban kapcsolódnak az eukarióta vírusok Ismétléseihez, mint más prokarióta plazmidokhoz és vírusokhoz.

ezután további információkat szereztünk a bakteriális genomokban kódolt vírusszerű SC2 ismétlések sokféleségéről és rendszertani eloszlásáról. Maximális valószínűség filogenetikai elemzés feltárta 9 jól támogatott kládok (ábra. 2a). A klaszterezés és az azt követő közösségi kimutatási elemzés validálta a bakteriális ismétlések 9 csoportját (ábra. 2b), ahol az 1-3 csoportok megfelelnek az ábrán látható p4M-szerű klaszternek. Az 1.csoport 4-8 a pCPa-szerű klaszterhez, a 9. csoport pedig a pPAPh2-szerű klaszterhez. A zsázsa-DNS vírusok ismétlésével való hasonlóságuk hangsúlyozása érdekében a 9 csoportot pCRESS1-től pCRESS9-ig nevezzük. Ezek a csoportok részben átfedő, de különálló taxonómiai eloszlásokat mutattak, amelyek 4 bakteriális phyla-n belül több osztályt lefedtek (kiegészítő ábra. 1.Kiegészítő táblázat 1.).

ábra. 2
figure2

a vírusszerű Rep fehérjék sokfélesége a baktériumokban. a bakteriális Rep fehérjék és homológjaik filogenetikai fája a P. pulchra – ban. A szorosan kapcsolódó szekvenciák háromszögekké válnak, amelyek oldalhossza arányos a legközelebbi és a legtávolabbi levélcsomópontok közötti távolsággal. B klánok csoportok bakteriális Rep fehérjék és homológok. A csomópontok fehérje szekvenciákat jeleznek. A vonalak szekvenciakapcsolatokat képviselnek(klánok P – érték 6e−05). Az azonos klaszterhez tartozó csomópontok azonos színekkel vannak színezve, amelyek megfelelnek az 1-9 csoportokat képviselő integrált és extrakromoszomális plazmidok panel A. C genom térképein látható kládoknak. A homológ gének azonos színnel vannak ábrázolva, funkcióik pedig az ábra jobb oldalán vannak felsorolva

a Pcress7 és pcress9 ismétlések többségét extrakromoszomális plazmidok kódolják (1.Kiegészítő táblázat). Ezzel szemben a túlnyomó többség (97.5%) a más csoportokban található ismétlések kódolva vannak a mobil genetikai elemeken belül-kifejezetten a bakteriális kromoszómákba integrálva (1.Kiegészítő táblázat; ábra. 2C; kiegészítő ábra. 3; Kiegészítő Megjegyzések 1). Nevezetesen, egyik elem sem kódolta a jelenleg ismert vírusstrukturális fehérjék homológjait (1.kiegészítő megjegyzés). Ezek a megfigyelések együttesen azt mutatják, hogy a vírusszerű ismétléseket a baktériumokban különböző extrakromoszomális és integrált plazmidok kódolják.

A bakteriális és zsázsa-DNS vírus ismétlések konzervált tulajdonságai

a szekvencia analízis kimutatta, hogy a jelentős teljes szekvencia divergencia ellenére a pCRESS4-8 ismétlései szorosan hasonló szekvencia motívumokat tartalmaznak a nukleáz és helikáz doméneken belül (ábra. 3), összhangban a klaszterezés és filogenetikai elemzések eredményeivel (ábra. 2). Különösen ez az 5 pCRESS csoport osztozik egy specifikus aláírással, YLxH (x, bármely aminosav) a nukleáz domén III.motívumán belül, amelyet a Pcress1–3 és 9 Reps-ben nem figyeltek meg (ábra. 3). Így a pcress4–8-ra együttesen YLxH szupercsoportként hivatkozunk (nem pedig a pCPa-szerű klaszter), hogy hangsúlyozzuk ezt a megosztott funkciót. Az YLxH aláírást a Pe194/pMV158-szerű klaszter Ismétléseiben is megőrizték, ami szorosabb evolúciós kapcsolatra utal a két klaszter között, annak ellenére, hogy a pE194/pMV158-szerű ismétlésekből hiányzik a helikáz domén. A pCRESS9 a P. pulchra plazmidjaihoz hasonló motívumokat is megjelenít, így ezeket a plazmidokat közös együttessé lehet egyesíteni. Ezzel szemben a pCRESS1, -2 és -3 (p4M-szerű klaszter) jellegzetes motívumkészleteket jelenít meg (ábra. 3; Kiegészítő Megjegyzések 1).

ábra. 3
figure3

Rep fehérjék konzervált szekvencia motívumai. A bakteriális Rep csoportokat szürke háttérrel ábrázolják. A maradékokat kémiai tulajdonságaik színezik (poláris, zöld; bázikus, kék; savas, piros; hidrofób, fekete; semleges, lila). A Rep csoportokat manuálisan rendeztük az összehangolt motívumok páros hasonlósága szerint. A HUH endonukleáz és az SF3 helikáz domének az ábra tetején vannak körülhatárolva

az SF3 helikáz domén eredete

a Szekvenciaelemzések azt sugallják, hogy az SF3 helikáz domént tartalmazó plazmid ismétlések, különösen a pCRESS2, pCRESS3 és pCRESS9, valamint a P. pulchra, szorosan kapcsolódnak egymáshoz a zsázsa-DNS-vírusok ismétléséhez. Az evolúció iránya azonban, vagyis hogy a plazmid ismétlések a zsázsa-DNS vírusokból fejlődtek-e ki, vagy fordítva, nem nyilvánvaló. Bár csábító a helikáz domén hiányát a pE194/pMV158-szerű klaszterben annak jelzésére, hogy ez a csoport a helikáztartalmú Reps őse, nem zárható ki, hogy ezek a plazmidok elveszítették a helikáz domént. Így nekiláttunk az SF3 helikáz domén eredetének vizsgálatához a plazmid és a vírus reps-ben. A hmmer-rel végzett érzékeny szekvenciakeresések az nr30 adatbázis alapján azt mutatták,hogy a plazmid és a zsázsa-DNS vírus Reps helikáz doménjei a legszorosabban kapcsolódnak az eukarióta pozitív érzékű RNS vírusokhoz (Picornavirales rend és Caliciviridae család), valamint az AAA+ ATPase szupercsaládhoz50, 51. Ebben az elemzésben a parvovírusok, poliomavírusok és papillomavírusok SF3 szekvenciáit is bevontuk, amelyekről úgy gondolják, hogy evolúciós kapcsolatban állnak a zsázsa-DNS vírusokkal2,25. A nagy dsDNS genomú vírusokból származó, távolabbi SF3 helikázok több csoportját52 figyelmen kívül hagyták. A nagy szekvencia divergencia és a viszonylag rövid hosszúság miatt az SF3 helikáz domének filogenetikai elemzése nem volt informatív, ami csillag alakú fa topológiákat eredményezett, függetlenül az alkalmazott evolúciós modellektől vagy rendszertani mintavételtől. A páros hasonlóságokon alapuló klaszterelemzés azonban betekintést nyújtott a különböző ATPase családok közötti kapcsolatokba (ábra. 4a). Különösen a bakteriális ismétlődések SF3 helikáz doménjei és a zsázsa-DNS vírusok közötti szoros kapcsolat volt egyértelműen alátámasztva. Mindkét csoport kapcsolódik az RNS vírusokhoz, de csak a bakteriális ismétlések, különösen az YLxH szupercsoport, mutatnak kapcsolatot az AAA + szupercsalád Atpázokkal, nevezetesen a bakteriális helikáz betöltő DnaC-val és kisebb mértékben a Dnaa-val és a Cdc48-szerű Atpázokkal (ábra. 4a). Az YLxH szupercsoport és a bakteriális AAA+ Atpázok közötti szorosabb hasonlóságot alátámasztja a katalitikus motívumok összehasonlítása, amelyek több közös származtatott karaktert tártak fel, más csoportok kizárásával (kiegészítő ábra. 4). Ugyanezen klaszterezési küszöbön sem az eukarióta DNS, sem az RNS vírusok nem kapcsolódtak az atpázok bármely csoportjához, kivéve a bakteriális plazmidokat. A parvovírusok SF3 helikázjai kapcsolódnak a zsázsa-DNS vírusokéhoz, összhangban a teljes hosszúságú Rep szekvenciák elemzésével (ábra. 1). A papillomavírusok és a poliomavírusok 2 klasztert alkottak, amelyek összekapcsolódtak egymással és a parvovírusokkal.

ábra. 4
figure4

kapcsolatok a 3.szupercsalád helikázjai és az AAA+ Atpázok között. a szupercsalád 3 helikáz és AAA+ ATPáz domének csoportosulnak páros hasonlóságukkal klánok segítségével. Összesen 3854 szekvenciát csoportosítottak klánokkal(klánok p−érték 6e-09). A nem osztályozott zsázsa-DNS vírusok csoportjait CRESSV1-től CRESSV6-ig (ref. 53). b javasolt evolúciós forgatókönyv a vírus szupercsalád 3 helikázok eredetére és evolúciójára. Rövidítések: SF3, szupercsalád 3 helikáz domén; HUH, HUH szupercsalád nukleáz domén; OBD, eredet-kötő domén; HGT, horizontális géntranszfer; RHR, rolling-hairpin replikáció

Ez a kapcsolódási minta az evolúció specifikus vektorát sugallja, és úgy tűnik, hogy a legjobban kompatibilis a következő forgatókönyvvel. A bakteriális plazmidok SF3 helikáz doménje bakteriális DnaC-szerű Atpázból fejlődött ki; ezt a helikáz domént a pe194/pMV158-szerű plazmidok reps nukleáz doménjéhez csatolták, így az ylxh szupercsoport őse lett; a bakteriális plazmid ismétléseket átadták a zsázsa-DNS vírusoknak; az RNS-vírusok SF3 helikázát vízszintesen vagy bakteriális plazmidokból, vagy inkább eukarióta zsázsa-DNS vírusokból szerezték be; a zsázsa-DNS vírusok parvovírusokat hoztak létre, amelyek viszont poliomavírusokat és papillomavírusokat eredményeztek (ábra. 4b). Az alternatív forgatókönyv, amely szerint az eukarióta RNS vírusok SF3 helikázjai bakteriális plazmidokon keresztül generálták az univerzális bakteriális DnaC és DnaA fehérjéket, nem tűnik parsimonikusnak és rendkívül valószínűtlennek. Valójában a DnaA mindenütt jelen van és elengedhetetlen a bakteria50,51-ben, így a helikáz plazmidból történő befogásának az élet bakteriális doménjének eredeténél kell megtörténnie. A pCRESS9 és a P. pulchra plazmidok nem kapcsolódnak más plazmidokhoz, hanem a zsázsa-DNS vírusokon keresztül kapcsolódnak a többi szekvenciához. Ez utóbbi mintát a HUH ismétlések globális klaszterezési elemzésében is megfigyelték (ábra. 1), valamint a nukleáz domének klaszterezésében.

A zsázsa-DNS vírusok eredete bakteriális plazmidokból

az SF3 helikáz domének elemzése azt sugallja, hogy a pE194/pMV158-szerű plazmidok ismétlései inkább ősi, mint származtatott formák. Jelenleg nem zárható ki az alternatív lehetőség, nevezetesen, hogy a pE194/pMV158-szerű plazmidok ismétlései elvesztették a helikáz domént. Az a tény azonban, hogy a helikáz domén nem veszett el a zsázsa-DNS vírusok számos ismert csoportjában vagy a pCRESS1-pCRESS9 plazmidokban, arra utal, hogy a megszerzés után a helikáz domén fontossá válik a hatékony plazmid/vírusgenom replikáció szempontjából. Így a pE194/pMV158-szerű ismétlések és az YLxH szupercsoport szoros hasonlósága, ami a két csoport közvetlen összekapcsolódását eredményezi a globális hálózatban (ábra. 1), azt jelenti, hogy az előbbi csoport megfelelő outgroup a Reps a bakteriális plazmidok és zsázsa-DNS vírusok. A filogenetikai elemzésekhez SC2 ismétlések adatkészletét használtuk, kivéve a parvoviridae és a zsázsa-DNS vírusok ismétlését, amelyeket korábban nukleáz és helikáz domainjeik tekintetében kimérának ítéltek53, hogy elkerüljük az egymásnak ellentmondó filogenetikai jelekből eredő lehetséges leleteket. Az adatkészlet tartalmazta a zsázsa-DNS vírusok összes Osztályozott családjának képviselőit, valamint a nem osztályozott zsázsa-DNS vírusok 6 csoportját, ideiglenesen címkézve zsázsa V1-6 (ref. 53), valamint a GasCSV-szerű vírusok egy kis csoportját, amelyekről korábban észrevették, hogy a bakteriális ismétlésekkel szignifikáns hasonlóságot kódolnak54. A jól támogatott maximális valószínűségű filogenetikai fában, amelyet PhyML-lel építettek, és pE194/pMV158-szerű ismétlésekkel gyökereztek, az YLxH szupercsoport (pCRESS4–8) egy olyan összeállítás alapja, amely magában foglalja az összes zsázsa-DNS vírust, a pCRESS1–3 és a pCRESS9, valamint a P. pulchra plazmidokat. Ez az összeállítás két kládra oszlik (ábra. 5). Az 1. klád két alosztályt tartalmaz, amelyek közül az egyik geminivírusokból és genomovírusokból áll, amelyek a fitoplazma pCRESS9 plazmidjait egyesítik, a másik pedig a CRESSV6 és a P. pulchra plazmidokat tartalmazza. Nevezetesen, úgy tűnik, hogy a P. pulchra plazmidok közvetlenül a CRESSV6 sokféleségéből származnak, a legszorosabb kapcsolatban áll a szennyvízmintákból szekvenált vírusok CRESSV6 alosztályával. A geminivírusok/genomovírusok és a pCRESS9 plazmidok közötti kapcsolat nem oldódik meg a filogenitásban. A klaszterezési elemzések azonban határozottan azt sugallják, hogy a pcress9 plazmidok ismétlése geminivírusokból-genomovírusokból (füge. 1. és 4.). Ezzel a forgatókönyvvel összhangban a phytoplasma pcress7 és pCRESS9 plazmidok, annak ellenére, hogy filogenetikailag különböző ismétléseket kódolnak, megosztják a géntartalmat, nevezetesen a kópiaszám-kontroll fehérjét, a PRK06752-szerű SSB fehérjét és a konzervált hipotetikus fehérjét (kiegészítő ábra. 3g, i). Továbbá a geminivírusok és a CRESSV6 homológ kapszid fehérjéket kódolnak, ami arra utal, hogy egy közös vírus ősből fejlődtek ki, nem pedig két plazmidcsoportból konvergáltak a homológ kapszid fehérje gének befogásával. A 2. klád magában foglalja a pcress1–3 és testvércsoportként a Nanoviridae/Alphasatellitidae, Smacoviridae és Circoviridae családokba tartozó zsázsa-DNS vírusokat, valamint a nem osztályozott zsázsa V1-től zsázsa V5-ig, míg a gascsv-szerű vírusok a bakteriális pCRESS2-be ágyazódnak.

ábra. 5
ábra 5

a Rep fehérjék filogenetikai fája. GasCSV-Haslábúakhoz kapcsolódó körkörös ssdns vírus. A fát PhyML78-Mal építették. A 70 alatti tartóértékkel rendelkező ágakat szerződtetjük

a PhyML fa robusztusságát további elemzésekkel validáltuk (1. kiegészítő megjegyzés), beleértve (i) a maximális valószínűségű filogenetikai elemzéseket raxml és IQ-Tree alkalmazásával, alternatív ágtámogatási módszerekkel (S5 ábra); (ii) filogenetikai rekonstrukció a 20 profilú keverékmodell alkalmazásával (S5 ábra); (iii) a nem korlátozott és 3 korlátozott fa topológia statisztikai elemzése (2.Kiegészítő táblázat). Ezek az eredmények együttesen azt mutatják, hogy a kapott fa topológia rendkívül robusztus, és valószínűleg pontosan tükrözi a zsázsa-DNS vírusok és plazmidok által kódolt ismétlések evolúciós történetét.

nevezetesen a konzervált motívumok elemzése (ábra. 3) konkrét összefüggést javasol az 1.klád vírusismétlői és a bakteriális pCRESS3 (nem pedig a pcress1–3 együttesen) között, ami arra utal, hogy a filogenetikai elhelyezést befolyásolhatják az ősi rekombinációs események. Ezenkívül a bacilladnavírusokat kihagyták a globális filogenetikai fáról, mert ismétlésük instabil helyzetet mutatott a filogenitásban a taxon mintavételétől függően (kiegészítő ábra. 6), valószínűleg a rendelkezésre álló szekvenciák kis száma, nagy divergenciájuk és potenciális kimérizmusuk miatt. Ettől függetlenül a filogenetikai elemzés határozottan azt sugallja, hogy a zsázsa-DNS vírusok többsége, beleértve a circovírusokat, a smacovírusokat, a nanovírusokat és a CRESSV1–5–et, egy közös ősből fejlődött ki a pcress1-3 bakteriális ismétlésével, míg a nem tenyésztett GasCSV-szerű vírusok közvetlenül a bakteriális pCRESS2 ismétlésből származnak (ábra. 5). A geminivírusokat, a genomovírusokat és a CRESSV6-ot is magában foglaló csoport eredete kevésbé egyértelmű, de megelőzheti a többi CRESS-DNS víruscsoport megjelenését, és valószínűleg az YLxH szupercsoporttal közös ősről van szó. A bakteriális pCRESS9 és P. a pulchra plazmidokat valószínűleg vízszintesen szerezték be újabban a megfelelő zsázsa-DNS vírusokból.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.