Gen-pseudogene evoluce: pravděpodobnostní přístup

V této části jsme se poprvé představili Pseudogenization, Duplicity, Ztráty, Rychlost a Posloupnost evoluce modelu, PDLRS. Začneme tím, že nejprve definujeme některé základní pojmy. Druh-strom je zakořeněný binární strom, který představuje evoluční historii druhů, kde listy představují existující druhy a vnitřní vrcholy představují speciační události. Genový strom je také zakořeněný binární strom, který představuje evoluční historii sady genů. Genový strom může mít jako své listy geny nebo pseudogeny.

PDLRS model

PDLRS model je rozšíření DLRS modelu získaného také zahrnutím pseudogenizačních událostí. Model popisuje, jak gen linie se vyvíjí uvnitř druhu-strom s titulem jeden kořen, začíná u kořene a následně vyvíjejí listy, zatímco vystaveni genové duplikace, genové ztráty, a pseudogenization události na sazby δ, μ, a ψ, resp. Také, když genová linie dosáhne vrcholu druhového stromu, vždy (tj., deterministicky) antil a dva, aby obsahoval gen linií i nadále vyvíjet pod druhy-strom vrcholy, jeden v každé z jeho dvou odchozí druhů-strom hrany.

ačkoli během tohoto procesu může genová linie přejít na pseudogenní linii, pseudogenní linie nesmí přejít zpět na genovou linii. Pseudogenizační události zavádějí vrcholy stupně dva v genovém stromu. A pseudogene lineage jinak se chová jako genové linie, to může duplikovat, nebo se ztratil během evoluce, a to deterministicky antil, když dosáhne druhů-strom vrchol. Linie, která dosáhne listů druhového stromu, vede k listu v genovém stromu, představující existující gen nebo pseudogen. Vrcholy a okraje genového stromu, které nevedou k žádným takovým existujícím listům, jsou však prořezány z genového stromu (Obrázek 1). Protože tento proces probíhá v druhy-strom s časem na jeho vrcholů a hran, každá událost nastane v určitém čase. Kdykoli událost vytvoří nový vrchol genového stromu, čas události je spojen s novým vrcholem.

Číslo 1
1

Pseudogenization, Duplicity, Ztráty, Posloupnost evoluce & Sazby (PDLRS). Evoluce genových a pseudogenních linií uvnitř okraje druhového stromu je modelována procesem narození a smrti. Genová / pseudogenní linie se může setkat s duplikací nebo speciační událostí. Gen rodokmen (zastoupená černá linie) se mohou převést do pseudogene linie (zastoupeny hnědé linie). Pokaždé, když Gen/pseudogenní linie prochází speciační událostí, rozdělí se na dvě nezávislé genové linie. Genová linie může být také ztracena. Po prořezávání všech ztracených linií se získá konečný genový strom. Uvolněné molekulární hodiny se používají k získání délky větví. Nakonec standardní model evoluce sekvence generuje sekvence přes genový strom s délkami větví. Zelená a hnědá barva představuje vývoj genové a pseudogenní sekvence.

s cílem získat uvolněný molekulární hodiny, sazby jsou ve vzorku nezávisle na Γ-rozdělení (parametrizované tím, že průměr a rozptyl) pro každou hranu, a okraj s čas t a rychlost r je přiřazena délka l. Konečně, sekvence se vyvinul v průběhu tohoto genu-strom s jeho délky. Připomeňme, že události pseudogenizace zavádějí vrcholy stupně dva v genovém stromu. Přes hranu, kde rodičovský vrchol je gen model posloupnost evoluce vhodné pro geny se používá, když rodičovské vrchol představují pseudogene (a proto také dítě zastupovat pseudogene) model posloupnost evoluce vhodné pro pseudogenes se používá. Tyto modely se mohou měnit, ale zde používáme dva kodonové modely popsané níže.

abychom modelovali dva způsoby evoluce sekvencí, používáme dvě substituční matice kodonů navržené, jednu pro vývoj pseudogenů a druhou pro vývoj genů. Okamžitá substituce frekvence matice z kodonu i kodonu j, q ij je v obou případech určena:

q i j = 0 , pokud i a j se liší na více než jednu pozici v kodonu triplet μ π j , liší synonymem transverze μ κ π j , liší synonymem přechod μ ω π j , liší nonsynonymous transverze μ κ ω π j , liší nonsynonymous přechod

kde π j je rovnovážná frekvence kodonu j, μ je normalizační faktor, κ je přechod/transverze poměr, a ω je non-synonymní synonymní (dN/dS) poměr. Kromě ω jsou tyto parametry sdíleny mezi dvěma způsoby evoluce sekvence. U pseudogenů je ω rovno 1 a je povolen přechod na stop kodony, zatímco u genů přechod na stop kodon není povolen.

rámec PrIME-PDLRS MCMC

PrIME-PDLRS je analytický nástroj založený na MCMC pro výše uvedený model. Bere jako vstup vícenásobné sekvenční zarovnání genových a pseudogenových sekvencí spolu s klasifikací těchto sekvencí jako genů nebo pseudogenů. Vyžaduje také datovaný druh-strom s. Označme genový strom g, jeho délky okrajů l a další parametry modelu θ. Parametr θ je sloučenina, obsahující: zdvojení frekvence; ztráty; pseudogenization sazba; okraj sazbu průměr a variační koeficient; a non-synonymní synonymní sazby (dN/dS) a přechod/transverze sazby pro kodonu substituční model posloupnosti evoluce.

použijeme Ψ k označení množiny pseudogenizačních vrcholů (stupeň dva) v genovém stromu (žádný z těchto vrcholů nesmí ležet na stejné cestě kořene k listu). Používáme P (·) K označení pravděpodobnosti a p (·) k označení hustoty pravděpodobnosti.

stav v našem markovském řetězci je čtyřnásobek (G, l, θ, Ψ). Listy v genovém stromu odpovídají daným sekvencím a každá sekvence klasifikovaná jako pseudogen musí mít předka v G, který patří do Ψ. Když současný stav je (G, l, θ, Ψ), pravděpodobnost přijetí navrhovaného stavu ( G ‚, l ‚, θ ‚, ψ ‚) , je dán poměrem mezi p(G, l, θ, Ψ| D, S) a p ( G ‚, l ‚, θ ‚, ψ ‚ | D , S ) , kde D je dána dat a S je druhy-strom s časem. Protože každý z těchto hustot lze vyjádřit pomocí Bayesova rovnosti, např.,

p ( G , l , θ , ψ | D , S ) = P ( D | G , l , ψ ) p ( G , l , ψ | θ , Y ) p ( θ ) P ( D | S)

dva jmenovatele P(D|S) v pravděpodobnost přijetí vzájemně ruší, a získáme

p ( G , l , θ , ψ | D , S ) p ( G ‚, l ‚, θ ‚, ψ ‚| D , S ) = P ( D | G , l , ψ ) p ( G , l , ψ | θ , Y ) p ( θ ) P ( D | G ‚, l ‚, ψ ‚) p ( G ‚, l ‚ , ψ ‚| θ ‚, Y ) p ( θ ‚ ) .

zde mají čitatel a jmenovatel stejnou strukturu, takže stačí popsat, jak vypočítat první. Za prvé, faktor P (D/ G, l, Ψ) lze vypočítat pomocí algoritmu dynamického programování (DP) navrženého Felsensteinem . Okraje a části okrajů, pro které by měl být použit genový nebo pseudogenní způsob evoluce sekvence, jsou specifikovány Ψ. Rovnovážné frekvence jsou odhadovány z genových a pseudogenových sekvencí a jsou sdíleny oběma modely evoluce sekvencí. Za druhé, předchozí p (θ) je zvolen tak, aby mohl být snadno vypočítán. Konečně, hlavním technickým přínosem je algoritmus DP pro výpočet pravděpodobnosti genového stromu a jeho délky hran daných parametrů a druhového stromu podle modelu DL. Pro výpočet p (G, l, θ, Ψ|D, S) navrhujeme nový algoritmus DP, který integruje proces pseudogenizace a proces DL.

V, byl popsán DP algoritmus pro výpočet faktoru p(G, l|θ, S). Pojďme nejprve definovat některé klíčové pojmy. Nechť S‘ být diskretizována druhů-strom, kde hrany druhů-strom S byly rozšířené o další diskretizace vrcholů taková, že všechny rozšířené vrcholy jsou ve stejné vzdálenosti během jedné hrany, viz obrázek S1 v další soubor 1. DP je použití tabulky, s(x, y, u), která je definována jako pravděpodobnost, že když jeden gen rodokmen začíná vyvíjet na vrchol x∈V ( S ‚) , strom G u (gen-strom kořeny u spolu s rodičovskou okraj u) je generován spolu s hranou délky, uvedeno l, a, kromě toho, událost, odpovídající u se vyskytuje na y∈V ( S ‚ ) . Nechť v A w jsou děti u v G A nechť x, y A z jsou vrcholy V (S‘).

Nechť ρ(r) je pravděpodobnost, že hrana G má rychlost r. také nechť t (x, y) je čas mezi vrcholy x, y∈V ( S ‚ ) . Nechť σ(u) je funkce definovaná takto (i) pro list u∈L ( G ) , σ (u) je druh stromu list, v němž gen, který u reprezentuje, může být zjištěno, a (ii) pro každý vnitřní vrchol u, G, σ (u), je poslední společný předek L(G. u ) v S. využíváme p11(x, y) k označení pravděpodobnost, že genová linie vyvíjí „1-to-1“ mezi dvěma body v druhu stromu, tj., jeden gen začínající na x, pro některé k vede k liniím k Na y, z nichž k-1 vyhyne a jedna genová linie může nebo nemusí vyhynout. Používáme p 11 ψ ( x , y ) značí pravděpodobnost pseudogene vyvíjí „1-to-1“ mezi dvěma body x a y podle druhu stromu, tzn., že jeden pseudogene začíná na x, pro některé k vede k pseudogene linií v y, z nichž k – 1 vyhynou, a jedna linie, která může nebo nemusí vyhynout. Vrchol u∈V (T) se nazývá pseudogen, pokud má předka, který patří ke všem vrcholům představujícím pseudogenizační události Ψ mají stupeň dva. Jak vypočítat obě tyto pravděpodobnosti „1: 1“ je popsáno v dalším souboru 1. Následující rekurze popisují, jak lze tabulku s vypočítat pomocí dynamického programování:

1 Pokud u∈L (G) A x = σ (u), s(x, x, u) = 1.

2 Pokud x V V (S ) A x σ σ (u), s(x, x, u) = 0.

3 je-Li x∈V ( S ) \L ( S ) ,u∉ψ, x = σ(u),

y ( x , x , u ) = ∑ y ∈ D L ( x ) s ( x , y , v ) ∑ y ∈ D R ( x ) s ( x , y , w ) ,

kde D L (x) a D R (x) jsou potomci levé a pravé dítě x v S‘, resp.

4 Pokud x∈V ( S ‚ ) \V ( S ) a u∉ψ,

y ( x , x , u ) =2δ ∑ y ∈ D ( x ) \ { x}, y ( x , y , v ) ∑ y ∈ D ( x ) \ { x}, y ( x , y , w ) ,

kde D(x) je sada potomci x.

5, Pokud x∈V ( Y ) , rodič u (tj. p(u)), není pseudogene, a z je dítě x takové, že σ ( L, ( G, u ) ) ⊆K ( S, z ‚ ) a z je předkem y, pak

y ( x , y , u ) = p 11 ( x , z), ε ( x , z ) ρ ( l ( p ( u ) , u ) / t ( x , y ) ) ρ ( l ( p ( u ) , u ) / t ( z , y ) ) s ( z , y , u)

, kde ε ( x , z ) je pravděpodobnost, že genová linie začíná na x nedosahuje jakékoliv list l∈L ( Y x ) \L ( S, z ‚ ) . Nicméně, pokud navíc y je dítětem x výše uvedené výrazy snížit,

y ( x , y , u ) = p 11 ( x , y ) ε ( x , y ) ρ ( l ( p ( u ) , u ) / t ( x , y ) ) s ( y , y , u ) .

6, Pokud x∈V ( S ) , p(u) je pseudogene, a z je dítě x takové, že σ ( L, ( G, u ) ) ⊆L ( S, z ‚ ) a z je předkem y, pak

y ( x , y , u ) = p 11 ψ ( x , z), ε ( x , z ) ρ ( l ( p ( u ) , u ) / t ( x , y ) ) ρ ( l ( p ( u ) , u ) / t ( z , y ) ) .

Nicméně, pokud navíc y je dítětem x výše uvedené výrazy snížit,

y ( x , y , u ) = p 11 ψ ( x , y ) ε ( x , y ) ρ ( l ( p ( u ) , u ) / t ( x , y ) ) s ( y , y , u ) .

pravděpodobnost, že ten gen-strom G je generována je pravděpodobnost, že když jeden rodokmen začíná u kořene S, jeden, dítě c kořene G se vyskytuje někde pod stupni jeden kořen ρ S, a pak se tento proces pokračuje a generuje G. Proto,

p ( G , l | θ , ψ , Y ) = ∑ y ∈ D ( ρ ) ( ρ , y , c ) ,

kde D(ρ) je sada potomci p.

odběr Vzorků d-realizace

s cílem zmapovat pseudogenization vrcholy vrcholy discretized druhů-strom S‘, použijeme dynamické programování algoritmus navrhl v . Potlačením pseudogenizačních vrcholů Ψ genového stromu G (tj. odstraněním každého stupně – dvou vrcholů a sousedením jeho koncových bodů) získáme genový strom G*. Vzorkovací algoritmus představil v se používá k mapování vrcholů gen-strom V(G*) na vrcholy discretized druhů-strom V(S‘) (viz Další Soubor 1). Časové body spojené s vrcholy diskretizovaného druhu-stromu vyvolávají asociaci časových bodů s vrcholy G*. Jakmile čas body byly spojeny s rodičovskou vertex a dítě vrcholu pseudogenization vrchol u z G, a časový bod může být snadno spojeny s u, pomocí branch délky incidentu hran.

Srovnání pseudogenization konfigurace

Máme zájem o vyčíslení rozdílu mezi dvěma pseudogenization konfigurace G spolu s ψ a G spolu s ψ‘ jedné genové rodiny. Všimněte si, že když jsme se potlačit vrcholy, ψ v G a ψ‘ v G (tj. odstranit každý takový stupeň-dva vrcholy a koncové body sousední stát), respektive, pak stejný strom G* je získán. Nechť E ψ a E ψ‘ jsou množinou hran g * zavedených potlačením ψ a ψ‘. Pokud byla hrana e ∈ E (G*) vytvořena potlačením u, pak se u nazývá původ e.

Všimněte si, že pro jakoukoli hranu f v E ψ nebo E ψ ‚ jsou všechny listy pod f pseudogeny. Takže pokud f ∈ E ψ, pak jsou buď okraje E ψ ‚pod f na jakékoli cestě od f k listům pod ním, nebo je hrana nad f, která patří E ψ‘ . V prvním případě nazýváme f střechu a okraje E ψ‘ její stín. V druhém případě se hrana E ψ ‚ nazývá střecha a f patří do jejího stínu.

první vzdálenost, vzdálenost hrany, nerespektuje čas a je místo toho definována na základě vzdálenosti v G*. Pro každou dvojici hran g* existuje jedinečná nejkratší cesta, která je obsahuje; vzdálenost mezi dvěma takovými hranami je definována jako počet vnitřních vrcholů na této cestě.

nejprve definujeme dvě topologické vzdálenosti (Obrázek 2). Okraje vzdálenost mezi dvěma pseudogenization vrcholů a ψ a b ψ‘, kde ψ b ψ jsou počátky hrany e a a e b , respektive takové, že e a , e b ∈ E(G∗), je definována jako minimální délka cesty mezi e a a e b v G∗. Pro každou hranu střechy F ∈ E ψ nebo f ∈ E ψ‘ nechť d m (f ) A d a (e) je maximální vzdálenost hrany a průměrná vzdálenost hrany mezi f A okraji jejího odstínu. Nechť maximální topologická vzdálenost D m a průměrná topologická vzdálenost D a mezi G, ψ a G‘, ψ‘ jsou maximální d m (f) a průměr d A (f) na všech střechách f ∈ E ψ ∪ e ψ“. Nechť pravý genový strom a jeho pseudogenizační vrcholy jsou (G, ψ) a q je zadní rozdělení pravděpodobnosti. Nakonec spočteme očekávanou průměrnou E D a a maximální průměr M D a topologické vzdálenosti jako:

Obrázek 2
obrázek 2

Topologické Vzdálenosti mezi dvěma pseudogenization konfigurace, D = ((1 + 1) / 2 + (1 + 2 + 2) / 3) / 2, D m = max ( max (1 , 1) , max (1 , 2 , 2)).

E D a ( ( G , Ψ ) , q ) = ∑ G ‚, Ψ ‚D a ( ( G , Ψ ) , ( G ‚, Ψ ‚) ) q ( G , Ψ ) M D a ( ( G , Ψ ) , q ) = max G ‚ , Ψ ‚D a ( ( G , Ψ ) , ( G ‚, Ψ ‚ ) ) q ( G , Ψ )

také definovat očekávané maximální E D m a maximální maximální M D m z topologické vzdálenosti, jak:

E D m (v ( G , Ψ ) , q ) = ∑ G ‚, Ψ ‚D m (v ( G , Ψ ) , ( G ‚, Ψ ‚) ) q ( G , Ψ ) M D m (v ( G , Ψ ) , q ) = max G ‚, Ψ ‚D m (v ( G , Ψ ) , ( G ‚, Ψ ‚ ) ) q ( G , Ψ )

za Druhé, jsme se definovat časové vzdálenosti. Tyto jsou získány obdobně jako topologické, ale namísto použití hrany vzdáleností mezi střech a jejich odstíny, používáme časové vzdálenosti mezi čas spojený s původem střechu a čas spojený s počátky jeho stínu.

Topologické vzdálenosti měří vzdálenost pravého pseudogenization vrchol z dovodit, jeden podél gene tree topologie stromu, vzhledem k tomu, že časová vzdálenost měří vzdálenost mezi časy (spolu druhu stromu), spojené s true pseudogenization vertex a odvodit.

syntetická a biologická analýza

Testovali jsme naši metodu PrIME-PDLRS na syntetických datech a aplikovali ji na biologická data. Nejprve popíšeme testy na syntetických datech. Náhodný gen-stromy s hranou délky a pseudogenization vrcholy byly generovány pomocí modifikované verze PrIME-Gen-Tree generátor s pseudogenization sazba 0,5 a biologicky realistické zdvojování-ztráta ceny zjištěné na základě analýzy genových rodin OPTICKÉHO datového souboru . Genové sekvence byly generovány podle modelu PDLRS. Genové sekvence byly vyvinuty pomocí matic substituce kodonů, jak navrhli Bielawski et al. . Neutrální kodonu substituční matice byl použit pro vývoj pseudogenes, kde poměr non-synonymní synonymní substituce (dN/dS) byl nastaven na 1.0. V neutrálním modelu substituce kodonu mohl být jakýkoli kodon nahrazen stop kodonem, zatímco to nebylo možné v substitučním modelu použitém v případě evoluce genu. Dvacet pět různých kombinací dN/dS poměr tahu a hmotnosti a přechod/transverze sazba poměry byly použity ke generování sekvencí genu přes dvacet pět genové rodiny, za použití jednotných kodonu rovnováhy frekvencí. Za účelem simulace biologicky realistický scénář, jsme použili druhy-strom (získané jako v ) pro devět druhů obratlovců OPTICKÉHO datového souboru, který byl stažen z http://genserv.anat.ox.ac.uk/downloads/clades/ odvodit pseudogenization vrcholy pak byly ve srovnání se skutečnou pseudogenization vrcholy pomocí dvou druhů vzdálenost metriky, tj. topologické vzdálenosti (gene-strom), a časová vzdálenost (druh stromu).

biologické datové sady se skládaly z podrodů ze dvou největších genových rodin obratlovců, tj. Čichové receptory byly hlášeny jako největší genová rodina u obratlovců . U druhů, jako je kráva, ptakopysk a primáti, byla pozorována vysoká míra pseudogenizace, zatímco vačice, psi, myši a krysy mají relativně nízkou míru pseudogenizace . Sedm sub-genové rodiny, pokud možno s alespoň jedním pseudogene za druhy byly staženy z http://bioportal.weizmann.ac.il/HORDE/ pro druh člověka (Homo sapiens), psa (Canis lupus familiaris), vačice (Didelphis virginiana) a ptakopysk (Ornithorhynchus anatinus). Dva zinek prst sub-genové rodiny byly také studovány po druhem člověka (Homo sapiens), šimpanz (Pan troglodytes), orangutan (Pongo abelii), makak rhesus (Macaca mulatta). Pro tento účel jsme vybrali dva sub-rodiny z vysoké důvěry orthologous genů (které jsou podporovány OrthoMCL , reciproční nejlepší zasáhne, a synteny). Odpovídající rodič/paralogní geny byly vyhledávány pomocí PSI-BLAST a extrahuje z http://ensembl.org. Orthologní geny s vysokou důvěrou byly staženy z „katalogu KZNF“ (http://znf.igb.illinois.edu). Jako pseudogenes ve zinek prst genové rodiny mají většinou vyvinul v důsledku roztříštěné zdvojování , je to náročné, aby správně sladit pseudogenes a odpovídající geny, jasně nezbytnou podmínkou pro rekonstrukci gen-strom. Poloha devět sub-genové rodiny byly ručně kurátor, zarovnejte je s MACSE , což stop kodony a zavádí sankce pro vytvoření mezery (-7), prodloužení mezery (-1), a zavedení posunovými (-14). Datované druhy stromů pro oba biologické datové soubory byly staženy z http://timetree.org. Subgenové rodiny byly poté analyzovány pomocí stejného potrubí, jaké bylo použito pro syntetickou analýzu. Potenciální genové stromy byly rekonstruovány pomocí PrIME-DLRS, které byly poté analyzovány pomocí PrIME-PDLR pomocí možnosti fixního genového stromu. Genový strom PrIME-DLRS s nejlepším stavem PrIME-PDLRS s nejvyšší zadní pravděpodobností byl vybrán jako nejpravděpodobnější genový strom. Zadní nad pseudogenizačními událostmi nejpravděpodobnějších genových stromů byly poté analyzovány pomocí podrobných realizací generovaných během procházení Markovova řetězce.

MCMC analýza

Bayesovská analýza byla provedena pro genové rodiny pomocí analytického nástroje založeného na MCMC, PrIME-PDLRS. Na MCMC řetězce byl nastaven tak, aby integrovat přes všechny parametry, tj. gen-stromu, hranu délky, pseudogenization vrcholy na gen-strom, narození-smrt a pseudogenization sazby, a průměr a rozptyl okraji substituce sazby. Odebrali jsme různé parametry v celém MCMC procesu, včetně narození, úmrtí, pseudogenization sazba, gene-strom, pseudogenization vrcholy, dN/dS poměr, a přechod/transverze poměr. Při každé iteraci byl narušen jeden nebo více parametrů. Porucha genového stromu byla provedena pomocí standardních metod perturbace genového stromu, jako je prořezávání subtree a regrafting, výměna nejbližšího souseda a opětovné zakořenění. Po perturbaci byla ověřena platnost výsledného genového stromu, tj. žádná pseudogenní linie nevedla k genové linii. Je navržen platný narušený genový strom, pokaždé, když je navržen genový strom. Metoda sousedního spojování se používá ke konstrukci počátečního stromu na začátku řetězce MCMC. Návrh rozdělení navrhuje pohyby pseudogenization vrcholy, přes linie gen-strom, takovým způsobem, že pravděpodobnost, naznačuje vzestupný tah pseudogenization vrcholu je rovna pravděpodobnosti, navrhnout pohybovat směrem dolů. DN/dS sazby jsou poměry vzorku z zkrácen normální rozdělení , zatímco přechod/transverze sazby jsou poměry vzorku z zkrácen normální rozdělení . Míry narození a úmrtí a pseudogenizace jsou vzorkovány ze zkrácené normální distribuce v. Zkrácený normální návrhy byly použity pro rozrušení parametry rychlost modelu a hranou délky kolem současné hodnoty, s ladění parametrů ručně s ohledem na přijetí poměry. Parametry míry substituce byly narušeny buď narušením distribučního průměru, nebo variačním koeficientem. Abychom zjistili, zda se řetězce MCMC sblížily, použili jsme VMCMC jako diagnostický nástroj. Z počátečních běhů bylo zjištěno, že je bezpečné používat dobu hoření 2 500 000. Pro zbytek běží, jsme použili 5,000,000 iterací, burn-v období 2,500,000 a řídnutí 500. Použili jsme PrIME-DLR jako první krok k rekonstrukci potenciálních genových stromů. Každý potenciální genový strom byl analyzován pomocí primárních PDLR s možností fixního genového stromu.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.