Image-based promotore di stima: un promotore metodo di previsione basato su evolutivamente generato modelli
Posted on
Generazione di “immagini” da un approccio evolutivo
base di IBPP è quello di generare un’ “immagine” da sequenze di formazione, che viene poi utilizzato per valutare eventuali sequenza target e valutare la sua somiglianza con il “immagine”. Partendo da seed-images casuali, le “immagini” finali sono state ottenute con un approccio evolutivo. Il metodo evolutivo ha avuto un effetto di uniformizzazione sulle “immagini”, che è stato il fondamento di questo processo. Sebbene le nuove immagini-seme siano state continuamente integrate durante tutto il processo evolutivo, abbiamo scoperto che la diversità delle “immagini” mostrava una tendenza decrescente (Fig 2, S1). C’è stato un aumento della diversità nelle prime cinque generazioni causato dalla sostituzione di ‘–’ con simboli nucleotidici. Tuttavia, dopo la 60a generazione, la diminuzione della diversità ha rallentato (Fig. 2 quater). Anche se la diversità sembrava continuare a diminuire dalla generazione 100th (Fig. 2c), abbiamo fermato l’evoluzione a questo punto per testare la capacità predittiva delle immagini generate.
Le sequenze promoter e non promoter nei set di test sono state valutate con l ‘ “immagine” generata alla 100a generazione. Come mostrato nella Tabella 1, il punteggio medio delle sequenze promoter era superiore a quello delle sequenze non promoter (p < 0,001). Ciò ha dimostrato che le “immagini” avevano il potenziale per distinguere i promotori dai non promotori. Con una soglia appropriata, le sequenze con punteggi superiori alla soglia sono state previste come promotori, mentre le sequenze con punteggi inferiori alla soglia sono state previste come non promotori. Tuttavia, c’era ancora una certa sovrapposizione tra i punteggi delle sequenze promoter e non promoter, indicando che il metodo non poteva soddisfare simultaneamente i requisiti di sensibilità e specificità.
In effetti, la sensibilità era correlata negativamente con la soglia (r = 0,999), mentre la specificità era correlata positivamente con la soglia(r = 0,999; Fig. 3 bis). Quando la soglia era inferiore a 9, IBPP ha acquisito una sensibilità superiore all ‘ 87%, ma la specificità è stata ridotta al di sotto del 70%. Nei nostri esperimenti, il punteggio F1 più alto è stato ottenuto con una soglia di 9 (F1 = 77,9%). Tuttavia, in pratica, una specificità inferiore al 90% può causare problemi considerevoli. Pertanto, si raccomanda una soglia di 12, con una sensibilità e specificità di 58.2% ± 5.1% e 92.8% ± 1.6%, rispettivamente. Per i promotori in altre specie, la soglia ottimale può differire.