Przewidywanie promotorów oparte na obrazie: metoda przewidywania promotorów oparta na ewolucyjnie generowanych wzorach
Posted on
generowanie „obrazów” przez podejście ewolucyjne
podstawą IBPP jest generowanie „obrazu” z sekwencji treningowych, który jest następnie używany do oceny dowolnej sekwencji docelowej i oceny jej podobieństwa do „obrazu”. Począwszy od przypadkowych obrazów nasion, końcowe „obrazy” zostały uzyskane przy użyciu podejścia ewolucyjnego. Metoda ewolucyjna miała wpływ uniformizacyjny na” obrazy”, które były podstawą tego procesu. Chociaż nowe obrazy nasion były stale uzupełniane przez cały proces ewolucji, odkryliśmy, że różnorodność „obrazów” wykazywała tendencję spadkową (fig.2, S1). W pierwszych pięciu pokoleniach nastąpił wzrost różnorodności spowodowany zastąpieniem ” – ” symbolami nukleotydów. Jednak po 60. pokoleniu spadek różnorodności spowolnił (rys. 2c). Chociaż różnorodność wydawała się nadal zmniejszać przez 100. pokolenie (rys. 2C), zatrzymaliśmy ewolucję w tym momencie, aby przetestować zdolność predykcyjną generowanych obrazów.
sekwencje promotorów i nie promotorów w zestawach testowych zostały ocenione za pomocą „obrazu” wygenerowanego w setnej generacji. Jak pokazano w tabeli 1, średni wynik sekwencji promotorów był wyższy niż w przypadku sekwencji innych niż promotory (p < 0,001). Pokazało to, że” obrazy ” mają potencjał odróżniania promotorów od nie-promotorów. Przy odpowiednim progu sekwencje z wynikami powyżej progu przewidywano jako promotory, podczas gdy sekwencje z wynikami poniżej progu przewidywano jako nie-promotory. Jednakże nadal istniało pewne nakładanie się wyników sekwencji promotorowych i nie promotorowych, co wskazuje, że metoda nie mogła jednocześnie spełniać wymagań zarówno czułości, jak i swoistości.
w rzeczywistości czułość była ujemnie skorelowana z progiem (r = 0,999), natomiast swoistość była dodatnio skorelowana z progiem (R = 0,999; Fig. 3A). Gdy próg był poniżej 9, IBPP uzyskał czułość wyższą niż 87%, ale swoistość została zmniejszona do poniżej 70%. W naszych eksperymentach najwyższy wynik F1 uzyskano z progiem 9 (F1 = 77,9%). Jednak w praktyce specyfika poniżej 90% może powodować poważne problemy. Dlatego zaleca się próg 12, przy czułości i swoistości 58.Odpowiednio 2% ± 5,1% i 92,8% ± 1,6%. Dla promotorów u innych gatunków próg optymalny może się różnić.