Per la prima volta in assoluto, ci sono dati per Step2 CK da Reddit per Reddit! Dopo quasi quattro mesi di raccolta delle risposte al sondaggio, i risultati sono in. La buona notizia è che ci sono molti buoni dati informativi; la cattiva notizia è che alcune cose non erano così granulari come si spera. Una buona notizia secondaria dalla cattiva notizia è che quelle aree più difficili o meno chiare vengono migliorate per il sondaggio 2019. Indipendentemente dalle difficoltà di dati, si farà bene su Step2 CK.
Metodi di raccolta dati: Dati basati su sondaggi di Google raccolti da coloro che hanno sostenuto l’esame nel 2018. I dati raccolti inclusi: data presa, punteggio, punteggi degli esami di pratica, risorse utilizzate, tipo di scuola, curriculum, specialità desiderata e punteggi degli esami di scaffale. Tutti i sondaggi erano anonimi.
Inclusione / esclusione: non ci sono state esclusioni. Step2 punteggio CK è stato richiesto di presentare il sondaggio, così tutti coloro che hanno presentato il sondaggio sono stati inclusi.
Analisi: statistiche descrittive, ANOVA, test t e regressioni lineari univariate sono state eseguite in Excel 2016. Il modello lineare generalizzato (GLM) per valutare l’effetto multifattoriale è stato eseguito in Matlab da un compagno di classe con esperienza nell’esecuzione di questa analisi. Per i test ANOVA o t, le variabili sono state escluse per la dimensione del campione bassa (2 o meno).
Topic | Link |
---|---|
Folder | |
School | https://imgur.com/Iws4ZGn |
Curriculum | https://imgur.com/GL73FeE |
Specialty | https://imgur.com/GAXSw0F |
Specialty Detail | https://imgur.com/oqoUfXx |
Goal Score | https://imgur.com/anMkgyh |
NBME6 | https://imgur.com/1IMe9gS |
NBME7 | https://imgur.com/395UEAV |
NBME8 | https://imgur.com/oXes9Wq |
UWSA1 | https://imgur.com/ltJ5Edp |
UWSA2 | https://imgur.com/620kqa3 |
UW 1st pass % | https://imgur.com/js7Wdja |
IM & Surg Shelf | https://imgur.com/AEhrJdg |
Peds & OBGYN shelf | https://imgur.com/H80x3qP |
Psych & FM shelf | https://imgur.com/mRXfASg |
dimensione dell’Effetto | https://imgur.com/Kk14COs |
Dedicato | https://imgur.com/4Lpwq8a |
Totale studio | https://imgur.com/nRgR9wy |
Risultati & Parziale DiscussionGeneral: Con un N 249, la media Step 2 CK punteggio era 253.3 con una deviazione standard di 15.6 e l’errore standard di 0,99. Questo viene confrontato con la media complessiva del NRMP 2018 per MDS statunitensi abbinati di 246 (240 per DOS statunitensi). La mediana complessiva era di 256 con un intervallo interquartile di 245 & 264.
Risorse: Con sorpresa di nessuno, quasi tutti hanno usato UWorld (98,8%). AMBOSS è stato il secondo QBank più utilizzato (7.2%), seguito da Kaplan (4.8%), e infine USMLE-Rx (2%). Molte persone hanno usato qualche tipo di mazzo Anki, il più comune è qualcosa di diverso dai mazzi “in primo piano” su r/medicalschoolanki (14,1%). Un secondo estremamente vicino è Zanki Step2 (12%); Bros Step2 è un forte terzo contendente (6.4%). Tutti gli altri combinati sono stati utilizzati da meno di Bros Step2. Tra le risorse del libro, First Aid ha avuto la parte del leone (18,1%) con Master the Boards (2,8%), Blueprints (any; 1,6%) e Kaplan review notes (0,4%) e Step up to Medicine (0,8%) trascinando dietro. Ho trascurato di aggiungereME alla lista, con molti che lo aggiungono tramite l’opzione “altro” per un totale di 22.1%.
Data dell’esame e tempo di studio: la maggior parte degli intervistati ha sostenuto l’esame a luglio (39,4%), mentre giugno (14,9%) e agosto (20,1%) sono anche mesi popolari. Nessun intervistato ha sostenuto l’esame prima di aprile (ad eccezione di uno che lo ha ripreso a giugno 2017). Dal momento che il sondaggio è stato avviato alla fine dell’anno, molti esaminandi precedenti potrebbero aver perso il sondaggio. Il tempo totale dello studio (in giorni) non aveva assolutamente alcuna correlazione con il punteggio (R2=0,0006). La durata dello studio dedicato (in settimane) non è stata correlata con il punteggio (=0,0575), che è ulteriormente stabilito da una piccola dimensione dell’effetto (-1,492) e non-significatività (p=0,092) su GLM. Tuttavia, quando la durata dello studio dedicato è suddivisa in gruppi di incrementi di 2 settimane, c’è stata una differenza nel punteggio medio tra meno di 4 settimane e 4 o più settimane: il punteggio medio è più alto per coloro che hanno trascorso meno di 4 settimane in dedicato (p = 0.0009 ANOVA, vedere il foglio di calcolo per i t-test a coppie). Ci sono rendimenti decrescenti per lunghi periodi di studio.
Esami di pratica: Ora per i pezzi più importanti di informazioni. Tra le cinque prove pratiche sul sondaggio (mi scuso per aver dimenticato Free-120), punteggio NBME7 ha avuto la migliore correlazione con Step2 CK punteggio esame (R2=0.6948). UWSA2 era un secondo vicino (=0.6554) e UWSA1 era un terzo leggermente distante (=0.5973). NBME6 eked in quarta (=0.5234), UW primo passaggio per cento (non un vero e proprio test di pratica, ma posto migliore discutere di questo) era quinto (=0.4669), e, infine, NBME8 punteggio ha avuto la peggiore correlazione al punteggio Step2 (=0.3784). Quando le intercettazioni sono ancorate a zero, ogni singolo test di pratica sottovaluta il punteggio CK Step2. È interessante notare che, da parlare con i compagni di classe che hanno preso il test, UWSAs (soprattutto UWSA2) e Free-120 guardare e sentire più come il vero affare in base allo stile domanda e difficoltà. Quando questi test vengono eseguiti insieme in un GLM, solo NBME7 (p<.0001, effetto=48.434) e UWSA1 (p = 0.048, effetto=25.003) sono stati significativi. Tuttavia, l’UWSA2 non significativo (p=0,062) ha avuto un effetto maggiore rispetto all’UWSA1 (effetto=32,098).
Varie: Punteggi degli esami scaffale. Le correlazioni per ogni esame scaffale sono così male che fanno arrossire NBME8. Il migliore è IM a R2=0.18. Il peggio è FM a R2=0.028. Mentre FM era significativo su GLM (p=0.05), ha avuto il più piccolo effetto di qualsiasi variabile (effetto=-18.707). Penso che ci sia stata confusione sul fatto che si intendesse il punteggio grezzo o percentile (alcune risposte erano negli anni ‘ 20 e molte oltre 100), oltre alla necessità di stratificare in base a quando è stato preso l’esame shelf. La specialità ha avuto un certo effetto sul punteggio, con gli intervistati legati alla dermatologia che hanno fatto saltare tutti gli altri fuori dall’acqua (reddit media 270.3, US MD media 256). C’è probabilmente qualche auto-selezione che si verificano in base al punteggio Step1. Infine, il punteggio obiettivo ha avuto la migliore correlazione complessiva con il punteggio Step2 a R2=0.7314. Su GLM, il punteggio obiettivo era statisticamente significativo e ha avuto l’effetto più forte sul punteggio Step2 (p<.0001, effetto=108.545). Tuttavia, poiché il punteggio obiettivo viene raccolto dopo il punteggio finale, esiste un potenziale pregiudizio.
Discussione & Future DirectionsStep2 CK è una bestia. Tutti quelli con cui ho parlato hanno odiato l’esame, molti di più di Step1. Si tratta di un esame più lungo con una maggiore diversità di argomenti. Quindi, congratulazioni se hai completato questo esame! Per coloro che stanno leggendo e non hanno ancora preso, prendere il cuore: avete l’esperienza di acquirenti del passato per sostenervi.
Come nel caso di Step1, Reddit ha superato la media nazionale per Step2 CK. Come si può vedere nella tabella delle specialità linkata di seguito, questo era vero su tutta la linea, anche se alcuni come FM ed EM erano più vicini alle medie nazionali rispetto ad altre specialità (rispetto a 2018 NRMP US MDs). La tabella delle specialità mostra i confronti Step2 disponibili per US MDs, US DOs, US-IMGs e non-US-IMGs. L’anno prossimo, voglio raggruppare i punteggi in base al fatto che il convenuto sentisse o meno che il suo punteggio fosse necessario prima delle domande. Inoltre, voglio raccogliere il punteggio Step1 per vedere quale correlazione, se presente, esiste tra i punteggi Step1 e Step2.
Mi scuso con i futuri patologi, chirurghi vascolari e medici/pediatrici. Ti ho escluso per errore e questo sarà corretto nei sondaggi futuri.
Che NBME7 abbia la migliore correlazione e l’effetto più forte di tutti i test pratici sul punteggio Step2 è sorprendente, specialmente quando i test-takers scoprono che UWSAs e Free-120 si sentono più come il vero affare. Oltre ad aggiungere Free-120 l’anno prossimo, voglio aggiungere una domanda che valuta la gestalt di ogni intervistato su quali valutazioni pratiche Step2 era simile. Voglio anche includere una scala per la fiducia lasciando l’esame.
Per quanto riguarda le date, c’è un ritorno in diminuzione con periodi di studio più lunghi e tempo di studio totale (come iniziare un mazzo anki all’inizio dell’anno prima dedicato) che non ha alcuna correlazione con il punteggio. Sulla base di questi risultati, se hai bisogno di più tempo per assorbire il materiale, fallo; ma se riesci a funzionare bene con un tempo limitato per fare tutto il tuo studio, non allungarlo. In futuro, voglio aggiungere un’opzione per quando Step1 è stato preso per valutare come distanza da Step1 impatti punteggio, così come stratificazione quando durante l’anno ogni esame scaffale è stato preso come punteggi tendono a cambiare a seconda del periodo dell’anno.
Riconoscimentivoglio dire un ENORME grazie a tutti coloro che hanno partecipato a questo sondaggio! Il vostro duro lavoro di preparazione e di prendere Step2 aiuterà non solo voi stessi, ma anche i futuri studenti! E ai compagni di classe che mi hanno lasciato rimbalzare idee fuori di loro per il sondaggio del prossimo anno, grazie per avermi permesso di scegliere il tuo cervello. Per il mio amico che ha aiutato con l’analisi, le parole non possono descrivere quanto sia sorprendente di un essere umano sei.
Aspettatevi un nuovo e migliorato sondaggio da me nelle prossime settimane. Inizierò presto un corso basato su ICU, quindi dipenderà da quando sarò in terapia intensiva da quanto velocemente posso ottenere la nuova indagine costruita e inviata.
Edit1: spaziatura
Edit2 (5/2020): rimosso il collegamento ai dati grezzi e limitato l’accesso al repository di Google Drive