Zum ersten Mal gibt es Daten für Step2 CK von Reddit für Reddit! Nach fast vier Monaten des Sammelns von Umfrageantworten, Die Ergebnisse sind in. Die gute Nachricht ist, dass es mehrere gute, informative Daten gibt; Die schlechte Nachricht ist, dass einige Dinge nicht so detailliert waren, wie man hoffen würde. Die gute Nachricht von den schlechten Nachrichten ist, dass diese schwierigeren oder weniger klaren Bereiche für die Umfrage 2019 verbessert werden. Unabhängig von Datenschwierigkeiten werden Sie mit Step2 CK gut abschneiden.
MethodsData Sammlung: Google-umfragebasierte Daten von Personen, die ihre Prüfung im Jahr 2018 abgelegt haben. Zu den gesammelten Daten gehörten: Aufnahmedatum, Punktzahl, Prüfungsergebnisse, verwendete Ressourcen, Schultyp, Lehrplan, gewünschtes Fachgebiet und Prüfungsergebnisse. Alle Umfragen waren anonym.
Inklusion/Exklusion: Es gab keine Ausschlüsse. Step2 CK Score war erforderlich, um die Umfrage einzureichen, sodass alle, die die Umfrage eingereicht haben, einbezogen wurden.
Analyse: Deskriptive Statistiken, ANOVAs, T-Tests und univariate lineare Regressionen wurden in Excel 2016 durchgeführt. Das generalisierte lineare Modell (GLM) zur Bewertung des multifaktoriellen Effekts wurde in Matlab von einem Klassenkameraden mit Erfahrung in der Durchführung dieser Analyse durchgeführt. Für ANOVA- oder t-Tests wurden Variablen für eine niedrige Stichprobengröße (2 oder weniger) ausgeschlossen.
Topic | Link |
---|---|
Folder | |
School | https://imgur.com/Iws4ZGn |
Curriculum | https://imgur.com/GL73FeE |
Specialty | https://imgur.com/GAXSw0F |
Specialty Detail | https://imgur.com/oqoUfXx |
Goal Score | https://imgur.com/anMkgyh |
NBME6 | https://imgur.com/1IMe9gS |
NBME7 | https://imgur.com/395UEAV |
NBME8 | https://imgur.com/oXes9Wq |
UWSA1 | https://imgur.com/ltJ5Edp |
UWSA2 | https://imgur.com/620kqa3 |
UW 1st pass % | https://imgur.com/js7Wdja |
IM & Surg Shelf | https://imgur.com/AEhrJdg |
Peds & OBGYN shelf | https://imgur.com/H80x3qP |
Psych & FM shelf | https://imgur.com/mRXfASg |
Wirkung größe | https://imgur.com/Kk14COs |
Gewidmet | https://imgur.com/4Lpwq8a |
Insgesamt studie | https://imgur.com/nRgR9wy |
Ergebnisse & Partielle Diskussionallgemein: Mit einem N von 249 betrug der durchschnittliche Step2 CK Score 253,3 mit eine Standardabweichung von 15,6 und ein Standardfehler von 0,99. Dies wird mit dem Gesamtmittelwert aus dem NRMP 2018 für übereinstimmende US-MDs von 246 (240 für US-DOs) verglichen. Der Gesamtmedian betrug 256 mit einem Interquartilbereich von 245 & 264.
Ressourcen: Zu keiner Überraschung nutzten fast alle UWorld (98,8%). AMBOSS war die am zweithäufigsten verwendete QBank (7,2%), gefolgt von Kaplan (4,8%) und schließlich USMLE-Rx (2%). Viele Leute benutzten irgendeine Art von Anki-Deck, am häufigsten etwas anderes als die „vorgestellten“ Decks bei r / medicalschoolanki (14,1%). Ein extrem enger Zweiter ist Zanki Step2 (12%); Bros Step2 ist ein starker dritter Anwärter (6.4%). Alle anderen zusammen wurden von weniger als Bros Step2 verwendet. Unter den Buchressourcen hatte Erste Hilfe den Löwenanteil (18,1%), wobei Master the Boards (2,8%), Blueprints (beliebig; 1,6%) und Kaplan Review Notes (0,4%) und Step up to Medicine (0,8%) zurückblieben. Ich habe es versäumt, OME zur Liste hinzuzufügen, und viele haben es über die Option „Andere“ zu insgesamt 22,1% hinzugefügt.
Prüfungstermin und Studienzeit: Die meisten Befragten legten ihre Prüfung im Juli ab (39,4%), wobei Juni (14,9%) und August (20,1%) ebenfalls beliebte Monate waren. Kein Befragter hat die Prüfung vor April abgelegt (mit Ausnahme derjenigen, die sie im Juni 2017 abgelegt haben). Da die Umfrage Ende des Jahres gestartet wurde, Viele frühere Testteilnehmer haben die Umfrage möglicherweise verpasst. Die Gesamtstudienzeit (in Tagen) hatte absolut keine Korrelation mit dem Score (R2 = 0,0006). Die Studienlänge (in Wochen) korrelierte nicht mit dem Score (= 0.0575), der weiter durch eine kleine Effektgröße (-1.492) und Nicht-Signifikanz (p = 0.092) auf GLM. Wenn die Studienlänge jedoch in Gruppen von 2-Wochen-Schritten unterteilt wird, gab es einen Unterschied in der durchschnittlichen Punktzahl zwischen weniger als 4 Wochen und 4 oder mehr Wochen: die durchschnittliche Punktzahl ist höher für diejenigen, die weniger als 4 Wochen im Bett verbracht haben (p = 0,0009 ANOVA, siehe Tabelle für paarweise t-Tests). Es gibt abnehmende Renditen für lange Studienzeiten.
Praxisprüfungen: Jetzt zu den wichtigsten Informationen. Unter den fünf Praxistests in der Umfrage (ich entschuldige mich dafür, dass ich Free-120 vergessen habe) hatte NBME7 Score die beste Korrelation mit Step2 CK Exam Score (R2 = 0.6948). UWSA2 wurde knapp Zweiter (= 0.6554) und UWSA1 war ein etwas entfernter Dritter (= 0.5973). NBME6 wurde Vierter (=0.5234), UW First Pass Prozent (kein echter Praxistest, aber bester Platz dafür) war Fünfter (= 0.4669), und schließlich hatte NBME8 Score die schlechteste Korrelation zu Step2 Score (= 0.3784). Wenn die Intercepts auf Null gesetzt sind, unterschätzt jeder einzelne Praxistest den CK-Score von Step2. Interessanterweise sehen UWSAs (insbesondere UWSA2) und Free-120 aus Gesprächen mit Klassenkameraden, die den Test bestanden haben, aufgrund des Fragenstils und der Schwierigkeit eher wie das echte Geschäft aus. Wenn diese Tests zusammen in einem GLM ausgeführt werden, nur NBME7 (p<.0001, p=48.434) und UWSA1 (p=0.048, Effekt=25,003) signifikant. Das nicht signifikante UWSA2 (p = 0,062) hatte jedoch einen größeren Effekt als UWSA1 (Effekt = 32,098).
Verschiedenes: Shelf exam scores. Die Korrelationen für jede Shelf-Prüfung sind so schlecht, dass NBME8 errötet. Am besten ist IM bei R2 = 0,18. Am schlimmsten ist FM bei R2 = 0,028. Während FM für GLM signifikant war (p = 0,05), hatte es den geringsten Effekt einer Variablen (Effekt = -18,707). Ich denke, es gab Verwirrung darüber, ob Roh- oder Perzentil-Score gemeint war (einige Antworten waren in den 20er Jahren und viele über 100), zusätzlich zu der Notwendigkeit, basierend auf dem Zeitpunkt der Shelf-Prüfung zu stratifizieren. Dies hatte einen gewissen Einfluss auf die Punktzahl, wobei dermatologisch gebundene Befragte alle anderen aus dem Wasser sprengten (Reddit-Mittelwert 270,3, US MD-Mittelwert 256). Es gibt wahrscheinlich eine Selbstauswahl basierend auf dem Step1-Score. Schließlich hatte der Torwert die insgesamt beste Korrelation mit dem Step2-Wert bei R2 = 0.7314. Bei GLM war der Torwert statistisch signifikant und hatte den stärksten Effekt auf den Step2-Wert (p<.0001, Effekt=108,545). Da das Torergebnis jedoch nach dem Endergebnis gesammelt wird, besteht eine potenzielle Verzerrung.
Diskussion & Future DirectionsStep2 CK ist ein Biest. Jeder, mit dem ich gesprochen habe, hat die Prüfung gehasst, viel mehr als Step1. Es ist eine längere Prüfung mit einer größeren Themenvielfalt. Herzlichen Glückwunsch, wenn Sie diese Prüfung abgeschlossen haben! Für diejenigen, die lesen und es noch nicht genommen haben, nehmen Sie sich ein Herz: Sie haben die Erfahrung früherer Abnehmer, um Sie zu unterstützen.
Wie bei Schritt 1 hat Reddit den nationalen Durchschnitt für Schritt 2 CK übertroffen. Wie aus der unten verlinkten Spezialitätentabelle hervorgeht, war dies auf der ganzen Linie der Fall, obwohl einige wie FM und EM näher am nationalen Durchschnitt lagen als andere Spezialitäten (im Vergleich zu 2018 NRMP US MDs). Die folgende Tabelle zeigt verfügbare Step2-Vergleiche für US-MDs, US-DOs, US-IMGs und Nicht-US-IMGs. Nächstes Jahr möchte ich die Punktzahlen danach gruppieren, ob der Befragte das Gefühl hatte, dass seine Punktzahl vor Bewerbungen erforderlich war oder nicht. Außerdem möchte ich Step1 Score sammeln, um zu sehen, welche Korrelation, falls vorhanden, zwischen Step1- und Step2-Scores besteht.
Ich entschuldige mich bei zukünftigen Pathologen, Gefäßchirurgen und Med / Peds-Leuten. Ich habe Sie fälschlicherweise ausgeschlossen, und dies wird in zukünftigen Umfragen korrigiert.
Dass NBME7 die beste Korrelation und stärkste Wirkung aller Praxistests auf Step2 Score hat, ist erstaunlich, besonders wenn Testteilnehmer feststellen, dass UWSAs und Free-120 sich eher wie das echte Geschäft anfühlen. Zusätzlich zum Hinzufügen von Free-120 im nächsten Jahr möchte ich eine Frage hinzufügen, in der die Gestalt jedes Befragten bewertet wird, wie die Praxisbewertungen in Schritt 2 aussehen. Ich möchte auch eine Skala für das Vertrauen in die Prüfung hinzufügen.
In Bezug auf Daten gibt es eine abnehmende Rendite, wenn längere Studienzeiten und die Gesamtstudienzeit (z. B. der Beginn eines Anki-Decks früher im Jahr vor dem Abschluss) keine Korrelation zum Score aufweisen. Basierend auf diesen Ergebnissen, wenn Sie länger brauchen, um Material zu absorbieren, tun Sie dies; Aber wenn Sie mit begrenzter Zeit gut funktionieren können, um all Ihr Studium zu machen, strecken Sie es nicht aus. In Zukunft möchte ich eine Option hinzufügen, wann Schritt 1 ausgeführt wurde, um zu beurteilen, wie sich die Entfernung von Schritt 1 auf die Punktzahl auswirkt, und um zu stratifizieren, wann im Laufe des Jahres jede Regalprüfung durchgeführt wurde, da sich die Punktzahlen je nach Jahreszeit tendenziell ändern.
Danksagungenich möchte allen, die an dieser Umfrage teilgenommen haben, ein großes Dankeschön sagen! Ihre harte Arbeit, die sich auf Schritt 2 vorbereitet und unternimmt, wird nicht nur Ihnen, sondern auch zukünftigen Studenten helfen! Und an Klassenkameraden, die mich für die Umfrage im nächsten Jahr Ideen abprallen lassen, Danke, dass ich dein Gehirn auswählen durfte. Für meinen Freund, der bei der Analyse geholfen hat, können Worte nicht beschreiben, wie erstaunlich Sie als Mensch sind.
Erwarten Sie in den kommenden Wochen eine neue und verbesserte Umfrage von mir. Ich werde bald einen Intensivkurs beginnen, Es hängt also davon ab, wann ich auf der Intensivstation bin, wie schnell ich die neue Umfrage erstellen und versenden kann.
Edit1:
Edit2 (5/2020): Link zu Rohdaten entfernt und Zugriff auf Google Drive-Repository eingeschränkt