Pour la première fois, il y a des données pour Step2 CK de Reddit pour Reddit! Après près de quatre mois de collecte des réponses à l’enquête, les résultats sont arrivés. Les bonnes nouvelles sont qu’il existe plusieurs bonnes données d’information; les mauvaises nouvelles sont que certaines choses n’étaient pas aussi granulaires qu’on pourrait l’espérer. Les bonnes nouvelles secondaires des mauvaises nouvelles sont que ces zones plus difficiles ou moins claires sont améliorées pour l’enquête 2019. Indépendamment des difficultés de données, vous réussirez bien à l’étape 2 CK.
Méthodes de collecte de données: Données basées sur des enquêtes Google collectées auprès de ceux qui ont passé leur examen en 2018. Les données recueillies comprenaient: la date de prise, le score, les scores de l’examen de pratique, les ressources utilisées, le type d’école, le programme d’études, la spécialité souhaitée et les scores de l’examen en plateau. Toutes les enquêtes étaient anonymes.
Inclusion/exclusion : Il n’y a pas eu d’exclusions. Le score CK de l’Étape2 était requis pour soumettre le sondage, de sorte que tous ceux qui ont soumis le sondage ont été inclus.
Analyse: des statistiques descriptives, des ANOVAs, des tests t et des régressions linéaires univariées ont été effectuées dans Excel 2016. Un modèle linéaire généralisé (GLM) pour évaluer l’effet multifactoriel a été réalisé dans Matlab par un camarade de classe expérimenté dans cette analyse. Pour les tests ANOVA ou t, les variables ont été exclues pour une faible taille d’échantillon (2 ou moins).
Topic | Link | |
---|---|---|
Folder | ||
School | https://imgur.com/Iws4ZGn | |
Curriculum | https://imgur.com/GL73FeE | |
Specialty | https://imgur.com/GAXSw0F | |
Specialty Detail | https://imgur.com/oqoUfXx | |
Goal Score | https://imgur.com/anMkgyh | |
NBME6 | https://imgur.com/1IMe9gS | |
NBME7 | https://imgur.com/395UEAV | |
NBME8 | https://imgur.com/oXes9Wq | |
UWSA1 | https://imgur.com/ltJ5Edp | |
UWSA2 | https://imgur.com/620kqa3 | |
UW 1st pass % | https://imgur.com/js7Wdja | |
IM & Surg Shelf | https://imgur.com/AEhrJdg | |
Peds & OBGYN shelf | https://imgur.com/H80x3qP | |
Psych & FM shelf | iv la taille de l’effet | https://imgur.com/Kk14COs |
Dédié | https://imgur.com/4Lpwq8a | |
Étude totale | https://imgur.com/4Lpwq8a | |
/td> | https://imgur.com/nRgR9wy |
Résultats&Discussion PartiellegÉnérale : Avec un N de 249, le le score CK moyen de l’étape 2 était de 253,3 avec un écart-type de 15,6 et une erreur-type de 0,99. Ceci est comparé à la moyenne globale du PNRMP de 2018 pour les MDs américains appariés de 246 (240 pour les DOS américains). La médiane globale était de 256 avec une plage interquartile de 245 &264.
Ressources: À la surprise de personne, presque tout le monde a utilisé UWorld (98,8%). AMBOSS était le deuxième QBank le plus utilisé (7,2%), suivi de Kaplan (4,8%) et enfin de USMLE-Rx (2%). Beaucoup de gens utilisaient un type de deck Anki, le plus courant étant autre chose que les decks « en vedette » de r/ medicalschoolanki (14,1%). Une deuxième étape extrêmement proche est Zanki Step2 (12%); Bros Step2 est un bon troisième concurrent (6,4%). Tous les autres combinés ont été utilisés par moins de Bros Step2. Parmi les ressources de livres, les premiers secours se taillaient la part du lion (18,1%), avec Master the Boards (2,8%), Blueprints (any; 1,6%) et Kaplan review notes (0,4%) et Step up to Medicine (0,8%). traînant derrière. J’ai négligé d’ajouterME à la liste, beaucoup l’ajoutant via l’option « autre » pour un total de 22,1%.
Date et heure de l’examen: La plupart des répondants ont passé leur examen en juillet (39,4 %), juin (14,9 %) et août (20,1 %) étant également des mois populaires. Aucun répondant n’a passé l’examen avant avril (à l’exception d’un qui l’a passé en juin 2017). Étant donné que l’enquête a été lancée à la fin de l’année, de nombreux candidats aux tests antérieurs ont peut-être manqué l’enquête. La durée totale de l’étude (en jours) n’avait absolument aucune corrélation avec le score (R2 = 0,0006). La durée de l’étude dédiée (en semaines) n’était pas corrélée avec le score (= 0,0575), ce qui est également établi par une petite taille d’effet (-1,492) et une non-signification (p = 0,092) sur la GLM. Cependant, lorsque la durée de l’étude dédiée est divisée en groupes d’incréments de 2 semaines, il y avait une différence de score moyen entre moins de 4 semaines et 4 semaines ou plus: le score moyen est plus élevé pour ceux qui ont passé moins de 4 semaines en dédié (p = 0,0009 ANOVA, voir la feuille de calcul pour les tests t par paires). Les rendements diminuent pour les longues périodes d’étude.
Examens de pratique: Maintenant pour les informations les plus importantes. Parmi les cinq tests pratiques de l’enquête (je m’excuse d’avoir oublié Free-120), le score NBME7 présentait la meilleure corrélation avec le score de l’examen CK de l’étape 2 (R2 = 0,6948). UWSA2 était une seconde proche (= 0,6554) et UWSA1 était une troisième légèrement distante (= 0,5973). NBME6 est entré en quatrième position (= 0.5234), le premier pourcentage de réussite de l’UW (pas un vrai test de pratique, mais le meilleur endroit en discute) était cinquième (= 0,4669), et enfin le score NBME8 avait la pire corrélation avec le score de l’étape 2 (= 0,3784). Lorsque les interceptions sont indexées à zéro, chaque test de pratique sous-estime le score CK de l’étape 2. Fait intéressant, en parlant avec des camarades de classe qui ont passé le test, les UWSAS (en particulier UWSA2) et les Free-120 ressemblent davantage à la vraie affaire en fonction du style de question et de la difficulté. Lorsque ces tests sont exécutés ensemble dans un GLM, seulement NBME7(p<.0001, effet = 48,434) et UWSA1 (p = 0.048, effet = 25,003) étaient significatifs. Cependant, l’UWSA2 non significatif (p = 0,062) a eu un effet plus important que l’UWSA1 (effet = 32,098).
Divers: Résultats de l’examen d’étagère. Les corrélations pour chaque examen d’étagère sont si mauvaises qu’elles font rougir NBME8. Le meilleur est IM à R2 = 0,18. Le pire est FM à R2 = 0,028. Bien que la FM soit significative sur la GLM (p = 0,05), elle a eu le plus petit effet de toutes les variables (effet = -18,707). Je pense qu’il y avait une confusion quant à savoir si le score brut ou percentile était signifié (certaines réponses étaient dans les années 20 et beaucoup plus de 100), en plus de la nécessité de stratifier en fonction du moment où l’examen de plateau a été passé. La spécialité a eu un certain effet sur le score, les répondants liés à la dermatologie soufflant tout le monde hors de l’eau (moyenne reddit 270.3, moyenne US MD 256). Il y a probablement une certaine auto-sélection en fonction du score de l’étape 1. Enfin, le score de but avait la meilleure corrélation globale avec le score de l’étape 2 à R2 = 0,7314. Sur GLM, le score de but était statistiquement significatif et avait l’effet le plus fort sur le score de l’étape 2 (p<.0001, effet = 108,545). Cependant, étant donné que le score de but est collecté après le score final, il existe un biais potentiel.
Discussion &Futures DirectionsStep2 CK est une bête. Tous ceux à qui j’ai parlé ont détesté l’examen, beaucoup plus que l’étape 1. C’est un examen plus long avec une plus grande diversité de sujets. Alors, félicitations si vous avez terminé cet examen! Pour ceux qui lisent et ne l’ont pas encore pris, prenez courage: vous avez l’expérience des preneurs passés pour vous soutenir.
Comme c’est le cas pour l’étape 1, Reddit a surpassé la moyenne nationale pour l’étape 2 CK. Comme on peut le voir dans le tableau des spécialités lié ci-dessous, cela était vrai dans tous les domaines, même si certaines, telles que la FM et la ME, étaient plus proches des moyennes nationales que d’autres spécialités (par rapport à 2018 NRMP US MDs). Le tableau des spécialités montre les comparaisons disponibles à l’étape 2 pour les MD américains, les DOS américains, les IMG américains et les IMG non américains. L’année prochaine, je veux regrouper les scores selon que le répondant estimait ou non que sa note était nécessaire avant les demandes. De plus, je veux rassembler le score de l’étape 1 pour voir quelle corrélation, le cas échéant, existe entre les scores de l’étape 1 et de l’étape 2.
Je m’excuse auprès des futurs pathologistes, chirurgiens vasculaires et médecins/pédiatres. Je vous ai exclu par erreur et cela sera corrigé dans de futures enquêtes.
Que NBME7 ait la meilleure corrélation et l’effet le plus fort de tous les tests pratiques sur le score de l’étape 2 est stupéfiant, surtout lorsque les candidats aux tests constatent que les UWSAs et les Free-120 ressemblent davantage à la vraie affaire. En plus d’ajouter Free-120 l’année prochaine, je veux ajouter une question évaluant la gestalt de chaque répondant quant à l’étape 2 des évaluations de la pratique. Je veux également inclure une échelle de confiance à la sortie de l’examen.
En ce qui concerne les dates, il y a un rendement décroissant avec des périodes d’étude plus longues et le temps d’étude total (comme commencer un deck anki plus tôt dans l’année avant dédié) n’ayant aucune corrélation avec le score. Sur la base de ces résultats, si vous avez besoin de plus de temps pour absorber du matériel, faites-le; mais si vous pouvez fonctionner correctement avec un temps limité pour faire toutes vos études, ne l’étirez pas. À l’avenir, je souhaite ajouter une option pour savoir quand l’étape 1 a été prise pour évaluer l’impact de la distance par rapport à l’étape 1 sur le score, ainsi que pour stratifier le moment où chaque examen de plateau a été passé au cours de l’année, car les scores ont tendance à changer en fonction de la période de l’année.
Remerciements Je tiens à remercier tous ceux qui ont participé à cette enquête! Votre travail acharné de préparation et de prise de Step2 vous aidera non seulement vous-mêmes, mais aussi les futurs étudiants! Et aux camarades de classe qui m’ont laissé rebondir des idées pour l’enquête de l’année prochaine, merci de m’avoir laissé choisir votre cerveau. Pour mon ami qui a aidé à l’analyse, les mots ne peuvent pas décrire à quel point vous êtes un être humain incroyable.
Attendez-vous à une nouvelle enquête améliorée de ma part dans les semaines à venir. Je commencerai bientôt un cours en soins intensifs, cela dépendra donc du moment où je serai en soins intensifs pour savoir à quelle vitesse je pourrai construire et envoyer le nouveau sondage.
Edit1: espacement
Edit2 (5/2020): suppression du lien vers les données brutes et accès restreint au référentiel Google Drive