Subscribe to RSS
DOI: 10.1055/a-1306-0335
Entwicklung der Ergebnisse des zweiten und dritten Abschnitts der Ärztlichen Prüfung („M2“ Und „M3“) In Deutschland
Trends in the Results of Part II and III of the German Medical Licensing ExaminationsZusammenfassung
Ziel der Studie Analyse der Entwicklung der Ergebnisse des Zweiten (klinisch-schriftlichen, „M2“) und Dritten (klinisch-mündlichen; „M3“) Abschnitts der Ärztlichen Prüfung in Deutschland.
Methodik Es wurden öffentlich verfügbare Daten des Zweiten und Dritten Abschnitts der Ärztlichen Prüfung analysiert (Jahre 2014–2020). Meta-Regressions-Modelle (mixed-effects) schätzten Zusammenhänge zwischen Prüfungsergebnissen und dem Zeitpunkt der Prüfung ein.
Ergebnisse Im untersuchten Zeitraum nahmen insgesamt 63 811 bzw. 32 852 Teilnehmer an den untersuchten M2- bzw. M3-Prüfungen teil. Der Prozentsatz durchschnittlich richtig beantworteter Fragen aller M2-Examina lag bei 77,7% (Minimum: 73%; Maximum: 82,7%). Es zeigte sich über die Zeit eine große Variation in den Ergebnissen: Der Anteil von Teilnehmern mit „sehr gutem“ Ergebnis variierte zwischen 0,1% (Frühjahr 2020) und 17% (Herbst 2015) und der Anteil von Teilnehmern mit „gutem“ Ergebnis zwischen 21% (Frühjahr 2020) und 52% (Herbst 2015). Insgesamt zeigte sich bei Analyse der M2-Examina ein negativer Trend. Über die Zeit sanken bspw. der Prozentsatz richtig beantworteter Fragen (Steigung β=-0,82%; p < 0,01) und der Anteil von Teilnehmern mit „sehr gutem“ (β=-1,17; p=0,04) und „gutem“ (β=-2,58; p=0,02) Ergebnis. In den Modellen konnte mit dem Zeitpunkt der Prüfung zwischen 20 und 34% der Heterogenität zwischen den Prüfungen erklärt werden. In den M3-Examina zeigte sich nur eine sehr geringe Variation über die Zeit, außerdem waren keine Trends zu erkennen (p=0,08–0,60).
Schlussfolgerung Die Ergebnisse der M2-Examina variierten über die letzten Jahre stark, außerdem zeigte sich ein deutlicher Trend hin zu durchschnittlich schlechteren Ergebnissen. Die Ergebnisse der M3-Examina blieben hingegen bei geringer Variation auf konstantem Niveau. Mögliche Ursachen dieser Entwicklungen – etwa schlechter werdende schriftliche Fähigkeiten der Studierenden oder ein höherer Anforderungsgrad in den M2-Examina – sollten untersucht werden. Die große Variation der durchschnittlichen Ergebnisse stellt die Reliabilität und Vergleichbarkeit der M2-Examina in Frage.
Abstract
Objective Trend analysis of the results of the second clinical (written, “M2”) and third clinical (oral, “M3”) part of the German medical licensing examination.
Methods Publicly available data were analyzed (2014–2020) using meta-regression models (mixed-effects) for evaluation of correlations between results and the time point of the examinations.
Results A total of 63,811 and 32,852 students participated in the M2 and M3 examinations, respectively. The average percentage of correctly answered questions across all M2 examinations was 77.7% (minimum: 73%; maximum: 82.7%). Generally, there was great variation: The percentage of participants with “very good” results varied between 0.1% (spring 2020) and 17% (fall 2015) as did the percentage of participants with “good” results (between 21% (spring 2020) and 52% (fall 2015)). Analysis of M2 examinations showed an overall negative trend. Over time, for example, the percentage of correctly answered questions (slope β=-0.82%; p < 0.01) and the percentage of participants with “very good” (β=-1.17; p=0.04) and “good” (β=-2.58; p=0.02) results decreased significantly. The time point of the examinations explained between 20 and 34% of heterogeneity between examination results. With regard to the M3 examinations, there was only little variation over time, and no negative trends were observed (p=0.08–0.60).
Conclusion Results of the M2 examinations varied greatly over the last years, and there was a significant negative trend. In contrast, results of the M3 examinations remained constant with little variation. Possible explanations such as worsening written skills or higher requirements in the M2 examinations need to be investigated. The observed great variation of average results questions the reliability and comparability of the M2 examinations in Germany.
Publication History
Article published online:
07 January 2021
© 2021. Thieme. All rights reserved.
Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany
-
Literatur
- 1 Approbationsordnung für Ärzte. https://www.gesetze-im-internet.de/_appro_2002/BJNR240500002.html (2002)Accessed 21. Juli 2020
- 2 Institut für Medizinische und Pharmazeutische Prüfungsfragen: Praktische Hinweisezur Durchführung derschrif tlichen Prüfungennach der Approbationsordnung für Ärzte. https://www.impp.de/files/PDF/Praktische%20Hinweise/Medizin_56Auflage.pdf (2018) Accessed 21. Juli 2020
- 3 Vogel T. Ärztliche Prüfung: Das Stex im Wandel. https://www.aerzteblatt.de/archiv/200878/Aerztliche-Pruefung-Das-Stex-im-Wandel (2018) Accessed 8. September 2020
- 4 Institut für Medizinische und Pharmazeutische Prüfungsfragen: Ergebnisberichte Medizin https://www.impp.de/informationen/berichte/ergebnisberichte/medizin.html (2020) Accessed 23. Juli 2020
- 5 Institut für Medizinische und Pharmazeutische Prüfungsfragen: Ergebnisse der Prüfungen nach der Approbationsordnung für Ärzte Herbst 2013/Frühjahr 2014 https://www.impp.de/informationen/berichte/ergebnisberichte/medizin.html (2015) Accessed 12. August 2020.
- 6 Viechtbauer W. Conducting Meta-Analyses in R with the metafor Package. J Stat Softw 2010; 36: 48. doi: 10.18637/jss.v036.i03
- 7 Borenstein M, Hedges LV, Higgins JPT. et al. Introduction to Meta Analysis. Hoboken, New Jersey, USA: Wiley; 2009
- 8 Himme A. Gütekriterien der Messung: Reliabilität, Validität und Generalisierbarkeit. In: Albers S, Klapper D, Konradt U, Walter A, Wolf J editors Methodik der empirischen Forschung Wiesbaden: Gabler; 2007: 375-390