Gesundheitswesen 2022; 84(11): 1067-1070
DOI: 10.1055/a-1306-0335
Kurzmitteilung/Kasuistik

Entwicklung der Ergebnisse des zweiten und dritten Abschnitts der Ärztlichen Prüfung („M2“ Und „M3“) In Deutschland

Trends in the Results of Part II and III of the German Medical Licensing Examinations
Andriko Palmowski
1   Klinik für Rheumatologie und Klinische Immunologie, Charité – Universitätsmedizin Berlin, Berlin, Deutschland
› Author Affiliations

Zusammenfassung

Ziel der Studie Analyse der Entwicklung der Ergebnisse des Zweiten (klinisch-schriftlichen, „M2“) und Dritten (klinisch-mündlichen; „M3“) Abschnitts der Ärztlichen Prüfung in Deutschland.

Methodik Es wurden öffentlich verfügbare Daten des Zweiten und Dritten Abschnitts der Ärztlichen Prüfung analysiert (Jahre 2014–2020). Meta-Regressions-Modelle (mixed-effects) schätzten Zusammenhänge zwischen Prüfungsergebnissen und dem Zeitpunkt der Prüfung ein.

Ergebnisse Im untersuchten Zeitraum nahmen insgesamt 63 811 bzw. 32 852 Teilnehmer an den untersuchten M2- bzw. M3-Prüfungen teil. Der Prozentsatz durchschnittlich richtig beantworteter Fragen aller M2-Examina lag bei 77,7% (Minimum: 73%; Maximum: 82,7%). Es zeigte sich über die Zeit eine große Variation in den Ergebnissen: Der Anteil von Teilnehmern mit „sehr gutem“ Ergebnis variierte zwischen 0,1% (Frühjahr 2020) und 17% (Herbst 2015) und der Anteil von Teilnehmern mit „gutem“ Ergebnis zwischen 21% (Frühjahr 2020) und 52% (Herbst 2015). Insgesamt zeigte sich bei Analyse der M2-Examina ein negativer Trend. Über die Zeit sanken bspw. der Prozentsatz richtig beantworteter Fragen (Steigung β=-0,82%; p < 0,01) und der Anteil von Teilnehmern mit „sehr gutem“ (β=-1,17; p=0,04) und „gutem“ (β=-2,58; p=0,02) Ergebnis. In den Modellen konnte mit dem Zeitpunkt der Prüfung zwischen 20 und 34% der Heterogenität zwischen den Prüfungen erklärt werden. In den M3-Examina zeigte sich nur eine sehr geringe Variation über die Zeit, außerdem waren keine Trends zu erkennen (p=0,08–0,60).

Schlussfolgerung Die Ergebnisse der M2-Examina variierten über die letzten Jahre stark, außerdem zeigte sich ein deutlicher Trend hin zu durchschnittlich schlechteren Ergebnissen. Die Ergebnisse der M3-Examina blieben hingegen bei geringer Variation auf konstantem Niveau. Mögliche Ursachen dieser Entwicklungen – etwa schlechter werdende schriftliche Fähigkeiten der Studierenden oder ein höherer Anforderungsgrad in den M2-Examina – sollten untersucht werden. Die große Variation der durchschnittlichen Ergebnisse stellt die Reliabilität und Vergleichbarkeit der M2-Examina in Frage.

Abstract

Objective Trend analysis of the results of the second clinical (written, “M2”) and third clinical (oral, “M3”) part of the German medical licensing examination.

Methods Publicly available data were analyzed (2014–2020) using meta-regression models (mixed-effects) for evaluation of correlations between results and the time point of the examinations.

Results A total of 63,811 and 32,852 students participated in the M2 and M3 examinations, respectively. The average percentage of correctly answered questions across all M2 examinations was 77.7% (minimum: 73%; maximum: 82.7%). Generally, there was great variation: The percentage of participants with “very good” results varied between 0.1% (spring 2020) and 17% (fall 2015) as did the percentage of participants with “good” results (between 21% (spring 2020) and 52% (fall 2015)). Analysis of M2 examinations showed an overall negative trend. Over time, for example, the percentage of correctly answered questions (slope β=-0.82%; p < 0.01) and the percentage of participants with “very good” (β=-1.17; p=0.04) and “good” (β=-2.58; p=0.02) results decreased significantly. The time point of the examinations explained between 20 and 34% of heterogeneity between examination results. With regard to the M3 examinations, there was only little variation over time, and no negative trends were observed (p=0.08–0.60).

Conclusion Results of the M2 examinations varied greatly over the last years, and there was a significant negative trend. In contrast, results of the M3 examinations remained constant with little variation. Possible explanations such as worsening written skills or higher requirements in the M2 examinations need to be investigated. The observed great variation of average results questions the reliability and comparability of the M2 examinations in Germany.



Publication History

Article published online:
07 January 2021

© 2021. Thieme. All rights reserved.

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany