Keywords
breast cancer - digital breast tomosynthesis - independant double reading - screening
Einleitung
Brustkrebs-Früherkennung verfolgt das Ziel, fortgeschrittene Tumorstadien durch eine Diagnosevorverlagerung zu reduzieren, somit Therapievorteile zu ermöglichen und die brustkrebsspezifische Mortalität zu senken [1]. Die Mammografie ist eine evidenzbasierte Methode zur systematischen Früherkennung mit nachgewiesenem, die Sterblichkeit an Brustkrebs senkenden Effekt [2]
[3]. In Deutschland wurde seit 2005 flächendeckend ein Mammografie-Screening-Programm (MSP) basierend auf den Europäischen Leitlinien implementiert. Diese empfehlen unter anderem eine räumlich und zeitlich getrennte unabhängige Doppelbefundung der Mammogramme zur Steigerung der Sensitivität um 5–15 % [4], die im deutschen MSP obligat zum Einsatz kommt [5].
Die digitale Brust-Tomosynthese (DBT) mindert durch einen Schwenk der Röntgenröhre sowie Rekonstruktion von detektor-parallelen Schichten Gewebsüberlagerungen; daraus resultieren höhere Brustkrebsdetektionsraten als bei der digitalen Mammographie (DM), dem derzeitigen Standard in der populationsbezogenen Früherkennung [6]. Die randomisierte, kontrollierte TOSYMA-Studie, die in das laufende deutsche Mammografie-Screening-Programm eingebettet ist, zeigte eine statistisch signifikante Überlegenheit in der Detektion invasiver Mammakarzinome bei einem Vergleich des Testarms mit DBT plus synthetischer Mammografie (SM) gegenüber dem Kontrollarm mit DM [7]
[8]. In beiden Studienarmen wurde eine unabhängige, d. h. gegeneinander verblindete, Doppelbefundung der mammografischen Untersuchungen von denselben, qualifizierten Befundern durchgeführt. Die unabhängige Doppelbefundung bedeutet insbesondere im Screening mit DBT ein ärztliches Ressourceninvestment, da die mediane Befundungszeit mit 109 Sekunden höher liegt als mit 54 Sekunden unter Einsatz der DM [8]: Ihr Einsatz muss deshalb sachlich begründet sein.
Die randomisierte TOSYMA-Studie bietet durch die hohe Strukturgleichheit beider Studienarme eine valide Grundlage, den Einfluss einer unabhängigen Doppelbefundung auf die Mammakarzinomdetektion mit digitaler Mammografie bzw. mit digitaler Brust-Tomosynthese zu vergleichen [8].
Ziel der vorliegenden TOSYMA-Subanalyse ist ein Vergleich der beiden Studienarme hinsichtlich des bei der unabhängigen Doppelbefundung aufgetretenen Anteils diskordanter, d. h. nur einfach richtig-positiver, Befunde und einer Charakterisierung der so entdeckten Mammakarzinome.
Materialien und Methoden
Studiendesign
Die Phase 1 der multizentrischen TOSYMA-Studie wurde von Juli 2018 bis Dezember 2020 in 17 Screening-Einheiten in den Bundesländern Nordrhein-Westfalen und Niedersachsen durchgeführt. Dabei wurden 99.689 Frauen mit einer 1:1-Randomisierung dem Testarm (DBT+SM) oder dem Kontrollarm (DM) zugeordnet. Das Studienprotokoll wurde von der zuständigen Ethikkommission genehmigt (2016-132-f-S) und von zwei weiteren Ethikkommissionen geprüft. Alle Studienteilnehmerinnen gaben ihr schriftliches Einverständnis. Das Studienprotokoll, die Ergebnisse des ersten primären Endpunkts mit sekundären Endpunkten sowie zwei Subanalysen wurden bereits veröffentlicht [7]
[8]
[9]
[10].
Studienteilnehmerinnen
Alle Frauen im Alter von 50 bis 69 Jahren werden alle zwei Jahre schriftlich zu einer Teilnahme am deutschen MSP eingeladen. In den Einzugsgebieten der TOSYMA-Studienzentren erhielten Frauen zusammen mit dem regulären Einladungsschreiben zusätzlich eine persönliche Studieneinladung mit Informationsmaterial. Nicht anspruchsberechtigt zur MSP-Teilnahme waren Frauen mit einer Brustkrebsdiagnose bis zu 5 Jahre zuvor oder mit einer Mammografie innerhalb der letzten 12 Monate. Brustimplantate oder eine wiederholte TOSYMA-Teilnahme waren spezifische Ausschlusskriterien für die TOSYMA-Studie [7]
[8].
Erstellung der Screening-Untersuchung
In 17 Screening-Einheiten wurde an 21 Standorten (Niedersachsen Nordwest (Wilhelmshaven), Hannover, Niedersachsen Nord (Stade), Niedersachsen Mitte (Vechta), Niedersachsen Nordost (Lüneburg), Duisburg, Krefeld/Mönchengladbach/Viersen, Wuppertal/Solingen (Bergisches Land/Kreis Mettmann), Aachen-Düren-Heinsberg, Köln rechtsrheinisch (Bergisch Gladbach), Münster-Süd/Coesfeld, Bottrop, Gelsenkirchen, Recklinghausen, Minden-Lübbecke/Herford, Bielefeld/Gütersloh, Hamm/Unna/Märkischer Kreis (Schwerte), Höxter, Paderborn, Soest (Lippstadt), Münster-Nord/Warendorf) eine Studienteilnahme angeboten.
Fünf verschiedene Hersteller von Mammografie-Geräten wurden zur Erstellung der DBT+SM oder DM-Untersuchung eingesetzt: Amulet Innovality (Fujifilm Cooperation, Tokyo, Japan; n = 10.075), Class Tomo (IMS Giotto, Sasso Marconi, Italy; n = 7.970), Lorad Selenia 3Dimensions (Hologic, Malborough, US; n = 10.955), Lorad Selenia Dimensions (Hologic, Malborough, US; n = 40.645), MAMMOMAT Inspiration (Siemens Healthineers, Erlangen, Germany; n = 6.759), MAMMOMAT Relevation (Siemens Healthineers, Erlangen, Germany; n = 12.917), Senographe Essential (GE Healthcare, Chicago, US; n = 10.237).
Die Untersuchungen umfassten in beiden Studienarmen die cranio-caudale und die medio-latero-oblique Projektion pro Brust. Im Testarm wurden neben den synthetisierten, zweidimensionalen Mammografien (SM) gestapelte Schichten von ≤ 1 mm Dicke zur Befundansicht rekonstruiert (DBT) [8]
[9].
Unabhängige Doppelbefundung
Wie im laufenden MSP wurde in beiden Studienarmen eine unabhängige Doppelbefundung durch dieselben zertifizierten Ärztinnen und Ärzte durchgeführt. Insgesamt umfasste die Screening-Studie 83 erfahrene Befunderinnen und Befunder, die zuvor Screening-Erfahrung von mindestens zwei Jahren hatten mit mindestens 5.000 Screening-Befundungen pro Jahr. Vor Beginn der TOSYMA-Studie wurden DBT-Schulungen durchgeführt. Pro Standort gab es vier bis acht Befunderinnen bzw. Befunder. Sie erhielten ihre Liste mit Studienuntersuchungen in einer gemischten Reihenfolge beider Studienarme, ohne dass der Studienarm vor der Fallanwahl in der Screening-Software zu identifizieren war.
Bei Auffälligkeiten wurden die Ergebnisse mit der/dem Programmverantwortlichen Ärztin bzw. Arzt in der Konsensuskonferenz besprochen, um zu entscheiden, ob eine weiterführende Abklärungsdiagnostik indiziert war. Die Abklärungsdiagnostik nach Studienteilnahme unterschied sich nicht vom etablierten Ablauf des MSP und umfasste befund-orientiert neben einer klinischen Untersuchung ggf. weitere mammografische Projektionen (z. B. Vergrößerungsmammografien oder DBT), die Sonografie, MR-Untersuchungen oder invasive Abklärungsverfahren.
Alle Screening-Daten wurden im Screening-Dokumentationssystem MaSc (KV-IT GmbH, Dortmund, Deutschland) gespeichert [7]
[8]
[9].
Studiendaten
Die Datenbasis umfasste alle Ergebnisse der Doppelbefundungen, sodass Anzahl und Anteil der konkordanten (zweifach richtig-positiv) und diskordanten (einmal richtig-positiv und einmal falsch-negativ) Befundungen der im jeweiligen Studienarm detektierten Mammakarzinome (invasive Mammakarzinome und duktales Carcinoma in situ (DCIS)) ermittelt werden konnten.
Eine Befundung wurde als richtig-positiv gewertet, wenn es bei einem nachfolgend diagnostizierten Karzinom zu einer Vorstellung in der Konsensuskonferenz aufgrund mindestens einer mammografischen Auffälligkeit kam (Befundstufe 4a, 4b, 5), und als falsch-negativ, wenn bei diesem Karzinom der radiologische Befund keine Vorstellung in der Konsensuskonferenz zur Folge hatte (Befundstufe 1, 2) [4]
[11].
Die Brustdichte wurde anhand der DM- bzw. SM-Bilder visuell den Kategorien A (lipomatös), B (fibroglandulär), C (heterogen dicht), D (extrem dicht) zugeordnet [12]. Wenn sich beide Mammae in der Dichte unterschieden, wurde die höhere Kategorie dokumentiert [12], im Fall von diskordanter Dichtekategorisierung in der unabhängigen Doppelbefundung wurde die höchste Dichtekategorie verwendet [9]. A und B wurden als nicht-dichtes Parenchym, C und D als dichtes Parenchym zusammengefasst.
Die Anteile konkordant und diskordant befundeter Mammakarzinome wurden nach T-Kategorien stratifiziert (Tis, T1, >T1). Im Falle mehrerer Manifestationen wurde die fortgeschrittenere Diagnose verwendet, bestimmt anhand der histologischen Größe (pT) bzw. im Fall einer neoadjuvanten Therapie definiert anhand der Bildgebung (cT). Weitere Stratifizierungen umfassten den histologischen Subtyp (invasives Mammakarzinom nicht spezieller Typ, invasiv lobuläres Mammakarzinom, andere Subtypen), den mammografischen Verdachtsgrad für Malignität (Befundstufe 4a: suspekte Veränderung, eher benigne; 4b: suspekte Veränderung, eher maligne; 5: hochgradig malignitätsverdächtiger Befund) sowie die mammografische Morphologie (Herd, Mikrokalk, Architekturstörung, Asymmetrie, Verdichtung) der Konsensuskonferenz.
Statistische Auswertung
In den modifizierten vollständigen Analysesatz wurden 49.762 Frauen aus dem Testarm (DBT+SM) und 49.796 Frauen aus dem Kontrollarm (DM), die nach der Randomisierung eine Screening-Untersuchung erhielten, aufgenommen. Die deskriptive Subanalyse umfasste alle Frauen mit einem Screening-detektierten Mammakarzinom, 416 Frauen aus dem Testarm und 306 Frauen aus dem Kontrollarm ([Abb. 1]). Es wurden für die kategorialen Variablen absolute und relative Häufigkeiten berechnet. Zudem wurden die Detektionsraten von einfach und zweifach richtig-positiv befundeten Mammakarzinomen pro 1.000 untersuchte Frauen berechnet.
Abb. 1 Randomisierte Zuordnung der TOSYMA Studien-Teilnehmerinnen. DBT+SM: Digitale Brust-Tomosynthese plus synthetische Mammografie; DM: Digitale Mammografie.
Ergebnisse
Im DBT+SM-Arm wurden 416 von 49.762 (8,4 ‰) Frauen mit Brustkrebs detektiert. Bei 112 Frauen führte eine diskordante radiologische Befundung mit nur einem richtig-positiven Befund zur Diagnose (26,9 %), was einer Detektionsrate von 2,3 ‰ (112/49.762) entsprach.
Im DM-Arm lag die Brustkrebsdetektionsrate mit 6,1 ‰ (306/49.796) niedriger als im DBT+SM-Arm, der Anteil der diskordanten Befundungen betrug 22,2 %, die resultierende Detektionsrate 1,4 ‰ (68/49.796) ([Tab. 1]). Die Stratifizierung nach nicht-dichtem und dichtem Parenchym zeigte vergleichbare Anteile von einfach-positiv detektierten Mammakarzinomen in beiden Studienarmen (DBT+SM: 29,6 % bzw. 24,7 %; DM: 20,5 % bzw. 23,8 %).
Tab. 1
Anzahl (N) und Anteil (%) der einfach bzw. zweifach richtig-positiv detektierten Mammakarzinome (invasiv und DCIS), basierend auf einer unabhängigen Doppelbefundung in den Studienarmen DBT+SM und DM.
Ergebnis der unabhängigen Doppelbefundung
|
DBT+SM
n (%)
|
DBT+SM
A+B
n (%)
|
DBT+SM
C+D
n (%)
|
DM
n (%)
|
DM
A+B
n (%)
|
DM
C+D
n (%)
|
einfach richtig-positiv
|
112 (26,9 %)
|
56 (29,6 %)
|
56 (24,7 %)
|
68 (22,2 %)
|
30 (20,5 %)
|
38 (23,8 %)
|
zweifach richtig-positiv
|
304 (73,1 %)
|
133 (70,4 %)
|
171 (75,3 %)
|
238 (77,8 %)
|
116 (79,5 %)
|
122 (76,2 %)
|
Summe (invasive Mammakarzinome plus DCIS)
|
416 (100 %)
|
189 (100 %)
|
217 (100 %)
|
306 (100 %)
|
146 (100 %)
|
160 (100 %)
|
DBT+SM: Digitale Brust-Tomosynthese + Synthetische Mammografie
DM: Digitale Mammografie
DCIS: duktales Carcinoma in situ
Visuell bestimmte Brustdichte-Kategorien A+B (BI-RADS 5th ed. [12]): nicht-dichtes Parenchym
Visuell bestimmte Brustdichte-Kategorien C+D (BI-RADS 5th ed. [12]): dichtes Parenchym
Bei den nur einfach richtig-positiv detektierten Mammakarzinomen im DBT+SM-Arm lag in 24,1 % (27/112) ein DCIS vor, in 67,9 % ein invasives Mammakarzinom bis 20 mm (67/112) und in 8 % (9/112) ein invasives Mammakarzinom größer als 20 mm. Die entsprechenden Anteile im DM-Arm betrugen 32,4 % (22/68), 55,9 % (38/68) bzw. 11,8 % (8/68) ([Tab. 2]).
Tab. 2
Anzahl (n) und Anteil (%) der einfach bzw. zweifach richtig-positiv detektierten Mammakarzinome (invasiv und DCIS), differenziert nach Tumorcharakteristika und histologischem Subtyp, nach unabhängiger Doppelbefundung in den Studienarmen DBT+SM und DM.
Tumorcharakteristik
|
DBT+SM
einfach richtig-positiv
n (%)
|
DM
einfach richtig-positiv
n (%)
|
DBT+SM
zweifach richtig-positiv
n (%)
|
DM
zweifach richtig-positiv
n (%)
|
pTis
|
27 + 0 (24,1 %)
|
22 + 0 (32,4 %)
|
35 + 0 (11,5 %)
|
44 + 0 (18,5 %)
|
pT1 + cT1
|
68 + 8 (67,9 %)
|
34 + 4 (55,9 %)
|
187 + 33 (72,4 %)
|
114 + 30 (60,5 %)
|
> pT1 + >cT1
|
8 + 1 (8,0 %)
|
8 + 0 (11,8 %)
|
34 + 15 (16,1 %)
|
38 + 12 (21,0 %)
|
Nicht spezieller Typ
|
56 (65,9 %)
|
31 (67,4 %)
|
210 (78,1 %)
|
157 (80,9 %)
|
Lobulärer Subtyp
|
20 (23,5 %)
|
12 (26,1 %)
|
42 (15,6 %)
|
29 (14,9 %)
|
Andere Subtypen
|
9 (10,6 %)
|
3 (6,5 %)
|
17 (6,3 %)
|
8 (4,1 %)
|
Alle Histologien basieren auf der abschließenden post-operativen Bewertung.
pTis: Duktales Carcinoma in situ
pT1: Histologische Tumorgröße bis 20 mm, > pT1: Histologische Tumorgröße größer 20 mm
cT: Im Fall einer histologischen Sicherung eines invasiven Mammakarzinoms mit Indikation zu einer neoadjuvanten Therapie wurde die Tumorgröße anhand der Bildgebung eingeschätzt.
Unter den einfach (diskordant) und zweifach richtig-positiv (konkordant) detektierten invasiven Mammakarzinomen dominierte der nicht spezielle Typ in beiden Studienarmen. Im Vergleich zu den zweifach richtig-positiv detektierten Mammakarzinomen lag dagegen der Anteil des invasiv lobulären Subtyps unter den einfach richtig-positiven Befundungen höher (DBT + SM: 15,6 % (42/269) vs. 23,5 % (20/85), DM: 14,9 % (29/194) vs. 26,1 % (12/46) ([Tab. 2]).
Hochgradig malignitätsverdächtige Befunde (Befundstufe 5) waren in beiden Studienarmen mit unter 10 % unter den Karzinomen mit diskordanten Befunden selten. Hier überwogen suspekte Veränderungen mit eher benigner Dignität (Befundstufe 4a) mit Anteilen von 67,7 % (73/112) im DBT+SM-Arm und von 84,6 % (55/68) im DM-Arm ([Tab. 3]).
Tab. 3
Anzahl (n) und Anteil (%) der einfach bzw. zweifach richtig-positiv detektierten Mammakarzinome, differenziert nach dem mammografischen Verdachtsgrad, nach unabhängiger Doppelbefundung in den Studienarmen DBT+SM und DM.
Befundstufe Konsensuskonferenz
|
DBT+SM
einfach richtig-positiv
n (%)
|
DM
einfach richtig-positiv
n (%)
|
DBT+SM
zweifach richtig-positiv
n (%)
|
DM
zweifach richtig-positiv
n (%)
|
4a – Suspekte Veränderung eher benigne
|
73 (67,6 %)
|
55 (84,6 %)
|
101 (33,6 %)
|
101 (43,7 %)
|
4b – Suspekte Veränderung eher maligne
|
26 (24,1 %)
|
6 (9,2 %)
|
83 (27,6 %)
|
65 (28,1 %)
|
5 – Hochgradig malignitäts-verdächtiger Befund
|
9 (8,3 %)
|
4 (6,2 %)
|
117 (38,9 %)
|
65 (28,1 %)
|
Fehlende Angabe
|
4
|
3
|
3
|
7
|
Summe (invasive Karzinome plus DCIS)
|
112 (100 %)
|
68 (100 %)
|
304 (100 %)
|
238 (100 %)
|
Mammografischer Verdachtsgrad dokumentiert im Rahmen der Konsensuskonferenz, basierend auf einer einfach oder zweifach-positiven unabhängigen Doppelbefundung von Screening-detektierten Mammakarzinomen beider Studienarme in Anlehnung an das BI-RADS 4th ed. [11]
DCIS: Duktales Carcinoma in situ
Unter den nur einfach richtig-positiv befundeten Untersuchungen war der Anteil von Herden und Architekturstörungen im DBT+SM-Arm höher als im DM-Arm, während der Mikrokalkanteil geringer war ([Tab. 4, ]
[Abb. 2]).
Tab. 4
Anzahl (n) und Anteil (%) der einfach bzw. zweifach richtig-positiv detektierten Mammakarzinome, differenziert nach der mammografischen Morphologie, nach unabhängiger Doppelbefundung in den Studienarmen DBT+SM und DM.
Morphologie Konsensuskonferenz
|
DBT+SM
einfach richtig-positiv
n (%)
|
DM
einfach richtig-positiv
n (%)
|
DBT+SM
zweifach richtig-positiv
n (%)
|
DM
zweifach richtig-positiv
n (%)
|
Herd
|
29 (26,9 %)
|
13 (20,0 %)
|
115 (38,3 %)
|
106 (45,9 %)
|
Mikrokalk
|
26 (24,1 %)
|
24 (36,9 %)
|
50 (16,7 %)
|
51 (22,1 %)
|
Architekturstörung
|
23 (21,3 %)
|
7 (10,8 %)
|
29 (9,6 %)
|
11 (4,8 %)
|
Asymmetrie
|
0 (0,0 %)
|
3 (4,6 %)
|
0 (0,0 %)
|
4 (1,7 %)
|
Verdichtung
|
0 (0,0 %)
|
5 (7,7 %)
|
2 (0,7 %)
|
9 (3,9 %)
|
Kombination
|
30 (27,8 %)
|
13 (20,0 %)
|
105 (34,9 %)
|
50 (21,6 %)
|
Fehlende Angabe
|
4
|
3
|
3
|
7
|
Summe invasive Karzinome plus DCIS
|
112 (100 %)
|
68 (100 %)
|
304 (100 %)
|
238 (100 %)
|
Mammografische Morphologie dokumentiert im Rahmen der Konsensuskonferenz, basierend auf einer einfach oder zweifach-positiven unabhängigen Doppelbefundung von Screening-detektierten Mammakarzinomen beider Studienarme. DCIS: duktales Carcinoma in situ
Abb. 2 Screening-detektiertes Mammakarzinom. a Einfach richtig-positive Screeningbefundung mit dargestellter Architekturstörung in der digitalen Brust-Tomosynthese (cranio-caudal) der linken Brust in den lateralen Quadranten. Histologie: invasiv lobuläres Mammakarzinom, pT1c (11 mm), pN0, cM0, G2. b Befundrelevante Ausschnittsvergrößerung.
Die mediane Befundungszeit bei einfach richtig-positiver Befundung lag bei 238,0 Sekunden mit DBT+SM und bei 121,5 Sekunden mit DM, bei einfach falsch-negativen Befundungen betrug sie 100,0 (DBT+SM) bzw. 40,0 Sekunden (DM). Zweifach richtig-positive Screening-detektierte Mammakarzinome wiesen eine mediane Befundungszeit von 194,0 Sekunden im DBT+SM-Arm und von 99,5 Sekunden im DM-Arm auf.
Diskussion
Die große, multizentrische, randomisiert und kontrolliert im Rahmen des deutschen MSP umgesetzte TOSYMA-Studie zeigt, dass durch die unabhängige Doppelbefundung sowohl im Screening mit DM (22,2 %) als auch im Screening mit DBT+SM (26,9 %) ein relevanter Anteil von Karzinomen mit nur einer einfach richtig-positiven Befundung detektiert wird. Vergleichbare Anteile diskordanter Befundungen wurden bereits für bisher in der Routine laufende Mammografie-Programme beschrieben: So wurden im norwegischen Screening 23,6% der screening-detektierten Mammakarzinome mit einer diskordanten Screeningbefundung diagnostiziert [13] bzw. 23% [14]. Die Doppelbefundung trägt also auch nach anderen Berichten in der Literatur zur Steigerung der Sensitivität der mammografischen Diagnostik bei [15]
[16]
[17]. Unsere Ergebnisse stehen im Einklang mit der Literatur, die eine singuläre Mammografie-Befundung im Vergleich zur Doppelbefundung verbunden mit einer Abnahme der Sensitivität für alle Dichtekategorien beschreibt [18].
In der TOSYMA-Studie ergibt sich bei einer höheren totalen Brustkrebsdetektionsrate durch DBT+SM versus DM auch eine höhere Brustkrebsdetektionsrate mit einer einfach richtig-positiven und einer falsch-negativen Befundung (DBT+SM-Arm: 2,3‰, DM-Arm 1,4‰). Diese im DBT-Arm einfach richtig-positiv diagnostizierten Karzinome umfassen insbesondere invasive Mammakarzinome bis 20 mm Durchmesser mit mammografisch geringem Verdachtsgrad (Befundstufe 4a). Es führt das Mammakarzinom vom nicht speziellen Typ während die mammografischen Morphologien variieren. Die Detektion von T1-Karzinomen wird in der Früherkennung angestrebt; sie scheint aber auch für Erfahrene mit beiden mammografischen Techniken eine Herausforderung darzustellen. Die Befundungsdauer könnte einen Einfluss auf die Mammakarzinomdetektion haben, da die medianen Befundungszeiten der einfach falsch-negativen Befundungen deutlich niedriger liegen als die der einfach richtig-positiven Befundungen bzw. geringfügig niedriger liegen als die gesamte mediane Befundungszeit pro Studienarm [8]. Zusätzlich könnten die einfach richtig-positiven Mammakarzinome subtilere Auffälligkeiten aufweisen als die zweifach richtig-positiven bei einer pro Studienarm jeweils längeren medianen Befundungszeit.
Die Studie bewertet die Sensitivität nicht auf der Ebene der Karzinomläsion, sondern basiert auf der Bewertung der Screening-Untersuchung. Da die Vorlage in der Konsensuskonferenz nicht gleichzusetzen ist mit einer obligaten Rückrufindikation, sondern z. B. auch die Anforderung externer Mammografien oder anderer Untersuchungsergebnisse beinhaltet, wurde auf Befunderebene kein Spezifitätsparameter errechnet. Insgesamt unterschied sich die Rückrufrate zwischen den beiden Studienarmen nicht markant (DBT+SM: 4,9 %, DM: 5,1 %), der positive prädiktive Wert des Rückrufs zur Abklärungsdiagnostik (PPV1) lag im Testarm höher als im Kontrollarm (DBT+SM: 17,2 %, DM: 12,3 %) [8].
Unter den einfach richtig-positiven Mammakarzinomen war die größte Anteilsdifferenz bei Mikroverkalkungen zu verzeichnen, wobei der Anteil im DM-Arm höher war (DM: 36,9 %, DBT+ SM: 24,1 %). Dies steht im Einklang mit Ergebnissen zum 2D-Mammografie-Screening, die einen signifikant höheren Anteil an Mikroverkalkungen unter diskordanten als konkordant diagnostizierten Mammakarzinomen beschreiben [13]. Da die DCIS-Detektionsrate zwischen beiden Studienarmen nicht markant unterschiedlich war [8] und die DCIS-Detektion eine starke Assoziation zu Mikroverkalkungen hat [19], erscheint die richtig-positive Befundung von Mikrokalk mittels DBT+SM weniger ausgeprägt von der unabhängigen Doppelbefundung abzuhängen als es bei anderen mammografischen Morphologien der Fall ist. Ggf. führt ein betonter Kontrast der Mikroverkalkungen zu einer markanteren Wahrnehmung im Testarm als im Kontrollarm [6]. Die zweitgrößte Anteilsdifferenz bildete die Architekturstörung mit einem höheren Anteil im DBT+SM-Arm (DBT+SM: 21,3 %, DM: 10,8 %). Die Literatur beschreibt vielfältig die Überlegenheit der DBT in der Detektion von Spikulierungen und Architekturstörungen [6]. Diese Arbeit zeigt, dass die unabhängige Doppelbefundung einen positiven Einfluss auf dessen Diagnosehäufigkeit hat.
Insbesondere im Kontext der im Vergleich zur DM längeren Befundungszeit mit DBT aufgrund des größeren Umfangs des Bildmaterials bei 1 mm messenden rekonstruierten Schichten und einer medianen Brustkompressionsdicke von 59 mm [8], erscheint als Alternative zur unabhängigen Doppelbefundung der Einsatz von künstlicher Intelligenz (KI)-basierenden Systemen vielversprechend. Eine Realisierung ist durch standardisierte mammografische Einstelltechniken begünstigt und könnte perspektivisch die menschliche Befundung unterstützen und durch stratifizierte Vorauswahlen entlasten. So zeigen die retrospektiven KI-Bewertungen des Malmö-Trials und der Córdoba-Studie potenzielle Einsatzmöglichkeiten [20]
[21]: Anhand einer DBT-Projektionsebene wurde durch KI die Zweitbefundung ersetzt und es wurden 95 % der mit Doppelbefundung diagnostizierten Mammakarzinome entdeckt; diese Karzinomdetektionsrate lag im Vergleich zu einer unabhängigen Doppelbefundung im DM-Screening um 26 % höher – allerdings auf Kosten einer Steigerung der Rückrufrate um 53 %. KI allein im DBT-Arm hatte eine vergleichbare Sensitivität zum DM-Arm mit Doppelbefundung [20]. Im Vergleich zu einer unabhängigen Doppelbefundung von DBT-Untersuchungen könnte KI somit ohne Unterlegenheit in der Sensitivität zu einer relevanten Senkung der Arbeitslast beitragen [21]. Ergebnisse einer randomisierten Studie mit Prüfung einer KI-gestützten Mammografie-Befundung im Vergleich zur etablierten Doppelbefundung stützen die Annahme einer vergleichbar erreichbaren Brustkrebsdetektionsrate bei einer wesentlich geringeren Arbeitsbelastung unter Einsatz von KI [22].
Der verwendete Parameter der einfach richtig-positiv detektierten Mammakarzinome reflektiert nicht die einzelne, sondern die kombinierte Befunderleistung. Dieser Parameter wurde in gleicher Weise für beide Arme innerhalb einer randomisierten Studie erhoben, die nur ein sehr geringes Potenzial für verzerrende Einflüsse durch eine selektive Auswahl von Screening-Teilnehmerinnen, Untersuchern oder Geräten hatte. Der weiterhin nicht geringere Anteil der einfach richtig-positiven Mammakarzinome im DBT-Arm spricht dafür, dass auf eine Doppelbefundung in einem DBT-Screening nicht verzichtet werden kann.
TOSYMA ist die bisher größte randomisiert-kontrollierte Screening-Studie zur Untersuchung von DBT+SM versus DM mit fast 100.000 Studienteilnehmerinnen. Sie ermöglicht ergänzende explorative Auswertungen auf der Basis einer erfolgreichen Randomisierung. Der pragmatische Ansatz hat ein hohes Maß an externer Validität und belegt auch die praktische Umsetzbarkeit, insbesondere aufgrund der Einbeziehung zahlreicher Screening-Einheiten und Gerätetechnologien. Radiologische Fachkräfte, Befunderinnen und Befunder und Pathologinnen und Pathologen wurden vor Studienbeginn geschult. Alle Ärzte waren erfahren und unterschieden sich weder zwischen den Studienarmen noch zwischen der Studie und dem Routine-Screening.
Die Studie hat auch Limitationen. TOSYMA analysierte nur eine Screening-Runde, daher könnten die Unterschiede zwischen den Studienarmen durch einen initialen Prävalenz-Screening-Effekt mit DBT+SM beeinflusst sein. Darüber hinaus könnte eine Lernkurve in der Befundung von Tomosynthesen vorhanden sein, die sich mit steigender Erfahrung auf die Befundungszeit reduzierend auswirken könnte. Die Subanalyse bezieht sich in der Bewertung ‚richtig-positiv‘ auf die Untersuchungsebene, nicht auf die Läsionsebene.
Klinische Relevanz
Wie im digitalen Mammographie-Screening findet sich ein relevanter Anteil von Mammakarzinomen, der nur durch einen der beiden Befunder richtig-positiv detektiert wird, vor allem bei Tumoren bis 20 mm Durchmesser bzw. unter Läsionen ohne hochgradigen Malignitätsverdacht. Die obligate, unabhängige Doppelbefundung erscheint auch in einem DBT-Screening weiterhin erforderlich. Künftig könnte sich hier ein Feld für den Einsatz künstlicher Intelligenz entwickeln.
Förderung
Deutsche Forschungsgemeinschaft (DFG)
HE 1646/5–1, HE 1646/5–2