Subscribe to RSS
DOI: 10.1055/s-0039-3403203
Klassifikationsmodelle zur Detektion und Lokalisation von Husten mit Hilfe akustischer Eigenschaften
Publication History
Publication Date:
28 February 2020 (online)
Methoden zur Detektion und Klassifikation von Lungengeräuschen können in der Diagnose, Überwachung und Behandlung von Patienten mit Lungenerkrankungen eine wichtige Ergänzung sein. Diese Methoden sind nicht-invasiv, kostengünstig und in der Regel mobil anwendbar. Ziel dieser Arbeit ist die Präsentation eines Algorithmus zur Detektion und Lokalisation von Hustengeräuschen mit Hilfe von Entscheidungsbäumen und Extreme Gradient Boosting. Die verwendeten Auskultationsdaten wurden mit dem LEOSound Lungen-Sound-Monitor (Löwenstein Medical GmbH & Co. KG, Bad Ems) bei stabilen COPD-Patienten im häuslichen Umfeld aufgezeichnet. Die Abtastrate der Audiodaten beträgt 5512 Hz. Zum Training der Modelle wurde 756 Segmente mit einer Länge von 30 Sekunden ausgewählt. Die Validierung erfolgte an 180 Segmenten. Zur Detektion und Lokalisation wurden verschiedene Eigenschaften wie Mel Frequency Cepstral Coefficients (MFCC) und weitere statistische Parameter dieser MFCC verwendet. Ein Modell zur Identifikation von Segmenten mit Husten erzielt, basierend auf einem Entscheidungsbaum, eine Genauigkeit von 95%, eine Sensitivität von 98% und eine Spezifität von 90%. Ein ähnliches Modell, basierend auf Extreme Gradient Boosting, erzielte eine Genauigkeit von 98% (Sensitivät: 98%, Spezifität: 97%)Die anschließende Lokalisation der Ereignisse erzielt unter Verwendung von Entscheidungsbäumen eine Genauigkeit von 92% (Sensitivität: 91%, Spezifität: 92%). Wird der Entscheidungsbaum durch Extreme Gradient Boosting ersetzt, verbessert sich die Genauigkeit auf 95% (Sensitivität: 95%, Spezifität: 95%). Die ersten Resultate zeigen eine Überlegenheit von Extreme Gradient Boosting gegenüber Entscheidungsbäumen. Beide Ansätze erzielen eine hohe Genauigkeit. Zukünftig soll das Modell noch um eine Klassifikation der Hustenqualität (produktiv, nicht produktiv) erweitert werden. Des Weiteren sind weitere Trainingszyklen mit verrauschten Daten geplant, um so das Modell robuster zu gestalten.
#