Laryngorhinootologie 2001; 80(3): 117-122
DOI: 10.1055/s-2001-11883
© Georg Thieme Verlag Stuttgart · New York

Psychoakustische Skalierung akustischer Stimmparameter durch multizentrisch validierte RBH-Bewertung[1]

R. Schönweiler1 , P. Wübbelt2 , M. Hess3 , M. Ptok1
  • 1Klinik für Phoniatrie und Pädaudiologie, Medizinische Hochschule Hannover
  • 2Institut für Biometrie, Medizinische Hochschule Hannover
  • 3Abt. für Hör-, Stimm- und Sprachstörungen (Phoniatrie und Pädaudiologie), Universitäts-Klinik Hamburg-Eppendorf
Further Information

Publication History

Publication Date:
31 December 2001 (online)


Hintergrund: Es ist bekannt, dass akustische Stimmmerkmale mit perzipierter Heiserkeit korrelieren. Um diese Korrelation diagnostisch nutzbar zu machen, sollte eine Skalierung geeigneter Parameter nach einem bekannten psychoakustischen Stimmbewertungsverfahren, dem RBH-Index, entwickelt werden.

Methoden: Es wurde ein akustischer Datensatz von 120 normalen und heiseren Stimmen verwendet, für den multizentrisch ermittelte RBH-Bewertungen vorlagen. Mit einer Regressionsbaumanalyse wurden aus einer Vielzahl akustischer Parameter diejenigen identifiziert, die am stärksten an einer korrekten Klassifikation beteiligt waren. Mit diesen Parametern wurden Feedforward-Netze trainiert und in ein Computerprogramm für die praktische Anwendung implementiert.

Ergebnisse: Die mittleren Wahrscheinlichkeiten für korrekte Klassifikation betrugen 0,65 - 0,85, also weit mehr als die doppelte Ratewahrscheinlichkeit (0,25). Das Computerprogramm war in der Lage, zu 40 % sowohl für Rauigkeit als auch Behauchtheit, zu 65 % wenigstens in Rauigkeit oder Behauchtheit korrekt zu klassifizieren.

Schlussfolgerungen: Es wurde ein neues psychoakustisch basiertes Klassifikationssystem entwickelt. Die hier verwendeten Klassifikationsschemata erlauben zukünftig auch die Berücksichtigung anderer Parameter, wie z. B. GNE, wodurch die Klassifikationsgenauigkeit eventuell noch gesteigert werden kann.

Psychoacoustical Scaling of Acoustical Voice Parameters by Multicenter Voice Ratings

Background: The purpose of the study was to analyze if perceptual voice quality ratings of the well-known RBH rating procedure (a 4-point scale of roughness, breathiness, and hoarseness) covary with acoustical voice parameters. Methods: 120 voice samples from subjects with healthy and hoarse voices were rated on the RBH-index in a multicenter study with 31 raters. Multivariate regression tree analysis classified the perceptual ratings as “gold standard”. Voice samples were acoustically analyzed with a feature extraction method. Feedforward-networks were trained to selected acoustical parameters having highest “relative importance” in the regression trees. Based on the best classifier, a computer program consisting of 50 simultaneous working networks was developed. Results: Mean probabilities for correct classifications were found at 0.65 - 0.85, implying a significance level over chance (0.25). Classifications of the program matched in 40 % with a priori values in the categories roughness combined with breathiness, and in 65 % in at least one domain. Conclusions: The new method described here provides a psychoacoustically based “objective” classification of hoarse voices, which seems to enable future analysis of new parameters (like GNE), which may even improve the present results.

1 Herrn Professor Dr. Klaus Jahnke zum 60. Geburtstag gewidmet.


  • 1 Hirano M (Hrsg.). Clinical Examination of Voice. New York; Springer 1981
  • 2 Baken R J. . Introduction. In: Baken RJ (Hrsg.) Clinical measurement of speech and voice. London; Taylor & Francis 1987: 1-5
  • 3 Hacki T. Comparative speaking, shouting, and singing voice range profile measurement: physiological and pathological aspects.  Log Phon Vocol. 1996;  21 123-129
  • 4 Schultz-Coulon H J, Klingholz F. Objektive und semiobjektive Untersuchungsmethoden der Stimme. In: Kittel G, Schürenberg B (Hrsg.) Objektive und semiobjektive Untersuchungsmöglichkeiten von Stimme, Sprache und Gehör. Köln; Deutscher Ärzte-Verlag 1988: 1-71
  • 5 Pahn J, Pahn E. Formblatt, Eigenschaften, Ablauf und Bedeutung des Tests der Sensibilität formaler sprachlicher Elemente im Hinblick auf Perzeption und Produktion.  Sprache Stimme Gehör. 1991;  15 19-23
  • 6 Pinto N B, Titze I R. Unification of perturbation measures in speech signals.  J Acoust Soc Am. 1990;  87 1278-1289
  • 7 Titze I R. Workshop on acoustic voice analysis - Summary statement. Denver; National Center for Voice and Speech 1995
  • 8 Hanson D G, Chen J, Jiang J J, Pauloski B R. Acoustic measurement of change in voice quality with treatment for chronic posterior laryngitis.  Ann Otol Rhinol Laryngol. 1997;  106 279-285
  • 9 Wendler J, Seidner W, Kittel G, Eysholdt U. Lehrbuch der Phoniatrie und Pädaudiologie. 3. Aufl. Stuttgart; Thieme 1996
  • 10 Verdolini K, Ramig L, Jacobson B. Outcomes measurement in voice disorders. In: Frattali CM (Hrsg.) Measuring outcomes in speech-language pathology. New York; Thieme 1998: 354-386
  • 11 Nawka T, Anders L C, Wendler J. Die auditive Beurteilung heiserer Stimmen nach dem RBH-System.  Sprache Stimme Gehör. 1994;  18 130-133
  • 12 Kreiman J, Gerratt B R, Precoda K, Berke G S. Individual differences in voice perception.  J Speech Hear Res. 1992;  35 512-520
  • 13 Fex S. Perceptual evaluation. J.  Voice. 1992;  6 155-158
  • 14 Kreiman J, Gerratt B R. The perceptual structure of pathologic voice quality.  J Acoust Soc Am. 1996;  100 1787-1795
  • 15 Schönweiler R, Hess M, Wübbelt P, Ptok M. Zur Unschärfe der Bewertung heiserer Stimmen: ein auditives oder ein akustisches Problem?. In: Gross M (Hrsg.) Aktuelle phoniatrisch-pädaudiologische Aspekte 1999/2000. Bd. 7. Heidelberg; Median 2000: 64-68
  • 16 Ptok M, Ptok A. Apparative Stimmdiagnostik. Teil 4: Schallspektrographische Untersuchung: Bestimmung von Jitter und Shimmer.  HNO Aktuell. 1997;  5 261-266
  • 17 Rabinov C R, Kreiman J, Gerratt B R, Bielamowicz S. Comparing reliability of perceptual ratings of roughness and acoustic measure of jitter.  J Speech Hear Res. 1995;  38 26-32
  • 18 de Krom G. Some spectral correlates of pathological breathy and rough voice quality for different types of vowel fragments.  J Speech Hear Res. 1995;  38 794-811
  • 19 Martin D, Fitch J, Wolfe V. Pathologic voice type and the acoustic prediction of severity.  J Speech Hear Res. 1995;  38 765-771
  • 20 Hillenbrand J, Cleveland R A, Erickson R L. Acoustic correlates of breathy vocal quality.  J Speech Hear Res. 1994;  37 769-778
  • 21 Hillenbrand J, Houde R A. Acoustic correlates of breathy vocal quality: dysphonic voices and continous speech.  J Speech Hear Res. 1996;  39 311-312
  • 22 Michaelis D, Strube H W. Orthogonale akustische Stimmgüteparameter zur Stimmtherapiedokumentation. In: Arnold W, Hirsekorn S (Hrsg.) Fortschritte der Akustik - Deutsche Jahrestagung für Akustik (DAGA 95). Oldenburg; Deutsche Gesellschaft für Akustik (DEGA) - c/o Universität Oldenburg, Fachbereich Physik/Akustik 1995
  • 23 Qi Y, Hillman R E. Temporal and spectral estimations of harmonics-to-noise ratio in human voice signals.  J Acoust Soc Am. 1997;  102 537-543
  • 24 Zwirner P, Murry T, Swenson M, Woodson G E. Effects of botulinum toxin therapy in patients with adductor spasmodic dysphonia: acoustic, aerodynamic, and videoendoscopic findings.  Laryngoscope. 1992;  102 400-406
  • 25 Zwirner P, Murry T, Woodson G E. Perceptual-acoustic relationships in spasmodic dysphonia.  J Voice. 1993;  7 165-171
  • 26 Aref A, Dworkin J, Devi S, Denton L, Fontanesi J. Objective evaluation of the quality of voice following radiation therapy for T1 glottic cancer.  Radiotherapy Oncol. 1997;  45 149-153
  • 27 Schönweiler R, Wohlfarth K, Dengler R, Ptok M. Supraglottal injection of Botulinum Toxin A in adductor type spasmodic dysphonia with both intrinsic and extrinsic hyperfunction.  Laryngoscope. 1998;  108 55-63
  • 28 Zwirner P, Michaelis D, Kruse E. Akustische Stimmanalysen zur Dokumentation der Stimmrehabilitation nach laserchirurgischer Larynxkarzinomresektion.  HNO. 1996;  44 514-520
  • 29 Fröhlich M, Michaelis D, Strube H W, Kruse E. Acoustic voice description: Case studies for different regions of the hoarseness diagram. In: Wittenberg T, Mergell P, Tigges M, Eysholdt U (Hrsg.) Advances in quantitative laryngoscopy. Göttingen; Abteilung Phoniatrie der Universitäts-HNO-Klinik 1997: 143-150
  • 30 Hess M, Mansmann U, Grohmann G, Lautsch-Müser V, Gora U, Günter R, Rimkus G, Gross M. Multicenter-Studie „RBH”: Erste Ergebnisse. In: Gross M, Eysholdt U (Hrsg.) Aktuelle phoniatrisch-pädaudiologische Aspekte 1996, Bd. 4. Berlin; Renate Gross 1997: 30-31
  • 31 Nawka T, Anders L C. Die auditive Bewertung heiserer Stimmen nach dem RBH-System (2 CDs). Stuttgart; Thieme 1996
  • 32 Schönweiler R, Wübbelt P, Schöler C, Ptok M. Multidimensional signal analysis in relation to subjective rating of voice quality: Classification results using multivariate statistics and neural nets. In: Wittenberg T, Mergell P, Tigges M, Eysholdt U (Hrsg.) Advances in quantitative laryngoscopy, Bd. 2. Göttingen; Abteilung Phoniatrie der Universität Göttingen 1997: 151-158
  • 33 Deliyski D. Acoustical model and evaluation of pathological voice production.   Proc EUROSPEECH. ’93 1993;  1969-1972
  • 34 Breiman L, Friedman J, Olshen R, Stone C. Classification and regression trees. Toronto; Wadsworth 1984
  • 35 Michie D, Spiegelhalter D J, Taylor C C (Hrsg.). Machine learning, neural and statistical classification. New York; Ellis Horwood Ltd 1994
  • 36 Bishop C M. Neural networks for pattern recognition. Oxford (UK); Oxford University Press 1995
  • 37 Looney C G (Hrsg.). Pattern recognition using neural networks - Theory and algorithms for engineers and scientists. Oxford (UK); Oxford University Press 1997
  • 38 Scherer A (Hrsg.). Neuronale Netze - Grundlagen und Anwendungen. Braunschweig; Vieweg 1997
  • 39 Breiman L. Bagging predictors.  Machine Learning. 1996;  26 123-140
  • 40 Baxt W G. Application of artificial neural networks to clinical medicine.  Lancet. 1995;  346 1135-1207
  • 41 Michaelis D, Gramß T, Struwe H W. Glottal to noise excitation ratio - a new measure for describing pathological voices.  Acustica. 1997;  83 700-706
  • 42 Kruse E, Michaelis D, Zwirner P, Bender E. Stimmfunktionelle Qualitätssicherung in der kurativen Mikrochirurgie der Larynxmalignome.  HNO. 1997;  45 712-718

1 Herrn Professor Dr. Klaus Jahnke zum 60. Geburtstag gewidmet.

Priv.-Doz. Dr. med. Rainer Schönweiler

Klinik für Phoniatrie und Pädaudiologie
Medizinische Hochschule Hannover

30623 Hannover

Email: E-mail:
