Sprache · Stimme · Gehör 2011; 35(02): 65
DOI: 10.1055/s-0031-1281020
Der kleine Repetitor
Georg Thieme Verlag KG Stuttgart · New York

Voice Onset Time

Further Information

Publication History

Publication Date:
21 June 2011 (online)

Zoom Image

Voice Onset Time (VOT, Stimmeinsatzzeit) bezeichnet die zeitliche Relation zwischen der Lösung eines Verschlusslautes (Plosiv, Okklusiv) und dem Einsetzen des Stimmtons eines folgenden Sonoranten. Der von Lisker und Abramson 1964 eingeführte Ausdruck war ursprünglich eher technisch geprägt, als man bei der Konstruktion der ersten Sprachsynthese-Apparate entdeckte, dass eine mehr bzw. weniger lange Verzögerung des Einfügens von Stimmhaftigkeit nach einem Verschlusslaut dessen Perzeption als stimmhaft bzw. stimmlos bewirkte. VOT ist heute ein klassischer Parameter bei der akustischen Analyse des Sprachsignals mittels Oszillogramm oder Kurzzeit-Spektrogramm (Sonagramm) und spielt eine bedeutende Rolle bei der phonetischen Fundierung der Fortis-Lenis-Dichotomie.

Tritt der Stimmton bereits vor der Plosivlösung auf (sog. voicing lead), wird die Zeitspanne als "negative VOT" bezeichnet. Im Sonagramm von Abb. [1] ist dies links bei [ba] zu sehen: Die als senkrechte "Spikes" sichtbaren Explosionen der periodischen glottalen Verschlüsse beginnen hier bei - 92 ms. Beim Entsetzen des Stimmtons nach der Lösung ("voicing lag") ergeben sich positive VOT-Werte: für das stimmlose, aber nicht aspirierte [pa] + 9 ms (Bildmitte) und für das – im Deutschen übliche – stark aspirierte [pha] + 62 ms (rechts). Wie man an dem Beispiel sieht, kann die VOT in einer Sprache wie dem Deutschen auch zur Beschreibung der Opposition stimmhafter und stimmloser Verschlusslaute benutzt werden, die ja phonetisch meist nicht wirklich durch Vorhandensein bzw. Fehlen von Stimmhaftigkeit realisiert wird, sondern mit Hilfe der Aspiration: Bei oral gelösten deutschen /p, t, k/ bleibt die Glottis bis zum Einsatz der Stimmlippenbewegung in Abhängigkeit von der lautlichen Umgebung und anderen Faktoren bis zu 80 ms und länger geöffnet. Während dieser Zeit kann transglottal Luft entweichen: es entsteht Aspiration. Bei /b, d, g/ dagegen setzt die Stimmlippenbewegung (fast) unmittelbar mit der Verschlusslösung ein, so dass keine Zeit für Aspiration verbleibt. Die Aspiration darf nicht mit dem für den jeweiligen Verschlusslaut typischen lokalen Lösungsgeräusch verwechselt werden, wenn sie auch rein zeitlich gesehen diesem überlagert ist.

VOT ist jedoch nicht ohne Einschränkungen zur akustischen Beschreibung der Stimmbeteiligungsverhältnisse bei Verschlusslauten geeignet. Wenn beispielsweise ein /d/ nach einem stimmhaften Laut steht, z.B. postvokalisch wie in dem Wort "Ida", tritt zumindest im (Nord-) Deutschen häufig der Fall ein, dass es zunächst durchaus stimmhaft ist und erst in seiner letzten Phase vor der Verschlusslösung graduell stimmlos wird, wenn nämlich das für das Schwingen der Stimmlippen erforderliche transglottale Druckgefälle als Folge der oralen Verschlussbildung abgebaut worden ist. Die VOT ist hier per definitionem positiv, bezieht sich dabei aber ausschließlich auf das Ereignis nach dem Verschlusslaut. Um einen solchen, z.B. im deutschen Lautsystem regelhaft auftretenden Fall partieller Stimmhaftigkeit besser beschreiben zu können, wird als Erweiterung des Begriffs VOT auch eine "Voice Offset Time" verwendet.

Zoom Image
Abb. 1 Breitband-Spektrogramm der Silben [ba ... pa ... pha]. Die VOT ist jeweils die Zeitspanne innerhalb der senkrechten Striche.

Fazit

VOT ist ein wohldefinierter und leicht zu messender Parameter des akustischen Signals, der in den Bereichen der Phonetik, Phonologie, (klinischen) Linguistik und Phoniatrie einen hohen Stellenwert besitzt.

Prof. Dr. Hermann J. Künzel, Marburg