Über die Laute unserer Sprache machen wir uns kaum Gedanken: Die Vokale a, e, i, o,
u produzieren wir mit der gleichen Leichtigkeit wie die Konsonanten m und n, p oder
t. Nur beim Erlernen von Fremdsprachen merken wir manchmal, dass es „schwierige“ Laute
gibt, die vor allem deswegen schwierig zu sein scheinen, weil wir sie eben nicht kennen:
Der Japaner hört den Unterschied zwischen „l“ und r“ zunächst deswegen nicht, weil
es diesen Unterschied in Form der beiden Laute eben im Japanischen gar nicht gibt.
Wir Deutschen haben mit dem Englischen „th“ (einem Frikativ mit bewegter Zunge) so
unsere Probleme, sollten aber wissen, dass das noch gar nichts ist gegen das schnelle
Hervorbringen afrikanischer „Klick“-Laute – wir sprechen hierzulande vom „Schnalzen“
der Zunge – im Sprechfluss anderer Vokale und Konsonanten.[
1
] Fragen wie „Wo kommen die Laute unserer Sprache her?“ oder „Wie viele Sprachlaute
gibt es überhaupt?“ kommen uns nur selten in den Sinn.
Kurz: Wir sprechen eben so „wie uns der Schnabel gewachsen ist“, wie der Volksmund
schon lange behauptet. Wie sehr er damit Recht hat, wissen wir jedoch erst seit dem
15. März 2019. An diesem Tag erschien im Fachblatt Science eine Arbeit, aus der hervorgeht,
dass der Neandertaler noch kein „f“ sprechen konnte, dass sogar viele Menschen das
bis heute (noch) nicht können, und dass – wer hätte das schon gedacht? – die von uns
verwendeten Sprachlaute nicht zuletzt auch davon abhängen, was und wie wir essen [2]– Ja, Sie lesen richtig!
Wie kommt man auf so etwas, und warum? – Die Geschichte geht, so kurz wie möglich
erzählt, wie folgt. Die einfachsten Sprachlaute sind „a“ und „m“: Macht man den Mund
auf und benutzt die Stimmbänder, kommt „aaa“ heraus, macht man dann bei schwingenden
Stimmbändern den Mund zu, ergibt das ein „mmm“. Fängt man das mit geschlossenem Mund
an und macht den Mund dann zweimal auf, kommt „Mama“ heraus, eines der am leichtesten
zu sprechenden Wörter überhaupt, weswegen es Babys sehr schnell lernen und damit das
benennen, was ihnen am nahesten und wichtigsten ist: die Brust und die damit verbundene
Mutter. Schon Neugeborene reagieren übrigens auf solche Wörter mit sich wiederholenden
Silben besser als auf andere Wörter [5].
Die Anzahl der Sprachen auf der Erde beträgt insgesamt etwa 7000.[
2
] Wie viele Sprachlaute (Phoneme) es gibt, kann man absolut kaum sagen, denn ihre
genaue Zahl hängt davon ab, wie genau man unterscheidet. Nach dem internationalen
phonetischen Alphabet (IPA) gibt es 107 Sprachlaute (und Symbole dafür), 52 unterschiedliche
Akzente und 4 Intonationen[
3
]. Manche Sprachwissenschaftler gehen von etwa 2000 unterscheidbaren Sprachlauten
aus [3]. Die Anzahl der Sprachlaute, die es in den jeweils einzelnen Sprachen gibt, unterscheidet
sich stark. Nach der IPA-Zählung hat Dänisch 52 Phoneme, Deutsch 45, Italienisch 30
und Japanisch 22. Es gibt sehr viele interessante, kaum bekannte Tatsachen zu Sprache
und Sprachlauten, z. B. dass die Anzahl der Sprachen bezogen auf eine bestimmte Anzahl
von Menschen vom Äquator zu den Polen abnimmt, und dass die Anzahl der Sprachen auch
vom Regen, von Infektionskrankheiten und von Kriegen sowie von bestimmten Genen abhängt.
In kalten Gegenden gibt es mehr Vokale, in warmen mehr Konsonanten.
Doch zurück zum „f“. Im Jahr 1985 publizierte der Linguist Charles Hockett eine Arbeit
mit dem kürzest möglichen Titel, der nur aus einem Buchstaben bestand: „F“. Ihm war
aufgefallen, dass Reibelaute zwischen der Unterlippe und den oberen Schneidezähnen,
die sogenannten labiodentalen Frikative[
4
] (kurz gesagt: „f“ und „v“), in vielen Sprachen der Welt nicht vorkommen. Zudem meinte
er, dass es einem Zusammenhang zwischen der Art der Nahrung und den Sprachlauten dahingehend
gäbe, dass die genannten nur dort auftreten, wo auch eher weiche (d. h. gekochte)
Nahrung konsumiert wird [6].
Es ist immer eine Sache, etwas zu behaupten, und eine ganz andere, nachzuweisen, dass
die Behauptung stimmt. Im Hinblick auf die Behauptung von Hockett brauchte es ein
interdisziplinäres Team aus Linguisten, Anthropologen, Evolutionsbiologen und Biomechanikern,
das in insgesamt 5-jähriger Arbeit den Nachweis für die Behauptung erbrachte [2].
Sowohl die Milchzähne als auch die zweiten Zähne wachsen normalerweise so, dass die
oberen Schneidezähne im Vergleich zu den unteren weiter vorne stehen (vertikaler Überbiss,
engl.: overbit) und beim Zusammenbeißen der Zähne die unteren Schneidezähne überlappen
(horizontaler Überbiss, engl.: overjet ▶[
Abb. 1
]).
▶ Abb. 1 Schema zur Verdeutlichung des normalen Überbisses beim Menschen, der eine vertikale
Komponente (overbit) und eine horizontale Komponente (overjet) hat (links), was zusammen
das für den Menschen normale Scherengebiss ausmacht (Mitte). Liegt der Überbiss sowohl
in der Horizontalen wie in der Vertikalen bei Null, stehen die Kiefer also direkt
aufeinander, spricht man von einem Kopfbiss oder Tête-a-tête-Biss (engl.: „edge-to-edge“;
rechts) (Quelle: Wikipedia).
Wie etwa ein Gletscher bei flüchtiger Betrachtung starr erscheint, bei längerer Betrachtung
jedoch im Fluss ist, sind – bei noch wesentlich längerer Betrachtungszeit – auch die
Zähne im Fluss. Durch das Zermalmen von harter Nahrung schleifen sie sich im Laufe
des Lebens ab, und zum Ausgleich wachsen sie sehr langsam nach. Dabei rücken sie nicht
nur insgesamt nach vorne, sondern auch die oberen Schneidezähne drehen sich derart,
dass ihre Schneide weiter nach hinten zeigt. Unterm Strich führt dies zur Entwicklung
einer anders konfigurierten Bisslinie: Beim Zusammenbeißen der Zähne stehen nun die
Schneidezähne direkt übereinander. Funde aus der Steinzeit von Schädeln erwachsener
Menschen zeigen genau diese Stellung der Zähne als Ergebnis von Abschleifen und langsamer
Dynamik (Wachstum, Wanderung, Stellungsänderung).
Mit dem Aufkommen von Ackerbau und Viehzucht – nicht nur im „fruchtbaren Halbmond“
des Vorderen Orients (in der Ebene der Flüsse Euphrat und Tigris im heutigen Irak),
sondern weltweit mindestens 11 mal unabhängig voneinander an Orten wie Mexiko bis
Sumatra (▶[
Abb. 2
]) – reduzierte sich diese Dynamik: Weichere, (in Tontöpfen, deren Entwicklung mit
Ackerbau und Viehzucht einher ging) gekochte Nahrung sowie das Vorhandensein von flüssiger
Nahrung, die gar nicht gekaut werden muss (Milch!), führte zu weniger Abrieb der2Zähne
und damit zum längeren „Erhalt“ des Überbisses. Zudem waren die Zähne (durch das Kalzium
in der Milch) stärker mineralisiert, was deren Härte vermehrte und den Abrieb verminderte.
Schließlich wurde die Kaumuskulatur insgesamt weniger beansprucht, was zu einem Rückgang
der Kaumuskulatur und einer Verkleinerung des Unterkiefers und damit ebenfalls zur
Erhaltung des Überbisses bei Erwachsenen beitrug [8].
▶ Abb. 2 Vor etwa 12- bis 8-tausend Jahren entstanden Ackerbau und Viehzucht weltweit an mindestens
11 Orten unabhängig voneinander (grün). Einer davon war der fruchtbare Halbmond (blau;
Ausschnitt aus [7]; Original in [9]).
Vor diesem Hintergrund führte das Wissenschaftlerteam biomechanische Modellierungen
der Bewegungen des Kauapparats (Knochen, Muskeln) beim Sprechen durch, um den von
Hocket formulierten Gedanken empirisch zu überprüfen. Sie ermittelten damit u. a.
den Kraftaufwand, den es für bestimmte Konfigurationen bedarf, sowie deren zeitlichen
Ablauf bei der Produktion bestimmter Laute, bei Überbiss und bei direkt aufeinander
stehenden Kiefern (Kopfbiss). Die „Anstrengung bei der Artikulation eines Lautes“
(„articulatory effort“) wurde berechnet als Integral der Kräfte, die von allen beteiligten
Muskeln aufgewandt werden (gemessen als Prozentsatz der maximal möglichen Kraft) über
die Zeit der Artikulation hinweg.[
5
] Diese Simulation des Kraftaufwandes zur Produktion des Lautes „f“ mithilfe eines
Überbiss-Modells und eines Modells aufeinander stehender Zähne ergab, dass der Laut
bei Überbiss mit 29 % weniger Kraftaufwand produziert werden kann.
Jeder Leser mit normalem Überbiss bekommt eine Vorstellung von dem, was hier gemeint
ist, wenn er versucht, einen f-Lauf mit direkt aufeinander gestellten Schneidezähnen
(man muss hierzu den Unterkiefer vorschieben) nur mit Hilfe der Lippen zu erzeugen.
Solche Lippenverschluss-Laute gibt es ja: Man schließe nur die Lippen, erhöhe den
Druck der auszuatmenden Luft und öffne dann die Lippen schnell. Es entsteht ein labio-labialer
Plosiv-Laut, also entweder das „stimmhafte b“ (bei vor der plötzlichen Lippenöffnung
beginnender Stimmbandvibration) oder das „stimmlose p“ (die Stimmbänder vibrieren
erst nach der Lippenöffnung). Sie können also auch versuchen (was auf das Gleiche
herauskommt), mit wie zur Produktion eines „p“ zusammengepressten Lippen diese ein
klein wenig zu öffnen, um ein Zischen der Luft zu erzeugen, das ähnlich wie ein „f“
klingt. Sie werden merken, dass man mehr Kraft braucht und dennoch ein leiseres Zischen
produziert.
Interessanterweise ergab die Simulation der zur Produktion eines „p“ notwendigen Kraftanstrengung
mit dem Überbiss-Modell und dem Modell aufeinander stehender Kiefer das Gegenteil
zum Ergebnis beim „f“: Ein „p“ braucht weniger Anstrengung, wenn die Zähne aufeinander stehen (die Lippen sind in diesem Fall ja
näher beieinander!) als wenn ein Überbiss vorliegt. Der Erhalt des Überbisses durch
Änderung der Nahrung machte also das „f“ leichter und das „p“ schwerer. Da ein „f“
jedoch insgesamt mehr Kraft braucht als ein „p“, überwiegt der Effekt des „f“.
An dieser Stelle sollte erwähnt werden, dass sich sehr viele Eigenarten von Sprache
durch das Prinzip der geringsten Anstrengung („principle of least effort“[
6
]) erklären lassen. So verhält sich beispielsweise die Häufigkeit eines Wortes umgekehrt
proportional zu dessen Länge (vgl. „ich“, „zu“, „sein“ und „Salz“ mit „Bruttosozialprodukt“,
„Scheibenwischer“, „Existenz“ und „Majoran“). Das ist sinnvoll, weil man so mit geringstmöglichem
Aufwand (Artikulation) am meisten sagen (Information) kann.
Weil also der Kauapparat letztlich mit dem Sprachproduktionsapparat identisch ist,
führten die Änderungen der Ernährungsgewohnheiten, die mit Ackerbau und Viehzucht
einhergingen, zu einer Erleichterung der Produktion von „f“. Dies sollte einen Einfluss
auf das Vorkommen von „f“ in den heutigen Sprachen haben. Genauer lautet die Argumentation
so: Wenn es so ist, dass der Aufwand zur Lautproduktion sich in der Häufigkeit der
entsprechenden Laute niederschlägt, die Art der Nahrung und damit das Abschleifen
der Zähne diesen Aufwand für manche Laute ändert, dann sollten die Häufigkeiten der
labiodentalen Laute (dazu gehören auch Zusammensetzungen wie „pf“) von der Nahrung,
die hauptsächlich in einer Gesellschaft gegessen wird, abhängen.
Und genau dies hat man auch nachweisen können, indem man 1672 Sprachen einer vorhandenen
Datenbank auswertete. Bilabiale Sprachlaute wie „p“ und „m“, bei denen beide Lippen
aufeinander liegen, finden sich mit 95 % (beim „m“), 87 % („p“) und 71 % („b“) in
fast allen bzw. vielen Sprachen. Die Produktion dieser Laute braucht weniger Kraftanstrengung
als die Produktion von labiodentalen Lauten wie „f“ oder sein stimmhaftes Äquivalent
(im Deutschen etwa „w“).
Diese labiodentalen Laute sind dagegen seltener: in 49 % der Sprachen gibt es ein
„f“, in 37 % dessen stimmhafte Variante und in nur 2 % ein „pf“.Am wichtigsten ist
jedoch der Befund, dass in Gesellschaften von Jägern und Sammlern labiodentale Laute
(das „f“) in nur 27 % der Häufigkeit findet, die sie in Gesellschaften mit Nahrungsmittelzubereitung
haben. Detaillierte Analysen der Sprachen in Grönland, Afrika und Australien (wo es
noch heute Gesellschaften von Jägern und Sammlern gibt) konnten weiterhin zeigen,
dass es in diesen Gegenden kaum Sprachen gibt, die ein „f“ enthalten und dass in wenigen
Fällen das Vorhandensein von „f“ durch den Kontakt mit Dänen, Deutschen bzw. Engländern
zu erklären ist, und vor allem Lehnwörter aus den entsprechenden Sprachen betrifft.
Um den direkten Nachweis zu führen, dass sich die labiodentalen Laute erst während
der letzten Jahrtausende (aufgrund der geänderten Ernährung) in unsere Sprachen gleichsam
eingeschlichen haben, rekonstruierten die Autoren die Evolution der indoeuropäischen
Sprachfamilie mit den heute hierfür zu Verfügung stehenden Datenbanken und statistischen
Verfahren. Diese große Sprachfamilie erstreckt sich von Island bis ins östliche Indien
und ihr kultureller Hintergrund als auch ihre Entwicklung ist relativ gut bekannt.
Man kennt Lautverschiebungen von einem bilabialen „p“ zu einem labiodentalen „f“ in
Wörtern wie dem italienischen „padre“ und dem englischen „father“. Während im proto-Indoeuropäischen
vor 6000 bis 8000 Jahren die Häufigkeit labiodentaler Laute nach den durchgeführten
Berechnungen 3 % betrug, liegt sie in dieser Sprachfamilie heute bei 76 %.
Tonscherben zeigen frühe Nahrungsmittelproduktion an. Insbesondere in der griechischen
und römischen Antike gab es bereits vor 2300 Jahren wassergetriebene Mühlen und eine
hochentwickelte Nahrungsmittelproduktion. Das vermehrte Auftreten labiodentaler Laute
begann in der Indoeuropäischen Sprachfamilie vor etwa 3500 bis 4500 Jahren, mit einem
steilen Anstieg vor etwa 2500 Jahren. Dies passt zu den Funden von Schädeln erwachsener
Menschen aus Pakistan (4300 Jahre alt), Europa (3600 Jahre alt) und Indien (2400 Jahre
alt) bei denen das Bestehenbleiben des Überbisses sichtbar ist.
Die Autoren fassen ihre Erkenntnisse wie folgt zusammen: „Our findings suggest that
the wane of edge-to-edge bite configuration since the Neolithic gradually facilitated
the emergence and spread of labiodental sounds in languages. Specifically, we find
a substantial difference in labiodental production effort and production stability
between bite configurations, a well-established mechanism of bite change resulting
from wear, a worldwide association between subsistence induced diet differences and
the presence of labiodentals, and a recent increase of labiodentals driven by diet
changes in a large and well studied language family spanning at least six or seven
millennia“ [2], S. e6].
Man kann aus den Befunden auch ableiten, dass der Neandertaler höchstwahrscheinlich
kein „f“ kannte bzw. sprach. Und was geht uns das an? – Man könnte das Ganze als Kuriosität
abtun, wären da nicht die vielen Meinungen zum Wesen der Sprache und zu deren Entstehung
und Entwicklung. Vor dem Hintergrund sehr vieler Vermutungen und „Theorien“, von denen
nicht einmal klar ist, wie sie falsch sein könnten, sind harte Daten zu den Rahmenbedingungen
von Sprache viel Wert. Sie zeigen an, dass man nicht voraussetzen kann, dass ein universales
Lautsystem schon immer vorlag, und – ganz allgemein – dass in ganz vielfältiger Hinsicht
auch kulturelle Entwicklungen eine biologische Grundlage haben können.