Nervenheilkunde 2023; 42(04): 237-242
DOI: 10.1055/a-1948-8993
Geist & Gehirn

Keilschrift, KI und Hermeneutik

Eine aktuelle Darstellung der Zusammenhänge
Manfred Spitzer
 

Über künstliche Intelligenz (KI) wird mittlerweile nahezu täglich in immer neuen Zusammenhängen berichtet. Sie wird auf kleinste und größte Gegenstände, Moleküle und Galaxien angewendet, aber auch auf alles dazwischen, wie archäologische Befunde, mathematische Beweise oder zur Verbesserung der Corona-Grenzkontrollen Griechenlands [1]. Auch über Anwendungen in den Bereichen der Schrift und Sprache sowie der Medizin wurde an dieser Stelle bereits berichtet, nebst gefährlichen Auswirkungen im Bereich des Militärs [2], [3]. Wenn im Folgenden nun erneut KI im Zusammenhang mit Schrift und Sprache diskutiert wird, dann liegt das an einer Reihe bemerkenswerter, hochrangig publizierter Arbeiten zu Themen aus den Altertumswissenschaften, die man zunächst eher nicht erwartet hätte.

Keilschrift

Die Keilschrift[ 1 ] wurde von den Sumerern im Zweistromland vor mehr als 5000 Jahren erfunden und gilt damit als das älteste System zum Festhalten und langfristigen Speichern von Sprache bzw. sprachlichen Gedanken ([ Abb. 1 ]). Im Laufe von mehr als 3000 Jahren wurden mit ihr Texte in etwa einem Dutzend Sprachen meist auf Tontäfelchen geschrieben, indem man mit einem Keil in weichem Ton Eindrücke erzeugte. Erhalten sind jedoch auch in Stein gemeißelte Keilschrift, wie beispielsweise die sehr bedeutsame Behistun-Inschrift ([ Abb. 2a ]). Kaum jemand ist sich darüber im Klaren, dass Keilschrift die wesentliche Schrift während der gesamten ersten Hälfte der Geschichte war; niemand weiß bis heute, warum sie etwa im vierten vorchristlichen Jahrhundert verschwand [8] [ 2 ]; und die Wenigsten wissen, dass es bis zu 10-mal mehr Texte in Keilschrift auf mindestens 600 000 Tontafeln [10] gibt als alle Texte – auf Papyrus, Pergament und in Stein gemeißelt – aus der griechischen und römischen Antike zusammengenommen. Während jedoch die in den entwickelten Ländern verbreitete lateinische und griechische Altphilologie die antiken Texte schon im vorletzten Jahrhundert praktisch komplett übersetzt und zugänglich gemacht hatte, ist das bei den Keilschrift-Texten aus Mesopotamien nicht der Fall. Denn es gibt in den entwickelten Ländern nur jeweils etwa eine Handvoll Personen, die Keilschrift lesen können (in Deutschland sind es etwa 5, in den USA vielleicht etwa 20; um nur die Größenordnung zu benennen [11]). Daher liegt ein großer Teil dieser Texte in Form von Tontafeln in Tausenden von Schubladen gelagert bis heute noch ungelesen in den Museen dieser Welt herum und ist weder übersetzt noch ausgewertet oder gar rezipiert – 165 Jahre, nachdem der Schrift-Code geknackt worden war. Dies ändert sich jedoch seit etwa 2–3 Jahren.

Zoom Image
Abb. 1 Eines der ältesten Schriftstücke überhaupt ist dieses im British Museum ausgestellte Tontäfelchen mit sumerischer Keilschrift, die vor 5100–5200 Jahren geschrieben wurde. Im Text geht es um das Bier, das Arbeiter als Teil ihres täglichen Lohns erhalten. Dies ist nicht ungewöhnlich, behandelten doch die meisten Schriftstücke damals wirtschaftliche und Verwaltungsvorgänge [4], also Rechnungen, Buchungen oder Schuldscheine. Hätte es damals schon Computer gegeben, wäre die Anwendersoftware Excel für fast 1000 Jahre verwendet worden, ehe jemand auf die Idee kam, dafür Word zu verwenden. Erst Enheduanna, die Tochter des ersten akkadischen Königs Sargon und zugleich Priesterin und Schriftstellerin, begann vor etwa 4300 Jahren mit dem Schreiben von Geschichten und Mythen. Sie gilt als erste namentlich bekannte Autorin von Belletristik überhaupt [5]. Quelle: The British Museum, London (UK)
Zoom Image
Abb. 2 Links (a) die Behistun-Inschrift (auch Bisotun-, Bisitun- oder Bisutun-Inschrift genannt) und rechts (b) der Stein von Rosetta (Rosetta Stone). Beide haben bei der Entzifferung der Keilschrift bzw. der Hieroglyphen eine große Rolle gespielt, weil auf ihnen jeweils der gleiche Text in 3 Sprachen/Schriften erhalten ist. Die Behistun-Inschrift ist ein 15 Meter hohes und 25 Meter breites Felsrelief auf einer Klippe am Berg Behistun in der Provinz Kermanshah im heutigen Iran und wurde zwischen 522 und 486 vor Christus vom Perserkönig Darius dem Großen verfasst. Bei der Behistun-Inschrift sind es die Sprachen Altpersisch, Elamitisch und Akkadisch (auch Babylonisch-Assyrisch genannt, weil dies die beiden in der Süd- bzw. Nordhälfte von Mesopotamien gesprochenen Dialekte des Akkadischen waren [12]). Die ersten Kopien des Behistun-Reliefs wurden 1764 angefertigt. Der Rosetta-Stein ist 112,3 cm hoch, 75,7 cm breit, 28,4 cm tief und wiegt 762 kg [13]. Es handelt sich um den erhaltenen Teil einer Stele aus Ägypten, auf der im Auftrag eines Nachfolgers von Alexander dem Großen (Ptolemäus V.) im Jahr 194 vor Christus ein Dekret „publiziert“ worden war. Auf ihm findet sich der gleiche Text in den folgenden 3 Sprachen: oben ägyptische Hieroglyphen, in der Mitte die altägyptische Sprache/Schrift Demotisch und unten Altgriechisch. Die ersten Gipsabdrücke des Steins von Rosetta kursierten bald nach dessen Entdeckung durch einen französischen Soldaten im Jahr 1799; seit 1802 wird das Original im British Museum in London ausgestellt. Quelle Teilabbildung rechts (b): © Özgür Güvenç/stock.adobe.com

Der französische Sprachwissenschaftler Jean-François Champollion entzifferte im Jahr 1822 die Hieroglyphen-Inschrift auf dem Stein von Rosetta ([ Abb. 2b ]). Was dieser Stein für die Entzifferung der ägyptischen Hieroglyphen war, bedeutete die Behistun-Inschrift für die elamitische und akkadische Keilschrift. Wie beim Rosetta-Stein eine der Sprachen, das Altgriechische, noch gut bekannt war (bis heute als Neugriechisch auch gesprochen) und als Bindeglied für das Verständnis von Hieroglyphen wirkte, war es bei der Behistun-Inschrift das noch bekannte Altpersisch. Geschrieben wurde das Altpersische in der persischen Keilschrift, die mit den Keilschriften aus Mesopotamien nur die äußerlichen Zeichenformen (Keile eben) gemein hat. Es ist die jüngste und einfachste Form der Keilschrift mit nur 41 Zeichen, von denen 36 Zeichen für Silben stehen. Aufgrund der Einfachheit der Schrift und dem Erhalt des Persischen als lebendiger Sprache über die Jahrtausende konnte die persische Keilschrift bereits zu Anfang des vorletzten Jahrhunderts entziffert werden. So war es dann bis Mitte des vorletzten Jahrhunderts möglich, auch die elamitische und die akkadische Keilschrift zu entziffern.

Das Problem hierbei ist, dass die Tontafeln, von denen es Zehntausende gibt, oft kaputt und daher unvollständig sind, d. h. es ist Text verloren gegangen ([ Abb. 3 ]). Das stellt die Experten vor das Problem, den vorhandenen unvollständigen Text aufgrund von Informationen aus dem Kontext (ganz wörtlich: es geht um die Wörter um den fehlenden Text herum) zu vervollständigen. Eine solche Aufgabe ist prädestiniert für den Versuch, sie durch KI zu lösen – also dadurch, dass man ein neuronales Netzwerk mit vorhandenen Daten trainiert, um dann mit dem trainierten Netzwerk den Inhalt der Textlücken herauszufinden [10], [15]. Man geht dabei prinzipiell so vor, dass man intakte Tafeln zum Training verwendet, bei denen man einen Teil des Textes für das Netzwerk unsichtbar macht, sodass es anhand der bekannten Lösung lernen kann, diese zu finden. Hierzu bedarf es sehr großer Datenmengen, sodass das Netzwerk dann auch auf Fälle anwendbar wird, die beim Training nicht auftraten.

Zoom Image
Abb. 3 Beispiel einer Tontafel mit akkadischer Keilschrift, die beschädigt ist und damit nur unvollständigen Text enthält [14]. Die Tafel ist Teil des von den Autoren untersuchten Open Richly Annotated Cuneiform Corpus (Oracc), der 10 000 transkribierte und annotierte Tontafeln mit etwa 2,3 Millionen Zeichen enthält. Quelle: © kmiragaya/stock.adobe.com

Und genau das ist bei der akkadischen Keilschrift ein Problem: Zwar gibt es viele Tontafeln, aber es gibt längst nicht genug Text zum Trainieren eines solchen „Lücken-Ergänzungs-Netzwerks“, eben weil viele Tafeln noch nicht übersetzt wurden. Um angesichts der begrenzten Menge vorhandener Tontafeln mit akkadischer Keilschrift das Problem dennoch zu lösen, verwendete ein Team aus Computer-Fachleuten und Archäologen von der Hebrew University of Jerusalem einen Trick. Dieser bestand darin, das Netzwerk zunächst mit 104 anderen Sprachen darin zu trainieren, zuvor unkenntlich gemachten Text durch dessen Kontext wieder zu ergänzen. Erst dann wurde mit akkadischer Keilschrift (in transliterierter Form, also einer Art lateinischer Lautschrift) weiter trainiert, um gewissermaßen nur noch „Finetuning“ des vorhandenen Netzwerks zu betreiben. Dies führte zu einer Erfolgsrate richtiger Ergänzungen von zuvor entfernten, bekannten akkadischen Textstellen von etwa 89 % [14]. Durch den Vergleich verschiedener Modelle fand man, dass das Vortraining mit großen Datensätzen verschiedener Sprachen allein schon ausreichte, um fehlenden Text zu ergänzen, ganz ohne Training des Akkadischen. Das mehrsprachige Training erwies sich sogar als wirksamer im Vergleich zum alleinigen Training mit dem viel kleineren akkadischen Textdatensatz. Anders gesagt: Man kann (zuvor gelöschte) Textstellen in akkadischen Texten besser wiederherstellen (Textlücken ergänzen), wenn man 104 andere Sprachen als Kontext heranzieht, anstatt (nur) alle bekannten akkadischen Texte.

Dass man die Bedeutung von Vorwissen für das Verstehen eines Textteils aus seinem Kontext (also von etwas Einzelnem aus seinem Zusammenhang) einmal empirisch anhand der Funktion neuronaler Netzwerke würde zeigen können – dass man also die Hermeneutik[ 3 ] mittels mathematischer Netzwerkmodelle nachspielt und quantifiziert –, hätte noch vor 10 Jahren niemand für möglich gehalten. Offenbar war das Vortraining mit anderen Sprachen gut geeignet, um semantische Regelmäßigkeiten auch in transliteriertem akkadischem Text zu repräsentieren und damit auch aufzufinden. Schließlich wurde das voll trainierte Netzwerk auf tatsächlich existierende Lücken in akkadischen Text-Tontafeln angewendet und dessen Ergänzungen dann von 2 Assyriologen bewertet. Hierbei zeigte sich, dass das voll (mit anderen Sprachen und dem Akkadischen) trainierte Netzwerkmodell bei der Ergänzung von einem oder 2 fehlenden Wörtern nach Meinung der Experten meist eine plausible Lösung lieferte. Bei der Vorhersage von 3 fehlenden Wörtern war es dann immerhin in jedem zweiten Fall noch erfolgreich. Die Experten waren über die „kreativen“ Lösungen des Netzwerks zuweilen erstaunt: „Manchmal hat das Modell [die Experten] auf einen neuen Gedanken gebracht, auf den sie nicht gekommen sind“, kommentierte der Senior-Autor Gabriel Stanovsky und fuhr fort „Die wichtigste Erkenntnis aus dieser Arbeit ist, dass die Verwendung anderer Sprachen bei der Lösung des Akkadischen wirklich geholfen hat“ [16], denn ohne das Vortraining des Netzwerks mit den 104 anderen Sprachen war dessen Genauigkeit bei der Ergänzung von Textlücken (nach alleinigem Training mit Akkadisch) um fast 30 % geringer.

Das Fazit der Autoren lautet wie folgt: „Wir haben ein auf dem neuesten Stand befindliches Modell für die Vervollständigung fehlender Zeichen in akkadischen Texten vorgestellt, das ein mehrsprachiges Vortraining und eine Feinabstimmung an akkadischen Texten verwendet. […] Schließlich haben wir eine kontrollierte Benutzerstudie durchgeführt, das die Anwendbarkeit des Modells zur Unterstützung von Experten beim Verstehen und Interpretieren gezeigt hat“ (Seite e9 in [14]).


#

Griechisch

Ithaca ist der Name eines im vergangenen Jahr im Fachblatt Nature publizierten tiefen neuronalen Netzwerkmodells zu Ergänzung von Lücken in altgriechischen Texten, das von einem Team von Wissenschaftlern entwickelt wurde, die aus Fachgebieten und Institutionen kommen, die verschiedener und illustrer kaum sein könnten: Die Londoner KI-Firma DeepMind, das Department of Humanities an der Ca’ Foscari Universität von Venedig, das Zentrum für Hellenic Studies der Harvard University, das Department of Informatics an der University of Economics and Business in Athen und die Faculty of Classics an der Universität Oxford. Das von ihnen aufgegriffene Problem beschreiben die Autoren wie folgt: „Die antike Geschichte stützt sich auf Disziplinen wie die Epigrafik, d. h. auf das Studium von Inschriften, um auf das Denken, die Sprache, die Gesellschaft und die Geschichte vergangener Zivilisationen zu schließen. Im Laufe der Jahrhunderte wurden jedoch viele Inschriften so stark beschädigt, dass sie unleserlich wurden, sie wurden an weit von ihrem ursprünglichen Standort entfernte Orte transportiert, und das Datum, an dem sie geschrieben wurden, ist mit einer erheblichen Unsicherheit behaftet“ (Seite 280 in [17]). Das Ergänzen von Inschriften ([ Abb. 4 ]) sowie ihre zeitliche und örtliche Einordnung ist eine Aufgabe, die Altphilologen beschäftig, seit es die klassische Philologie (Latinistik und Gräzistik) gibt, also seit etwa 220 Jahren [18].

Zoom Image
Abb. 4 Beispiel für die Restauration einer griechischen Inschrift. Quelle: Assael Y, Sommerschield T, Shillingford B et al. Restoring and attributing ancient texts using deep neural networks. Nature 2022; 603: 280–283. DOI: 10.1038/s41586-022-04448-z

Was eine langwierige und sehr komplexe Aufgabe von Fachgelehrten war, wurde mit der gerade genannten Arbeit aus dem vergangenen Jahr mittels KI angegangen – mit spektakulärem Erfolg. Schon lange verwendete man Computer, um bestimmte Wörter oder Wortgruppen in antiken Texten wie beispielsweise der Bibel zu finden. Man sprach dabei von „string matching“, das jedoch nicht immer gut funktioniert, weil es anfällig ist gegenüber kleinen Abweichungen, beispielsweise in Texten, die von verschiedenen Personen übersetzt wurden. Erst seit wenigen Jahren werden in der klassischen Philologie hierzu neuronale Netzwerke verwendet [19].

Das von Assael und Mitarbeitern entwickelte Netzwerkmodell wurde mit griechischen Inschriften trainiert, die vom siebten vorchristlichen bis ins fünfte nachchristliche Jahrhundert stammen. Das Modell konnte beschädigte Inschriften mit einer Genauigkeit von 62 % rekonstruieren ([ Abb. 5 ]), wohingegen Historiker nur eine Genauigkeit von 25 % erreichten. Ähnlich wie in der Dermatologie oder Radiologie wurde das beste Ergebnis – eine Genauigkeit von 72 % – erzielt, wenn das Netzwerk von Historikern verwendet wurde. Das Netzwerk konnte zudem Inschriften mit einer Genauigkeit von 71 % ihrem ursprünglichen Standort zuordnen und sie mit einer Genauigkeit von weniger als 30 Jahren datieren.

Zoom Image
Abb. 5 Diese Abbildung aus Roueché 2022, Seite 235 [20] (basierend auf erweiterten Daten aus [17]), zeigt sehr eindrücklich, wie gut künstliche Intelligenz (KI) beim Entschlüsseln von alten Schriften helfen kann. Die Lücken in einer transkribierten griechischen Inschrift (links) wurden von der KI Ithaca ergänzt und stimmten mit den bereits vorliegenden Ergänzungen (rechts) von Altphilologen weitgehend überein (blau unterlegter Text). Nur bei den rot unterlegten Textstellen wich Ithaca von den Experten ab.

Die Arbeit zeigt, dass neuronale Netzwerke durchaus in der Lage waren, Texte des klassischen Athens besser zu datieren als Experten auf dem Gebiet der Altphilologie. Ganz prinzipiell kann damit KI wichtige Beiträge zu aktuellen Forschungsbemühungen im Bereich der Antike (Geschichte, Archäologie, alte Sprachen und damit auch Linguistik und Philologie allgemein) leisten. KI wird also Philologen nicht ersetzen. Aber Philologen, die keine KI verwenden, werden auf Dauer durch Philologen, die KI verwenden, ersetzt werden[ 4 ]. Für Archäologen gilt das Gleiche, erlaubt doch KI auch in diesem Bereich die genauere und vorurteilsfreiere Klassifikation unterschiedlichster Funde wie etwa prähistorische Steinwerkzeuge oder vulkanisches Glas [23], [24] [ 5 ].


#

Hermeneutik

Charlotte Roueché beendet ihren ebenfalls in Nature publizierten Kommentar zur Arbeit von Assael et al. [17] wie folgt: „Das Training von Ithaca erfolgte mit einem Datensatz, der von der Wissenschaft bereitgestellt wurde. Durch Ithaca werden bereits vorhandene Analyseprinzipien erweitert. Die Konfrontation und das Arbeiten mit diesem Werkzeug dürften bedeutsame neue Erkenntnisse hervorbringen, sollten jedoch zudem den Wissenschaftlern helfen, ihre eigenen Gedanken besser zu verstehen. Der Einsatz von KI wird den Wissenschaftler nicht überflüssig machen, sondern vielmehr sein Verständnis dessen, was er zu wissen glaubte, infrage stellen“. Was hier schlicht und unscheinbar formuliert ist, bedeutet nichts weniger, als dass KI einen genuin neuen und eigenen Beitrag zum hermeneutischen Zirkel, der bis heute als Grundmodell des verstehenden Arbeitens in der Philologie gilt, leisten kann.

Bislang ging es in der Hermeneutik um die Erfahrungen des Einzelnen. Wer einen Text oder irgendeinen anderen Sachverhalt verstehen möchte, muss ihn in dessen Kontext betrachten, was wiederum voraussetzt, dass man den Text/Sachverhalt schon kennt. So entsteht ein Widerspruch – um X zu verstehen, muss man X schon verstanden haben. Erstmals wurde dieser Widerspruch als Zirkel wahrscheinlich vom klassischen Philologen Friedrich Ast (1778–1841) in der Schrift „Grundlinien der Grammatik, Hermeneutik und Kritik“ aus dem Jahr 1808 (Seite 179) [26] bezeichnet: „[…] wie ist es möglich, da wir immer nur das eine nach dem anderen, nicht aber das Ganze zu gleicher Zeit auffassen können, das Einzelne zu erkennen, da dieses die Erkenntnis des Ganzen voraussetzt? Der Zirkel, dass ich a, b, c und so weiter nur durch A erkennen kann, aber dieses A selbst wieder nur durch a, b, c usf., ist unauflöslich […].“

In [ Abb. 6 ] ist das Ganze anhand eines einfachen Beispiels verdeutlicht. Die meisten Leute lesen „THE CAT“ und merken gar nicht, dass die beiden mittleren Buchstaben der beiden Wörter optisch identisch sind, also erst durch den Kontext (die beiden jeweils links und rechts stehenden Buchstaben) disambiguiert werden. Erst wenn ich den Satz „THE CAT“ gelesen habe, kann ich wissen, dass der zweite Buchstabe ein „H“ und der fünfte Buchstabe ein „A“ ist. Um den Satz zu lesen, muss ich aber zuerst alle 6 Buchstaben des Satzes gelesen haben. Um Ast zu paraphrasieren: „Der Zirkel, dass ich T, H und E sowie C, A und T nur durch „THE CAT“ erkennen kann, aber dieses „THE CAT“ selbst wieder nur durch die einzelnen Buchstaben, ist unauflöslich.“

Zoom Image
Abb. 6 Die meisten Menschen lesen „THE CAT“. Das „H“ und das „A“ sind jedoch identisch.

Der Widerspruch lässt sich auflösen, wenn man erstens den Faktor Zeit und zweitens inkomplettes Verstehen ins Spiel bringt: Man fängt eben irgendwo an – beim Text meistens vorne und bei irgendwelchen Zusammenhängen irgendwo – und versteht ein bisschen. Dieses Bisschen, das man verstanden hat, ermöglicht neue Bezüge, neue Einordnungen und damit neue Fragen, deren Beantwortung weiteres Verstehen bewirkt. Und so geht es weiter. Allgemeine Zusammenhänge kann man nur verstehen, wenn man zuvor Beispiele für den Zusammenhang kennengelernt hat (um zu erkennen, dass Vögel fliegen und Fische schwimmen, muss man verschiedene einzelne Vögel und Fische beobachtet haben). Man versteht also Allgemeines nur über Einzelnes. Dieses Einzelne versteht man wiederum durch das Allgemeine besser. Vögel fliegen nicht nur, sondern haben Federn, eine bestimmte Anatomie und legen Eier. So entdeckte man, dass Pinguine zwar nicht fliegen, aber sehr gut schwimmen können, es sich bei ihnen aber dennoch um Vögel handelt. Bei fliegenden Fischen, die innerhalb von 30 Sekunden bis zu 400 Meter weit fliegen können, handelt es sich hingegen tatsächlich um Fische.

Weil der Löwenanteil des Wissens der meisten Menschen nicht durch eigene Erfahrungen, sondern durch das Lesen von Texten, generiert wird, ist es für jede Theorie darüber, wie Textverstehen überhaupt funktioniert, sehr wichtig, dass dieses prinzipiell auf die gleiche Weise abläuft. Aus einem Text lernen wir bestimmte Einzelheiten und Zusammenhänge, die wir in anderen Texten bestätigt sehen oder zu denen wir Widersprüche finden. Beides bringt uns weiter, und wieder verstehen wir erst ein bisschen und dann immer mehr – und den Wechsel zwischen dem Verstehen von Einzelnem und Allgemeinem gibt es ebenso wie beim Verstehen von sachlichen Zusammenhängen.

Gewiss profitiert geschichtlich und faktisch gesprochen jeder Einzelne immer vom Austausch mit anderen. Je weiter man kommt, desto mehr schätzt man diesen Austausch, weswegen Experten am liebsten mit anderen Experten des gleichen Fachgebietes diskutieren. Das ist für sie am ergiebigsten und am spannendsten. Aus diesem Grund war Wissenschaft schon immer eine gemeinschaftliche Institution. Der Prozess des Verstehens blieb jedoch prinzipiell – trotz gemeinschaftlicher Erarbeitung – beim Einzelnen und dessen Kapazität hierfür.

Mit der Verfügbarkeit von KI ist seit einigen Jahren neu, dass gleichsam eine Art Obergrenze des möglichen Verständnisses eines bestimmten Bereichs (z. B. der Keilschrift oder sämtlicher Texte der griechischen Antike) produziert werden kann. Die KI liest einfach alles, und stellt Zusammenhänge zwischen allem her, die unabhängig sind von den Zufällen (und der Begrenztheit) eines menschlichen Lebens. Daher kann sie das Verstehen bei einem einzelnen Menschen nicht nur gezielter und nachvollziehbarer hinterfragen als andere Experten, sondern sogar besser als dieser selbst. Die KI wird daher zu einem genuin eigenen und neuen Teil des philologischen Geschäfts. Sie kann beispielsweise vor Fehlern (oder ganzen, erkenntnismäßigen Sackgassen) bewahren. Sie kann sogar prinzipiell echten Fortschritt im Erkenntnisprozess anzeigen, weil sie „Sackgassen“ (Nebenmaxima in einer Karte von Vorhersagewahrscheinlichkeiten) identifizieren kann.

Damit ist keineswegs behauptet, dass ein Kasten, in dessen Siliziumchips Synapsen-Gewichts-Vektoren mit Milliarden Parametern implementiert sind (und der dadurch Keilschrift oder griechische Inschriften zu ergänzen vermag), irgendetwas „versteht“. Aber ein Philologe kann mithilfe dieses Werkzeugs seine Arbeit nicht nur viel schneller, sondern zuweilen sogar besser leisten als ohne ihn. Und der Kasten entwickelt tatsächlich selber neue Hypothesen, auf die der Gelehrte aufgrund seines begrenzten Wissens nie gekommen wäre.

Die Philologie oder die Hermeneutik hören ebenso wenig auf zu existieren, weil es KI gibt, wie die Mathematik, die Chemie oder die Radiologie aus dem gleichen Grund aufhören werden, zu existieren. Aber KI ist dabei, ein Bestandteil von Wissenschaft zu werden, ebenso wie die Schrift und der Buchdruck nach ihrer Erfindung ein Bestandteil der Wissenschaft wurden – nicht mehr, aber auch nicht weniger.


#
#

Interessenkonflikt

Es besteht kein Interessenkonflikt.

1 Sie war in der Nervenheilkunde bereits vor etwa 3 Jahren Thema [6].


2 Die letzten Texte wurden im ersten vorchristlichen Jahrhundert verfasst, als die Keilschrift längst bedeutungslos war, was sicherlich mit einer Verschiebung des Machtzentrums der Region Südosteuropa und angrenzendem Orient von Mesopotamien nach Griechenland zur Zeit Alexanders des Großen in Verbindung steht. Man beachte jedoch, dass Schriften nicht für eine Weile leben und dann aussterben. Ähnlich wie Sprachen handelt es sich vielmehr um dynamische, ständig im Wandel befindliche Systeme, die lediglich uns Menschen so „fest“ bzw. „unwandelbar“ erscheinen, weil wir – obwohl es Sprache und Schrift ohne uns nicht gäbe – zu schnell leben, um deren Veränderungen zu erfahren. Ähnlich wie man die Bewegung von Gletschern nur in Zeitraffer-Filmen sieht, erkennt man die Veränderungen von Sprache und Schrift nur durch Vergleiche über Jahrhunderte bis Jahrtausende [7]–[9].


3 Hermeneutik nennt man die Theorie der Interpretation von Texten und des Verstehens von Sachzusammenhängen. Die hier skizzierten Probleme von Allgemeinem (Ideen) und Einzelnem (Dingen) wurden bereits in der griechischen Antike diskutiert. Die Problematik des Verstehens von Texten mithilfe von Kontexten und interner Konsistenz ist noch älter und kommt in den ältesten religiösen Texten vor. Als Theorie des Verstehens im Sinne einer Theorie von dessen Auftreten beim einzelnen Menschen (Psychologie) oder beim gemeinschaftlichen Erörtern einer Expertengruppe (Erkenntnis- und Wissenschaftstheorie) entwickelte sich das Verstehen des Vorgangs des Verstehens in der Philosophie bis heute weiter. Die Bezeichnung „Hermeneutik“ ist dagegen erst etwa 400 Jahre alt. Man findet dazu in Wikipedia die Auskunft, dass der deutsche lutherische Theologe, Hochschullehrer und Dichter Johann Conrad Dannhauer (1603–1666) das Wort erstmals in einem Buchtitel verwendet haben soll. Wie im Haupttext erwähnt, ist der „hermeneutische Zirkel“ erst knapp 200 Jahre jung.


4 Mit diesen Sätzen wiederhole ich nur, was in anderen Bereichen schon gesagt wurde: In einer Arbeit über die KI „Chematica“ wird der MIT-Chemiker Derek Lowe wie folgt zitiert: „AIs will not replace chemists. But chemists that use AIs will replace chemists that don’t“ [21]. In einer Übersicht zu KI in der Radiologie wird Dr. Felix Nensa, Radiologe am Institut für diagnostische und interventionelle Radiologie und Neuroradiologie der Universität Essen, wie folgt zitiert: „AI will not replace the radiologist. Rather, radiologists who do not use AI will be replaced by those who do” [22].


5 Ein eindrucksvolles Beispiel hierfür ist eine Folgearbeit von Grove und Brinkhorn [25], in der deutlich wird, wie die Verwendung von KI ganz grundlegende Fragen bei der Interpretation von Funden neu aufwirft. Welche Ordnungsprinzipien und Klassifizierungssysteme (Taxonomien) sollten verwendet werden, wie ist eine „Grabungsstelle“ überhaupt definiert usw. [25].



Korrespondenzadresse

Prof. Dr. Dr. Manfred Spitzer
Universität Ulm
Abteilung für Psychiatrie
Leimgrubenweg 12–14
87054 Ulm
Deutschland

Publikationsverlauf

Artikel online veröffentlicht:
06. April 2023

© 2023. Thieme. All rights reserved.

© Georg Thieme Verlag KG
Stuttgart · New York


Zoom Image
Abb. 1 Eines der ältesten Schriftstücke überhaupt ist dieses im British Museum ausgestellte Tontäfelchen mit sumerischer Keilschrift, die vor 5100–5200 Jahren geschrieben wurde. Im Text geht es um das Bier, das Arbeiter als Teil ihres täglichen Lohns erhalten. Dies ist nicht ungewöhnlich, behandelten doch die meisten Schriftstücke damals wirtschaftliche und Verwaltungsvorgänge [4], also Rechnungen, Buchungen oder Schuldscheine. Hätte es damals schon Computer gegeben, wäre die Anwendersoftware Excel für fast 1000 Jahre verwendet worden, ehe jemand auf die Idee kam, dafür Word zu verwenden. Erst Enheduanna, die Tochter des ersten akkadischen Königs Sargon und zugleich Priesterin und Schriftstellerin, begann vor etwa 4300 Jahren mit dem Schreiben von Geschichten und Mythen. Sie gilt als erste namentlich bekannte Autorin von Belletristik überhaupt [5]. Quelle: The British Museum, London (UK)
Zoom Image
Abb. 2 Links (a) die Behistun-Inschrift (auch Bisotun-, Bisitun- oder Bisutun-Inschrift genannt) und rechts (b) der Stein von Rosetta (Rosetta Stone). Beide haben bei der Entzifferung der Keilschrift bzw. der Hieroglyphen eine große Rolle gespielt, weil auf ihnen jeweils der gleiche Text in 3 Sprachen/Schriften erhalten ist. Die Behistun-Inschrift ist ein 15 Meter hohes und 25 Meter breites Felsrelief auf einer Klippe am Berg Behistun in der Provinz Kermanshah im heutigen Iran und wurde zwischen 522 und 486 vor Christus vom Perserkönig Darius dem Großen verfasst. Bei der Behistun-Inschrift sind es die Sprachen Altpersisch, Elamitisch und Akkadisch (auch Babylonisch-Assyrisch genannt, weil dies die beiden in der Süd- bzw. Nordhälfte von Mesopotamien gesprochenen Dialekte des Akkadischen waren [12]). Die ersten Kopien des Behistun-Reliefs wurden 1764 angefertigt. Der Rosetta-Stein ist 112,3 cm hoch, 75,7 cm breit, 28,4 cm tief und wiegt 762 kg [13]. Es handelt sich um den erhaltenen Teil einer Stele aus Ägypten, auf der im Auftrag eines Nachfolgers von Alexander dem Großen (Ptolemäus V.) im Jahr 194 vor Christus ein Dekret „publiziert“ worden war. Auf ihm findet sich der gleiche Text in den folgenden 3 Sprachen: oben ägyptische Hieroglyphen, in der Mitte die altägyptische Sprache/Schrift Demotisch und unten Altgriechisch. Die ersten Gipsabdrücke des Steins von Rosetta kursierten bald nach dessen Entdeckung durch einen französischen Soldaten im Jahr 1799; seit 1802 wird das Original im British Museum in London ausgestellt. Quelle Teilabbildung rechts (b): © Özgür Güvenç/stock.adobe.com
Zoom Image
Abb. 3 Beispiel einer Tontafel mit akkadischer Keilschrift, die beschädigt ist und damit nur unvollständigen Text enthält [14]. Die Tafel ist Teil des von den Autoren untersuchten Open Richly Annotated Cuneiform Corpus (Oracc), der 10 000 transkribierte und annotierte Tontafeln mit etwa 2,3 Millionen Zeichen enthält. Quelle: © kmiragaya/stock.adobe.com
Zoom Image
Abb. 4 Beispiel für die Restauration einer griechischen Inschrift. Quelle: Assael Y, Sommerschield T, Shillingford B et al. Restoring and attributing ancient texts using deep neural networks. Nature 2022; 603: 280–283. DOI: 10.1038/s41586-022-04448-z
Zoom Image
Abb. 5 Diese Abbildung aus Roueché 2022, Seite 235 [20] (basierend auf erweiterten Daten aus [17]), zeigt sehr eindrücklich, wie gut künstliche Intelligenz (KI) beim Entschlüsseln von alten Schriften helfen kann. Die Lücken in einer transkribierten griechischen Inschrift (links) wurden von der KI Ithaca ergänzt und stimmten mit den bereits vorliegenden Ergänzungen (rechts) von Altphilologen weitgehend überein (blau unterlegter Text). Nur bei den rot unterlegten Textstellen wich Ithaca von den Experten ab.
Zoom Image
Abb. 6 Die meisten Menschen lesen „THE CAT“. Das „H“ und das „A“ sind jedoch identisch.