Ein riesiger Durchbruch beim Übersetzen nicht mehr genutzter Sprachen war der Stein von Rosetta, der das Fragment einer ägyptischen Stele ist. Dessen Besonderheit: Er enthält eine mehrsprachige Aufschrift in ägyptischen Hieroglyphen, der Demotischen Kursivschrift der Ägypter – und in Altgriechisch. Dank der griechischen Version konnten auch die anderen Versionen entschlüsselt werden. Auch von anderen verlorenen Sprachen gibt es nach wie vor Schriftzeugnisse – jedoch ohne Übersetzungsschlüssel. Moderne KI soll stattdessen diese Rolle übernehmen. In diesem Artikel betrachten wir die aktuellen Möglichkeiten genauer.
Die Geschichte der Sprachen und Schriftsprachen
Nicht jede gesprochene Sprache hat auch eine zugehörige Schrift. Die ältesten bisher gefundenen Schriftzeugnisse stammen aus China und werden auf etwa 6.600 v. Chr. datiert. Schon vor mehr als 8.000 Jahren also nutzten Menschen Schrift: in diesem Fall als Grabbeigabe und in Schildkrötenpanzer geritzt. Es handelt sich hierbei um eine Art Bilderschrift, die mit Symbolen arbeitet.
Häufig wurden Bildschriften im Laufe der Zeit weiter abstrahiert und konnten sich teils von Wort- zu Silbenschriften weiterentwickeln.
Ein Alphabet, das sich auf Laute gründet, wurde vor rund 3.100 Jahren von den seereisenden Phöniziern erfunden. Auf diese, 22 Zeichen umfassende Schriftsprache, gründen sich sowohl die aramäische, die hebräische als auch die arabische Schrift.
Doch es gibt viele alte Zivilisationen, die vermutlich keine Schrift nutzten – oder von denen keine Schriftzeugnisse erhalten sind. Das betrifft insbesondere die Inka (hier gab es allerdings Knotenschnüre, mit denen Zahlen übermittelt wurden).
Welche antiken Schriften sind bislang nicht übersetzbar?
Es gibt einige antike Hochkulturen, die Schriftzeugnisse hinterlassen haben, die wir heute noch nicht übersetzen können.
Dazu gehören:
- Indus-Schrift: Überliefert auf Keramiken, vermutlich eine Mischung aus Bild- und Silbenschrift, ca. 4.000 – 5.000 Jahre alt
- Linear A: Schrift der Minoer auf Kreta, vermutlich auf Silbenbasis, genutzt vor rund 2.000 bis 4.000 Jahren
- Rongorongo: Schrift der polynesischen Kultur auf der Osterinsel, vermutlich mit religiösem oder rituellem Hintergrund, erhaltene Holzschrifttafeln stammen wahrscheinlich aus dem 18. Jahrhundert
Warum wünschen wir uns Übersetzungen?
Wir Menschen möchten begreifen und verstehen – und derartige Schriftzeugnisse könnten uns nicht nur Informationen über Warenlisten oder Steuern geben, sondern uns die Lebensweise früherer Völker besser verstehen lassen.
Mit sogenannten „Bilingues“ wie dem Stein von Rosetta kann uns das gelingen. Die dadurch gewonnenen Erkenntnisse können dann auf weitere Schriftzeugnisse übertragen werden, um diese lesen zu können. Ein umfassendes Bild des Lebens zu früheren Zeiten oder in anderen Regionen der Welt erhalten wir dadurch oft trotzdem nicht, denn oft wurden nur administrative Dinge verschriftlicht, keine Geschichten, Alltagserlebnisse oder religiöse Rituale.
Wie soll KI die Schriftzeichen entschlüsseln?
Der große Vorteil von KI ist, dass hier große Mengen an Daten durchsucht und abgeglichen werden können. Anhand statistischer Methoden können beispielsweise Pendants zum Rosetta-Stein gefunden und somit verloren geglaubte Sprachen entziffert werden.
Dabei ist unter Wissenschaftlern aber klar: Eine schnelle Übersetzung wie mit einer Übersetzungs-App für moderne Sprachen ist nicht möglich. Es geht vorrangig darum, Fragmente und Elemente bekannter und unbekannter Schriften, oft aus dem gleichen Kulturraum, miteinander zu vergleichen und somit Anhaltspunkte für eine Deutung zu finden.
Problematisch sind dabei typischerweise mehrere Punkte:
1) Fehlende Schriftzeugnisse
Für viele frühe Schriftsprachen gibt es nur noch wenige erhaltene Zeugnisse. Das kann am verwendeten Material liegen – Blätter oder andere organische Materialien sind naturgemäß weniger beständig als Stein oder gebrannte Schrifttafeln. Das erschwert natürlich ein Verständnis.
KI kann aber dort helfen, wo nur noch Fragmente vorhanden sind – oder wo diese zusammengesetzt werden müssen, beispielsweise bei Scherben.
2) Fehlender nachvollziehbarer Inhalt
Listen, die vorrangig Zahlen beinhalten, können meist schlechter interpretiert oder verstanden werden, als Fließtexte, die vielleicht Chroniken oder Dekrete beinhalten. Je mehr wir ohnehin über bestimmte Kulturen wissen, umso leichter kann uns das Verständnis von Schriftzeugnissen fallen. Andersherum interpretieren wir Inhalte aber immer durch unsere Prägung – und der Computer gar nicht. Es braucht also immer menschlichen Input, um Inhalte zu deuten oder Vermutungen anzustellen.
3) Fehlende Digitalisierung
Woran zur Entschlüsselung per KI gearbeitet werden muss, ist die Digitalisierung der alten Schriftzeugnisse. Im Falle der Khipus der Inka (Knotenschnüre) wurden diese teils zur Zeit der spanischen Kolonialisierung als Beweise vor Gericht genutzt. Die aus dieser Zeit erhaltenen Gerichtsprotokolle müssen digitalisiert und mit – ebenfalls standardisierten und nutzbaren – Daten der noch erhaltenen Khipus abgeglichen werden.
Mithilfe von KI können Wissenschaftler teils gezielter arbeiten oder sich auf bestimmte Teilaufgaben konzentrieren, während Berechnungen oder Abgleiche computergestützt ablaufen. KI ist also schon jetzt eine Arbeitserleichterung für Archäologen, die jedoch auch dort nicht – ähnlich wie bei Übersetzern – die Arbeit der Profis ersetzt, sondern lediglich ergänzt und teilweise beschleunigt.
Quellen:
- Rafael Dos Santos: „Kann künstliche Intelligenz verlorene Sprachen entziffern?“ in Trusted Translations, abgerufen unter https://www.trustedtranslations.com/de/blog/kann-kuenstliche-intelligenz-verlorene-sprachen-entziffern, zuletzt am 05.11.2024.
- Marco Faisst: „Wie KI bei der Erkennung von Hieroglyphen hilft“ in Aktuelle Themen: KI – Hochschule der Medien Stuttgart, abgerufen unter https://ai.hdm-stuttgart.de/downloads/student-white-paper/Sommer-2022/KI_Hieroglyphen.pdf, zuletzt am 05.11.2024.
- Matthias Heine: „Diese alten Schriften sind noch immer ein Rätsel“ in Welt, abgerufen unter https://www.welt.de/kultur/article175646706/Linear-A-Vinca-Meroitisch-Rongorongo-Raestelhafte-alte-Schriften.html, zuletzt am 05.11.2024.
- Vera Pache: „Im Reiche der Knotenschnüre“ in Deutschlandfunk, abgerufen unter https://www.deutschlandfunk.de/der-vergessene-code-der-inka-im-reich-der-knotenschnuere-100.html, zuletzt am 05.11.2024.
- Paul Rincon: „‘Earliest writing‘ found in China“ in BBC News, abgerufen unter http://news.bbc.co.uk/2/hi/science/nature/2956925.stm, zuletzt am 05.11.2024.
- Volkart Wildermuth: „Mit künstlicher Intelligenz in die Töpfe Babylons schauen“ in Deutschlandfunk, abgerufen unter https://www.deutschlandfunk.de/ki-kuenstliche-intelligenz-uebersetzung-keilschrift-babylon-100.html, zuletzt am 05.11.2024.