Ansichten eines Informatikers

Präteritum

Hadmut
17.5.2023 19:22

Ein Seiteneffekt der KI.

Ich hatte doch gerade eben diesen Zeitungsartikel angesprochen, der vom Computer, anscheinend KI, erzeugt wurde.

Ein Leser findet ihn nicht gut:

Gut ist der Text wirklich nicht, ich finde ihn aber auch nicht schlechter als das, was Menschen oft abliefern. So ist der Text nicht gegendert, und Gendersprache ist ja schon ziemlich bescheuert.

Ich will aber auf etwas ganz anderes hinaus:

Menschen orientieren sich – in unterschiedlicher Gewichtung und Mischung – sowohl an Schriftsprache, als auch an gesprochener Sprache. Heute kommen noch das Social Media-Gequatsche und Emojis dazu. Es gab auch mal eine Zeit, als Comic-Sprache üblich war, und man nicht schrieb „Ich wundere mich, dass…“ sondern „*wunder*“, als wäre man ein Comic-Strip aus Entenhausen und Donald Duck persönlich. Dann kamen irgendwann die Abkürzungen aus IRC in die Sprache, und heute quatschen die Leute in 140- und 280-Zeichen-Sätzen. Viele Amerikaner können beispielsweise „for“ und „4“ oder „and“, „&“ und „+“ sprachlich nicht mehr unterscheiden.

Und so manchen Menschen oft den Fehler, zu schreiben, wie man spricht. Manchmal tue ich das auch im Blog hier, meist aber absichtlich. Ich mag es einfach, meine Kritik dahinzuschnoddern. Es ist so herrlich geringschätzig. Ausgefeilte, gute Sprache ist schön, und liest sich auch gut, ist aber beim Lesen anstrengend und wird in ihrer Monotonie auch irgendwann langweilig.

Es ist eine Frage der Abwägung, des richtigen Mischungsverhältnisses, der Abwechslung und der dem Inhalt angemessenen Wortwahl.

KI-Systeme werden – derzeit – aber fast nur auf Schriftsprache trainiert. Gut, nicht alle. Es gibt ja auch die KI-Systeme, die gesprochene Sprache verstehen und beispielsweise Videos automatisch untertiteln. Aber texterzeugende Systeme wie etwa ChatGPT werden mit Schriftsprache-Texten trainiert. Und deshalb erzeugen sie Text, der nach Schriftsprache gebaut ist und der Komponente der gesprochenen Sprache weitgehend, weitestgehend entbehrt.

Und deshalb erscheint uns dieser Text irgendwie schräg, komisch, weil er Gebrauch von Imperfekt/Präteritum macht, das in der deutschen Umgangssprach kaum noch vorkommt. Caesar sagte noch veni, vidi, vici, „Ich kam, ich sah, ich siegte“. Heute heißt es „Ich habe sie gesehen, habe sie besiegt und bin gekommen“. Was auch damit zusammenhängt, dass das Imperfekt oder Präteritum eine vergangene, nicht mehr fortgeführte Handlung ohne konkretes Ergebnis beschrieb, während das Perfekt eher Wert auf das in der Gegenwart vorliegende Ergebnis einer abgeschlossenen Handlung legt. Was haben sie am Dienstag um 10 gemacht? Ich baute an meinem Haus. Heißt: Ergebnis egal, es geht darum, was ich am Dienstag gemacht habe. Ich habe mein Haus gebaut. Heißt: Ich habe es selbst gemacht und geschafft, da steht es. Deshalb, nämlich weil man viel öfter über Handlungen mit Ergebnis mit Gegenwartsbezug erzählt, und weil es grammatikalisch einfacher ist, redet man umgangssprachlich fast nur im Perfekt.

KI tut sich schwer damit, den Inhalt der Erzählung sachlich zu verstehen und zu bedenken. Sie erzählt nicht, was das Ergebnis ist. Sie sagt nicht, ob die Täter Erfolg hatten oder dass die Bedrohten traumatisiert und die Autos beschädigt sind. Sie betreibt eine trockene Nacherzählung, wie damals im Deutschunterricht für den Aufsatz gelernt. Was ist an dem Tag zu diesem Zeitpunkt passiert, eins nach dem anderen. Deshalb Präteritum.

Das ist an sich sogar richtig, aber es wirkt seltsam auf uns, weil wir uns an eine nachlässige Umgangssprache gewöhnt haben.

Und ein menschlicher Autor wird auch nicht völlig monoton und langweilig einen Stil durchziehen, sondern immer wieder mal wechseln, Perfekt und Präsens einstreuen. Der bedrohte Fahrer ist traumatisiert und befindet sich in Betreuung. Scheißegal, aber sprachlich war eine Auflockerung und ein gedanklicher Gang in die anderen Zeitformen nötig und eine Betrachtung des Ergebnisses. Auf die geschaffenen Tatsachen. Auf den Gegenwartsbezug, denn der ist für uns wichtig. Deshalb wird ein menschlicher Autor immer auch andere Zeitformen einstreuen, etwa Futur verwenden, was der einzige Zweck dieses ansonsten völlig nichtssagenden Satzes hier ist, weil mir gerade nichts Besseres einfiel, um ein Futur unterzubringen.

Es wird nicht lange dauern, und wir werden da auch verschiedene Stilrichtungen vorfinden.

Beispielsweise könnte man KI-Systeme ausschließlich auf Texte des Mittelalters oder vor 1900 trainieren. Oder auf die 1950er Jahre. Es gibt ja noch große Archive alter Schriften, etwa im Vatikan. Man könnte beispielsweise eine Zeitung produzieren, die die Nachrichten im Stil mittelalterlicher Mönche berichtet.