Hadmut Danisch

Ansichten eines Informatikers

„colossal information“: KI als Wissenschafts-Ghostwriter

Hadmut
3.9.2021 22:31

Sie meinen, Hunderte wissenschaftliche Veröffentlichungen seien nur Schrott aus der KI-Spritze.

Das ging ja schon vor 30 Jahren um, als ich noch im Studium war. Damals war das noch so, dass in jedem Supermarkt im Zeitungsregal eine ganze Reihe von A5-großen Heftchen mit irgendwelchen Herz-Schmerz- und Schicksalsromanen zu kaufen waren, gern mit irgendwelchen Rosen-Ranken verziert. Damals schon ging das Gerücht, dass die mit Softwareunterstützung geschrieben wären, später dann ab und zu ganz aus dem Computer kämen, das merke längst niemand mehr (oder zumindest störe es nicht).

Zeitungsartikel wie Sportkommentare oder Börsennachrichten werden ja auch schon automatisch erstellt. Ich glaube, von Wetterberichten sagten sie das auch mal irgendwo.

Die NZZ meint nun, auch wissenschaftliche Artikel würden inzwischen häufig von Computern per KI erstellt.

Das würde mich nicht wundern, denn die meisten Papers und in manchen Bereichen auch alle haben weit mehr Autoren auf dem Titelblatt gelistet als sie Leser haben. Autoren eingeschlossen, viele wissen oft nicht, was im Paper steht, und manche wissen nicht, dass sie Autor sind. Der ganze Mist vergammelt in den Bibliotheken und Verlage verdienen sich dumm und dämlich daran, Text massenweise auf Papier zu drucken, obwohl sie niemand jemals lesen wird.

Und viele „wissenschaftliche“ Texte sind so doof, so dämlich, so dumm, dass sie niemals jemand außerhalb derer Zitierkartelle jemals läse oder lesen wollte. Der ganze Genderschrott zum Beispiel, alles so schrecklich dämlich. Und das Philosophengeschwurbel ist so verschwurbelt, weil die nicht wollen, dass das jemand lesen kann, sonst würde man ja merken, dass ihnen nichts von Gehalt einfällt.

Nun sei aber aufgefallen, dass sich KI gelegentlich bei den Begriffen vertut, weil sie zwar sinnähnliche, aber doch kurios verschobene Begriffe wählen würde:

Der Mathematiker Alexander Magazinov las vor einigen Monaten spätabends ein Fachmagazin. «Was zum Kuckuck ist ‹colossal information›, ‹discourse acknowledgement› (direkt übersetzt: Diskursbestätigung) oder ‹counterfeit consciousness› (falsches Bewusstsein), habe ich mich da gefragt», erzählt er, der tagsüber als Softwareprogrammierer beim Internetdienstleister Yandex tätig ist. Da er schon länger Fälschungen entlarvt, war sein Argwohn geweckt, er las nun Satz für Satz die fraglichen Publikationen.

Offenbar stand «colossal information» für «big data», «discourse acknowledgement» für «voice recognition» und «counterfeit consciousness» für «artificial intelligence». Doch warum verwendeten die Autoren diese auf den ersten Blick eher amüsanten Wörter statt der etablierten Fachbegriffe, fragte sich Magazinov. Die Veröffentlichungen waren ja schliesslich in anerkannten Fachzeitschriften abgedruckt, keinem Satiremagazin.

Ich hätte zuerst vermutet, dass irgendwer, der kein Englisch kann, das Paper geschrieben und durch irgendeinen Übersetzer gedreht hätte. Inder zum Beispiel als Ghostwriter.

Die drei konnten dann nicht nur die echten Fachbegriffe rekonstruieren. Ihnen wurde bald auch klar, wie diese zustande gekommen waren. «Hier handelt es sich um Sätze, bei denen eine spezielle Software, ein sogenannter Spinbot, etwas andere Wörter als die anerkannten Fachbegriffe verwendet hat» erklärt Labbé. Solche teilweise kostenlos im Internet zugängliche Software werde von Autoren verwendet, die eine Veröffentlichung ohne wissenschaftliche Eigenleistung verfassen wollten. Oder anders ausgedrückt, die ohne Aufwand fälschen wollen.

Um das Abschreiben aus bereits vorliegenden, in Fachzeitschriften publizierten Veröffentlichungen zu verschleiern, formuliert der Spinbot einen vorgegebenen Satz leicht um und ersetzt Begriffe durch Synonyme. So sind die Ähnlichkeiten dann nicht zu auffällig.

Ah, könnte natürlich sein, dass der Computer da automatisiert (vermeintlich) synonyme oder bedeutungsgleiche Begriffe eingesetzt hat, um Plagiate zu verschleiern, damit man sie nicht so leicht googeln kann.

Labbé verdeutlicht das an dem Sprichwort «The road to hell is paved with good intentions» (der Weg zur Hölle ist mit guten Vorsätzen gepflastert). Nach einem Spinbot-Durchgang wurde daraus: «The way to damnation is cleared with well meaning goals» (der Weg zur Verdammnis ist mit wohlmeinenden Zielen geebnet). In der Alltagssprache kann man mit gutem Willen das Originalsprichwort erkennen, man nimmt vielleicht an, hier habe ein Nicht-Muttersprachler ein Sprichwort zitiert.

Manche Programme generieren automatisch ganze Passagen oder gar Texte. Aus vier bereits publizierten Zusammenfassungen entsteht eine fünfte, aus drei Einleitungen anderer Veröffentlichungen eine vierte. Auch werden Bilder, Grafiken und Tabellen aus der publizierten Fachliteratur gestohlen, mithilfe von Photoshop leicht verändert und als neue Daten präsentiert.

Das kenne ich eigentlich sehr ausgiebig von den Unis. Aus etwa drei Diplomarbeiten lässt sich eine Dissertation zusammenverwursten und so weiter.

Informatik

Magazinov schätzt, dass allein in den Computerwissenschaften mehrere tausend gefälschte Publikationen veröffentlicht wurden. Andere Experten befürchten gemäss einem Artikel in der Fachzeitschrift «Nature» ähnliche Ausmasse für ihre eigenen Fachbereiche. Abgedruckt wurden die Fälschungen in Dutzenden von Fachmagazinen, auch von renommierten Verlagen wie Elsevier, Springer oder Wiley. Hunderte wurden allein in diesem Jahr mit Warnhinweisen versehen, nachdem Fälschungsdetektive ihre Erkenntnisse auf der Plattform pubpeer.com präsentiert hatten.

Wen kann das überraschen? Ist doch sowieso fast alles nur noch Schwindel.

Vor allem Autoren aus China und Indien fallen gemäss dem «Nature»-Artikel durch eine Vielzahl gefälschter oder erfundener Fachartikel auf. Doch unabhängig vom Heimatland der Autoren, ihre Motivation ist immer dieselbe: Sie benötigen eine bestimmte Anzahl an Publikationen, um einen Job in der Forschung zu bekommen oder der Kündigung zu entgehen. «Publish or perish», «Publiziere oder geh unter», nennt man das in der Wissenschaftergemeinde. Doch oftmals bleibt wenig Zeit, die benötigten Publikationen seriös, sprich durch echte Forschungsarbeit, zu erstellen. Fehlen die Daten, aber das Ende des Zeitvertrags naht, dann werden sie eben erfunden.

Klima, Corona, Gender

erwähnen sie zwar nicht.

Es würde mich aber interessieren, wieviele der Papers da per KI als Ableitungen bereits bestehender Artikel geschrieben wurden.

Das Problem ist nämlich, dass wenn eine Meinung erst mal häufig vertreten wird und damit eine (politisch bedingte) hohe Chance besteht, dafür Anerkenntnis zu bekommen, einfach weil man das politisch gewollte sagt, sie selbstverstärkend reproduziert wird, weil man damit vorankommt.

Es ist lang und breit bekannt, dass man insbesondere zu Themen wie Gender und Klima mit wirklich jedem, noch so dummen Scheiß Karriere machen und Erfolg abräumen kann, weil man das bringt, was die Leute hören wollen. Sagt man aber etwas politisch inkorrektes, wird man abgesägt, egal wie gut es begründet ist. In der Folge hat das alles längst nichts mehr mit Wissenschaft zu tun, sondern wird zur Filterblase, zur Echokammer, zum sozialen Anerkennungskuchen. Gibt ja sogar Sittenwächter, die darauf achten, dass nichts politisch korrektes abgelehnt und nichts politisch unkorrektes gedruckt wird. Schreib was gegen Frauenquote oder habe nur Männer als Autoren, und Du wirst abgesägt. Schreib ein Frauen- oder Migrantengejammer, und alles geht durch.

Und damit hat man natürlich eine ideale Grundlage, das Zeug vom Computer generieren zu lassen, wenn es nur noch auf die Tendenz und nicht mehr auf den Inhalt ankommt. Man muss eigentlich nur noch darauf achten, dass genügend viele Frauen als Autorinnen drauf stehen, und dann traut sich auch keiner mehr zu fragen.

Und wieder mal zeigt sich, dass Universitäten und Wissenschaft zwei verschiedene Dinge sind und nur wenig miteinander zu tun haben.

Universitäten sind vor allem eine Betrugsolympiade, in der gewinnt, wer am unverschämtesten Geld abgreift. Nur deshalb konnten Gender Studies dort entstehen.

Und wir sehen gerade, wie das alles völlig im Betrug versinkt.

Ich glaube, das Prinzip der öffentlichen Universität, in die jeder rein kann, hat sich demnächst erledigt. Was jedem offensteht, wird in Zeiten wie diesen unweigerlich nach unten gezogen. Ernsthafte Forschung wird künftig nur noch in Firmen stattfinden können, die darauf achten, dass eben nicht jeder reinkommt.