Ansichten eines Informatikers

Das ultimative Plagiatswerkzeug

Hadmut
5.7.2022 0:58

Die nächste Stufe der Verblödung der Menschheit steht an.

KI wird gerade in immer mehr Bereiche gedrückt, sie soll uns etwa beim Schreiben von Texten wie Büchern und E-Mails helfen. Und dabei kopieren und variieren.

Ich hatte die Gefahr ja neulich schon bei Bildern prognostiziert. KI kann inzwischen zu einem vorgegebenen Bild Variationen erzeugen, und das macht das Plagiieren dann natürlich einfach, wenn man nicht mehr das Originalbild klaut, sondern es durch die KI-Mühle jagt, und eine Variante davon nimmt. Was immer noch ein reines Plagiat ist, nur eben aus dem geklauten Bild und aus allen Bildern, auf die die KI trainiert wurde.

Und ebensolche Effekte wird man dann bei Texten, Büchern, Zeitungs- und Blogartikeln, Dissertationen und sowas haben: Man gibt ein paar Stichworte, und die Software jodelt einem die Dissertation dazu, und zwar so, dass die Plagiatsjäger das nicht mehr nachweisen können. Kann zwar sein, dass der Text dann keinen Sinn mehr ergibt oder sich selbst widerspricht, aber das merkt bei den Geisteswissenschaften eh keiner, da ist das normal. Und Texte werden an den Hochschulen sowieso nicht gelesen, nur geschrieben. Künftig braucht man keinen Ghostwriter mehr, sondern nur noch die KI, die auf die Dissertationen der letzten 40 Jahre trainiert ist. Und das beschleunigt die Sache dann auch enorm, wenn man eine Dissertation über Nacht erzeugen kann. Fördert die Work-Life-Balance und die Frauenquote.

Es würde mich durchaus mal interessieren, die Datenbank all meiner Blogartikel mal durch so ein System zu jagen, es darauf zu trainieren, und zu schauen, was es dann für Texte schreibt.

Sowas in der Art passiert gerade bei Software, Quelltexten.

Golem berichtet:

Mit einer groß angelegten Öffentlichkeitskampagne fordert die Software Freedom Conservancy die Entwickler der Open-Source-Community dazu auf, die Dienste der Code-Hosting-Seite Github vollständig zu verlassen. Als Analogie dazu führt die Conservancy einen ähnlichen Vorgang bei der einstmals sehr beliebten Code-Hosting-Seite Sourceforge vor etwa zwei Jahrzehnten auf, als ein ähnlicher Rückzug schon einmal umgesetzt worden ist. […]

Aktueller Auslöser für die Kampagne ist aber offenbar die Einführung des KI-Werkzeugs Copilot durch Github.

Die Organisation führt hier vor allem auf, dass Copilot – auch laut Aussagen von Github selbst – auf dem öffentlichen Code trainiert worden ist, der auf der Seite gehostet wird. Nicht nur ist also ein proprietärer Dienst auf Grundlage von Open Source Code trainiert worden. Unter den Trainingsdaten befindet sich auch zahlreicher Copyleft-Code, so die Organisation.

Die damit verbundenen Lizenzbedingungen werden mit Copilot von Github und dessen Mutterunternehmen Microsoft ignoriert, so die Conservancy. Darüber hinaus heißt es, dass nicht nur die juristischen Fragen dazu noch nicht geklärt, sondern auch die ethischen Implikationen “gravierend” seien.

Microsoft „klaut“ also Sourcecode, indem sie ihn nicht einfach banal abkupfern, sondern eine große KI darauf trainieren und der Code damit in einer großen Trainingswolke verschwindet, so dass ihn niemand, vor allem kein Jurist, darin mehr finden kann.

Und das heißt dann, dass man zum Programmieren nicht mehr Programmieren können muss, sondern dem Ding einfach nur noch sagt, was es werden soll, und das Ding sich dann irgendwas zusammenstrickt, ohne es aber zu verstehen. Dumm ist dann, wenn es der Auftraggeber auch nicht versteht. Das alles ist natürlich prima für quereinsteigende Quotenfrauen, die vorher Gender-Studies, Schwedisch, Soziologie oder Wirtschaftsinformatik studiert haben, und damit nun endlich auch „programmieren“ können. Jede Wette, da kommen groteske Programmierfehler zusammen.

Vor allem wird man damit in kurzer Zeit enorm große Mengen an Software produzieren können, die kein Mensch mehr lesen kann, will und wird. Wobei „produzieren“ das falsche Wort ist, weil das KI-System ja nicht neu erzeugt, sondern nur Gelerntes rekombiniert, aber nicht verifiziert. Bei KI-Erzeugten Fotos findet man ja auch subtil-groteske Fehler, die man nicht unbedingt sofort erkennt.

Da zieht gerade eine ganz neue Generation von Plagiaten und Softwarekatastrophen herauf.

Andererseits könnten dann die Plagiatsjäger auch mit sprachlichen Mustererkennungen arbeiten, die auch vollständige Umformulierungen durch Synonymersetzungen, was ja heute auch schon Stand der Technik ist und mitunter zu grotesken Formulierungsfehlern führt, wieder erkennt.

Künftig gibt es dann kein Lernen mehr. Sondern nur noch das Äußern von Wünschen an die KI.

Bin mal gespannt, wann die erste Vorlesung, das erste Lehrbuch von KI erzeugt wird.