Ansichten eines Informatikers

Jugend forscht Informatik: Na, denen hätte ich aber was erzählt …

Hadmut
22.5.2023 12:01

Über die Politisierung von Mathematik und Informatik.

Aktuelle Meldung: Software gegen Verschwörungstheorien: Schüler aus NRW gewinnen bei “Jugend forscht”

Um antisemitische Verschwörungstheorien auf Twitter zu entlarven, haben Simon Rulle und Arthur Achilles aus Paderborn eine Software entwickelt. Und damit bei “Jugend forscht” gewonnen.

Die besten Nachwuchs-Forscherinnen und -Forscher wurden am Sonntag in Bremen ausgezeichnet. Auch Simon Rulle und Arthur Achilles aus Paderborn sind dabei. Die Schüler sind 16 und 17 Jahre alt. Mit ihrerm “Project Eagle” wurden sie nun bei “Jugend forscht” Bundessieger im Fachgebiet Mathematik/Informatik.

Die beiden entwickelten eine Software, die antisemitische Tweets oder Postings in sozialen Netzwerken in Echtzeit identifizieren kann. Ihr Werkzeug hilft dabei, die scheinbar unüberschaubaren sozialen Netzwerke zu durchsuchen und “Verbreitungswege” von Verschwörungsmythen nachvollziehen zu können.

Wie funktioniert die Software?

In den sozialen Netzwerken finden sich unzählige antisemitische Kommentare und Hassreden. Viele davon basieren auf bekannten Verschwörungsmythen. Die Software der Jugendforscher durchsucht Twitter auf antisemitische Verschwörungsmythen, modelliert die Vernetzungen (likes, follower, retweets) der einzelnen Tweets wie Likes, Follower, Retweets und speichert diese in einer Datenbank ab. Die Vernetzungen werden zudem graphisch aufbereitet. Die Jungforscher setzten unter anderem aktuelle KI-Chatbots ein, die ähnlich wie ChatGPT funktionieren.

Die beiden Schüler haben zunächst 6.000 Tweets händisch ausgewertet – ausgehend von dem Account des AfD-Politikers Björn Höcke und seinen Followern. Diese Tweets dienen als Trainingsdaten für ein neuronales Netz. Künstliche Neuronale Netze sind Algorithmen, die dem menschlichen Gehirn nachempfunden sind. Durch sie lassen sich Daten interpretieren und Muster erkennen.

Die Verbreitungswege der Mythen, die von der Software erkannt werden, werden dann als Grafiken dargestellt. Mit dem Programm lässt sich auch rekonstruieren, wie die Zahl antisemitischer Tweets eines Accounts mit der Zeit zugenommen hat.

Na, denen hätte ich aber was erzählt. Denen hätte ich gehörig die Ohren lang gezogen.

Aus der offiziellen Broschüre geht übrigens auch nicht mehr hervor.

Algorithmen

Es ist zwar eine – vor allem in politischen, journalistischen und feministischen Kreisen – verbreitete Ansicht, dass man einfach irgendwas bastelt, das dann „Algorithmus“ nennt und die Ergebnisse irgendwie für richtig hält, aber so funktioniert das eben nicht.

Der Algorithmus ist immer nur die Umsetzung einer Funktion, eines Modells in eine Rechenvorschrift eines bestimmten Maschinenmodells. Eine Verfahrensbeschreibung, wie man mit einer Maschine mit gewissen Fähigkeiten diese Funktion, dieses Modell, diese Aufgabe umsetzen kann. Geschätzte 99% derer, die heute öffentlich von Algorithmen faseln, wissen nicht, was das ist.

Bevor man einen Algorithmus schreibt, muss erst einmal die Zielfunktion, also das, was der Algorithmus umsetzen soll, definiert, beschrieben, greifbar sein. Dann schaut man sich an, was die Maschine kann, welche Fähigkeiten die hat, welche Schritte sie ausführen kann, schreibt dann den Algorithmus und weist dann die Korrektheit nach, namentlich die partieelle Korrektheit, dass also dann, wenn die Eingabe dem Definitionsbereich entspricht, und ein Ergebnis herauskommt, das Ergebnis stimmt. Und dass das Ding terminiert, also bei einer Eingabe aus dem Definitionsbereich auch zum Ende kommt. Ist beides erfüllt, spricht man von “total korrekt”. Hört sich etwas blöd an, ich habe den Begriff nicht geprägt, aber das sind die beiden Eigenschaften, die man dann nachweist (oder wenigstens zeigt, plausibel macht).

Das heißt, dass vor dem Algorithmus immer erst mal die Beschreibung da sein muss, was man eigentlich will und wohin es führen soll.

Woher aber die algorithmentaugliche Darstellung kommen soll, wie man „Antisemitismus“ als Netzwerk durch irgendwelche Likes, Follower und Retweets verfolgen könnte, erschließt sich mir überhaupt nicht. Das kann auch völlig andere Gründe habe, warum einer dem anderen folgt.

Was ist denn überhaupt „antisemitisch“? Eine ordentliche Definition ist mir noch nicht untergekommen. Das ist ein reiner Kampfbegriff, den man geformt hat, damit es sich in das pseudowissenschaftliche Schwafelschema von *isch und anti* einfügt. Irgendwo habe ich sogar mal „antisemitistisch“ gesehen. Das ist einfach nur Geschwätz. Viele Leser schrieben mir schon, dass der Begriff an sich schon unsinnig sei, weil er nicht den ethnischen, genetischen, religiösen oder geographischen Bereich bezeichnet, sondern eine Familie von Sprachen, die semitischen Sprachen. Arabisch gehöre aber ebenfalls zu den semitischen Sprachen, und ist, wie mir ein Israeli mal erklärte, mit Hebräisch verwandt (er hat mir das damals am Beispiel Shalom (alehem) erklärt, das mit Salam oder Salem aleikum dasselbe Wort sei. Auch Namen finden sich wie Salomon, Salman, Süleyman, Sliman zeigen die Verwandtschaft, alle vom Wort für Frieden, Shalom, abgeleitet) und deshalb für sie relativ leicht zu lernen. Antisemitismus wäre es, wenn es sich gegen Araber und Israelis gleichzeitig richtete. Der Begriff des Antisemitismus wird aber praktisch nie in dieser Funktion verwendet.

Warum man sich da einen politischen Gegner aussucht, hier Björn Höcke, quasi den als „antisemitisch“ definiert, und dann unterstellt, dass sich das über dessen Follower ausbreitet, und das eine transitive, graphentheoretisch erfassbare Eigenschaft handele, ist für mich nicht nachvollziehbar.

Wenn man aber von vornherein Blödsinn unterstellt, und den dann mit noch so großen Programmierfertigkeiten implementiert, ist das Ergebnis immer noch Blödsinn, denn Blödsinn wird nicht besser, indem man in als Programm schreibt.

Und es ist auch kein „Algorithmus“, wenn man einfach irgendwie irgendwas zusammennagelt, das dann irgendein Ergebnis ausspuckt, das einem dann gefällt, und das man glaubt, weil es doch der Computer ausgespuckt hat.

Hätte ich da in der Jury gesessen, hätte ich den beiden Jungs mal ein paar Takte dazu erzählt, dass sie nicht verstanden haben, was ein Algorithmus ist, und dass man mit dem Schreiben des Algorithmus und dem Programmieren erst gar nicht anzufangen braucht, solange die Spezifikation dazu nicht klar ist. Vereinfacht gesagt: Man muss a) vorher wissen, was man eigentlich will und b) plausibel zeigen können, dass das, was man will, auch richtig ist.

Datenschutz

Die schreiben da so treudoof, dass sie die Daten „in eine Datenbank“ schreiben.

Ich gebe mal einen dezenten Hinweis:

Art. 9 Absatz 1 DSGVO

Die Verarbeitung personenbezogener Daten, aus denen die rassische und ethnische Herkunft, politische Meinungen, religiöse oder weltanschauliche Überzeugungen oder die Gewerkschaftszugehörigkeit hervorgehen, sowie die Verarbeitung von genetischen Daten, biometrischen Daten zur eindeutigen Identifizierung einer natürlichen Person, Gesundheitsdaten oder Daten zum Sexualleben oder der sexuellen Orientierung einer natürlichen Person ist untersagt.

Davon gibt es zwar Ausnahmen, die in Absatz 2 definiert sind, u.a.

Absatz 2
Absatz 1 gilt nicht in folgenden Fällen:

[…]
e) die Verarbeitung bezieht sich auf personenbezogene Daten, die die betroffene Person offensichtlich öffentlich gemacht hat,
[…]

das ist aber eine ziemlich haarige Sache. Wenn jemand einen Text twittert, dann hat er ihn offensichtlich öffentlich gemacht. Ob aber jedem klar und und deshalb Absicht unterstellt werden kann, dass auch öffentlich sichtbar ist, wer wem folgt, das wage ich zu bezweifeln. Vor allem, wenn es in seiner Gesamtheit ausgewertet wird. Und insbesondere dann, wenn das wie hier transitiv ausgewertet wird, ist das eindeutig nicht mehr der Fall. Denn wenn A dem B folgt und B dem Höcke, dann kann man A nicht mehr unterstellen, dass er das wusste, wollte, öffentlich gemacht hat, dass er dem Höcke folgen würde.

Außerdem könnte das völlig andere Gründe haben. Ein Journalist könnte beispielsweise Höcke folgen, um zu sehen, was der macht. Das heißt ja noch nicht, dass er dem inhaltlich zustimmt.

Ich halte das für datenschutzrechtlich mindestens bedenklich und wackelig, jedenfalls solange nicht genau ersichtlich ist, was die da eigentlich treiben. Als Datenschutzbeauftragter oder Lehrer wäre ich da deutlich auf die Bremse getreten. Das könnte leicht strafbar sein.

Noch eine Strafbarkeit

Es ist auch noch in anderer Hinsicht problematisch. Denn was wollen die mit den Daten dann überhaupt machen? Worin liegt der Nutzen, der Sinn, der Zweck?

Veröffentlichen sollten sie diese jedenfalls nicht, denn

Strafgesetzbuch (StGB)
§ 126a Gefährdendes Verbreiten personenbezogener Daten

(1) Wer öffentlich, in einer Versammlung oder durch Verbreiten eines Inhalts (§ 11 Absatz 3) personenbezogene Daten einer anderen Person in einer Art und Weise verbreitet, die geeignet und nach den Umständen bestimmt ist, diese Person oder eine ihr nahestehende Person der Gefahr

1. eines gegen sie gerichteten Verbrechens oder

2. einer gegen sie gerichteten sonstigen rechtswidrigen Tat gegen die sexuelle Selbstbestimmung, die körperliche Unversehrtheit, die persönliche Freiheit oder gegen eine Sache von bedeutendem Wert

auszusetzen, wird mit Freiheitsstrafe bis zu zwei Jahren oder mit Geldstrafe bestraft.

(2) Handelt es sich um nicht allgemein zugängliche Daten, so ist die Strafe Freiheitsstrafe bis zu drei Jahren oder Geldstrafe.

(3) § 86 Absatz 4 gilt entsprechend.

Gerade in Zeiten, in denen die Antifa und inzwischen die Clans Schlägertruppen und Messerartisten in Richtung politischer Gegner schicken, ist so etwas sehr, sehr heikel.

Stasi und Rasterfahndung

Man sollte auch daran denken, dass man damit bei der Stasi Karriere gemacht hätte.

Können sich die Älteren unter den Lesern noch erinnern, was für ein Theater die Linken gemacht haben, als damals in der Zeit des RAF-Terrorismus die sogenannte „Rasterfahndung“ eingeführt wurde? Was die hier machen fällt im Prinzip unter „Rasterfahndung“. Nur in die andere Richtung, und dann soll es plötzlich gut sein.

Rechtfertigung?

Was geht die die politische Meinung anderer überhaupt an? Worin liegt eigentlich die Rechtfertigung dafür?

Und warum nur gegen „Antisemitismus“?

Warum nicht auch gegen arabischen „Antisemitismus“? Etwa die Demonstrationen zur Vernichtung Israels in Berlin?

Oder auch die Klima-Jünger, die ja ihrerseits eine linksextremistische Sekte sind?

16 und 17 Jahre alt

Ich will allerdings einräumen, dass die Jungs erst 16 und 17 Jahre alt und damit letztlich noch Kinder sind, die noch nicht mal das Abitur haben, und ich das an sich unter „Dumme-Jungen-Streich“ verbuchen würde. Oder „Denn sie wissen nicht, was sie tun“. Denen ist nicht bewusst und kann es auch gar nicht sein, wie gefährlich so etwas ist, wie sehr man damit Leute politischer Verfolgung, Vernichtung, Angriffen aussetzt, und wie hoch dabei die Gefahr ist, Leute falsch zu beschuldigen. Zumal man ja wohl noch nicht einmal erfährt, dass man von denen da erfasst wird.

Und da ist dann auch die Schwelle zum Linksterrorismus dann nicht mehr hoch. Ich glaube, dass die Jungs sich einbilden, dass sie da etwas „Gutes“ machten. Ich glaube aber nicht, dass sie das überhaupt abschätzen können. Kinder in dem Alter gehen auch zu „Fridays for Future“ und wissen auch nicht, was sie da tun.

Wer allerdings in diesem Alter schon an solchen Massenvernichtungswaffen baut, der kann sich dann auch nicht mehr allzu sehr auf seine Jugend berufen.

Stellt Euch einfach mal vor, die lassen das Ding auf ihre Mitschüler los, veröffentlichen die Ergebnisse, und dann kommt es zu einem Amoklauf durch irgendwen mit Knarre.

Ich gebe zu, dass man schon einige Kenntnisse in IT haben muss, um so etwas zu programmieren. Man muss aber auch erhebliche Wissenslücken und Unkenntnisse haben, um es zu tun. Und ein solches Ding zu bauen, von dem man die Richtigkeit überhaupt nicht abschätzen kann, das auf keiner nachvollziehbaren Grundlage beruht, und das im Ergebnis dazu führt, dass Menschen gesellschaftlich, beruflich usw. vernichtet, zusammengeschlagen, womöglich umgebracht werden, ist eine Katastrophe. Die sind damit selbst näher am Faschismus als die, die sie zu verfolgen glauben.

Denkt mal dran, was mir an Arbeitsplatz, am Wohnhaus, in der Nachbarschaft widerfahren ist, nachdem ich auf den agentin-Steckbriefen der grünen Böll-Stiftung landete.

Gerade hat man wohl einen AfD-Politiker niedergestochen und fast getötet, gegen den aufgewiegelt wurde.

Die Jungs sind sich nicht im Ansatz bewusst, was sie da treiben.

Die Jury

Das Hauptproblem sehe ich in der Jury.

Wenn ich sowas (aus der Broschüre) lese:

Laudatio Simon Rulle und Arthur Achilles beeindruckten die Jury durch die Kombination verschiedener informatischer Methoden zu einem neuen Instrument, das nicht nur antisemitische Tweets erkennt,
sondern auch die dazugehörigen Kommunikationsgruppen. Sie wenden ihr Verfahren auf das Themenfeld antisemitischer Verschwörungsmythen an. Es ist aber ohne Weiteres übertragbar auf andere inhaltliche Bereiche.

Woher will man wissen, was denn „antisemitische Tweets“ sind? Da steht kein Wort davon, woran man das erkennt. Im Gegenteil steht da für mich, dass man einen kolossalen Fehler übersehen hat, nämlich die zyklische Definition: Björn Höcke ist antisemitisch, und antisemtisch ist, wer Björn Höcke folgt. Es gehört zu den Elementarbefähigungen in Mathematik und Informatik, zirkuläre (und damit nutzlose) Pseudodefinitionen zu erkennen und zu vermeiden.

Und was ist das überhaupt für eine Formuilierung? „informatischer Methoden“. Was ist das für ein Scheiß-Wort, „informatisch“?

Ich wüsste ja zu gerne, wer da in der Jury saß. Befähigte Informatiker können das eigentlich nicht gewesen sein, das stinkt zehn Meilen gegen den Wind nach political correctness. Als ob da mal zwei Jungs die Frauenförderung abbekommen hätten.

Keine Ahnung, wer das war, aber es heißt dort:

Die Fachgebietsjurys bestehen aus Lehrkräften, Hochschullehrerinnen und -lehrern sowie Fachleuten von Unternehmen oder öffentlichen Einrichtungen, die ihre ehrenamtliche Tätigkeit für maximal zehn Jahre ausüben. Unter den Jurymitgliedern aller Wettbewerbsebenen befindet sich auch eine Reihe ehemaliger Preisträgerinnen und Preisträger. In der Zusammensetzung der Jurys kommt eine zentrale Idee des Wettbewerbs zum Ausdruck: die gemeinschaftliche Förderung des Nachwuchses durch Wirtschaft, Wissenschaft und Schule. Umgekehrt ist der Netzwerkgedanke auch ein wichtiges Motiv für die Jurymitglieder, sich bei Jugend forscht zu engagieren. Für sie ist es äußerst interessant, hier Fachleute aus anderen Bereichen zu treffen. Darüber hinaus empfinden sie es als reizvoll, mit leistungsbereiten Nachwuchstalenten ins Gespräch zu kommen.

Offenbar ist die Politisierung viel höher als die Sachkunde in Informatik.

Vielleicht hatten sie aber auch einfach nur keine Alternative, vielleicht ist sonst nichts eingereicht worden.

Hätte ich in dieser Jury gesessen, ich hätte denen was erzählt.