Ansichten eines Informatikers

Die Hintergründe der Twitter-Einschränkung nur noch für angemeldete Benutzer

Hadmut
1.7.2023 1:29

Beachtlicher sachlicher Grund.

Zum Artikel von vorhin über die Änderung bei Twitter, das nicht mehr unangemeldet zugänglich ist, kamen Hinweise, dass das keine Willkür von Musk/Twitter ist, sondern eine Notfallmaßnahme, weil deren Server massiv abgesaugt würden:

Angeblich haben KI-Firmen sehr aggressiv die Twitter-Tweets abgegrast um ihre Sprachmodelle damit zu füttern, und Twitter musste die Notbremse ziehen.

Das überrascht mich jetzt so halb-halb.

Es überrascht mich gar nicht, dass die KI-Firmen alles sammeln, was sie an freien Texten finden können. Ich bin mir da sicher, dass die auch Blogs und der gleichen abgreifen, alles, wo sich systematisch Texte einer Sprache abholen lassen.

Aber gerade bei Twitter hätte ich eher nicht damit gerechnet, weil das ja schreckliche Fetzen sind, die häufig aus gruseligen Verkürzungen bestehen, um in die Längenbeschränkung zu passen, sehr kontextabhängig sind und sich auf frühere Tweets beziehen. Abgesehen davon, dass Twitter schwer abzufragen ist, wenn man nicht direkt an die Datenbanken rankommt, halte ich die Texte auch qualitativ für schlecht und für KI-Training nur schlecht geeignet.

Das könnte aber durchaus zum Problem werden, dass jede Äußerung bald von KI gefressen wird. Oder zum Vorteil, weil das ja auch eine Art Suchmaschine darstellt.