Ansichten eines Informatikers

Identifikatoren

Hadmut
9.1.2014 22:33

Ein aktueller Bericht über die Gesichtserkennung per Handy und die massenhafte Erfassung biometrischer Merkmale hat mich gerade an etwas erinnert, worüber ich neulich abends während meiner Reise nachgedacht habe: Die geheimdienstliche Erfassung von Personen.

Seit Monaten diskutieren wir über die Überwachung unserer Kommunikation durch die NSA und die Verschlüsselung der Kommunikation. Als ob das Ziel der Ausforschung wäre, ob jemand am Telefon Buzzwords wie „Bombe” erwähnt. Dabei wird etwas übersehen. Nämlich dass die Kommunikationsinhalte gar nicht das primäre oder jedenfalls nicht das einzige Ziel der Ausforschung sind. Es geht viel mehr darum, herauszufinden, wer da kommuniziert und wer mit wem. Wichtiger als was gesagt oder geschrieben wird, sind die Zusammenhänge zwischen Personen. Wer taucht in welchem Kontext auf? Wer leiht sich wessen Buch? Wer mailt mit wem? Wer geht zu einer Veranstaltung? Wer war zur falschen Zeit am falschen Ort?

Ein wesentlicher Aspekt dabei ist, dass solche Informationen durch Computer wesentlich einfacher und systematischer auszuwerten sind als der Versuch, natürliche Sprache zu verstehen und zu interpretieren. Es ist drastisch einfacher, aus einer Kommunikation die äußeren Umstände (Telefonnummern usw.) und bestimmte syntaktisch besondere Informationen (Kreditkartennummer usw. ) herauszuziehen als Sprache verstehen zu wollen. Und genau so arbeiten Datenbanken der Geheimdienste auch. Ein Vorläufer war die berüchtigte PROMIS-Datenbank aus den 70er Jahren, die schon Informationen nach Personen und ihrer Rolle dabei sortieren konnte. Heutige Datenbanken sind da weiter und können eine Vielzahl von Informationen wie E-Mails, Zahlungsvorgänge, Flugtickets usw. aufnehmen und nach Personen und den Zusammenhängen zwischen Personen sortieren kann. Was gibt es zu einer Person zu wissen? Was hat Person A mit Person B zu tun? Mit wem hatte eine Person letzten Monat zu tun?

Wichtig ist dabei, die eingesammelten Informationen Personen zuzuordnen. Dazu braucht man Eigenschaften, die man den Personen zuschreiben kann, wie etwa eine Telefonnummer. Wie wichtig diese Informationen sind, merkt man, wenn man mal mit offenen Augen durch die Welt geht. Sehr häufig werden bei irgendwelchen Gelegenheiten – Bestellungen, Einreiseformulare, Hotelgastformulare, usw. – etwas mehr Informationen eingesammelt, als man eigentlich bräuchte. Schon mal aufgefallen, wieviele Daten man häufig auf amerikanischen Firmenseiten angeben muss? Es geht darum, möglichst viele Zuordnungen zu erlauben.

Die Frage ist, welche dieser Identifikatoren es gibt. Ich habe irgendwo gelesen, es gäbe etwa 85 Arten von Identifikatoren. Mir würden dazu einfallen:

  • Name, Geburtsname
  • Spitznamen, Nicknamen
  • Pseudonyme, Künstlernamen
  • Geburtsdatum/tag, Sterbedatum
  • Adresse
  • Sozialversicherungsnummer (USA), Mitgliedsnummern, Dienstnummern
  • Telefonnummern
  • IMEI, IMSI
  • statische und dynamische IP-Adressen
  • MAC-Adressen
  • Email-Adressen, Twitter-Accounts, URLs zu Webseiten, Facebook, Google-Accounts usw.
  • KFZ-Kennzeichen
  • Reisepassnummer/Daten (Ausstellungdatum, Ort)
  • Bankverbindung, Kreditkartennummern, Paypal usw.
  • Kundennummern
  • Biometrie (Fingerabdrücke, Gesicht, Foto, DNA, Stimme)

Neben solchen Informationen, die etwas auf eine oder sehr wenige Personen einschränken sind auch viele Informationen denkbar, die etwas nur auf eine Personengruppe einschränken oder eine Gruppe ausschließen:

  • Ortsangaben (Wohnungen, Arbeitsplatz,…) und dynamische Ortsangaben (war am … am Ort …)
  • Speisen
  • Religion
  • Beruf
  • Ein- und Ausreisen
  • Orts- und Bewegungsdaten
  • typisch besuchte URLs / Webseiten

Noch Ideen? Wem fällt noch was ein?

14 Kommentare (RSS-Feed)

denn
9.1.2014 23:11
Kommentarlink

Bonuskarten (wahrscheinlich lassen sich aus deren Informationen auch Bewegungsdaten und Interessen selbst ableiten)
und Interessen selbst (Film, Spiele, Literatur, …)
Lebenszeiten (zu welcher Zeit macht man normalerweise was, Schafrythmus etc.)
Ausbildungsgrad (Hochscule, Abitur etc.)

füge zu den Accounts noch Passwörter bzw. daraus abgeleitet Passwort-Schema (wie die Passwörter aufgebaut sind. Ich denke, jeder Mensch verwendet vermutlich immer ein “Algorithmus” für Passworterzeugung, wenn er sich das Passwort aussuchen kann – Dadurch sind die anderen vielleicht einfacher zu knacken)


Anmibe
10.1.2014 0:27
Kommentarlink

Hobbies sind von erheblicher Bedeutung, bspw. wer besucht mit wem Flugschulen, Sportschützenvereine, Tauchschulen, Clubs etc. pp.
Dsgl. jede Form von Kontakten zu politischen Organisationen (Parteien, NGOs etc.).


Hadmut
10.1.2014 0:35
Kommentarlink

Da wär ich mir jetzt nicht so sicher, ob das nur Informationen über eine Person oder eben Identifikatoren sind.


Jens
10.1.2014 2:00
Kommentarlink

User Agent ist auch beliebt als Quasi-Identifier.


Anmibe
10.1.2014 2:12
Kommentarlink

Identfikatoren nicht unbedingt, aber da Du selbst bereits eine Liste mit „Informationen über“ angefangen hattest, fiel mir spontan auf, daß dort Wesentliches fehlt. Ich hatte Deine Frage auf Beides bezogen verstanden.

Zur Biometrie gehören noch Spenderdatenbanken (Blut- und Gewebetypisierung), bspw. DKMS.
Elektronische Zertifikate wie PGP, X.509 (MIME) sind auch gute Identifikatoren für die Analyse eines Beziehungsnetzwerkes.

Ich versuche mich auch verzweifelt daran zu erinnern wo ich mal eine Liste mit eben diesen Identifikatoren gelesen hatte. Das ist schon einige Zweit her und war definitiv vor der Snowden-Affäre.


EBecker
10.1.2014 2:43
Kommentarlink

Kurzes Gebrainstorme:

Zu Beruf: Noch Berufskategorie (Angestellt/Selbstständig/Handwerk/Schreibtisch/Ingenieur/Sachbearbeiter/…) oder Einkommensgruppe?

Soziale Schicht: Einmal vom Wohlstand her, aber auch vom kulturellen her (Hipster, Emo, Goth, sonstige Subkultur)

Besuchte Webseiten: Geblockte Werbung, akzeptierte Cookies, User-Agent, Suchbegriffe? Laut einem Buch über Computersicherheit, das ich vor vielen Jahren in der örtlichen Bibliothek las, sollen manche Seiten auch tracken, was für einen Surf-Stil man hat (auf “Weiter” oder “Seite X” klicken soll bereits Rückschlüsse erlauben).

Ziemlich ausführliche Liste, ich würde vllt. bei Twitter/Facebook/Google noch die altmodischen Online-Identitäten in Foren o.ä. aufzählen, die weit weniger “persönlich” als ein Profil in einem soz. Netz sind. Und der Vollständigkeit halber sage ich jetzt noch “Mailingliste”. Und Job-/Dating-Portale.

Sollte man noch irgendwo einen öffentlichen PGP-Schlüssel aufzählen? Da gibt es ja auch Tools, um den Graph des Schlüsselsignierens aufzuzeigen.


Leif
10.1.2014 2:48
Kommentarlink

Personenstand, sexuelle Orientierung.


wollepelz
10.1.2014 7:59
Kommentarlink

Ich sollte letztens einer Mutter aus der Klasse meines Sohnes folgende Daten übermitteln:

Mein Name, Telefonnummer, E-Mail-Adresse, Anschrift,
Name meines Sohnes, Geburtsdatum, evtl. E-Mail-Adresse.

Diese Daten wollte sie zu einer Liste machen und über eing Google-Konto an alle Eltern der Klasse versenden. Ich habe ihr geschrieben, dass mir die Daten zu sensibel seien, als dass sie über einen Googleserver gehen sollten.

Ich gelte jetzt bestimmt als paranoid und habe bestimmt als einziger keine Klassenliste. 😀

Mein Hinweis auf den unsensiblen Umgang mit den Daten wurde natürlich ignoriert.


irgendeiner
10.1.2014 8:18
Kommentarlink

Gebrechen, spezielle Medikamente

P.S.: Nanu? Tor geblockt?


Flusskiesel
10.1.2014 8:44
Kommentarlink

Übrigens ein Grund für die etwas angestaubt klingende “Datensparsamkeit” als Grundsatz des Datenschutzes.


yasar
10.1.2014 10:15
Kommentarlink

Browser-Fingerprint, im Zeitalter der Webmaildienste auch sehr stark als identifikator geeignet:

http://www.heise.de/security/meldung/Fingerprinting-Viele-Browser-sind-ohne-Cookies-identifizierbar-1982976.html


euchrid eucrow
10.1.2014 12:00
Kommentarlink

es ist schon widerlich. will man sich den verlinkten focusartikel ansehen, muß man ghostery erlauben tracker nicht zu blocken.
die da wären: Facebook Connect, Facebook Social Graph, Facebook Social Plugins. da gehts schon los.

brainstorming:

zu a:
– nummer der bedarfsgemeinschaft, wenn man mal was mit dem aa oder der arge zu tun hatte
– steuer oder steuer-identifikationsnummer

zu b:
– betriebssystem und sicherheitseinstellungen
– browser, browsereinstellung, addos (adblocker, trackerblocker, tor, u.s.w.)
– regelmäßig angesurfte seiten und deren thematischer schwerpunkt
– hinterlassene kommentare auf webseiten und in foren
– nutzung sozialer netzwerke (ohne facebook ist man bestimmt schon suspekt)
– nachrichtenroutine (mainstream oder dunkelste unterwelt)
– stream- oder downloadverhalten
– sonstige interessen (musik, pc-games, konsolen, freizeit, sport)
– whatsapp, skype

führt man beides zusammen, kann man daraus sehr schön ein personalisiertes sozialprofil erstellen, welches sich auch politisch einordnen lässt.

@wollepelz
im kindergarten wollten die eltern neulich eine facebookgruppe aufmachen. außer mir gabs noch ein elternteil, das diese plattform nicht benutzt.


Steffen
11.1.2014 12:37
Kommentarlink

klingt vielleicht blöd und rückwärtsgewandt, aber das hat die Stasi früher auch als großes Projekt gehabt:

“Wer ist wer?” hieß das bei denen.

Man stellt ja heutzutage die Stasi als 0815-Idiotentruppe hin, die eigentlich nichts weiter im Sinn hatte, als die Leute davon abzuhalten, aus der DDR abzuhauen und dann noch evtl. ein paar spektakuläre Spionagecoups (Nato usw.) zu landen.

Dem war aber nicht so. Das war ein extrem gut ausgerüsteter Geheimdienst. Die hatten mit den damaligen technischen Möglichkeiten alles, was man sich (nicht) vorstellen kann und die haben auch damals genau das getan, was die NSA heute tut. Logisch hatten die keine Supercomputer, die 4096 Bit Verschlüsselungen knacken konnten, aber die hatten alles andere, was es zu dieser Zeit gab. Inklusive Telefonabhöranlagen, die im Leerlauf mitliefen und wenn jemand ein Buzzword gesagt hat, sind die Dinger automatisch angesprungen und haben aufgezeichnet.
Die hatten Geruchskonserven, die dazu dienten, jemanden, der ein Plakat aufgehängt hatte, irgendwas an eine Wand geschrieben hatte oder was auch immer, zu identifizieren. Man brauchte keine Fingerabdrücke oder Zeugen. Die Geruchskonserve und ein Hund hat gereicht… und wenn sie keine entsprechende Konserve hatten, haben sie aus den Spuren eine angelegt und darauf gewartet, bis sie sie einer Person zuordnen konnten.

Die hatten damals auch Vernetzungen zu allen Ämtern. Die hatten also von vornherein jede Kennnummer (Sozialversicherung etc.) von jedem Menschen.

Heute, mit den Onlineaccounts, Email, Whatsapp usw. ist das natürlich viel umfangreicher und einfacher für einen Geheimdienst geworden, Daten zu sammeln. Aber es ist nichts neues. Ich denke, es ist irgendwie eine “Grundfunktion” eines Geheimdienstes, so ein Programm zu haben: “wer ist wer?”.
Andererseits haben die heute wohl keine offizielle Vernetzung mit den Ämtern, also müssen sie solche Kennnummern anders herausfinden, wenn sie keinen Spitzel bei der Arge sitzen haben.

In so einem “wer ist wer”-Programm werden wirklich alle Informationen, die man zu einem Menschen findet, dazu benutzt, ein Profil zu erstellen. Alle nebensächlichen Infos werden einfach so gespeichert, im Fall, dass man sie nochmal brauchen kann.
Datensparsamkeit? Irgendwas hinterlässt jeder. Und selbst die kleinsten Schnippsel werden gespeichert. Zumindest hat es die Stasi so gemacht.

Aber wie gesagt: das ist nichts neues. Was es umso schlimmer macht, denn man könnte solch idiotische Dinge doch einfach lassen und sich sinnvolleren Sachen zuwenden. Machen sie aber nicht, weil sie einfach nur total paranoid sind und Angst haben. Nur: wovor? Man könnte auch [Utopiemodus an] einfach eine perfekte Welt erschaffen. Dann würde es diese gesellschaftlichen Probleme nicht geben und man müsste dementsprechend auch als herrschende Kaste keine Angst haben… [Utopiemodus aus]


gedankenwerk
11.1.2014 21:58
Kommentarlink

Geburtsort fehlt. Allein mit Geschlecht, Geburtsdatum und Geburtsort kommt man schon zu einer ziemlich großen Abdeckung.

http://dl.acm.org/citation.cfm?id=1179615