Hadmut Danisch

Ansichten eines Informatikers

10 Jahre Blog

Hadmut
10.9.2016 13:08

Heute vor 10 Jahren, am 10.9.2006, habe ich meinen ersten Blog-Artikel in diesem Blog hier geschrieben. [Update]

Ich erinnere mich daran, als wäre es gestern gewesen. Allerdings staune ich oft darüber, wie gut sich viele Leser an Blog-Artikel erinnern, die ich selbst längst vergessen haben und bei denen ich mich nicht mehr erinnern kann, dazu schon mal was geschrieben zu haben.

Zeit für paar SQL-Fingerübungen:

In den 10 Jahren habe ich auf danisch.de 5342 Artikel geschrieben (diese nicht mitgezählt, aber der gehört ja auch schon in die nächste Dekade), auf Forschungsmafia.de 1257. Macht zusammen 6599, was nicht ganz stimmt, weil ich damals einige Artikel von danisch.de nach forschungsmafia.de übertragen habe und deshalb in beiden Blogs auftauchen, also doppelt gezählt sind. Ich hab aber gerade weder Lust noch Zeit, das noch rauszupfriemeln. Macht auf 10 Jahre (10*365 + 3 Schalttage = 3653 Tage) durchschnittlich 1,8 Artikel pro Tag.

Der kürzeste Artikel mit 29 Byte war dieser hier (was so auch nicht stimmt, denn rein textuell hatte ich auch kürzere, die waren aber Links auf andere Webseiten, und da ich hier jetzt der Einfachheit halber nur Byte und nicht netto-Text gezählt habe, ist der dann der kürzeste).

Der längste Artikel mit 87145 Byte (was auch nicht ganz stimmt, weil ich mittlerweile UTF-8 speichere, Sonderzeichen dann mehrere Byte haben und man eigentlich die Zahl der Zeichen und nicht der Byte angeben müsste, aber ich hab gerade weder Lust noch Zeit…, früher rechnete man übrigens mit etwa 2000 Zeichen pro A4-Seite, der Artikel wäre also über 40 Seiten lang) war dieser hier, gefolgt von diesem hier mit 83792 Zeichen und diesem hier mit 81385 Byte.

Die Summe aller Artikel beträgt bei danisch.de 20625611 und bei Forschungsmafia 3644731 Byte, zusammen also 24.270.342, über 23 Megabyte. Macht im Durchschnitt 3678 Byte (fast zwei Seiten) pro Artikel oder 6644 Byte (über drei Seiten) pro Tag.

[Update:Ein Leser weist mich gerade darauf hin, dass es unter MySQL noch char_length() gibt, das die Zahl der Zeichen und nicht der Bytes ausgibt. Damit sind es dann 20339337 Zeichen statt 20640439 Byte (inzwischen ist ja dieser Artikel hier noch dazugekommen) und bei Forschungsmafia 3147659 statt 3590229, wobei ersteres plausibel und letzteres eben nicht plausibel ist, ich da also offenbar noch nicht alle Zeichensatzkonvertierungsfehler behoben habe. Ist ja zwischendrin mal mit den Umstellungen zwischen MySQL- und WordPress-Versionen was schief gelaufen. Wenn ich mal Zeit und Lust habe, korrigiere ich das.]

Keine Ahnung, wie lange ich dafür gebraucht habe. Bei Schreiben komme ich schon auf 5 bis 10 Zeichen pro Sekunde, aber nur wenn ich auch weiß, was ich schreiben will. Vieles muss aber gelesen und recherchiert werden. Rechnet man einfach mal als ganz wild Schätzung mit einer Produktivität von 1 Byte pro Sekunde, was gar nicht so falsch ist, weil die 6644 Byte pro Tag dann 1,8 Stunden pro Tag entsprächen, was gefühlt sogar ungefähr hinkommt, war ich aufsummiert 6741 Stunden oder 280 Tage oder eben ein Dreiviertel Jahr (Ununterbrochen rund um die Uhr) am Bloggen. Rechnet man es aber auf einen normalen Job um, bei dem man 8 Stunden arbeitet, davon 6 an der Sache selbst, und das bei 220 Arbeitstagen im Jahr, entspräche das 5 Jahre Vollzeit-Job. In 10 Jahren realer Zeit.

Die Leser waren aber auch nicht faul und haben bei danisch.de 80118 freigeschaltete Kommentare mit zusammen 54.103.715 Byte (der längste davon 24005 Byte, es gab aber auch nicht freigeschaltete mit weit über 40000 Byte) und bei forschungsmafia.de 4347 Kommentare mit zusammen 3.147.659, der längste mit 17208 Byte. Die ja auch alle moderiert werden mussten (zuzüglich der nicht durchgelassenen wie Spam usw.), was ja auch noch zur Arbeitszeit hinzukam.

Wieviele Leser ich habe? Keine Ahnung. Ich mache keine Auswertungen. Hin und wieder zähle ich mal aus Neugier strichprobenartig die Tageszugriffe, und liege seit Jahren eigentlich immer über 100.000 HTTP-Zugriffen pro Tag, bei denen aber eben auch Style Sheets, Graphiken, Index-Seiten usw. drin sind. Wieviele Leserzugriffe das sind (die Browser cachen ja auch und fragen Style Sheets usw. nicht jedesmal neu an), weiß ich nicht. Allerdings geben die großen kommerziellen Medien ihre Zugriffe ja auch so an. Neulich hatte ich mal 340.000 Zugriffe an einem Tag. Vielleicht auch schon mehr, wie gesagt, ich zähle es nur hin und wieder mal für die Server-Last. So manche Zeitungsredaktion würde sich über die Zugriffszahlen freuen.

Übrigens stimmt auch das mit den 10 Jahren eigentlich nicht, denn Webseiten habe ich ja schon früher betrieben. Die Domain danisch.de habe ich – ich weiß es nicht mehr genau – glaube ich im Herbst 1998 nach meinem Wechsel zu Xlink bekommen. Angefangen mit dem World Wide Web habe ich aber schon früher, nämlich als damals der erste Webbrowser Mosaic über Newsgruppen verteilt wurde, und ebenfalls auch der erste Web-Server. Damals noch auf Sun Workstations mühsam aus 40 oder 60 Teilen in einzelnen News-Postings zusammengepappt und mit Hexenkunst compiliert. Und dann unter großem Oh und Ah und allgemeinem Staunen vorgeführt. Ich weiß nicht mehr, wann das war, aber es war die erste Version von Mosaic, und laut Web war das 1993. Ich war damals an der Uni Karlsruhe er erste, der sich damit befasste, und eigentlich auch weltweit einer der ersten außerhalb der Erfinder-Truppe, die das Zeug benutzten, nachdem es öffentlich verfügbar war. Eigentlich stimmt auch das nicht, denn ich habe vorher schon das Institut umgekrempelt und Informationen auf gopher dargestellt. Und hatte mich erst geärgert, weil ich da viel Zeit reingesteckt hatte, und dachte, verdammt, jetzt kommen die schon wieder mit was neuem um die Ecke. Habe aber dann schnell gesehen, dass das viel schöner, besser und mächtiger als gopher war, und die Migration war einfach, weil frühe Versionen von Mosaic auch gopher konnten. Und hatte damals an der Uni meine ersten öffentlich sichtbaren Webseiten, erst mal Verzeichnisse von anderen Webseiten, sowas womit Yahoo! dann nacher Milliarden wert wurde. Also bin ich seit 23 Jahren im World Wide Web unterwegs, und wenn man den Vorläufer gopher mit dazu zählt, sind’s jetzt so ungefähr 25 Jahre.

Übrigens wurde ich damals, vor allem von Professoren, damit als Spinner abgetan. Hätte keine Aussicht, würde sich niemals durchsetzen. Wurde mir sogar als Zeitverschwendung und gegen akademische Gepflogenheiten verstoßend verboten. Wo kämen wir denn da hin, wenn wissenschaftliche Texte nicht mehr von den Professoren handverlesen im engsten Kollegenkreis persönlich übergeben würden, sondern einfach so für jeden unkontrolliert frei zugänglich verfügbar wären? Geht ja gar nicht.

Das äußerte sich in einer massiven Dreiteilung. Die Mitarbeiter und Hiwis stetzten damals stark auf Unix und das Zugehörige GNU/Unix-Eco-System in Form der sündhaft teueren Sun Workstations, und jubelten, als Linux kam (ich kann mich noch erinnern, als ein Student zu mir als dem damaligen Compilation-Hexenmeister kam, weil er was compilieren wollte und es nicht schaffte. Irgendso ein Spinner hätte da versucht, einen Unix-Kernel selbst zu schreiben. Ich hab das dann geschafft, und wir haben sogar passende Hardware aufgetrieben, und es kam – ein Shell-Prompt, mit dem man noch gar nichts machen konnte, einfach nichts machen konnte. Toll. Später nannten sie das dann Linux. Schon bald gab es die ersten Linux-Distributionen auf 20 Disketten, mit denen man sich erstmals zuhause ein X11 aufbauen konnte – wie geil.) Wir haben damals wahre Wunderdinge mit Newsgruppen, FTP und all dem frühen Unix-Zeugs gemacht. Es war eine fabelhafte Zeit.

Dem standen unsere Professoren feindlich gesonnen gegenüber, die hielten von Unix nichts.

Es gab die modern eingestellten Informatik Professoren, die auf den Macintosh als das allein seligmachende schworen, dazu Hypercard, und der Fakultät dazu ein grotek untaugliches Mac-Mailsystem aufzwangen, was häufig, manchmal mehrmals am Tag, einfach stehen blieb und dann ging nichts mehr. Und das Geschrei und die Panik waren groß. Dann gab es einen Magier, einen Mitarbeiter, der auf wundersame Weise und als einziger in der Lage war, das System wieder in Gang zu setzen, und der galt als extrem wichtige Person, weil niemand außer ihm dazu in der Lage war. Er hat mich mal im Vertrauen eingeweiht, was er da eigentlich macht, und ich glaube, heute kann ich das rauslassen, ohne gegen Geheimhaltungsversprechen zu verstoßen. Das System war nämlich eine völlige Krücke und der Mac als Server-System damals überhaupt nicht geeignet, weil allein an der graphischen Benutzeroberfläche orientiert, immer mit der Unterstellung, dass die ganze Zeit einer davor sitzt und die Maus schwingt. Das System spucke ab und zu eine Fehlermeldung aus, weil irgendeine Mail nicht zustellbar war, und dann geht ein Requester auf und die ganze Kiste bleibt stehen und wartet auf Eingabe. Alles, was er als Magier machte, war runter in den Keller zu gehen, durch drei verschlossene Türen, und einmal auf „OK” zu klicken. Solle man aber nicht den Profs verraten, die sollten weiter glauben, dass da unten Hexenwerk stattfände. Und die Informatik-Professoren schworen drauf. Lange Jahre.

Und es gab die andere Fraktion von Informatik-Professoren (bei so einem war ich gelandet), die alles moderne Computerzeug für Teufelszeug hielten und verdammten. Nur Papier sei Wahres. Deshalb mussten alle Fakultätsmitteilungen immer dreifach rausgehen. Als Mac-Mail für die modernen Professoren. Auf Papier für die altmodischen. Und als Unix-Mail für die Mitarbeiter. Ratet mal, wer die Informationen immer als erster und am zuverlässigsten hatte. Und die altmodischen Professoren, allen voraus meiner, waren der Meinung, das ist alles nichts, die Zukunft der Kommunikation läge in handgekritzelten Faxen. Während heute viele die erste Mail feiern wollen, wird vergessen, dass sich damals Professoren dafür feiern wollten, als erste Mail abgeschafft zu haben und Web als unwissenschaftlich zu verbieten. Man lacht heute gerne über „Internet-Ausdrucker”, obwohl es die selbst unter den dämlichsten nicht mehr gibt.

Der Prof, bei dem ich war, war da noch grotesker. Wenn der was aus dem Web wollte und am anderen Ende der Welt war, hat er hier in Deutschland seine Sekretärin beauftragt, das auszudrucken und ihm dann an die Hotel-Rezeption zuzufaxen, wo er es dann mit viel Getöse abholte. Mail umgekehrt, er hat das handgekritzelt, der Sekretärin gefaxt und die sollte es dann abtippen. Weil Web und Mail einfach unter seiner Würde waren, das war was für kleine Mitarbeiter und Sekretärinnen, aber nicht für Akademiker. Und hat auch noch damit angegeben, dass er seine Webseiten an die besten Hotels der edelsten Orte der Welt bekommt, um sie mit viel Theater und Bohay so an der Rezeption abzuholen, dass es auch jeder mitbekäme, was für ein toller Hecht er sei.

Ich habe damals für ihn auch das erste SmartPhone, den Nokia Communicator 9000, beschafft. Hatte auch nen Webbrowser und sowas. Voll durchkonfiguriert, an das Institutsmailsystem angeschlossen, funktionierte alles. Kapiert hat er es nicht, aber damit angegeben wie Schweinskopfsülze. Nachdem er schon zwei Monate damit angebend in der Welt unterwegs war, rief er mich mal wutentbrannt aus sonstwo an. Er hätte sich ja so mit dem Ding blamiert. Auf irgendeinem Flughafen hätte er eine hübsche Journalistin angebaggert und sie so weit gebracht, dass sie ihm sagte, er solle ihr eine Mail schicken. Das hätte er siebenmal versucht und es wäre nicht gegangen. Ich hätte ihn blamiert. Die Mail-Logs zeigten dann sieben Fehlermeldungen, in denen er an die Mailadresse „Sehr geehrte Frau…” schreiben wollte. Es war im nicht klarzumachen, dass in das Feld „Address” eine Mailadresse und keine Anrede rein müsste. Er hat nie kapiert, wie Internet funktioniert. War danach aber umso mehr überzeugt, dass Mail, Web usw. alles unakademischer Schrott sei und weg müsse, nur Faxen handgeschriebener Zettel sei Wahres. Hotels gäb’s schließlich überall.

Und so wurde man damals an einer Informatik-Fakultät als Spinner abgekanzelt, wenn man sich mit sowas wie Web-Servern und -Browsern beschäftigte. Es war nicht einfach, sich damals an einer Informatik-Fakultät mit sowas wie dem World-Wide-Web zu beschäftigen. Zu real. Zu effektiv. Nicht akademisch, nicht professorentauglich.

Sah übrigens auch die Poltik sehr ähnlich, die wollte den Universitäten eigentlich gar kein Internet erlauben und geben, weil eine gewisse Alice Schwarzer verkündet hat, Internet brauche man gar nicht, das hätte nur den einzigen Zweck, dass die Professoren den ganzen Tag Pornos gucken würden. Was grotesk dumm war. Nicht so sehr wegen der Pornos (Bilder zu übertragen war damals noch ein sehr kompliziertes, teures und aufwendiges Unterfangen, was sehr lange dauerte, da wäre noch niemand auf die Idee gekommen, sowas für Pornos zu vergeuden. Ich habe damals für meine Diplomarbeit einen Rechner gebaut, der auch Bilder verarbeiten konnte. Ich war im Besitz von sage und schreibe 5 oder 10 Bildern, niedrigst aufgelöst, schwarzweiß. Das war ja auch der Grund, warum eine gewisse Lena damals zum Standard-Testbild wurde. Weil man meist eben nur ein Bild speichern konnte.) Nein, grotesk war daran, dass die Professoren die waren, die von allen am wenigsten mit dem Web umgehen konnten und ihre Sekretärin für sie browsen und ausdrucken ließen. Trotzdem erreichte Schwarzer für einige Zeit, dass viele der Meinung waren, Web wäre böse, überflüssig, braucht man nicht, weg damit.

Mal sehen, was die nächsten 10 Jahre so bringen.

Und weil jetzt bestimmt Rückfragen kommen, so habe ich die Zahlen jetzt festgestellt:


select count(*) from posts where post_type='post' and post_status='publish';

+----------+
| count(*) |
+----------+
|     5342 |
+----------+

select id,post_date,post_name,length(post_content) as len,guid from posts where post_type='post' and post_status='publish' order by len desc limit 5;

select sum(length(post_content)) from posts where post_type='post' and post_status='publish' ;
+---------------------------+
| sum(length(post_content)) |
+---------------------------+
|                  20625611 |
+---------------------------+

select count(*) from comments where comment_type='' and comment_approved='1';

select length(comment_content) as len from comments where comment_type='' and comment_approved='1' order by len desc limit 5;

select sum(length(comment_content)) from comments where comment_type='' and comment_approved='1';