Ansichten eines Informatikers

Hägar der Schreckliche ist auch nicht mehr das, was er mal war

Hadmut
1.3.2014 11:45

Von wegen Papier ist haltbarer als elektronische Daten.

Ich oute mich jetzt mal. Zu meiner Studi-Zeit war ich leidenschaftlicher Fan von Hägar, dem Schrecklichen. Deutsch und Englisch. Außerdem von B.C. Und habe mir damals einige Bücher angeschafft, knapp einen Regalboden voll. Dazu kamen aus meiner nachstudentischen Zeit noch etliche Dilberts, ein paar PhDs, dazu noch ein paar bunt gemischte aus allen Ecken, darunter ein paar Mangas, Edel-Comics wie V wie Vendetta, und natürlich noch die Restbestände aus meiner Zeit aus Kindertagen wie eine Asterix-Sammlung und leider viel zu wenige Exemplare von Kommissar San-Antonio (völlig abgedreht). Nicht zu vergessen ein Komplettwerk von Nick Knatterton, dessen ursprüngliche und wirklich komplette Ausgabe mal aus dem Leim ging, in Einzelblätter zerfiel,entsorgt und durch ein anderes (hoffentlich auch komplettes) Buch ersetzt wurde.

Kam natürlich, wie es kommen musste: Sie stehen seit 20, 30 Jahren unangerührt im Regal und werden eigentlich nur angefasst, wenn ich mal wieder umziehe. Die Zeiten, in denen man Lust, Muße, Ruhe und eben Zeit hatte, sich einfach mal in einen gemütlichen Sessel zu setzen und Comics zu lesen, sind lange vorbei (warum eigentlich? – Ach ja. Weil soviel Zeit für’s Bloggen drauf geht).

Nun hab ich gerade mal beim Umsortieren durch die Dinger geblättert – und einen Hustenanfall bekommen. Der gleiche Effekt, den ich schon öfters bemerkt habe, wenn man etwa in Bibliotheken in alten Zeitschriften wie dem SPIEGEL aus den 50er Jahren etwas sucht. Anscheinend das nicht säurefreie Papier. Es dunkelt, wird leicht bräunlich, merklich spröder und staubt irgendwo im Bereich der Teilchen unterhalb der sichtbaren Größe. Und weil die Staubteilchen vermutlich noch sauer sind, muss man husten. Ich habe das auch bei alten Zeitschriften gemerkt, dass einem nach 20 Minuten des Blätterns die Hände zu brennen beginnen, und man sich mal schnell die Hände waschen muss. Oder gleich Handschuhe tragen. Was ebenfalls darauf hindeutet, dass es was mit Säure zu tun hat.

Die Frage ist nur, was machen?

Schmeißt man den Krempel blutenden Herzens weg?

Versucht man ihn einzuscannen? Also unter großen Zeitaufwand, viel Handarbeit, hohen Speicherkosten usw. den ganzen Krempel (urheberrechtlich noch zu prüfen) einzuscannen und digital zu bewaren, nur um ihn dann genausowenig anzusehen wie die Papierversion in den letzten 20 Jahren?

Tja, was machen?

24 Kommentare (RSS-Feed)

nullplan
1.3.2014 13:27
Kommentarlink

So hoch sollten die Speicherkosten dafür doch nun auch wieder nicht sein. Das müsste doch selbst in hoher Qualität alles noch auf eine 1TB-Platte passen, oder?

Aber du bräuchtest natürlich einen Scanner mit Automatikeinzug dafür, das ganze halbwegs schnell über die Bühne zu bringen (also Einband aufschneiden, auflösen, Blätter in den Scanner) aber so ein Ding mit Duplexfunktion für den Hausgebrauch könnte etwas ins Budget gehen. Ganz davon abgesehen, dass ich nicht weiß, ob die Seiten noch flexibel genug für maschinelle Verarbeitung dieser Art sind; sie könnten reißen oder brechen.

Tja, ansonsten böte sich als dritte Lösung die Beauftragung eines Dienstleisters an. Ich weiß nur nicht, ob es Leute gibt, die ihre Tage damit verbringen, Bücher auseinander zu schneiden und einzuscannen… Oh, Moment, frag mal jemanden von Project Gutenberg. Aber die haben vermutlich keine Zeit.


Hadmut
1.3.2014 14:15
Kommentarlink

@nullplan:

Ich habe einen Dokumentenscanner. (Fujitsu ScanSnap S1500) Und mit dem auch schon einige tausend Seiten gescannt.

Man sollte die Ergebnisse davon aber nicht überbewerten. Weil das Ding versucht, Falten usw. rauszumachen und schiefe Seiten geradezuziehen, ist das nicht so der Brüller, und häufig werden gerade Linien damit sogar schief. Außerdem wird das monströs groß, wenn man Farbseiten scannt.


Catwoman
1.3.2014 13:35
Kommentarlink

DIGITALISIEREN?

Das da ein selbsternannter Informatiker nicht selbst drauf kommt… bezeichned. omg.


Hadmut
1.3.2014 14:13
Kommentarlink

@catwoman:

> DIGITALISIEREN?

> Das da ein selbsternannter Informatiker nicht selbst drauf kommt… bezeichned. omg.

Frau, was?

Kannste lesen? Da steht „einscannen”. Da steht „digital zu bewahren”.

Wenn ich das schon hör, wenn sich leute selbst als „Catwoman” einstufen.

(Davon ganz abgesehen bin ich kein „selbsternannter”…)


Glasreiniger
1.3.2014 13:41
Kommentarlink

Im Fall der Comics könnte das Internet helfen.
zB: http://www.cartoons.ac.uk/record/AC2465


Zum Buchbinder, Rücken absäbeln oder selbst abschleifen und durch einen Einzugsscanner ziehen.

Carsten

Abgehängter Präkarier
(Muß das nicht abgehangener Präkarier heißen?)


dasuxullebt
1.3.2014 14:25
Kommentarlink

Weniger Bloggen, mehr Comics lesen. Ansonsten habe ich mal irgendwo gehört, dass es für sowas in einigen Archiven spezielle Öfen gibt, die die Säure aus dem Papier herauszaubern.


Fred
1.3.2014 14:56
Kommentarlink

Hm – auf was willst Du es denn speichern das in 20 Jahren noch lesbar ist? Was für ein Speichermedium aus dem Jahre 1994 wird heute noch verwendet? Floppys? Kennt heute schon keiner mehr – mal davon ab, dass die meisten Floppys heute vermutlich nicht mehr abspielen würden. CD? War 94 kaum verbreitet. Festplatte? Welche Schnittstelle hätten sie denn gerne? SCSI? Gibts heute nicht mehr. IDE? Gibt es gerade noch. Dann hat es damals hoffentlich jemand so abgespeichert, dass das Format heute noch lesbar ist.

Fred

P.S. Meine ZBV Reihe ( http://de.wikipedia.org/wiki/ZBV_%28Romanserie%29 ) kann ich heute noch problemlos durchblättern.


Steffen
1.3.2014 15:05
Kommentarlink

Archivlagerboxen für Bibliotheken sind leicht basisch um diesen Effekt abzufedern.


Scrooge
1.3.2014 16:55
Kommentarlink

@Fred:
Im Privatgebrauch sollte das alles nicht unbedingt das allzugrosse Problem sein, wenn man sich ein paar Gedanken macht. Daten müssen halt auf aktuelle Medien umkopiert werden bzw. halt auf das neugekaufte SAN und die Backups müssen laufen. Man lässt die Finger von (proprietären) Archiven und/oder Komprimierungen und speichert es in vernünftigen Auflösungen.

TIFF, GIF und JPG gibt es seit wenigstens zwei bis drei Jahrzehnten und bei unkomprimierten TIFFs täte auch ein späteres Konvertieren in andere Formate nicht weh. Dann gibt es noch PDF/A, welches ebenfalls für Archivzwecke entwickelt wurde, inzwischen aber auch schon in der 3. Version. Also damit eher vorsichtig und für die Zwecke, bei denen man es braucht. Es spricht aber viel dafür, dass normale Grafikformate auch in vielen vielen Jahren noch interpretierbar sind.

Meine Computererfahrungen gehen jetzt erst 25 Jahre zurück, ich bin gestartet mit einem AT und IDE-Platten. Alle Medien von damals ließen sich noch lesen, für die Disketten habe ich noch einen alten PC auch mit 5,25″-LW aufbewahrt, für IDE und auch SCSI gibt es noch Controller, die auch noch in einem modernen PC mit wenigstens PCI laufen würden. Ausnahme hier sind Bänder aller Art, egal ob QIC-80 oder DLT, hier braucht man die Laufwerke, z.T. seltsame Schnittstellen und Software. Aber das zählt für mich eher zum Backup.

Die alten Disketten mit den Schülerzeitungs-Daten von damals lassen sich physikalisch noch lesen! Leider habe ich sie mit dem Archivprogramm der PC-Tools beschrieben, so dass mir das reine Lesen-Können nun auch nichts mehr nützt. Verstoß gegen mein o.g. aufgestelltes Verbot proprietärer Archivformate, aber Disketten waren damals teuer (mein erstes 10er-Pack 3,5″-HD-Disketten für schlappe 70 DM!). Die Dateien des MS-Publisher 1.0 und 2.0 ließen sich dagegen noch öffnen, aber sie stecken halt im PC-Tools-Archiv…

@Hadmut:
Den ganzen Krempel für Dich privat einzuscannen, düfte rechtlich problemlos sein, denn es sind ja Deine Comics. Aber auch Sicht der Verlage zählt natürlich am ehesten der Neukauf! Zumal es gerade bei Hägar aktuell eine sehr gute Gesamtausgabe gibt.

Leider verhält es sich bei den Gesamtausgaben ähnlich wie bei den proprietären Formaten, man kann nie sicher sein, dass der Verlag nicht doch noch wieder was ausgräbt oder das Material in anderer Form neu auflegt.

Carl Barks (DER Donald-Duck-Zeichner!) z.B. gab es von Ehapa zuerst als Klassik-Album (mittendrin eingestellt), dann als Barks-Library im Softcover in diversen Reihen, aufgeteilt nach Lang- und Kurzgeschichten und Hauptpersonen, dann als Nachdruck im Sammel-Hardcover zum guten Preis (aber eingestellt nach der ersten Reihe), dann als ultimative chronologische 30-Bändige Gesamtausgabe im Schuber, aber in Deutschland ohne die Nicht-Disney-Barks-Comics, jetzt der Nachdruck der Schuber als Entenhausen-Edition und vermutlich in 5-10 Jahren dann nochmals als die dann wirklich komplette Gesamtausgabe! Ähnliches bei Asterix, Lucky Luke etc., wo es sogar noch neue Geschichten gibt. Bei Lucky Luke gibt es (noch) alle paar Jahre einen neuen Band der Gesamausgabe, bei Asterix gibt es aktuell aber schon die Neuauflage mit neuen Farben und größerem Format, so dass die ehemalige “Komplettausgabe” halt unkomplett bleibt. Na ja, bei der Qualität der neuen Geschichten nicht allzu schlimm…


Michael B
1.3.2014 17:16
Kommentarlink

Naja, dir scheinen deine alten Bücher ans Herz gewachsen zu sein, normalerweise achtet man dann nicht so aufs Geld. Kenne ich aus eigener scherzvollen finanziellen Erfahrung.

In deinem Fall würde ich nicht selber einscannen, für den Unternehmensbereich gibt es ja jede Menge Firmen die Belege archivieren. Suche da mal nach deinem Glück.

In einer Großstadt wie Berlin ist die Konkurenz untereinander bestimmt recht groß, da findest du bestimmt ein Betrieb, der in den umsatzschwachen Monaten noch einen kleinen Auftrag mitnehmen will.

Gruß Micha


Aggel
1.3.2014 19:20
Kommentarlink

Auf einem Kongress habe ich mal einen selbstgebauten “Buch-Scanner” mit 2 Digicams und Spiegeln gesehen. Eine Art Kubus wo oben die Kameras und Spiegel aufgehängt waren. Ein X-förmiger Ständer hielt das Buch und es wurden beide Seiten des Buchs über die Spiegel fotografiert. Hat den Vorteil, dass man das Buch nicht beschädigen muss. Soweit ich mich erinnere war das umblättern aber nicht automatisiert.


Stefan W.
1.3.2014 21:23
Kommentarlink

Wenn man ausprobiert, wie lange es dauert eiN Buch zu scannen, und wie viele man in einer Stunde/an einem Tag schafft, dann kann man auch einen Studenten von der TUSMA/Heinzelmännchen mit dem wenig interessanten Job betrauen.

Man muss dann abschätzen, ob es sich lohnt. Das Speichermedium sehe ich nicht als Problem. Alle 10 Jahre mag eines verschwinden, aber dann kopiert man es rüber auf ein neues, bei dem das TB nur noch ein 1/10tel kostet. Einmal digital ist das kaum ein Problem. Ich wette Hadmut hat noch aktivierbare Geräte, die Disketten lesen können.


Hadmut
1.3.2014 21:33
Kommentarlink

Leute, für wie doof haltet Ihr mich eigentlich?

Meine Daten werden regelmäßig umkopiert.

Und im Gegensatz zu einigen Verwandten, die damals auf Windows und irgendwelche Office-Pakete gesetzt haben, die es lange nicht mehr gibt, weshalb sie ihre alten Dateien nicht mehr lesen können, kann ich noch alles lesen, was ich ab etwa 1990 produziert habe. Nur manche Tex-Files lassen sich nicht mehr unverändert übersetzen, weil die Packages nicht mehr da sind, und manche dvi-Files sehen mangels der Fonts gruselig aus. Aber lesbar ist noch alles.


Carsten
2.3.2014 9:38
Kommentarlink

@Fred

P.S. Meine ZBV Reihe ( http://de.wikipedia.org/wiki/ZBV_%28Romanserie%29 ) kann ich heute noch problemlos durchblättern.

Heh, danke für den Link. Ich wusste noch gar nicht, dass es die mittlerweile als eBook gibt. Kann ich die im Karton fehlenden drei Bände ja doch noch mal lesen 🙂


Werner
2.3.2014 12:20
Kommentarlink

PDF/A should do it…


Stephan
2.3.2014 13:14
Kommentarlink

Den Aufwand die Bücher selbst zu scannen sehe ich als sehr hoch an. Wenn sie Dir also nur alle Jubeljahre beim Umzug in die Quere kommen, dann sind sie offentsichtlich nicht so wichtig für Dich. Ich bin in solchen Dingen dann nicht so sentimental und würde die Bücher so wie sie sind aufheben, oder tatsächlich wegschmeißen, bzw. an jemanden verschenken, der sowas sammelt.
Wenn es aber tatsächlich ums Habenwollen geht, dann würde ich mir vermutlich einen Dienst suchen, der mir die Dinger digitalisiert. Das kostet zwar, aber die Kosten sollten im Voraus halbwegs bekannt sein. Beim Selbermachen kommen erstmal Anschaffungskosten hinzu, von denen man nicht genau weiß wie hoch die sind. Dann scannst Du ein bischen, stellst fest, das dem Equipment etwas fehlt, Du wieder nachrüsten mußt und somit nochmal Geld ausgibst. Insgesammt kann das schon güstiger sein, als der Dienstleister, nur weißt Du das erst hinterher. Die Mühe und Zeit des Selbermachens mußt Du auch noch hinzu rechnen.


a scanner darkly
2.3.2014 16:07
Kommentarlink

Ich habe das mal teilweise gemacht. Erst die Bücher so gescannt dass sie heile bleiben -> extrem aufwendig.

Danach ging ich dazu über die Bücher zu zerschneiden durch einen Einzugscanner zu jagen, schon besser, da kann man schon einige wegschaffen aber wenn die Seiten wie bei dir schon am zerbröseln sind, wieder sehr aufwendig.

Mit Abfotografieren habe ich es zwischendrinn auch immer wieder versucht, grauenhafte Ergebnisse, viel Nachbearbeitungsaufwand, diese Methode frisst am meisten Zeit, ausser man hat eine spezielle Vorrichtung dafür.

Danach kam ich zu dem Entschluss dass ich das alles nicht mehr brauche und in den Müll geworfen oder z.T. noch verkauft.

Vermisse bis heute davon nichts. Selbst das was ich gescannt hatte wurde bisher nicht mehr wieder angefasst.

OCR lohnt nur wenn es reine Textseiten sind wie bei Romanen,… ansonsten viel Nachbearbeitung notwendig.

Das was wirklich wichtig ist und nicht mehr nachkaufbar würde ich ausser Haus geben, manches gibts auch schon fertig digitalisiert “von Dritten”, vor allem Comics, das muss man nicht nochmal selber machen.

Ansonsten ist das Ganze ein Vollzeitjob, da war mir die Zeit für andere Dinge doch wichtiger als monatelang am Rechner stupide Tätigkeit zu verrichten. Habe nach den letzten Büchern überschlagen wie lange ich dafür brauchen würde, über 2 Jahre wenn ich jedes Wochenende Bücher scannen würde. Ne da mache ich lieber was anderes.


Hadmut
2.3.2014 16:30
Kommentarlink

@a scanner darkly:

Ja. Genauso geht’s mir auch. Das ist ein Haufen Arbeit und frisst unglaublich viel Zeit, außerdem ist es stupide und hinterher tun einem die Arme weh.

All die Schlaumeier, die einem da „Digitalisieren” als tolle Idee anbieten, haben das selbst noch nie in größerem Umfang gemacht.


Alex
2.3.2014 17:13
Kommentarlink

http://www.golem.de/news/open-source-buchscanner-blaettert-mit-staubsaugerhilfe-um-1211-95718.html

http://wiki.diybookscanner.org/scanner-build-list

Mini-Projekt 🙂

(Eigentlich hätte ich erwartet,da ne version aus Lego zu finden, aber dem war nicht so 🙁


Hadmut
2.3.2014 17:18
Kommentarlink

> Eigentlich hätte ich erwartet,da ne version aus Lego zu finden

Lego ist out. Die Teiledaten für den 3D-Drucker wäre die aktuelle Methode.


Joe
4.3.2014 14:26
Kommentarlink

http://www.golem.de/news/open-source-buchscanner-blaettert-mit-staubsaugerhilfe-um-1211-95718.html

Mit schwachbrüstigen EU-Staubsaugern wird das wohl nicht funktionieren. 😉


Joe
4.3.2014 14:34
Kommentarlink

Und im Gegensatz zu einigen Verwandten, die damals auf Windows und irgendwelche Office-Pakete gesetzt haben, die es lange nicht mehr gibt, weshalb sie ihre alten Dateien nicht mehr lesen können, kann ich noch alles lesen, was ich ab etwa 1990 produziert habe.

Ich habe damals auf StarOffice gesetzt und das kann OpenOffice immer noch lesen. Da habe ich einfach mal Glück gehabt. 🙂

Strategisch klug bin ich damals bei der Wahl des Langzeit-Archivformates (ZIP) vorgegangen – zur Wahl standen u. a. ARJ, LZH, RAR und diverse andere Exoten, die heute keiner mehr kennt. Aber statt nach technischer Überlegenheit zu gehen, habe ich mich an einfach der Verbreitung orientiert und damit genau richtig gelegen.


Francis Schmit
8.3.2014 12:22
Kommentarlink

Der Scanrobot ist eine Entwicklung der Wiener Firma Treventus; das Buch liegt halb aufgeschlagen in einr ARt Wiege. Von links und rechts oben zwei Digitalkameras, die Seiten werden pneumatisch mit Unter- und Überdruck gewendet. Die ersten Exemplare kosteten 85.000 €, UB Göttingen hat einen , die Bayerische Staatsbibliothek viere, sie arbeiten aber nicht fürs Publikum. . Herr Plattner von Treventus wird sich sicher über die Neuerfindung durch google freuen.
Photographieren: 1965 habe ich in der Library of Congress, damals der größten Bibliothek der Welt, die Materialien für meine deutsche Bibliographie von Kamerun gesammelt, mit Hilfe einer Einrichtung von Kodak : die Retina wurde auf eine Halterung geschraubt, vier auszihbare Füßchen gingen zu einer Glasplatte, die den centimetergenauen Abstant garantierte, und das Gestellt wurde am Fenster auf das Buch gestellt. Zuhause in Yaoundé ließ ich die Abzüge zu dortigen Preisen entwickeln und konnte sie in ruhe bearbeiten. Dann verbreiteten sich langsam die Photokopierer und die Xerokopierer, die Technik für das Printin on denand.