Was und wie und für wen eigentlich archivieren?

29. September 2022 18:15 Uhr  |  Dr. Ulrich Kampffmeyer  |  Permalink


Die elektronische Archivierung wird inzwischen als selbstverständlich betrachtet. Viele denken dabei zunächst an die Aufbewahrung von geschäftlichen Unterlagen, die dem Records Management und der revisionssicheren Archivierung zuzuordnen sind. Archivierung ist aber mehr als das. Professionelle Archivare sprechen daher zur Unterscheidung vom Umgangssprachlichen von der Langzeitarchivierung. Langzeitarchivierung ist begrifflich jedoch ein Pleonasmus, da Archivierung die dauerhafte, die ewige Aufbewahrung von Dingen wie auch Information bedeutet. Langzeitarchivierung hat als Begriff den Zweck sich von der umgangssprachlichen Nutzung des Begriffes Archivierung abzugrenzen. Langzeitarchivierung hat den Anspruch, Information ewig aufzubewahren, ohne Aufbewahrungsfristen, in Formaten, die noch in Jahrzehnten, Jahrhunderten lesbar sein sollen.

„Warum“ überhaupt archivieren?

Die Fragen nach dem „Was, Wie, warum für wen“ gehören eigentlich zu den den grundsätzlichen Themen, die im Grundstudium für Historiker, Archivare, Bibliothekare, Dokumentare, Records Manager und Information Manager beantwortet werden müssen. Die Frage nach dem „Warum“ scheint dabei am Schwierigsten zu beantworten zu sein.

Auf der Webseite „Einstieg“ für das Archivwesen an FHs und Universitäten heißt es „Im Archivwesen-Studium lernst du Unterlagen zu bewerten und so zu lagern, dass sie im Ganzen oder in Ausschnitten auf Anfrage verfügbar sind, meist innerhalb eines engen Zeitrahmens. Du kümmerst dich um die Erhaltung historischer Dokumente und hilfst, historische Quellen zu sichten. Du beherrschst die Tektonik, um die verfügbaren Bestände nach ihrer Provenienz (Herkunft) zu gliedern oder bestmöglich verfügbar zu halten. Themen der Digitalisierung und Verfahren, Dokumente zu konservieren oder zu restaurieren, gehören ebenfalls zu deinem Fachgebiet. Der Umgang mit Datenbanksoftware und EDV-gestützten Verfahren spielt im Archivwesen-Studium – und auch in dessen Erweiterung als Studium des Bibliotheks-, Archiv-, Informations- und Dokumentationswesens – eine Schlüsselrolle.“ (https://www.einstieg.com/studium/detail/archivwesen.html). Langt dies auch noch heute?

Norbert Reimann hat in einem Artikel einiges Grundsätzliches zum Thema „Archiv“ zusammengestellt: https://www.phil-fak.uni-duesseldorf.de/fileadmin/Redaktion/Institute/Kultur_und_Medien/Medien_und_Kulturwissenschaft/Dozenten/Szentivanyi/Archive_im_digitalen_Wandel__mit_Kerstin_Reimann_/Reimann.pdf. Reimann spricht hier von den „klassischen Archiven“, wo eine Bewertung des Archivguts durch professionelle Archivare erfolgt.

Vielleicht steckt das „Warum?“ auch einfach in unseren Genen, in der Psychologie, alles zu sammeln und aufzubewahren. Eine menschliche Eigenschaft, sich mit der Frage nach dem „Woher“ und dem „Wohin“ zu beschäftigen. Das Aufbewahren „liegt uns im Blut“. Die ältesten Archive, z.B. Keilschrifttafeln, waren eher „kaufmännische Daten“ und Verträge denn Archive in unserem heutigen Sinne. Das Archiv als zivilisatorische Errungenschaft und Institution kommt erst später. Die Motivationen zum Archivieren scheinen aber auch damals die gleichen gewesen zu sein.

Marcus Friedrich sieht in seinem Überblick zur Geschichte des Archivierens einen Schwerpunkt beim Ansatz der Historiker, ohne dass das Archiv bei ihnen ein Schwerpunkt war: „Nach Ansicht der meisten Historiker, sind Archive oft nur Durchgangsstationen in der historischen Darstellung. Die Geschichte des Archivierens war bis vor kurzem kein vorrangiges Thema für Historiker.“ (https://lvrafz.hypotheses.org/2155). „Klassische Archive“ also nur als Grundlagen für die historische Forschung?

Auf Wikipedia (https://de.wikipedia.org/wiki/Archiv) heißt es „Archivgut ist derjenige Teil von Unterunterlagen, der von Schriftgut führenden Stellen wie beispielsweise Behörden, Unternehmen, Vereinen, Familien oder Privatpersonen für die aktuelle Aufgabenerledigung nicht mehr benötigt wird und vom zuständigen Archiv als unbefristet aufzubewahren bewertet wurde (Archivische Bewertung). Diese Art von Dokumenten haben die Eigenschaft, dass sie die Aufgaben (sowohl Pflichtaufgaben als auch freiwillige Aufgaben) und die Tätigkeiten der jeweiligen unterlagenführenden Stelle authentisch dokumentieren (beispielsweise Bankenaufsicht des Bundesfinanzministeriums, Wasserversorgung einer Gemeinde, Produktdesign im Autounternehmen, wissenschaftliche Daten eines Forschungsinstituts, Tagebuch oder Briefwechsel einer Privatperson).“ Es wird auch hier auf die ungenaue Benutzung des Begriffes „Archiv“ eingegangen: „Oft steht Archiv einfach für einen Ort, an dem nicht mehr Aktuelles vorgehalten wird, beispielsweise haben viele einen entsprechenden Archivbereich. Bei Archiv handelt es sich nicht um einen fest definierten oder gar geschützten Begriff. Ganz unterschiedliche Einrichtungen dürfen sich Archiv nennen, obwohl es vielfach näher läge, sie als Altregistraturen, Bibliotheken, Museen oder Dokumentationsstellen zu bezeichnen.“ Der Begriff des „Archivs“ hat in Unternehmen und Organisationen sowie bei Privatpersonen eine ganz andere Bedeutung als der akademisch gefasste Archivbegriff. Und der Archivbegriff wandelt sich durch die digitale Archivierung von elektronischer Information zunehmend. Wo letztlich physisch die Server stehen, wo das elektronische Archivgut gespeichert wird, spielt nicht mehr die Rolle, die physische Archiveinrichtungen haben. Das „warum archivieren wir überhaupt“ wird in dem Artikel auf Wikipedia nicht beantwortet.

Auch der Auftrag des Bundesarchives (https://www.bundesarchiv.de/DE/Navigation/Meta/Ueber-uns/Aufgaben/aufgaben.html) bringt wenig Licht in die Frage des „Warum“ sondern fokussiert zunächst auf das „Was“: „Das Bundesarchiv hat den gesetzlichen Auftrag, das Archivgut des Bundes auf Dauer zu sichern und nutzbar zu machen. Dabei handelt es sich um Unterlagen wie Akten, Karten, Bilder, Plakate, Filme und Tonaufzeichnungen in analoger und digitaler Form. Diese Unterlagen sind bei zentralen Stellen des Heiligen Römischen Reiches (1495-1806), des Deutschen Bundes (1815-1866), des Deutschen Reiches (1867/71-1945), der Besatzungszonen (1945-1949), der Deutschen Demokratischen Republik (1949-1990) und der Bundesrepublik Deutschland (seit 1949) entstanden. Das Bundesarchiv entscheidet, ob die Unterlagen „archivwürdig“ sind, das heißt ob ihnen bleibender Wert für die Erforschung und das Verständnis von Geschichte und Gegenwart, für die Sicherung berechtigter Interessen der Bürgerinnen und Bürger oder für Gesetzgebung, Verwaltung und Rechtsprechung zukommt.“ Im letzten Satz, der Sicherung von Interessen und bei Gesetzgebung und Rechtsprechung findet sich dann eine Begründung für „warum“. Immerhin wird auch explizit in der aktuellen Version der Aufgabenbeschreibung auf die Digitale Form hingewiesen.

Allerdings stellt sich weiterhin die Frage, ob die Prinzipien des „klassischen Archivs“ auch für die elektronische Archivierung, bzw. Digitale Archivierung gelten.

Peter Sandner, Landesarchiv Baden-Württemberg, hat in einem „FaQ“ die Anforderungen an die Digitale Archivierung allgemein erläutert: https://www.landesarchiv-bw.de/sixcms/media.php/120/59098/Sandner_10_FAQs.pdf.

Der bisherige Ansatz der Archivierung wirft jedoch einige grundsätzliche Fragen und Probleme in Bezug auf den Sinn und die Art des Archivgutes im Digitalen Zeitalter auf. Es ist notwendig, die Frage nach dem Ziel, Zweck und Sinn der elektronischen Archivierung noch einmal zu stellen.

Digitale Archivierung elektronischer Information

Es macht Sinn, zwischen den internen Informationssammlungen und öffentlich zugänglichen zu unterscheiden.

Intern genutzte Archive

Interne Archive stehen nur einer Gruppe von Berechtigten zur Verfügung. In der öffentlichen Veraltung hat es lange gedauert, bis man sich mit der elektronischen Langzeitarchiv ernsthaft auseinander gesetzt hat. Vielfach steckt die öffentliche Verwaltung auch noch im Records Management, der Schriftgutverwaltung, vor den Archivierung fest. Inzwischen gibt es aber Regularien, wie elektronisches Schrift an Archive, wie z.B. das Bundesarchiv (https://www.bundesarchiv.de/DE/Content/Downloads/Anbieten/b2-abgabe-elektronische-akten-datenpakete.pdf?__blob=publicationFile), Landesarchive, etc., abgegeben werden müssen. Dieser Ansatz basiert auf Paketen, die sich am internationalen Standard ISO 17421 Open Archival Information System (OAIS) orientieren und diesen technisch für bestimmte Anwendungsbereiche definieren. Hier wird auch unsere spätere Frage nach dem „Was“ beantwortet. In diesem Umfeld finden auch immer aufs Neue die Diskussionen statt, welche technischen Formate und Standards für Information, Dateiformate und ihre Anzeigekomponenten, für eine dauerhafte Archivierung geeignet sind (z.B. https://www.dpconline.org/handbook/technical-solutions-and-tools/file-formats-and-standards). Die Formatfrage lassen wir aber heute einmal außen vor, auch wenn sie für Verfügbarkeit und Nutzbarkeit von elektronischen Archiven eine entscheidende Rolle spielt. Auch das Thema „inhaltliche Erschließung“ mit Datenbanken und Suchmaschinen behandeln wir hier heute nicht.

In Unternehmen, Organisationen und Vereinen spielt eher die Frage der Aufbewahrung die wichtige Rolle. Die „Revisionssichere Archivierung“ lassen wir jedoch einmal außen vor (https://www.project-consult.com/category/revisionssichere-archivierung/). Bei der revisionssicherten Archivierung geht es um die Aufbewahrung, das Records Management, während der Aufbewahrungsfristen. Die eigentliche Archivierung, die Langzeitarchivierung (ein Pleonasmus), beginnt erst danach. In der öffentlichen Verwaltung wie auch in den Unternehmen spielt diese Form der Aufbewahrung eine andere Rolle als der akademische Archivierungsansatz. Auch in Organisationen und Unternehmen gibt es eine Langzeitarchivierung, z.B. das historische Unternehmensarchiv. Hier muss zwischen dem Bewahren von historischen Zeugnissen der Geschichte und „Wissens-Archiven“ unterschieden werden. Letztere haben das Ziel von allen Beteiligten als Wissensbasis genutzt werden zu können. So gesehen gibt es überall ein Bewusstsein, einen Bedarf, auch ältere, vielleicht sogar inzwischen irrelevante Information dauerhaft zu archivieren. Bei Wissensarchiven wird die obige Frage nach dem „Warum“ eher beantwortet als bei den „klassischen Archiven“.

Die freie, öffentliche Bereitstellung der Inhalte spielt bei dieser Gruppe von Archiven eher keine Rolle.

Öffentlich zugängliche Archive

Öffentlich zugängliche Informationssammlungen mit „archivischem Charakter“ benutzen heute meistens Internet-Technologien für den Zugang und die Bereitstellung. Suchfunktionen und Ordnungssystematiken erschließen diese Inhalte. Im Bereich der „echten Archive“ spielen die Informationsfreiheitsgesetze zunehmend eine wichtigere Rolle (das deutsche IFG https://www.bmi.bund.de/DE/themen/moderne-verwaltung/open-government/informationsfreiheitsgesetz/informationsfreiheitsgesetz-node.html). Die Archivierung von Webinhalten ist immer noch ein Problem. Die DNB Deutsche Nationalbibliothek hat erst seit 2006, konkretisiert 2017, den gesetzlichen Auftrag, deutsche Inhalte im Internet zu archivieren (warum eigentlich nicht das Bundesarchiv?). Das Internet-Archiv (www.archive.org) hat in ihrer Wayback-Maschine in zwischen Milliarden von Webseiten archiviert – jedoch auch nur ein Tropfen auf den heißen Stein. Wir erfahren gleichzeitig eine Flut von Information – vieles davon ROT (redundant, Outdated, Trivial) – und einen gigantischen Verlust von Information im Internet: das „Große Vergessen„. Kulturelle Archive wie Europeana (www.Europeana.eu) erfreuen sich lediglich der Besuche von Liebhabern. „Klassische Archive“ sind nur eingeschränkt im Internet erreichbar. Von Unternehmensarchiven oder archivierten Unternehmenswebseiten häufig ganz zu schweigen. Es gibt für die Öffentlichkeit häufig nur eine Auswahl an „interessanten“ Archivgütern. Nur wenige Unternehmen sind überhaupt in der Lage, die Dinge, die sie im Internet publiziert haben, auch im Zugriff zu halten.

Im Internet ist das Thema Archivierung noch nicht sehr weit entwickelt. Wir leben im „Dunklen Zeitalter der frühen Informationsgesellschaft„.

Wie, was und für wen?

Unsere Fragen „was“, „wie“ und „für wen“ sind miteinander verwoben. Besonders sind das „was“ ist vom „für wen“ eng mit einander verbunden. Welche Nutzungsmodelle sollen unterstützt werden? Wer sind die zukünftigen Nutzer? Damit meine ich nicht die aktuellen Nutzer, die praktisch weltweit direkten Zugriff auf elektronische Informationen haben. Auch die Frage „warum“ muss ständig neu gestellt werden. Auch elektronische Archive kosten Geld und bedeuten Pflegeaufwand. Wenn dahinter kein Sinn und Nutzen steht, also warum die Massen an Informationen, die auf uns einprasseln, auch noch archivieren? Man kommt ja kaum noch hinterher, die aktuelle Informationsflut zu überblicken, geschweige denn sinnvoll zu nutzen.

Beginnen wir unsere Fragen mit einem Katastrophen-Szenario zu beleuchten.
Der Gen-Pool des Home Sapiens ist zu eng geworden – die Varianz ist global gesehen geringer als bei einer Familie Orang-Utans. Die Menschheit stirbt über kurz oder lang aus.
Oder genauso drastisch – alle einfach erreichbaren Ressourcen sind erschöpft und die Menschheit wird auf einen kümmerlichen Rest reduziert.
Oder noch etwas drastischer – in den Kriegen um Wasser, Öl, Bodenschätze und Nahrung wird die Menschheit dramatisch eingedampft und fällt zivilisatorisch in die „vorchristliche Eisenzeit“ zurück.
Oder Mutter Natur treibt durch den Klimawandel nicht nur den Menschen an den Rand der Ausrottung.
Oder …
Es gibt aktuell viele Szenarien über Entwicklungen, die die Zukunft der Zivilisation, wenn nicht sogar die Zukunft des Menschen als Spezies bedrohen. In allen Szenarien wird es weniger Menschen und wahrscheinlich auch weniger Technologie geben. Geräte, Energie und Vernetzung bestimmen die Nutzbarkeit von elektronischer Information. Damit auch die Nutzbarkeit, bzw. das Überleben der „Gattung „Elektronisches Archiv“.

Die Frage nach dem „Wie“

Wir leben in Bezug auf die kulturelle Überlieferung bereits in einer digitalen Welt. Wir sind von der Verfügbarkeit von Strom, technischen Geräten und Software zu 100% abhängig. Die Überlieferung von Wissen auf Papier ist drastisch zusammengeschrumpft. Und auch Papier ist kein dauerhaftes Archivmedium. Elektronische Information ist flüchtig. Archivare und Bibliothekare machen sich schon lange Gedanken, wie denn die Information dauerhaft bewahrt werden kann. Man muss hier in Hunderten, ja sogar Jahrtausenden denken. Archive haben den Anspruch „ewig“ zu halten. Allein der aktuelle, immer schneller werdende technische Wandel. Stellen bisherige Archivierungskonzepte vor kaum lösbare Herausforderungen. Alles x-Mal verteilt speichern, auf verschiedenen Plattformen? Elon Musk für seinen nächsten Ausflug auf den Mars tausende Datenträger mitgeben? Per Laserstrahl das ganze Wissen ständig ins Weltall schießen, in der Hoffnung, es einmal wieder nutzbar zu machen? Oder doch wieder alles auf Mikrofilm bannen und im Barbara-Stollen einlagern?

Jede der prognostizierten Katastrophen, die auf die Menschheit über Kurz-oder-Lang zukommen, wird die Nutzung elektronischer Information stark beeinträchtigen. Was bliebe als Erbe einer heutigen Gesellschaft in 1000 Jahren übrig? Vielleicht Giftstoffe, vielleicht unterirdische Architektur, vielleicht allgegenwärtiges Plastik? Wenn man sich dieser negativistischen Anschauung über die Zukunft anschließt, ist man auch wieder sofort bei der Frage, „warum“ archivieren.

„Was für wen“?

Nehmen wir ein etwas positiveres Szenario an. Es gibt noch Computer, es gibt noch Strom, es gibt noch Netze – aber der Mensch in seiner Ignoranz hat die Gesellschaft und unsere jetzige technologisch definierte Zivilisation „zerlegt“. Wer benötigt dann was? Welche Information ist dann in diesem Hollywood-Katastrophenfilm nützlich? Braucht man dann noch elektronische Kopien von Verträgen, hochgeistige Literatur, Bilanzen vergangener Unternehmen, Betriebskonzepte für Atomlagerstätten? Oder ist der Bedarf dann eher aus Anleitungen zum Herstellen von Geräten, Videos zum herstellen von Keramik, Bildern zum Unterscheiden giftiger von ungiftigen Pilzen, Beschreibungen des Schmiedens oder Rezepte zum Wurzelnkochen ausgerichtet?

Es geht also um die Inhalte und Bewertungsmaßstäbe, was „archivierungswürdig“ ist. Dies entscheiden aktuell noch Menschen, teils Spezialisten, teils Laien. Zukünftig wird vielleicht Künstliche Intelligenz die Auswahl treffen, weil Menschen angesichts der Sturmflut von Information zunehmend überfordert sind. Es gibt halt zu wenige ausgebildete Archivare, Dokumentare, Bibliothekare, Records Manager. Und diese sind zum Teil auch noch verunsichert in Bezug auf ihre Arbeit und dass sie möglicherweise durch Software, durch Algorithmen, durch KI ersetzt werden (dies ist aber eher ein Thema für einen weiteren Artikel). Die Frage, was ist „archivierungswürdig“ muss ständig neu gestellt werden, um mit der Entwicklung unserer Gesellschaft Schritt zu halten. Viele bisherige Maßstäbe für die Archivierung gehören selbst ins Archiv. Wichtigstes Kriterium sollte nicht mehr der Bedarf der Historiker sein, sondern der Bedarf an Information „normaler Nutzer“. Deren Bedürfnisse sind unterrepräsentiert und damit sind auch die meisten Archive, ob nun digital oder physisch für die Mehrzahl der Menschen uninteressant.

Die elektronische Archivierung bietet aber hier gerade neue Möglichkeiten, Sinn und Nutzen von archivierter Information einer größeren Nutzergemeinschaft zugänglich zu machen. Damit lassen sich dann auch die Investitionen in mehr Personal, modernere Archive und die Erfassung von noch analogen Beständen begründen. Records Manager und Archivare gehören nicht an das Ende des Lebenszyklus der Information, wo diese in Senken verschwindet, sondern an den Beginn des Lebenszyklus. Dorthin, wo Information entsteht oder wo sie empfangen wird. Nur dann kann auch von Anfang an sauber eingesteuert werden, was mit der Information im weiteren Verlauf geschieht. Darauf zu warten, dass schon das „richtige“ Archivgut im elektronischen Ingest-Eingang eines Archivs eintrudelt, ist heute nicht mehr opportun.

Die Zukunft der Archivierung

Es wird auch in Zukunft Archive geben, physische und elektronische. Über ihre Akzeptanz wird der Zugang und die Nützlichkeit entscheiden. Museen haben hier einen Vorteil mit ihren Sammlungen („Archiven“), da sie auf ein größeres Publikum ausgelegt sind. Ob es den Archiven gelingt auch in Zukunft zu springen? Oder bleiben sie eine Erinnerung an die guten alten Zeiten des eingestaubten Papierarchivs? Die Archivierung des Internets und öffentlich zugänglicher Web-Inhalte wird sich fortsetzen, aber auch einem Kommerzialisierungsdruck unterliegen. Heute schon sind viele PDF-, Bild- und Powerpoint- und Video-Bibliotheken kostenpflichtig. Auch dort finden sich immer mehr Inhalte, die auch in „richtigen Archiven“ vorliegen sollten. Der Schutz von Information, Vertraulichkeit und Zugangsberechtigungen werden immer wieder durch „Hacks“ unterlaufen. So wird auch Archivgut, dass eigentlich gut geschützt in „vertrauenswürdigen Archiven“ liegen sollte, in die Öffentlichkeit gespült. Die Fragen personenbezogener Daten, der Geheimhaltung oder der Nutzung durch eine selbstlernende, sich selbst weiterentwickelnde Künstliche Intelligenz sind hier noch nicht einmal am Rande berührt.

Die Gremien, Verbände und Organisationen der Archivare wie auch die Gesetzgeber und Vorschriftenmacher haben hier noch viel zu tun, um die vielen „W“-Fragen ernsthaft und sinnhaft zu beantworten.

Oder sind Sie anderer Meinung? Dann freuen wir uns über Ihren Kommentar zu unserem Beitrag:
Warum?
Was?
Wie?
Für wen?

Dr. Ulrich Kampffmeyer

Curriculum auf Wikipedia https://de.wikipedia.org/wiki/Ulrich_Kampffmeyer

14 Kommentare zu “Was und wie und für wen eigentlich archivieren?

  • Just a few comments in the sideline
    24. Oktober 2022 um 17:28
    Permalink

    Hi Ulrich,
    Ich hätte meine Kommentare in Deutsch schreiben können, aber Englisch ist mehr ein bisschen mehr vertraut.

    You wrote quite a long read about archiving. I didn’t follow all the links, but I assume that’s fine. There is nothing more I can add to it. So let me give my perspective. You asks the three questions Warum?, Was? and Wie? That’s exactly the three questions archives can answer.

    Was?

    Most historical archives record what has happened in history. What has happened in the past? And also, when and by whom. These archives are used by historians and alike, also lots of amateurs. The main question is to reconstruct historical events according to a timeline. These types of archives are most known. They form, as we call it in the Netherlands, the “collective memory” (“collectief geheugen”). The documents and records in these archives should be kept forever. That is, as such, the main challenge.
    In the Netherlands these types of archives are getting digitised. The advantages is that they take up less space, are more easily searchable and accessible. And have fewer operating costs because you don’t need many personnel to handle the document retrieval.
    But on the other site, I think the maintenance costs are underestimated. To remain accessible, the documents need to be refreshed. That is relocated on newer media, possibly converted to new formats, etc. And to keep them preserved, we need energy with a CO2-footprint, diskspace (though cheap not for free), etc. It requires constant active maintenance. You cannot store them, like paper document and files, and leave them alone. Like so many local and private paper archives. Not good for preservation, but still possible.
    The major problem with electronic long-term archives will be the rising costs and effort for maintaining these archives. For whom, some silly historians? The deeper problem is that we live in unhistorical times. We don’t care we’re we came from anymore. So why archive so much, is the political question when money is limited.

    Warum?

    One of the main purpose of archives at government level in the Netherlands is to find answer to why-questions. Why and how did the government in general, and policy makers in particular, create specific laws, policies and so on. Governments in democracies need to be accountable, and archives can help.
    Needless to say, filling these archives correctly is always a problem, because politicians and civil servants want to have some room to play; they do not want everything confidential revealed and archived. Recent incidents around lost text messages of the Dutch prime minister illustrate this issue.
    Most archivists think these archives need to be integrated in the long-term archives. But do we need that level of detail for future generations? Or is it just a practical solution because there’s no manpower to cleanse the archives over time? Maybe some things need to be lost in the mist of history…

    Wie?

    This are the archives that support Knowledge Management. An archive as part of a knowledge database. Knowledge Management was hot twenty years ago but never took off. Because KM so hard to create. I’ve seen project files dumped into archives, but their accessibility is poor that they are hardly usable. Their searchability is also questionable, because when I have a question, where do I find the answer?
    I once hoped IBM Watson could make Knowledge Management based on documents possible. I still think it is technically feasible. But economical justification, culture differences and lack of added value* make the business case nearly impossible.
    *) When deployed as an expert system for experts, IBM Watson and the experts mostly agree. Most things in our daily lives are not that exceptional. Only in a few cases IBM Watson found alternative solutions for a problem. When a system mostly agrees, what’s the added value?

    But I want to add some extra insights, not covered in your article.

    Fake archives
    Fake archives are repositories that promise the long tail, but don’t do that. How many music lovers got rid of their CD’s because streaming services had it all readily stored? Now they discover that providers like Spotify and Netflix do curate their contents and delete content that isn’t accessed frequently enough.
    At the start of the internet age, we were promised the “long tail”. But of no avail, keeping scarcely used objects, like music or movies, only costs money to keep online. As said above, storage is cheap but not free.
    People, yes even governments, should realise that libraries are no archives. In my local library, older and less borrowed books are sold off. There isn’t enough room for storage and in the budget to keep those records.
    But still I read a lot about governments that want to reduce archiving costs and refer to the internet as the place to find information. It is already on the internet, why should we keep it. I find this dubious…

    Off-load archives
    Companies and governments that don’t want to spend a lot of money on archives, just buy storage space to store documents without curation. Email archives, or email dumps, are excellent examples. All emails are stored somewhere in a “data reservoir”. These dump yards are inaccessible because the documents are not tagged, labelled, classified, or indexed. Advanced search technology may help a little but looking for a needle in a haystack will always be a tedious, even impossible, task.
    Things even get worse when you’ve dispersed archives, better: document stores, with a company search engine. No curation at all…
    I once had a project for a data reservoir at a bank. I introduced to so familiar concepts as data/document life cycles, preservation, accessibility etc. The whole OAIS-stuff. My colleagues never heard about it but were grateful I introduced it. But how many data gurus think about these issues? (That’s a rhetorical question.) Nowadays, not all records are documents in a well-kept archive, to put it mildly. You get the gist…

    Deleted archives
    It is always painful to see company archives being shred. It seems they don’t have any interest anymore in their past. It’s all about money, isn’t it? In the best case, voluntaries will take over the archive and keep them for the future. And that’s sometimes the best-case scenario. It is also regrettable that institutions like the internet archive is also a voluntary based organisation. It does not dismiss the groups, but I think we should take long-term archiving more seriously. In order not to end in an era without records, hence without history.

    These are just my ideas triggered by your excellent article. Maybe they’re of help.

    Regards,
    Reinoud

    Antwort
    • Some reflections on Your ideas on Archives
      25. Oktober 2022 um 11:27
      Permalink

      Dear Reinoud,
      many, many thanks for your great comment! Some remarks to your ideas:


      „What“
      The question „what to archive“ addresses the material, especially the electronic content, which grows at exponential rates. It is understood, that „classic“ or „traditional“ or „historic“ archives can answer my question in regard to their goals and tasks. But the real question behind that, are these goals still sufficient in regard to the masses of electronic information. The general question is, are the scope, principles, material and objects of archiving still valid and suitable for our times. You write, „we live in unhistorical times“. I do not share this view. Our view on historical events has become different and the definitions of „historical“ and „history“ in regard to the objects to be archived are waivering. So what material, what content should be archived for future use and knowledge creation?

      „Why“
      Yes, the question „why“ can clearly answered by traditional archives and archivists. I linked answers in my blog article. But are these answers, these goals, these principles still valid in tthe digital age of our times? For what use are we archiving digital information? Historic? Knowledge? Practical Help? Guidance? Is the wish to keep information for ever (at least a lifetime of the human being, which archives) in our genes? The question of knowing „from where we came from“ remains strong. Even our inherited claim to gather and hoard stuff remains. And we currently hoarding masses of digital information redundantly, because they are of interest to many people. Other digital information, which may be even of greater importance but of interest only to a few people, gets lost. With regard to the continuous loss of digital information „We are living in the dark ages of the early information society“.

      „For whom“
      As well this question can be answered by the traditional archivist: primarly for the Historian, but as well as source for laws, legal issues and cultural values. A museum as „archive“ may be of greater use for the public, because it makes objects and information accessible. Accessing traditional public archives is quite different and often restricted to „specialists“. A state archive cannot be compared to a city archive, although ruled by the same principles. Different user audiences have different requirements in regard what can be found and how to access the objects. And there are more and different archives than those of the public sector, which a governend by laws and regulations. Which audiences will these archives address in the digital age? Electronic information can be stored easily, far more faster than traditional paper archives. With modern techniques the retrieval of the contents can be made mucher easier and faster. The capabilities should address a much wider range of users of such archives. So the question remains: which audience do we address with electronic archives?

      „How to“
      Digital archives are not only endangered by permament technology obsolence but generally by the availibility of ressources, electric power, networks, computers, and knowledgable people. We are by 100% dependant on the availibility of technical solutions when it comes to archives today (even the paper archives cannot suvive without electricity, computers and othe technical ressouces). So if we think about preservation on a long term time scale, our current archives a very vulnerable. Continouos migration helps on the short term, but what is our long term strategy? Assyrian burnt clay tablets, the few, that survived, are still available today and can be read. But what will happen to our disk, our cloud and other electronic storage systems?

      I still miss „real“ anwers and solutions for my questions.

      Thank you very much for adding some other aspects.

      „Fake archives“
      You are right, we cannot trust commcercial providers of archives for the general public, i.E. saving all your digital photographs on Amazon, storing your articles, slides and videos on publication websites like Slideshare, Scribd or Youtube. Even when it is a paid offering, you are subject to the commercial interests of the provider. Social media websites, containing as well articles, images and other stuff, where shut down like Google+. Initiatives like the Internet Archive (archive.org) are trying to save the contents of publicly accessible websites. But this is no solution for non-public, internal content on sites and servers of organisations, governments and businesses. A lot of folks even believe, that such internet solutions could solve the problems of saving all relevant content on the web. By the way, what about all the „archives“ of digital memorables, fotos and videos of private people? How can a private person deal with archiving of digital assets? These private collections will be all lost soon. I wouldn’t call these offerings on the web „archives“ at all, they are repositories at best. They do not follow the principles of traditional archives governerd by priniples and run by professional archivists. So „Fake „Archives““ could be a good term.

      „Off-load archives“
      These are no archives at all but garbage dumps. It is crucial to select the „right“ information, to organize it somehow and to make it accessible. With no possibility to find the correct, actual, authentic information needed, such an information dump is worthless. It is even dangerous, when people think, they had solved the archival problem with such a dump.
      You talk about OAIS in this context. OAIS is more about interchange of archival objects than archiving itself. OAIS is misunderstood by most people as architecture or even technical solution. By the way, OAIS is no solution for archiving systems directly connected and embedded in application delivering the content directly into the electronic archive. OAIS is based on isolated systems using packages for ingestion, storing and delivering information. But systems based on the OAIS concept are no dumps, because it is necessary to organize, format, describe and check information before it can be ingested in such a solution.

      „Deleted archives“
      We loose archives all the time. We lost them in the past, we’ll loose them in the future. In the public sector archives at least a certain share of the information will be perserved. In companies there is often no awareness of the value of information. IT-people (and their managers) often regard „Archives“ as expensive lead blocks of no use at all. In their mid, these growing static storages are obstacles to the flexible further development of IT solutions. But we forget about the opportunities which the digital world offers. It is very easy to copy digital information and to create controlled redundant archives. We are not talking about uncontrolled mass copies of accidental information but about controlled and usable copies of relevant archival information. So at least, loss by chance can be avoided. But I believe – sooner or later – Deletion is the fate of every digital archive when we continue to behave as huiman society as we do today. Environment, war, autocracy, greed, neglect, ressources – these are as well challenges for our archives. Leading back to our questions „What“, „Why“, „For Whom“ and „How To“.

      Kind regards,
      Uli

      Antwort
      • Just a few comments in the sideline (2)
        25. Oktober 2022 um 16:32
        Permalink

        Hi Ulrich,
        Thank you for your additions.

        My message is that there are different types of archives.
        For each type of archive we have different answers to the questions „What“, „Why“, „For Whom“ and „How To“. In fact, each individual archive might have different answers. But for example, an archive for Knowledge Management has different requirements than an long-term „historical“ archive. There’s of course a lot of overlap, but the use cases may differ.

        I see OAIS as a kind of checklist how to structure the ingest function. What steps you should take in order to store documents in an orderly manner. I know a lot of electronic archives where these steps are ignored. That’s my meaning of a „dump archive“. Just dump it in a repository, without any useful metadata etc. Full-text retrieval will do. They’re no archives, but users and consultants call these dumps archives. Archival awareness is scarce in IT.

        You talk about the challenges for electronic documents and how to preserve them over time. I don’t have answers either. Only that whatever solution we design, it will be costly to make it work. And are we prepared to pay the price? Who are the stakeholders for long-term archives? Is civilized society the prime stakeholder? That is rather diffuse. I was a couple of years ago in a local archive. They stored documents on writable CD’s. The archivists didn’t want to answer my questions about the durability of the medium, the availability of hardware to read CD’s, the conversion of file types etc. The looks they gave me was more like we know you’r questions are relevant, but we don’t want to think about it now. No resources, no ready solutions. [Personally, I would „print“ the documents to film. But that only works for documents, not for all those other formats like movies, sound, animations etc.]

        The quest we’re in is that we have to make clear that archiving is necessary, requires knowledge and discipline, and comes with a price. This becomes more urgent when we talk about archival of data in other forms than documents and files.

        Regards,
        Reinoud

        Antwort
        • Some Reflections on Your Ideas on Archives (2)
          26. Oktober 2022 um 13:36
          Permalink

          Dear Reinoud,
          thank you for your comment. There are three issues I want to address additionally:

          You mention: different types of Archives require different sets of goals, user communities, and causes. That is correct. But most of the small and private archives are not available via internet. Most of these don’t publish the reasons, why they do archiving.
          State and other public-sector „traditional“, „classic“ or „historic“ archives have their definitions of ‚why‘, ‚what‘ and ‚for whom‘. But I am not sure, if these goals and methods still fit to the Digital Age.
          Companies and other organisations surely have different goals for archiving as well.
          The example you posted, shows, that those people in your example had no idea about the implications of long-term preservation. They even had no idea of short-term archiving and records management. That’s why I posted my article with the „standard questions“ again.

          We are no longer talking about „classic“ or convential documents like PDFs, Word-files, Scans a.s.o. An archival object can be a data set, an audit trail, a foto, a video, an audio recording, a multi-media object or a 3D-model. A current trend is moving to „documents“, which are only data embedded in a layout, which as display or printout appears to be a document.
          The huge amount of different formats causes a lot of problems for archiving. Some try to tackle the problem of formats by converting every „document“ into an PDF/A – but this doesn’t help for most of the other mentioned types of formats for digital information. Formats may be only available for a certain technical environment and they change over time. Obsolence of access rights, formats, software, systems, databases and storage media is one of the largest technical challenge for long-term preservation.
          You talk about microforms – and Germany still has its „Barbarastollen“ archive, although films, chemicals, processing units and microfilm-terminals today are not easy to find. And even these microforms-archives are endangered due to film corrosion and the obsolence problems of electronic systems and databases providing access to the information on microforms.

          Your point about archives as a source of knowledge is correct. But a lot of archives are not easy to access. They focus on specialists to retrieve information and focus on a restricted user audience – historians. I do not believe that this enough.

          Kind regards,

          Uli

          Antwort
  • World Digital Preservation Day, November 3rd, 2022
    25. Oktober 2022 um 16:24
    Permalink

    Am Donnerstag, dem 3.11.2022, ist der WDPD World Digital Preservation Day: „Digits: for Good„. Zwei Links

    DPC Digital Preservation Coalition https://www.dpconline.org/events/world-digital-preservation-day

    nestor https://www.langzeitarchivierung.de/Webs/nestor/DE/Veranstaltungen_und_Termine/2022worldDigitalPreservationDay.html

    Als Beitrag zum diesjährigen #WDPD verweise ich auf das Thema „Nachhaltigkeit bei der Langzeitarchivierung“. Hierzu gibt es vom Anbieter Presevica (https://preservica.com/) ein interessantes Konzept „A Charter for Long-term Digital
    Preservation Sustainability – 7 independently ratified Principles for assessing the long-term sustainability and durability of Digital Preservation service providers. “ (https://www.PROJECT-CONSULT.com/files/Preservica__A-Charter-for-Long-term-Digital-Preservation-Sustainability__2022.pdf). Preservica hat sich die Bedingungen der Charter selbst auferlegt. Da das Thema Nachhaltigkeit in der IT (https://www.project-consult.com/in_der_diskussion/nachhaltigkeit/) auch bei uns aktuell adressiert wird, lohnt es sich auch unter diesem Gesichtspunkt einen Blick auf die Archivierung zu werfen. Preservica identifiziert für sich sieben Bereiche, in denen Nachhaltigkeit wesentlich ist:

    • Data Sustainability
    • Software Sustainability
    • Operational Sustainability
    • Knowledge Sustainability
    • Financial Sustainability
    • Governance Sustainability
    • Environmental Sustainability

    Die Kriterien sind ausführlich im Dokument erklärt.

    Eine wirklich lobenswerte Initiative von Preservica, die kontinuierlich fortgeführt wird.

    Antwort
  • Preservation Policies
    2. November 2022 um 11:13
    Permalink

    Natürlich kann man alles versuchen, schwarz/weiß zu malen. Aber man muss den professionellen Archivaren und Instituten zu Gute halten, dass es sehr wohl Richtlinien – oder Policies – gibt, was warum für wen zu archivieren ist. Im Nestor-Handbuch Kapitel 3 (https://www.PROJECT-CONSULT.com/files/Preservation_Policy__nestor_Handbuch_3.pdf)  findet sich eine Anleitung und in einem aktuellen Workshop „Preservation Policies – Guidelines, Beispiele und Lessons Learned“ wurde das Thema erneut beleuchtet (http://www.PROJECT-CONSULT.com/files/Preservation_Policies_Workshop_2022_Tunnat_Markus.pdf). Nicht zu vergessen die ganzen nestor Materialien (https://www.langzeitarchivierung.de/Webs/nestor/DE/Publikationen/nestor_Materialien/nestor_materialien_node.html), die das Thema Archivierung und Archivierungs-Policies umfassend behandeln (https://project-consult.theum.com/essentials/index.htm?t=Teams-Ressourcen-Resources,Archivierung).

    Es bleibt aber die Frage, ob die solcher Art formulierten Ziele angesichts der Informationsflut im Internet weiterhin angemessen sind.

    Antwort
  • Digital Books wear out faster than Physical Books
    16. November 2022 um 18:09
    Permalink
    Brewster Kahle hat Recht, wenn er davon spricht, dass elektronische Bücher sich schneller abnutzen oder verschwinden (z.B. vom Amazon-eBookReader …). Es ist aber nicht nur das ständige prüfen und konvertieren, um elektronische Bücher verfüg zu halten. Es geht auch um das allgemeine Bewußtsein zum Wert von digitalen Büchern, generell zum Wert elektronischer Information. Besonders Büchereien sind gefordert, sich auch der elektronischen Ausgaben anzunehmen (Thema Konvertierung … vor ein paar Jahren hatte ich den Vorschlag gemacht, dass doch Büchereinen einen neuen Service anbieten können, in dem sie alte Datenträger lesen können und historische Formate mittels Konvertierung wieder zum Leben erwecken). Elektronische Bücher können auch in neue Formen durch Vernetzung und Verlinkung überführt werden und so einen Mehrwert bieten, den dass einzelne Papierbuch nicht hat. Und auch das Argument der Barrierefreiheit (siehe hierzu die aktuelle Gesetzgebung bei uns im Blog) kann man elektronisch gut überbrücken – große Buchstaben mit dem Beamer an der Wand, Bücher vorlesen (bei Grafiken, Bildern, Formeln … klappt das nicht) oder mit speziellen Druckern Braille-Ausgaben erzeugen (auch ein neuer Job für Bibliothekare).
    Zusammenfassend – es fehlt an drei Dingen: (1) dem Bewußtsein um Wichtigkeit und Dringlichkeit des Themas, (2) entsprechendem Knowhow und Knowhow-Trägern, und (3) Geld und technische Ressourcen. Und letztere dürfen sich nicht auf die entwickelten Länder beschränken, denn gerade in den weniger entwickelten Ländern der Erde ist der Verlust an Kultur, Büchern und anderen Informationen noch weitaus größer. 

    Dr. Ulrich Kampffmeyer

    Antwort
  • Was passiert mit unserer digitalen Geschichte, wenn Twitter zusammenbricht?
    17. November 2022 um 16:47
    Permalink

    Auf Heise findet sich ein interessanter Artikel „Was passiert mit unserer digitalen Geschichte, wenn Twitter zusammenbricht?“ (Was passiert mit unserer digitalen Geschichte, wenn Twitter zusammenbricht? | heise online). Der Autor Chris Stokel-Walter bezieht sich auf die jüngsten Äußerungen von Elon Musk in Bezug auf Twitter. Er geht auf Möglichkeiten der individuellen Archivierung (Download der eigenen Tweets) aber verstärkt auf die bisherigen Versuche, Twitter als gesellschaftlich und historisch wichtiges Phänomen zu bewahren ein. Twitter ist nur das offensichtlichste Beispiel für einen drohenden Informationsverlust. Wir verlieren ständig Information und auch im Bereich Social Media ist schon vieles weg, z.B. MySpace oder Google+, demnächst auch die Gruppeninhalte bei XING. Muss man alles aufbewahren? Bei Twitter lebt alles von der Aktualität und sofort darauffolgenden Reaktion. Alte Inhalte sind vielleicht für Historiker, Sozialforscher, Politik-Analysten oder Daten-Archäologen interessant. Im Übrigen wäre ein solches gigantisches Twitter-Archiv schon nach kurzer Zeit für den „Normal-Internet-Nutzer“ uninteressant. Viele der Inhalte, wie Hass-Botschaften, Fake-Accounts, Propaganda, Lügen usw., massenhaft vervielfältigt, stellen zwar ein Social-media-Phänomen dar – aber muss man dass auf ewig (LZA Langzeitarchivierung) mitschleppen? Twitter ist unbestritten ein digitaler Zeitzeuge der Menschheitsgeschichte. Twitter hat massiv Meinungen und Menschen beeinflusst, hat Milliarden Stunden von Nutzern verschlungen, ist eine Instanz der Meinungsbildung und für viele Verfolgte ein Kanal in die Welt. Aber da keine Lösung für Twitter wie auch die Milliarden anderer Informationen im Web in Sicht ist, bleibt es bei meinem Zitat aus meiner Keynote anlässlich des DLM Forum in Toulouse 2008: „Future Historians will call our Era the Dark Age of the Early Information Society„.

    Antwort
    • P.S. ... Twitter ...
      20. November 2022 um 15:59
      Permalink

      Elon Musk dreht durch … Trump wieder auf Twitter?!
      Wir haben unsere zwei Firmen-Accounts und Dr. Ulrich Kampffmeyers direkten Account heute gelöscht.
      @PROJECTCONSULT_ (2284 Follower)
      @IIM_Information (1122 Follower)
      @DrUKff (824 Follower)
      Tschüss Twitter!

      Antwort
  • Mag. phil.
    31. Dezember 2022 um 22:29
    Permalink

    Sehr interessanter, umfassender Übersichts-Artikel von Ihnen, Herr Dr. Kampffmeyer! Er fasst einerseits das zusammen, was ich als gelernter Historiker österreichischer Provenienz um das Jahr 2000 noch über das KLASSISCHE ARCHIVWESEN gelernt habe (sprich bevor es noch digitale Archive gegeben hat).  Andererseits schneidet er die wesentlichen Thematiken an, die IM NEUEN ZEITALTER DES DIGITALEN ARCHIVIERENS maßgeblich sind. Da ich mich immerhin auch mit der letztgenannten Sphäre im Rahmen meines allerdings auch schon 15 Jahre zurückliegenden Informationsmanagement-Studiums an der Donau-Universität Krems ein wenig vertraut machen konnte, möchte ich hier anmerken, dass die BENUTZBARKEIT DER LANGZEITARCHIVIERTEN DATEN – sprich über sehr lange Zeiträume hinweg – wohl nach wie vor die größte Unsicherheitskomponente abgibt. Und hierbei müssen gar nicht erst die von Ihnen genannten Katastrophen-Szenarien eintreten. Die größte Gefahr für langzeitarchivierte Daten ist nämlich die ganz prosaische, alltägliche DES FORTSCHREITENS BZW. DES OBSOLETWERDENS VON TECHNISCHEN STANDARDS, die sich schon innerhalb eines Jahrzehnts oder doch in wenigen Jahrzehnten ganz grundsätzlich ändern. 2007 hat man diesbezüglich bereits an der Donau-Universität Krems VERSCHIEDENE GEGENSTRATEGIEN angedacht – u.a.:
    1) Ständige Migration der Daten gemäß dem Lebenszyklus der Formate, in denen jene vorliegen, in die jeweils gerade gängigen neue Formate.
    2) Einbettung der historischen Computerprogramme, die historische Daten lesen können, in virtuelle technische Umgebungen, die auch noch später die ursprüngliche Hardware simulieren können, auf denen besagte Programme liefen.
    3) Institutionalisierung von Computermuseen mit auf längere Sicht funktionsfähig gehaltener historischer Hard- und Software
    4) Entwicklung von dauerhaft verwendbaren Format-Standards wie PDF-A (der sich ja auch tatsächlich bis dato als solcher durchgesetzt hat), Speicherung als reine Textdateien oder auch im XML-Format.
    Da ich im Alltag nicht unmittelbar mit besagter Thematik der digitalen Langzeitarchivierung befasst bin, kann ich zwar nicht angeben, ob und welche der genannten Strategien sich augenblicklich gegenüber den anderen durchgesetzt haben. Ich denke allerdings, dass es wohl noch immer ein Mix der Strategien sein wird. Ganz sicher ist auch die Entwicklung von Format-Standards mittlerweile vorangeschritten. „In the long run“ wird es allerdings wohl doch so sein, dass als Ultima Ratio letztlich immer noch IN NEUE FORMATE MIGRIERT WERDEN MUSS, um die Benutzbarkeit des Datenstroms, auf die es ja einzig ankommt, aufrecht zu erhalten.
    Herzliche Grüße, Roman Lustig

    Antwort
    • FROHES NEUES JAHR
      1. Januar 2023 um 12:39
      Permalink

      Lieber Herr Lustig,

      während andere Silvester-Partys feierten, nahmen Sie sich die Zeit, auf einen Artikel von mir zu antworten: 31.12.2022, 22:29. Kaum vorstellbar 🙂 Vielen Dank. Ich hoffe, Sie haben den Jahreswechsel nicht verpasst und sind mit Verve ins Neue Jahr gestartet.

      Sie beschreiben 4 Szenarien für die Langzeiterhaltung.

      Dabei ist nur (1) die „Continuous Migration“, wie ich dieses Verfahren der ständigen Migration 1993 nannte, aktuell erfolgsversprechend (siehe auch ‚1000 Jahre Haltbarkeit‘ https://www.project-consult.com/in_der_diskussion/1000-jahre-haltbarkeit/). Bereits während des Betriebs eines elektronischen Langzeitarchives müssen die Verfahren der Migration geplant, vorbereitet und getestet werden.

      Die Methode (2) ‚“Emulation“, kann für bestimmte Systeme funktionieren, z.B. Spiele, stößt aber besonders im Bereich der Ein- und Ausgabe, bei Schnittstellen und genutzten externen Diensten an seine Grenzen. Dies geht nur für in sich geschlossene einfache Lösungen.

      (3) „Institutionalisierung von Computermuseen“ ist ein lustiger Gedanke, einem Lustig würdig. Die Systeme müssten ja auch noch lauffähig gehalten werden, ‚Wissende‘ müssten Fehler beseitigen können, genutzte Speicher dürften nicht ausfallen, usw. usw. Das alles angesichts der riesigen Mengen von digitalen Informationen. Letztlich würde dies die Verfügbarkeit ausgewählter kleinerer Informationsbestände auf sehr beschränkte „On-Site“- Benutzergruppen zu seltenen Gelegenheiten beschränken. Ich halte dies nicht für sehr zielführend.

      (4) „Dauerhafte“ Formate wie PDF/A gibt es. Wir können uns jetzt streiten, wie lange denn „dauerhaft“ ist. PDF/A wird aber nicht allen verfügbaren Informationen gerecht. Wie steht es mit 3D-Modellen, Videos, Audio, Geo-Informationen, Zeichnungen, Tomographenbilder usw.? Man kann nicht alle Information „einfach platt klopfen“ und als PDF/A  speichern. Man braucht weitere Formate. Selbst bei Dokumenten, die man in PDF/A wandeln kann, macht es Sinn, einmal das originäre Format zusammen mit der Anzeigeformat, z.B. PDF/A, zusammen unter gleichem Index zu speichern. So bleiben z.B. auch digitale Signaturen und damit die rechtliche Verbindlichkeit erhalten. Format-Obsoleszenz lässt sich gut in Verbindung mit Continuous Migration verbinden, in dem man die Anzeige- und gegebenenfalls Verarbeitungsfähigkeit von gespeicherten Objekten prüft und diese bei Bedarf als weiteres Format archiviert. Aber es geht ja nicht nur um die Speicherformate. Gern wird die Obsoleszenz der Metadaten vergessen, die von Datenbanksoftware, Speichermedien und anderen Parametern abhängig ist. Auch hier ist für Konsistenz, Integrität und Nutzbarkeit zu sorgen. Die Migration von Anwendungen und Datenbanken ist häufig schwieriger als das reine Umkopieren von Informationsobjekten.

      In jedem Fall muss man heute bei jeder längeren Informationsspeicherung an das Thema Migration denken. Selbst kaufmännische Aufbewahrungsfristen von etwas über 10 Jahren, stellen hier schon Probleme dar, von der Digital Preservation ganz zu schweigen. Viele Anwender meinen, sich des Themas durch Archivierung in der Cloud entledigen zu können. Dies ist aber ein Irrglaube, denn die Informationsobjekte, ihre Metadaten und ihre Nutzbarkeit liegen weiterhin in der Verantwortung des Eigentümers der Daten Diese Verantwortung wird aber nicht immer richtig wahrgenommen, in dem man die Zuständigkeit für Records Management, revisionssichere Archivierung und Digital Preservation irgendwo nach unten in der Organisation delegiert. Das Thema digitale Archivierung und der Erhalt der Information gehört aber auf die Chefebene, „Cxx-Ebene“. Es geht ja nicht nur um das Archivieren irgendwelcher Informationen sondern um die Erfüllung von Compliance- und Governance-Anforderungen und die Nutzung von Information als Wissensbasis in geschäftlichen Prozessen. Information hat einen Wert und dieser Wert muss langzeitig gesichert werden!

      Frohes Neues Jahr!

      Ulrich Kampffmeyer

      P.S. Wir spenden regelmäßig für Internet-Archiv Archive.org und Wikimedia e.V. / Wikipedia zum Erhalt des Wissens im Internet 🙂
      Und ich bin noch etwas bei Europeana.eu engagiert 🙂

      Antwort
      • Mag. phil.
        12. Januar 2023 um 13:18
        Permalink

        Lieber Herr Dr. Kampffmeyer,
         
        zunächst einmal erwidere ich an dieser Stelle IHRE NEUJAHRSGRÜSSE und wünsche auch Ihnen nochmals ALLES GUTE nicht nur für den engbegrenzten Zeitraum eines Neuen Jahres!
        Die Umstände, der mich bewogen haben, MEINEN ERSTKOMMENTAR ausgerechnet kurz vor dem Jahreswechsel zu verfassen, sind freilich schon außergewöhnlicher Natur gewesen, sodass mein Posting zum fraglichen Zeitpunkt auch nicht in Konkurrenz zu einer ebenso heißen wie feucht-fröhlichen Silvesterparty gestanden ist. 🙂 Das Sinnvollste, was es in Anbetracht dieser Tatsache hernach noch zu tun gab, materialisierte  sich wie von Zauberhand in jener geistigen Tätigkeit, die besagten Kommentar als Resultat zeitigte.
        Des Weiteren bedanke ich mich ganz herzlich FÜR IHRE EBENSO AUSFÜHRLICHEN WIE AUFSCHLUSSREICHEN ERLÄUTERUNGEN im Anschluss an meinen Gastkommentar. Sie sind höchst interessant gewesen! Wie ich richtig vermutet habe, ist also MIGRATION weiterhin die ULTIMA RATIO in allen Fragen der digitalen Langzeitarchivierung!
        Eben zu 1) „CONTINUOUS MIGRATION“ möchte ich noch eine persönliche Erfahrung anmerken. Im Jahr 1997 habe ich meine Diplomarbeit in Geschichte auf einem damals ohnehin schon längst völlig veralteten SIEMENS NIXDORF AT-COMPUTER mit Intel 286er-Prozessor formatiert und ausgedruckt, und zwar mit WORD für MS DOS 3.3. Schon 1999, als ich endlich einen moderneren Gebraucht-PC mein Eigen nannte (ich glaube es ist ein 486er oder gar schon ein Pentium-PC gewesen) und erstmals Internet-Anschluss hatte, konnte ich die MS DOS-Datei mit meiner Diplomarbeit im neuen WINDOWS-BETRIEBSYSTEM nicht mehr laden. Um mich meiner Diplomarbeit auch wieder in digitaler Form erfreuen zu können, scannte ich sie im Jahr 2010 aus ihrer Papiervorlage und brachte sie dabei gleich in das PDF-FORMAT. Aus Eigeninitiative stellte ich die entsprechende PDF/A-DATEI hierauf PHAIDRA, dem Repositorium der Universität Wien für die digitale Langzeitarchivierung, zur Verfügung. Immerhin ist es ja höchst angebracht, noch bei Lebzeiten etwas für die eigene Unsterblichkeit zu tun! 😉 – Was ich damit anhand der eigenen Erfahrung verdeutlichen möchte: Gerade in der Frühzeit des Heim-PCs wurde auf Abwärtskompatibilität der Hardware, der Betriebssysteme, der Anwendungen und Formate am allerwenigsten geachtet, obgleich Firmen auch schon damals damit warben (ein Versprechen, dass dann schon in wenigen Jahren obsolet war, denn gerade damals ist die technische Entwicklung am PC-Markt höchst disruptiv verlaufen). Bezogen auf mich selbst ist das Beispiel zugleich auch eine WORST CASE-Demonstration für nicht vollzogene „CONTINUOUS MIGRATION“ und ihre verlustreichen Folgen, doch welcher durchschnittliche Heimanwender der damaligen Zeit hat sich schon an besagte BEST PRACTICE-Vorgangsgsweise im Bezug auf die Langzeitbenutzbarkeit der Daten gehalten, zudem auch noch bevor sie offiziell erfunden worden ist. 😉
        AD 3) INSTITUTIONALISIERUNG VON COMPUTERMUSEEN: Ich teile Ihre Bedenken hinsichtlich deren Sinnhaftigkeit, möchte allerdings schon darauf hinweisen, dass mir zumindest ein hochoffizielles „Computermuseum“ bekannt ist. Als ich nämlich im Jahr 1988 (oder war es erst 1989?) in München gewesen bin, um obigen SIEMENS NIXDORF AT (286er)-PC als „neuwertigen Gebraucht-PC“ zu kaufen, habe ich auch das DEUTSCHE MUSEUM besucht. Dort gab es einen sehr interessanten Trakt mit damals bereits historischer COMPUTER-HARDWARE. Die Geräte waren noch immer funktionsfähig und mussten demgemäß auch von fachkundigem Personal gewartet werden. 🙂
         
        Nochmals herzliche Grüße, Roman Lustig

        Antwort
        • Continuous Migration
          12. Januar 2023 um 13:50
          Permalink

          Lieber Kollege Lustig,

          vielen Dank für Ihre Bestätigung zum Thema „Continuous Migration“.

          Mir ist es allerdings in frühen Jahren genauso gegangen. Meine Daten vom Apple II, sowohl Texte als auch strukturierte Daten, sind verloren. Gleiches gilt auch für frühe Daten auf dem PC oder einem XEROX-„Wissenschaftler Arbeitsplatz“. Aber auch die Daten von Host-Systemen wie für meine Magisterarbeit 1987 auf einer Telefunken TR440 (Universität Hamburg, die Lochkarten sind bei irgendeinem Umzug dann verloren gegangen), die Daten meiner Dissertation und meiner Diplomarbeit auf einer PDP10 mit Simula und Fortran IV an der Universität Kiel 1981 sowie die Daten von ARCOS 1 und ARCOS 2 auf VME-Bus mit OS9 am Fraunhofer Institut IITB 1987 haben das Zeitliche gesegnet (was schade war, weil ich vor ein paar Jahren die Anfrage bekam, ob man die Daten meiner Dissertation nicht neu auswerten könne).

          Dies bewog mich dann seit 1992, Gründung meiner Firma, systematisch immer Daten zu sichern und zu migrieren.

          Seit 1997 haben wir eine Webseite im Internet. Diese haben wir regelmäßig migiert, so dass alle Daten seit 25 Jahren weiterhin online zur Verfügung stehen (https://www.project-consult.com/news/www-project-consult-com/). Wir mögen halt keine „404“-Fehler und setzen auf Persistenz im Internet (sonst haben wir jetzt schon den Zustand, wie 2008 in einer Keynote auf der DLM Forum Conference in Toulouse postuliert, „Future Historians will call our Era the Dark Age of the Early Information Society“). Webseiten archiviere ich auch regelmäßig – wie Ihre Beiträge in unserem Blog – in der Wayback-Machine des Internet-Archivs (http://www.Archive.org).

          Meine Artikel und andere Publikationen zu Information-Management-Themen seit 1992 finden sich in unserer öffentlichen Knowledge Base „Essentials“ (https://project-consult.theum.com/). Viel Spaß beim Stöbern. Einiges Größeres habe ich auch in der DNB Deutschen National Bibliothek inzwischen hochgeladen (http://www.dnb.de). Es dürfte also das Eine oder Andere mich überdauern.

          Zu Punkt 3 „Computermuseen“ – natürlich gibt es diese und natürlich werden die Systeme am Laufen gehalten. Was fehlt sind öffentlich zugängliche Stationen zur Datenmigration und zum Umkopieren in neue Formate. Das wäre eigentlich eine schöne Zusatzfunktion für größere Bibliotheken, wo man mit seinen Datenträgern hingeht und diese auf neue Medien transformiert, weiter verarbeitungsfähig umkopieren kann. Die Formate älterer Standard-Software machen heute Ärger: alte Word- und Powerpoint-Dateien können nicht mehr angezeigt werden (dafür gibt es im Internet Webseiten, die das mehr recht-schlecht noch konvertieren können), bei frühen Excel-Dateien spielen die hinterlegten Funktionen und Algorithmen „Havoc“. Von ehemals populären Programmen wie StarWriter, WordPerfect oder Wordstar ganz zu schweigen (hatte ich alle mal in Benutzung). Dafür fehlt allerdings der Computer mit angeschlossenen alten Laufwerken von Bändern über die Kasetten, Disketten bis zum USB-Stick wie auch die universelle Erkennungs-, Wandlungs-, Aufbereitungs- und Migrationssoftware. Das wäre doch einmal eine schöne Forschungs- und Produkterstellungsaufgabe für Archive, Museen und Bibliotheken auf Bundesebene.

          An den vielen verlorenen „Archiven“ im privaten Umfeld und bei kleineren Organisationen will ich nicht rühren ….
          In großen Wirtschaftsunternehmen werden Anwendungen und Datenbanken zumindest, 10, 20 Jahre aus Compliance-Gründen am Laufen gehalten oder migriert. Hat man jedoch mehrere Versionen eines ERP-, Datenbank-, CRM- oder LIMS-System übersprungen, wird es schon knifflig.
          An die heterogene Softwarelandschaft in der öffentlichen Verwaltung mag ich erst gar nicht denken.
          Und auch „professionelle Archiv-System-Anbieter“ haben so Probleme, alte Metadaten und Informationsobjekte weiterhin zu nutzen und – automatisiert – zu migrieren, um der Obsoleszenz entgegen zu wirken. Eigentlich müsste dies eine Standard-Funktionalität von Archivsystemen sein, Informationsobjekte, Datenbankinhalte etc. zu exportieren – damit man sie in anderen Systemen nutzen kann –  und natürlich Continuous Migration zu planen und regelmäßig durchzuführen. Als Standard-Funktion, vom Anwender konfigurierbar, und nicht als extra aufwändige Dienstleistung, wenn es schon (fast) zu spät ist.

          Das Thema elektronische Archivierung und Bewahrung des Wissens wird mich auch in meiner Zeit als Rentier weiter begleiten.

          Beste Grüße,
          Ulrich Kampffmeyer

          Antwort
  • OAIS & GDPR
    21. April 2023 um 15:26
    Permalink

    OAIS Open Archival Information System in Gestalt der ISO-Norm 14721 ist vielfach die Grundlage für die elektronische Langzeitarchivierung in den Archiven der Öffentlichen Hand. Das Konzept stammt schon aus den Zeiten, als die Weltraumorganisationen gemeinsam den CCSDS OAIS veröffentlichten, der dann von der ISO als Norm übernommen wurde. Alle fünf Jahre wird die Gültigkeit des Standards überprüft. Das Thema GDPR, oder in Deutschland SGVO, wurde dabei bisher nicht offiziell adressiert. Grundsätzlich steht OAIS nicht im Widerspruch zu den GDPR-Anforderungen – wenn man es denn richtig einsetzt. Die GDPR sind dabei nicht allein eine Auswirkung auf das OAIS-Konzept, sondern auch ständig neu herauskommende EU-Richtlinien und nationale Gesetze erfordern ein Dokumentation von bestimmten Informationen wie auch die Möglichkeit Information zu schützen und gegebenenfalls mit Nachweis zu löschen. Aktuelle Entwicklungen sind hier eIDAS 2.0 mit seinen „Trust Services“ und das EU Digital Wallet.
    Das Thema Löschen widerspricht hier im Prinzip dem Anspruch der Langzeitarchivierung. OAIS ist für die ewige Aufbewahrung von Informationen gedacht und sieht eigentlich keine Zugriffskontrolle auf das Archivierungssystem vor.

    Welche Anforderungen müssen zukünftig bei OAIS ISO 14721 wie auch bei anderen Archivierungsstandards und Archivierungsverfahren beachtet werden. Eine kleine, unvollständige Übersicht:

    Datensparsamkeit und Aufbewahrungssteuerung

    Personenbezogene Daten sollten nur für festgelegte, eindeutige und rechtmäßige Zwecke erhoben und gespeichert werden und nicht länger als nötig aufbewahrt werden. Dies kommt in Artikel 5 der Datenschutz-Grundverordnung zum Ausdruck: Datenminimierung und Speicherungsbegrenzung.

    Digitale Archivierungslösungen sollten Funktionen wie automatisierte Aufbewahrungsrichtlinien für Objekte, die personenbezogene Daten enthalten, mit einem Löschverfahren besitzen. Das Löschkonzept ist auch eine Anforderung der GDPR. Es werden ferner granulare Zugriffskontrollen auf personenbezogene Daten (Metadaten und Dokumente) benötigt, die den Zugriff auf autorisierte Nutzer einschränken. Grundlage hierfür sollten Rollen und definierte Benutzerklassen sein, die auch die Verantwortlichkeiten und legitimen Zwecke klären und dabei langfristig stabil sind. Audit-Trails der Transaktionen entsprechend GDPR sollten Bestandteil der Archivierungssoftware sein.

    Recht auf Zugang zu den Daten und der Übergabe von Kopien der Daten

    Einzelpersonen haben entsprechend Artikel 15 DSGVO das Recht, auf ihre personenbezogenen Daten zuzugreifen und eine Kopie dieser Daten zu erhalten. Artikel 20 der Datenschutz-Grundverordnung behandelt das Recht auf Datenübertragbarkeit, so dass der berechtigte Anfragende seine Daten in einem strukturierten, allgemein verwendeten und maschinenlesbaren Format erhalten kann.

    Digitale Archivierungslösungen müssen daher das einfache Suchen und vollständige Abrufen der persönlichen Daten einer anfragenden Person ermöglichen. Hierfür braucht es Suchfunktionen, die vollständig alle Daten und Dokumente heraussuchen und anzeigen. Auf Basis dieses Suchergebnissen wird dann eine Export-Funktionalität aufgerufen, um die Informationen für die Übergabe bereitzustellen. Ein Standard-DIP-Format nach OAIS ist hierfür nicht geeignet. Der Anfragende hat das Recht, die Informationen in gängigen Formaten zu erhalten. Dies heißt bei Daten z.B. CSV oder XML, bei den Informationsobjekten z.B. PDF.

    Das Recht auf Vergessenwerden

    Artikel 17 der DSGVO räumt Personen das Recht ein, ihre personenbezogenen Daten unter bestimmten Bedingungen löschen zu lassen. Zum Beispiel wenn Zweck für den die Daten erhoben wurden, entfallen ist. Dies erfordert eine gezielte Löschung von Informationen in Records-Management-, revisionssicheren-Archiv- und Langzeitarchivsystemen. OAIS schweigt hierzu.

    Um diese Anforderung zu erfüllen muss ein sicheres Löschverfahren implementiert werden, dass auch den Nachweis liefert, dass die Dasten zerstört und nicht wiederherstellbar sind (ans Backup des Systems denken). Zum Nachweise dienen Löschungsprotokolle. Diese beinhalten Löschanträge, darauf folgende Löschtransaktionen und die Dokumentation des Verfahrens im Einzelfall.

    Datensicherheit

    Gemäß Artikel 32 der Datenschutz-Grundverordnung sollten alle Organisationen geeignete technische und organisatorische Maßnahmen vorhalten, um die Sicherheit personenbezogener Daten zu gewährleisten. Dazu gehört der Schutz der Daten vor unbefugtem Zugriff, versehentlichem Verlust oder Zerstörung.

    Zu den wesentlichen Sicherheitsfunktionen in digitalen Archivierungslösungen gehören z.B. die Datenverschlüsselung (aber auch kritisch zu sehen), regelmäßige Backups mit Überprüfung der Nutzbarkeit der Backups, und starke IT-Sicherheitssysteme gegen Angriffe und andere Mißbrauchsfälle. Dazu gehört das Erkennen und Verhindern von Einbrüchen durch geeignete Überwachungs- und Warnsysteme. 

    Verschlüsselung

    OAIS betrachtet die Verschlüsselung als ein mögliches Risiko für die spätere Nutzbarkeit der archivierten Information. Man muss allerdings hier auch unterschieden, auf welcher Ebene und für welche Objekte eine Verschlüsselung stattfindet. Häufig sind die Speichersysteme (z.B. Festplatten-Subsysteme) in sich verschlüsselt und erlauben keinen zugriff über das Netzwerkbetriebssystem.  Die Zugriffsleitung von extern sollte immer ein verschlüsselter VPN-Kanal sein. Die Informationsobjekte selbst zu verschlüsseln ist kritisch. Im Archiv sollten nur offene Formate liegen. Eine Verschlüsselung mit einem individuellen Passwort oder mit einer personengebundenen elektronischen Signatur sind für später Nutzer nicht mehr geöffnet werden. Daher ist auch keine Kontrolle möglich, ob darin personenbezogene Daten enthalten sind. Von einer Verschlüsselung einzelner Dokumente im Archiv sollte daher generell abgesehen werden.

    Die DSGVO und andere restriktive Regelungen zu Datenschutz und Datensicherheit sind zusätzliche Anforderungen an herkömmliche Archivierungssysteme. Viele der Anforderungen lassen sich ín einem Referenz-Datenbank-basierten System relativ einfach lösen. Die Datenbank erlaubt physisches Löschen der Zugriffsdaten und anderer persönlicher Daten in den Metadaten sowie in jedem Fall mögliche logische Löschung (es kann nicht mehr auf das weiterhin physisch gespeicherte Objekt zugegriffen werden) und noch konformer das physische Löschen durch mehrfaches Überschreiben der Daten auf dem Speichermedium. Wichtig ist ferner die Einrichtung von Audit-Trails, die es ermöglichen Journale oder Listen über die Einträge zu einem Anfragenden und seinen personenbezogenen Daten zu erzeuge n und auszugeben. Dann fehlt nur noch für die DSGVO die Übergabe der Daten auf einem Datenträger. 

    Zusätzliche Anforderungen kommen auf die Archivierung zu, wenn sie auch Webinhalte speichert, KRITIS-Anforderungen der Sicherheit und Dokumentation unterliegt, oder andere Regularien und Gesetze zu Aufbewahrung wie auch Vernichtung berücksichtigen muss. Das Thema Archivierung bleibt ständig aktuell, weil mit jeder neuen technischen Entwicklungen und jedem neuen Gesetz wieder andere Anforderungen gestellt werden – und andererseits der Anspruch von OAIS ewige Archivierung und Nutzbarkeit der archivierten Information bestehen bleibt.

    Antwort

Neuen Kommentar verfassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Ich stimme zu, dass die von mir eingegebenen Daten einschließlich der personenbezogenen Daten an PROJECT CONSULT übermittelt und dort zur Prüfung der Freischaltung meines Kommentars verwendet werden. Bei Veröffentlichung meines Kommentars wird mein Name, jedoch nicht meine E-Mail und meine Webseite, angezeigt. Die Anzeige des Namens ist notwendig, um eine individuelle persönliche Kommunikation zu meinem Beitrag zu ermöglichen. Anonyme oder mit falschen Angaben eingereichte Kommentare werden nicht veröffentlicht. Zu Nutzung, Speicherung und Löschung meiner Daten habe die Datenschutzerklärung zur Kenntnis genommen.

Ich versichere, mit meinem Kommentar alle gültigen Vorgaben des Urheberrechts beachtet zu haben. Ich habe keine Bilder, Grafiken, Texte oder Links in meinem Beitrag verwendet, die durch CopyRight, Leistungsschutzrecht oder Urheberrecht geschützt sind. Für den Inhalt meines Kommentars bin ich trotz Prüfung und Freischaltung durch PROJECT CONSULT ausschließlich selbst verantwortlich. Meine Rechte am Beitrag werden bei PROJECT CONSULT nur durch die CC Creative Commons by-nc-nd Vorgaben gewahrt.