Informationsqualität & Archivierung
30. Oktober 2020 16:06 Uhr | Dr. Ulrich Kampffmeyer | Permalink
Beginnen wir gleich mit dem Grundsätzlichen: Im Archiv wird Information weder mehr noch besser noch richtiger!
Für die Archivierung ebenso wie für die Elektronische Archivierung gibt es sinnvolle Vorgaben, wie Information bewertet, erfasst, kategorisiert, indiziert, verwaltet, erschlossen, bereitgestellt und entsorgt werden soll. Ist diese Information erstmal an das Archiv bzw. Archivsystem übergeben worden, wird sie dort sicher, wieder auffindbar, im eingelieferten Zustand integer und authentisch, verwaltet und für die Nutzung durch die Anwender zur Verfügung gestellt.
Die Aufgabe eines Archivs bzw. Elektronischen Archivs, auch wenn es nur um eine zeitliche begrenzte Aufbewahrung geht, ist klar definiert. Wir haben es nicht mit Fachanwendungen und Datenverarbeitung zu tun sondern ganz einfach mit Informationen aufzubewahren. Nicht weniger und nicht mehr.
Wenn es um die Qualität der Information geht, um Richtigkeit, Vollständigkeit und Inhalt der Information geht, ist nicht das Archiv bzw. Archivsystem selbst entscheidend, sondern was Ablieferer, die Information erzeugende Systeme, Archivare, hinterlegte Regeln, Künstliche Intelligenz oder wer/was auch immer vor der Archivierung tun.
Aber bleiben wir einmal beim Theme elektronische Archivierung und betrachten zwei konkrete Anwendungsfälle, einmal Aufbewahrung und einmal Archivierung von Informationen.
Das HGB Handelsgesetzbuch, die AO Abgabenordnung und die GoBD Grundsätze zur ordnungsmäßigen Führung und Aufbewahrung von Büchern, Aufzeichnungen und Unterlagen in elektronischer Form sowie zum Datenzugriff geben sehr konkret die Bedingungen für Verwaltung, Speicherung und Aufbewahrung von handelsrechtlich und steuerlich relevanten Daten und Dokumenten vor. Hier finden sich Begriffe wie Zeitgerechtigkeit, Vollständigkeit, Richtigkeit, Schutz vor Veränderung, Schutz vor Verlust, Prüfbarkeit und andere. Einige betreffen die Aufbewahrung (oder auch Revisionssichere Archivierung) direkt wie z.B. die Unveränderbarkeit, der Schutz vor unberechtigter Nutzung und andere. Die Qualität der Information, Anforderungen wie Wahrheit, Richtigkeit, Vollständigkeit und andere, entschieden sich jedoch in den Systemen, die Inhalte für die Aufbewahrung produzieren und bei Anwendern, die Daten und Dokumente für die Aufbewahrung erfassen und bereitstellen. Alle Fragen an inhaltliche Qualität und Richtigkeit, Vollständigkeit, Aufbewahrungspflicht und andere entscheiden sich also bereits bevor die Information ins Archivsystem gelangt. Um die Kriterien zu erfüllen, muss also sichergestellt sein, dass alles Notwendige übergeben wird und die Eingangskontrolle des Archives auch passiert. Je besser die Systeme eingerichtet sind, die Daten ans Archiv übergeben wie z.B. ein E-Mail-, ein Dokumentenmanagement-, ein ERP-, ein Scan- oder anderes System, desto besser wird auch die Qualität des Inhalts im Aufbewahrungssystem sein (das revisionssichere Archivsystem können wir auch gern Records-Management-System mit sicherem Speicher nennen). Im Archiv selbst wird die Information weder mehr noch besser noch richtiger!
Als zweites Beispiel nehmen wir einmal die Behandlung von DSGVO-relevanten personenbezogenen Daten. Sind solche Daten erstmal in einem elektronischen Archivsystem gelandet, dass auf unveränderbaren Speichern (WORM-Verfahren) oder Softwareablagen (z.B. Blockchain) basiert, sind diese nur mit Schwierigkeit zu löschen, da die Aufgabe des Archives es ist, Unveränderbarkeit und Schutz vor Verlust sicherzustellen. Kommt dann noch hinzu, dass bei der Klassifikation der Information nicht angegeben wurde, dass es sich um eine schützenswerte Information handelt, ist diese auch nur mit größer Mühe und ohne Sicherheit einer Vollständigkeit wieder herauszufinden. Die sicherste Maßnahme bei solchen Daten und Dokumenten ist, sie erst gar nicht ins Archiv zu speichern. Dies ist bei der Klassifikation schon schwierig genug, da sich der Charakter und Wert der Information über die Zeit ändert, und nicht immer auf den ersten Blick erkennbar ist, was denn alles schützenswerte personenbezogene Daten sind. Sollen – oder müssen auf Grund anderer rechtlicher Vorgaben – solche Daten in ein Archiv eingebracht werden, so müssen sie in jedem Fall über Attribute in der Verwaltung erschlossen und wiedergefunden werden können. Das Archivsysteme muss zudem dann konsistente, nachprüfbare, protokollierte Mechanismen für Löschungen von Akten, Daten sowie Dokumenten und Teilangaben in Dokumenten bereitstellen. Für ältere Archivsysteme, die nicht über die notwendigen Erschließungs- und kontrollierten Löschungsmechanismen verfügen, ist dies heute ein Problem. Daher hier ein anderer Merksatz: Im Archiv selbst wird die Information weder weniger noch schützbarer noch entsorgungsfähiger wenn entsprechende Metadaten und Funktionen fehlen!
Es gibt die These „je dümmer ein Archiv desto länger hat es Bestand“, die sich bei elektronischen Archivsystemen auf die Vermeidung von Fach- und Anwendungslogik im Archivsystem selbst bezieht. je mehr Logik, individuelle Anpassung und nicht-Archiv-fachliche Funktionalität desto mehr Schwierigkeiten bei Software-Updates, Aufrechterhaltung der Nutzbarkeit über die Zeit und Migrationen. Dennoch ist es heute erforderlich, sich noch mehr Gedanken über die Erfassungs-/Capture-/Ingest-Prozesse machen. Hier wird zunehmend auf Automatisierung gesetzt. Neben herkömmliche hinterlegte oder antrainierte regelbasierte Ansätze und Vererbung mit Klassenkonzepten treten Verfahren der automatischen Klassifikation, selbstlernende Systeme, Künstliche Intelligenz, Analytics und Robotic Process Automation. Bei der Übernahme von Information in elektronische Archivsysteme wird versucht, den Flaschenhals fehlerträchtiger manueller Erfassung, Bewertung und Indizierung zu überwinden. Dies bedeutet jedoch, dass man an diese, die Information dem Archiv bereitstellenden Systeme, besondere Qualitätsanforderungen setzen muss. Hierbei geht es nicht um technische Qualität wie die Erkennungsrate eine OCR sondern um die inhaltliche Qualität. Wenn es dem Menschen schon schwer fällt zu entscheiden, was ist nach Steuerrecht aufbewahrungspflichtig, was sind nach DSGVO personenbezogene Daten usw., dann muss dies den Maschinen beigebracht und dort auch regelmäßig kontrolliert werden. Informationserfassungs-, Aufbereitungs- und Erschließungslösungen werden so zu einem eigenständigen Arbeitsgebiet, das letztlich irgendwann der Records Manager, Registrar und Archivar bei der ständig wachsenden Informationsflut entlasten – oder auch ersetzen soll.
Aber auch für diese Erfassungs- und Erschließungswerkzeuge gilt weiterhin – aber abgewandelt: Im Archiv wird Information weder mehr noch richtiger – jedoch in Bezug auf den Inhalt und die Nutzbarkeit besser!
Kommentar
Ich frage mich, was der Unterschied zwischen einem zeitlich begrenzten und zeitlich unbegrenzten Archiv ist. Wenn ich das richtig verstanden habe, dann gibt es bei der Digitalisierung von Daten, die in einem zeitlich begrenzten Archiv gespeichert werden sollen, mehr Vorgaben. Auf jeden Fall hilft mir der Beitrag dabei die Thematik noch mehr zu verstehen.
Archivierung & Langzeitarchivierung
Hallo Christoph,
man muss bei der Benutzung des Begriffes ‚Archivierung‘ unterscheiden, ob er umgangssprachlich oder fachlich definiert benutzt wird.
Archivierung wie akademisch und in den Gesetzes zu den Aufgaben von Bundes- und Landesarchiven definiert, bezeichnet die dauerhafte Aufbewahrung von ausgewählten Informationsobjekten. Hier wird dann der Begriff ‚Langzeitarchivierung‘ ins Spiel gebracht, um die dauerhafte Aufbewahrung vom umgangssprachlichen ‚Archivierung‘ zu unterscheiden. Nach dieser Definition ist ‚Langzeitarchivierung‘ ein Pleonasmus, da Archivierung die langzeitige, oder ewige, Aufbewahrung inkludiert.
Im kaufmännischen Bereich spricht man gern von der ‚revisionssicheren Archivierung‘, die aber eigentlich eher mit der Aufbewahrung und dem Records Management gleichzusetzen ist. Die Aufzeichnungen (Records) unterliegen hier Aufbewahrungsfristen. Am Ende der Aufbewahrungsfrist wird dann entschieden, ob die Informationsobjekte weiterhin aufbewahrt werden sollen, d.h. in die Langzeitarchivierung übergehen, oder ob sie gelöscht werden.
Bei der Verwendung des Begriffes Archivierung also bitte aufpassen und darauf achten, in welchem Umfeld und für welchen Zweck über Archivierung gesprochen wird
Ulrich Kampffmeyer