Elektronische Archivierung bleibt ein ständig aktuelles Thema
19. Juli 2011 14:15 Uhr | Dr. Ulrich Kampffmeyer | Permalink
Natürlich muss die elektronische Archivierung per se immer ein wichtiges Thema bleiben – ab einem bestimmten Zeitpunkt soll irgendetwas aufgehoben und auf Dauer bewahrt werden. Die „richtige“ Archivierung, sprich „Langzeitarchivierung“ (ein weißer Schimmel) oder die „historische Archivierung“ (das will niemand hören) ist auf eine unbestimmte Aufbewahrungsfrist ausgelegt. Sie beginnt nach Bewertung von potentiell archivwürdigen Objekten und läuft dann ewig.
Bereits hier zeigt sich die unterschiedliche Auffassung der Begrifflichkeit im allgemeinen Sprachgebrauch, bei IT-affinen Menschen sowie bei Archivaren und Historikern. Alle reden von Archivierung meinen aber nach Auffassung von Archivaren, Dokumentaren und Registratoren lediglich die „Aufbewahrung“ oder „Langzeitspeicherung“. Ersteres ein Begriff aus dem Umfeld von Handels- und Steuergesetzen, letzteres der Versuch die „elektronische Archivierung“ von der Langzeitarchivierung“ durch die Einführung des Begriffes „Speicherung“ zu differenzieren. Die akademische Welt und die Freie Wirtschaft reden daher gern aneinander vorbei, wenn sie denn zum Thema Archivierung überhaupt miteinander reden. Ein Abbild findet sich auch auf Wikipedia – dort gibt es inzwischen mehrere Artikel wie Archiv, Langzeitarchivierung, Digitales Archiv und Elektronische Archivierung, die irgendwie das Gleiche aus unterschiedlichen Blickwinkeln meinen.
Wie hat sich das Thema Elektronische Archivierung entwickelt?
Blickt man aus der Sicht der ECM Branche in Deutschland (so es denn diese überhaupt gibt) auf das Thema Elektronische Archivierung (oder etwas eingeschränkter auf die „revisionssichere Archivierung“ ) so hatte das Thema über die Jahre verschiedene Schwerpunkte. In den 80er und 90er entwickelte sich das Thema aus dem Scannen von Dokumenten und dem Archivieren von Bildern. Dies wurde schnell ergänzt um die Listenarchivierung, auch COLD Computer Output on LaserDisk genannt. Es folgten dann Ansätze für die Konvertierung und Archivierung von Office Dokumenten während sich Spezialdisziplinen für Asset Management Archivierung und Technische Dokumentation entwickelten – getrieben von speziellen Dokument- und Containerformaten. Das erste Jahrzehnt des neuen Jahrtausends war geprägt vom Thema GDPdU (die GDPdU hatten gerade ihr 10jähriges Jubiläum). Obwohl eigentlich kein Archivierungsthema (denn es geht primär um die Aufbewahrung und die Auswertbarkeit von steuerrelevanten Daten) entwickelte sich hieraus ein regelrechtes Hype-Thema. Auch zeigte sich, dass elektronische Archivierung ein speziell deutsches Thema ist denn im Rest der Welt wurden Lösungen für Digital Preservation (Langzeitarchivierung) und Storage (Aufbewahrung) schon immer getrennt angeboten. So zielte denn auch die Nestor-Initiative auf die Langzeitarchivierung und ignorierte die Disziplin Archivierung bei Wirtschaftsunternehmen.
Ein Thema beschäftigte die Archivierung beim Wechsel ins neue Jahrzehnt – wie soll man mit elektronisch signierten Dokumenten in Archiven umgehen, wie ihren Beweiswert erhalten? Das BSI brachte eine Spezifikation heraus, die nach heftiger Diskussion überarbeitet jetzt vor sich hindämmert. Elektronisch signierte Dokumente sind nur ein Randproblem der Elektronischen Archivierung geblieben, die sich in Bezug auf die Produkte weiterhin an den kaufmännischen Compliance-Vorgaben orientierte. Hier hat natürlich inzwischen seit fast zwei Jahrzehnten das Thema SAP Archivelink Archivierung eine besondere Bedeutung, obwohl es auch nicht so richtig Archivierung ist sondern „Auslagern von Objekten aus SAP mit Beibehaltung der Verwaltungs- und Zugriffsinformation in SAP“. Eine ähnlich wichtige Rolle erlangte dann in den letzten Jahren die Bereitstellung von Archivierungskomponenten für Microsoft Sharepoint, wobei der Sharepoint auch das Zugriffsinterface für das Archiv bildet.
Ein vielfach diskutiertes Thema darf man nicht vergessen: E-Mail-Archivierung. Zwar gehören E-Mails nicht in spezielle "Töpfe" sondern im Sachzusammenhang mit anderen Dokumenten in ein Universalarchiv, aber irgendwie hat sich E-Mail-Archivierung – unter dem Eindruck von E-Discovery aus den USA – verselbstständigt und eine eigene Klasse von Lösungen herausgebildet. Ansonsten gliederte sich die elektronische Archivierung als Komponente in das Enterprise Content Management ein. In den Archiven der öffentlichen Verwaltung auf Bundes-, Landes- und Regionalebene gewann das Thema Elektronische Archivierung erst langsam an Dynamik, da die Welle der zu archivierenden elektronischen Güter noch nicht angekommen ist. Soweit in (sehr gestraffter) Kurzform der Status.
Aktuelle Themen der Elektronischen Archivierung
Neben den erwähnten „klassischen deutschen Archivierungsthemen“ oben kommen durch neue Technologien, neue Software und neue Nutzungsmodelle auch neue Anforderungen auf die elektronische Archivierung zu.
Datenbank-Archivierung
Als besonders komplex hat sich immer die Archivierung von Inhalten aus Datenbanken oder die Archivierung ganzer Datenbanken dargestellt. Im Regelfall hat man bisher Daten strukturiert aus den Datenbanken extrahiert und in Tabelle,- Listen- oder Report-Form an Archivsysteme übergeben. Dieses COLD-Verfahren der Datenarchivierung nimmt aber nicht die Logik einer Datenbankanwendung mit, sondern allenfalls die Bedeutung von Spaltenköpfen, Zeilenbeschriftungen und einfachen Strukturmerkmalen wie Gliederungen. Bei der Datenbankarchivierung kommt es darauf an, die Informationen im Kontext zu bewahren und gegebenenfalls auch im Kontext wieder innerhalb der Anwendung wieder recherchierbar und verarbeitungsfähig darzustellen. Hier geht es nicht um Einzelobjekte wie im Normalfall der Archivierung sondern um die Speicherung komplexer Objekte mit Lo0gik die zudem Laufzeit-, Release-Stand- und Anwendungsabhängig ist.
Bei der Datenbankarchivierung wird die Logik bei Exporten in Extrakte mitgenommen oder gleich die gesamte Datenbank derart archiviert, dass sie (eingeschränkt) weiter nutzbar ist. Diese Verfahren dienen im Wesentlichen zur Entlastung von Systemen, wenn nicht mehr benötigte aber aus Compliance- oder anderen Gründen weiterhin verfügbar zu haltende Systeme abgelöst werden sollen. Allerdings kann meistens nicht sichergestellt werden, dass die Informationen über lange Zeiträume und bei wechselnden Systemumgebungen nutzbar gehalten werden können – dann müsste man die „Konserve“ noch größer machen, Betriebssystem und Hardware gleich mit archivieren. Auch jeden Fall folgen die am Markt verfügbaren sehr speziellen Datenbank-Archivierungslösungen nicht dem Ansatz des Universal-Archivs.
Universal Archive
Da ist zunächst die Idee des Universal-Archivs, will heißen, ein Archiv für alle Typen von Inhalten, die gemeinsam nach den gleichen Kriterien erschlossen und verwaltet werden. Diese Idee gibt es schon seit Anbeginn des Themas Archivierung, hat sich jedoch durch spezielle Lösungen wie SAP-Archivierung, E-Mail-Archivierung, Scann-Archivierung, Sharepoint-Archivierung etc. durch verschiedene Typen von Dokumenten und durch die Anbindung an verschiedenen Anwendungssysteme in zahlreiche isolierte Insel- oder Silo-Lösungen entwickelt. Auch im Bereich der „richtigen Archivierung“ hing man bis zum Aufkommen von Europeana eher einer „Spartenorientierung“ an, weil doch jedes Medium seine eigenen Metadaten brauchen würde.
Besonders durch die Konzepte von ECM Enterprise Content Management mit einem „Federated Repository“-Ansatz wurde das Universal-Archiv hoffähig (was natürlich längst alle Anbieter im Portfolio hatten und nur bei Bedarf in spezielle Lösungen für E-Mail, Digital Assets, Lotus Notes, Pläne, GDPdU-Daten, Sharepoint, Oracle Financials oder was auch immer anpassten). Auf Viewer- und Index-Ebene war die Vereinheitlichung schon immer möglich. Nur mit Universal-Archiven kann man der Vielfalt von Formaten und Nutzungsmodellen überhaupt noch Herr werden. Dies gilt besonders für die Welt der Archivierung im Web.
Archivierung für Web-Inhalte und -Transaktionen
Lange Zeit eine offene Flanke der elektronischen Archivierung gewinnt das Thema der Archivierung von Webseiten und Portalen mit kaufmännisch relevanten Angeboten ebenso wie die Archivierung der Transaktionen von Nutzern solcher Webseiten an Bedeutung (ganz abgesehen davon, dass auch Unternehmen ein Interesse daran haben, wie ihre Webseite vor einiger Zeit aussah und was draufstand. Die Archivierung von Web-Inhalten ist nicht einfach, da insbesondere Personalisierung, Individualisierung und ständige automatische Aktualisierung eine moderne Webseite für jeden Besucher zu jedem Zeitpunkt im Prinzip anders aussehen lässt. Eine Reihe von Lösungen zielen daher auf die Archivierung der Informationen in der Form, wie sie auf die Webseite hochgeladen werden. Andere arbeiten mit einer Art „Screenshot“-Ansatz, bei dem immer die komplette Situation, d e ein Anwender sieht, vollständig gespeichert wird. Dieser Ansatz wird z.B. auch beim Besuch von externen Webseiten benutzt, um deren Inhalte – z.B. bei einer Entscheidung für ein Investment – zu dokumentieren.
Bei datenbankgestützten Webseiten und Portalen ist auch die Datenbank-Archivierung ein möglicher Ansatz (siehe oben). Die meisten setzen aber darauf, dass sie nur bei Transaktionen die Daten und die Situation, die der Anwender vor sich hat (und gegebenenfalls selbst archiviert oder ausdruckt) speichert. Hier geht es einmal um die Eingangsdaten für nachgelagerte Anwendungen, gegebenenfalls um Authentifizierungs- oder Signaturinformationen, und Abbilder der Angaben, die bei der Durchführung der Transaktion entstanden sind. In allen Fällen geht es darum, eine Situation, die mit Berechtigungen, Daten und Finanzen zu tun, nachvollziehbar so zu dokumentieren, dass man gegenüber dem Anwender beweisfähig bleibt und den Weg der Daten von der Webseite in nachgelagerte Anwendungen verlustfrei und veränderungsfrei nachvollziehen kann. Diese Form der Archiveirung wird immer wichtiger, da sich immer mehr Anwendungen in das Internet verlagern und Browser-basierte Oberflächen benutzen. Auch bei der Web-Archivierung gibt es weiterhin viele offene Themen wie z.B. die Form und Notwendigkeit der Archivierung von Informationen aus Social Communities, die Abbildung spezieller Formate und Container wie z.B. bei einem Wiki oder einem Multimedia-Objekt, Kurznachrichten ohne persistente Anker, Dialoge über Portale und Messaging-Systeme, Sprach- und Video-Aufzeichnungen usw. Die große Volalität des Web erfordert daher sehr flexible Archivsysteme auf Basis von Portal- und Webtechnologien. Besonders zusammen mit dem Trend „Mobile“ werden die Anforderungen an die Archivierung in diesem Bereich immer komplexer.
Archivierung für mobile Anwendungen
Die mobile Kommunikation hat zu zahlreichen neuen Anforderungen auch für die Archivierung geführt. Längst dienen mobile Geräte nicht mehr nur dem Telefonieren sondern sind in E-Mail-Kommunikation, Internet, Social Communities, Finanztransaktionen, Geodaten, Dokumentennutzung, E-Books und zahlreiche andere Anwendungen eingebunden. Alle diese mobilen Geräte verfügen über keine eigenen Archivspeicher. Zu archivierende Information muss daher anders abgespeichert werden, in internen Archivsystemen oder in Archiven als Software as a Service. Abgesehen vom Speicherort des Archives sind die Wege, wie Information erfasst, als archivwürdig oder archivpflichtig klassifiziert werden, und dann letztendlich einem Archiv zugänglich gemacht werden, weitgehend ungeklärt. Begonnen hatte es mit Archiven für die E-Mail- und Messaging-Kommunikation, die über die Server einer Firma abgewickelt wurden. Hier konnte über Zusatzsoftware die Kommunikation abgegriffen werden und in ein Archiv überführt werden. Diese Möglichkeiten sind für die Kommunikation und den Zugriff auf firmeninterne Inhalte immer noch gegeben, machen aber immer weniger der Nutzungen aus. Direkte Zugriffe von mobilen Geräten wie Telefonen oder Tablets werden häufig über spezielle Dienstanbieter abgewickelt, die ihrerseits auf ihren Servern Kommunikation wie auch Dokumente (zumindest zwischen-) speichern. Hier setzt das Geschäftsmodell aller großen Telekommunikations-, Web- und Softwareanbieter an – Google und Apple in der ersten Reihe. Wichtige Informationen aus diesen Umgebungen gelangen so zum Teil überhaupt nicht mehr in die strukturierten Ablagen und Archive der Unternehmen. Bei der schnellen Kommunikation z.B. zu Preisen, Angeboten, Vertragskonditionen etc. wird dies kritisch – für die Governance im Unternehmen wie auch für die Erfüllung rechtlicher Anforderungen. Nimmt man die Aussagen der Marktauguren ernst, dann ist das Zeitalter des Stand-PCs unter dem Schreibtisch bald vorbei und es werden nur noch Notebooks, Tablets und Mobiltelephone verwendet. Alle diese Geräte kommunizieren dann weitgehend kabelungebunden über W-LAN oder Internet. Die Kommunikationskanäle werden dabei entsprechend den verwendeten Betriebssystemen und Anwendungen immer vielfältiger und damit unter Archivierungsgesichtspunkten auch immer schwieriger abgreifbar. Der Kontrolle der Informationsflüsse kommt daher aus Unternehmenssicht immer größere Bedeutung zu und kann die Nutzung bestimmter Geräte in bestimmten Einsatzgebieten auch verbieten. In jedem Fall erfordert das Thema Mobile sehr spezielle Erfassungs- und Archivierungstechnologien die mit älteren Client-/Server-orientierten Anwendungen nicht abgebildet werden können. Viele setzen daher im Bereich der Archivierung bei der mobilen Kommunikation auf die Cloud.
Archivierung in der Cloud
Die Archivierung in der Cloud ist ein heiß umstrittenes und heiß umkämpftes Thema. Heiß umstritten, weil es um die Vertrauensfrage geht. Heiß umkämpft, weil es ein Riesenmarkt mit enger Kundenbindung ist. Die Grundprinzipien sind lange bekannt. In einem Rechenzentrum werden technische Ressourcen, Programme und/oder Speicherplatz bereitgestellt Früher nannte man dies Outsourcing oder Application Service Providing. Heute fallen dazu Akronyme wie IaaS Infrastructure as a Service, PaaS Platform as a Service und SaaS Software as a Service (manche Archivdiensteanbieter haben SaaS auch als Akronym für Storage as a Service adaptiert). Die Unterschiede liegen im Wesentlichen darin, ob man eigene Anwendungen unter eigener Kontrolle auf einem entfernt stehenden, fremden Server betreibt oder eine komplette bereitgestellte Software einfach nutzt und die Anwendungsdaten gleich auf der Server des Anbieters belässt. Auch muss man unterscheiden ob man von einer Private Cloud spricht, also die Technologie Inhouse auf eigenen Systemen einsetzt, oder eine öffentliche, eine Public Cloud über öffentliche Leitungen benutzt. Bei der Public Cloud ist man sehr schnell beim Thema rechtliche Anforderungen, da bestimmte Gesetze es nicht gestatten, außerhalb des eigenen Landes bestimmte Daten und Dokumente zu speichern. Zwar gibt es auch dedizierte Angebote, wo man die Cloud nutzt aber genau weiß in welchen Rechenzentren wo die Daten gespeichert sind, so ist das Prinzip der Cloud jedoch eigentlich, die Informationen nach Wirtschaftlichkeits- und Kapazitätsgründen möglichst optimal zu verteilen. Hierbei können sogar Sicherheitsaspekte eine wichtige Rolle spielen, wenn die Daten in drei verschiedenen Kontinenten unabhängig voneinander vorliegen und einen möglichen regionalen Katastrophenfall überleben (die Nutzer leider nicht). Rechtliche Fragen und die Vertrauensfrage sind eng miteinander verknüpft: die Angst, wer Zugriff auf die Daten hat, wer sie beim Hochladen und Runterladen mitliest; die Ungewissheit ob das Service-Unternehmen über die Dauer der Archivierungszeit überlebt (dies kann eine sehr weite Schere sein …), die Risiken der Einbehaltung der Daten und der Verweigerung des Zugriffs bei Zahlungsproblemen, Vertragsablauf oder Firmen-Merger, die Probleme der AGB und Vertragskonditionen in fremden Rechtsräumen, die fehlende Unsicherheit bei den Anzeigemöglichkeiten wenn Softwareupdates beim Diensteanbieter eingespielt werden, und, und, und. Die große Vertrauensfrage. Wo man in Deutschland empört aufschreien würde, wichtiger kaufmännische Unternehmensdaten z.B. bei Google zu speichern – wo andererseits Google mit den Postini-Services einer der größten SaaS-E-Mail-Archivierungsanbieter ist. Und denkt man an die besonders kritischen Daten im Unternehmen, die Daten zu Kunden und Interessenten, so sind heute CRM-Anwendungen ein sehr beliebtes SaaS-Thema geworden. Die Zeiten ändern sich und gerade durch mobiles Arbeiten und veränderte Formen der Collaboration gewinnt die Cloud in allen Bereichen an Bedeutung – auch bei der Archivierung. Allerdings gibt es für SaaS-Angebote zur Archivierung besondere funktionale Anforderungen: Caching bei Zugriffsspitzen, spezielle Abrechnungsmodule, sichere Authentifikation, Rückmeldesysteme an den Dateneigentümer, Protokollierung, Schnittstellen zur Einbindung lokal installierter Software, Backup und Softstandby auch für große Archivvolumina, spezielle Prefetch-Strategien, Preview-Konverter, Legal Hold, HSM, Teil-Replikation, paralleles Renditioning mit Langzeitformaten, Univeral-Archiv-Charakter da keine Kontrolle darüber besteht, was für Informationsobjekte die Anwender hochladen – der Katalog ist lang und beschriebt im Prinzip eine eigene Gattung von Archivsystemen. Diese sind bei traditionellen Outsourcern schon vorhanden und bei anderen großen Anbietern in Entwicklung. Hier reihen sich neben die bisherigen Spezialisten aus dem ECM-Umfeld auch Startups wie Boxnet und Dropbox sowie zunehmend die großen Web-Konzerne wie Amazon, Apple und Google mit Archivierungsangeboten ein. Denn wenn man viel Archiviertes erst einmal auf einer Plattform hat, dann kann man nur mit großem Aufwand auf eine andere Plattform wechseln. Ein ideales Kundenbindungsinstrument gerade in der stürmischen ITK Industrie. Aber man muss auch die positiven Seiten erwähnen – gerade die großen Anbieter im Web können mit höchster Performance, zu jederzeit fast ausfallsfrei und weltweit alle Informationen zur Nutzung bereitstellen. Dies lässt sich auch in großen Unternehmen mit einer Inhouse-Lösung kaum erreichen – zumal es dort immer heißt: Archivierung ist unwichtig, dafür gibt es kein Geld.
Archivierung sinnvoll nutzen
Die zu geringen Investitionen in die Archivierung treffen genau den Falschen. Bei Sparmaßnahmen für die IT-Abteilungen heißt es häufig pauschal bei Mitarbeitern, Speichern, Servern und Anwendungskosten prozentual zu sparen, Anwendungen zu konsolidieren und den Bestand zu reduzieren. Hier wird übersehen, dass die elektronische Archivierung gegenläufig ist – es werden immer mehr Informationen, der Speicherbedarf und der Pflegebedarf werden immer grösser (auch trotz gezielter Entsorgung der Archive). Damit werden im Prinzip die Archive über die Jahre immer teurer – wo doch eigentlich Sparen angesagt war. Deshalb wird häufig bei der Sicherheit, bei der Verfügbarkeit und der Aktualisierung der Archivsysteme gespart. Auch aus diesem Grund ist es essentiell notwendig auf die ständige Aktualität des Themas Elektronische Archiveirung hinzuweisen. Archivierung ist wichtig – und dies gilt es deutlich zu machen! Unabhängig von technologischen Strömungen und Kosten – es geht um die Bewahrung und Erschließung des Wissens in den Unternehmen. Archivierung nur aus Compliance-Gründen ist meistens unwirtschafltich! Die Informationen aus Archiven müssen in den Arbeitsprozessen nutzbar gemacht werden. Es gilt den Staub vom Begriff Elektronische Archivierung abzuschütteln und sich den Herausforderungen der globalen Informationsgesellschaft zu stellen.