Elektronisches Dokument

Das elektronische Dokument ist keine Abbildung eines Papierdokumentes sondern liegt als Datensatz, Bestandteil einer Datei oder Datei in digitalen Systemen vor.

Elektronische Dokumente sollten selbstbeschreibende Informationsobjekte ausgelegt sein, die alle ihre Attribute und Eigenschaften mit sich tragen. Nur so lassen sich die sichere Offline-Nutzung, der Schutz der Informationen und die langfristige Verfügbarkeit sicherstellen.

Definition auf Wikipedia

Ein elektronisches Dokument ist

im weiteren Sinne jede Art von strukturierten oder unstrukturierten Informationen, die als geschlossene Einheit in
einem EDV-System als Datei vorliegen.
eine durch besondere Methoden gegen Fälschung und Veränderung geschützte Datei, deren Beweiskraft in einem Rechtsgeschäft der einer schriftlichen Bekundung, eines Rechtsmittels oder einer Urkunde gleichkommt.
Dies kann ein Scan, ein Text, eine Zahlentabelle, ein Bild oder jede andere durch Digitalisieren (Umwandlung
in einen Binärcode) in Dateiform überführte oder erstellte Datei sein, die bestimmte normierte Bedingungen erfüllt.
ein physisches Reisedokument oder Identitätsnachweis (Ausweis) das ergänzend mit einem Speichermedium ausgestattet ist, welches die dem Dokument entsprechenden Daten in unveränderbarer Form drahtlos auslesbar zur Verfügung stellt (RFID-Chip).

Die Eigenschaften, die der Begriff jeweils darstellen soll sind, aufgrund der verschiedenen Verwendungen und fortgesetzter technischer Entwicklung, nicht fest definiert.

Die fehlende Legaldefinition wird von Juristen hinsichtlich der Verwendung des Begriffs durch den Gesetzgeber (in
Deutschland bspw. in § 130a Zivilprozessordnung (ZPO)) kritisiert.

Dokument

Mit Dokumentenmanagementsystemen werden elektronische Dokumente verwaltet. Der Begriff Dokument wird heute noch sehr unterschiedlich interpretiert. Im Angelsächsischen wird er häufig für Textdateien verwendet. Dies zeigt sich zum Beispiel deutlich an der verwendeten Endung “.doc” für Dateinamen von Textdokumenten. Es wird daher auch zwischen “Document Imaging”, der Verwaltung von gescanntem Schriftgut, und “Document Management”, der Verwaltung von bereits digital erzeugten Texten unterschieden.

Im Deutschen hat der Begriff des Dokuments einen konkreten Bezug zu papiergebundenem Schriftgut. Unter einem Dokument wird häufig auch ein Schriftstück mit hoher inhaltlicher Qualität und rechtlicher Bedeutung verstanden. Das Dokument wird nah an die im Gesetz verankerte Urkunde gerückt. Dies zeigt sich besonders in abgeleiteten Begriffen wie „Dokumentenechtheit“. Deutsche Anwender denken daher beim Begriff Dokumentenmanagement zunächst an gescanntes Schriftgut und bewegen sich damit nur in einem Teilgebiet dieser Technik. Im angloamerikanischen Sprachraum entspricht dem inhaltlich/rechtlich definierten Dokument der Begriff „Record“. „Records Management“ wird daher dort auch nicht mit „Document Management“ gleichgesetzt.

Der Begriff „elektronisches Dokument“ bezieht sich im Prinzip auf alle Arten von schwachstrukturierten oder unstrukturierten Informationen, die als geschlossene Einheit in einem EDV-System als Datei vorliegen. Es kann ein gescanntes Faksimile oder ein digital übermitteltes Fax, aber auch eine Datei aus einem Textverarbeitungsprogramm, ein Datenbankauszug oder eine Liste sein. Bei Dokumenten, die aus einem analogen Format, wie etwa Papier oder Sprache, durch Digitalisierung erfasst wurden und als nicht direkt auswertbarer Datenstrom oder Bild vorliegen, spricht man von Nicht-codierter Information (NCI). Bei Dokumenten, die durch Zeichensätze kodiert sind und von Programmen direkt ausgewertet werden können, spricht man von Codierter Information (CI). Durch Techniken wie OCR werden NCI-Dokumente in CI-Dokumente überführt.

Eine weitere Quelle für den Begriff „Dokument“ in Zusammenhang mit Dokumentenmanagement-Systemen ist die Bezeichnung „Dokumentation“, die sich auf eine Zusammenstellung von Dokumenten zu einem bestimmten Sachverhalt bezieht. Einige „klassische“ Dokumenten-Management-Systeme verfolgen daher auch das Ziel, aus verschiedenen Einzelkomponenten, die in unterschiedlichen Versionen vorliegen können, zu einem definierten Zeitpunkt eine in sich geschlossene, aktuelle Dokumentation zusammenzustellen.

Aus den verschiedenen Ursprüngen des Begriffs Dokument wird auch verständlich, wie sich bei Anbietern und Anwendern Missverständnisse hinsichtlich der unterschiedlichen Bedeutungen ergeben konnten. Wichtig ist daher zu ermitteln, welche Dokumente in eine Dokumentenmanagement-Lösung überführt werden sollen und wie sie physisch, formal und inhaltlich aufgebaut sind. Ausschlaggebend für die Verwaltung ist ferner der Nutzungs- und Rechtscharakter der Dokumente: dynamische, in Bearbeitung befindliche Textdateien sind von unveränderbar und langfristig aufzubewahrenden Dokumenten zu unterscheiden.

Ein Dokument hat daher in der Regel folgende Merkmale:

physische Eigenschaften (Papier, Datei),
formale Eigenschaften (Aufbau, Gestaltung),
Ordnung (fachliche Zugehörigkeit, Reihenfolge, Version, Einordnung in einen Aktenplan),
Inhalt (inhaltlicher Bezug),
Charakter (Archivierungswürdigkeit, Aufbewahrungsverpflichtung, Rechtscharakter, Bearbeitungsmöglichkeiten),
Zeit (Erzeugungsdatum, Verfallsdatum, letzte Benutzung),
Erzeuger (Absender, Ersteller, Autor),
Nutzer (Empfänger, berechtigter Bearbeiter, Leser, letzter Bearbeiter).

In der Regel ergeben sich alle diese Merkmale aus dem Dokument selbst. Sie werden in DV-Systemen für die Verwaltung, den Zugriff und die Bereitstellung genutzt. Aus ihnen ergeben sich auch die Schutz- und Suchmerkmale für das Dokumentenmanagementsystem. Attribute wie „Ordnung“ oder „Charakter“, die für alle Dokumente einer Klasse gelten, z. B. Aufbewahrungsfristen, Vernichtungszeitpunkte, gemeinsame Schlagworte, Berechtigungen etc., können über Dokumentenklassen vererbt werden.

Im Folgenden wird der Begriff Dokument für elektronische Dokumente aus unterschiedlichsten Quellen, die in einem DV-System als Datei, Bestandteil einer Datei oder Objekt vorliegen, verwendet.

Formen von Dokumenten

Dokumente können aus verschiedenen Quellen in ein Dokumentenmanagementsystem gelangen:

von Systemen selbst erzeugte Objekte wie Dateien (zum Beispiel Druck- oder Textdatei) oder Datensätze (zum Beispiel Tabelle aus einer Datenbank),
analoge, in ein digitales Format gewandelte Objekte wie Faksimiles (gescannte Images) oder Videofilme mit Ton, Sprache etc., die mit Kamera oder Mikrofon erfasst werden.

Ein Dokument kann weiterhin aus einem oder mehreren Einzelobjekten bestehen, wie beispielsweise:

Dokumente aus Textverarbeitung, Tabellenkalkulation oder Grafik,
Bilder, zum Beispiel gescannte Papierdokumente und Fotos,
Formulare, zum Beispiel Electronic Data Interchange (EDI),
COLD-Dokumente (Computer Output to Laser Disk),
ASCII– oder XML-Textdateien,
Video-Clips oder
Sound und Sprach-Clips, zum Beispiel ein aufgezeichnetes Interview.

Nach ihrer Komplexität können elementare Dokumente, Compound Documents und Container-Dokumente unterschieden werden.

Elementare Dokumente, die aus einem Objekt bestehen, enthalten nur Daten eines Typs, also keine eingebetteten Grafiken, Bilder oder Aufrufe anderer Objekte.
Aus mehreren Objekten zusammengesetzte Dokumente werden auch als Compound Documents bezeichnet. Compound Documents bestehen aus zusammengesetzten Dateien, die Text, Formatinformation, Bilder, Tabellen etc. sowie Hyperlinks oder Verweise auf andere Komponenten beinhalten können.
Einzelobjekte, komplexe Objekte, Verweisinformationen, Links, Metadaten und interne Verwaltungsdaten können zur besseren Handhabung auch in Containern zusammengefasst werden.

Selbstbeschreibende elektronische Dokumente

Container-Dokumente können in der Regel nur vom erzeugenden Programm zerlegt, interpretiert und angezeigt werden. Soll ein nur einmal gespeichertes Dokument aus verschiedenen Zusammenhängen heraus genutzt oder über andere als das erzeugende Programm auf einzelne Komponenten des Containers zugegriffen werden, muss das Container-Dokument alle benötigten Struktur-, Identifizierungs- und Verwaltungsinformationen mit sich tragen. Sind diese Bedingungen erfüllt, bezeichnet man die Dokumente als „selbstbeschreibend“.

Ein selbstbeschreibendes elektronisches Dokument besteht neben seinem Inhalt aus Attributdaten (Metadaten), die den Zugriff auf Dokumente und deren Katalogisierung erlauben. Diese werden heute meistens in XML auf Basis einer DTD oder eines Schemas abgebildet. Im englischen Sprachgebrauch werden solche Objekte als „Selfcontained Document Object“ bezeichnet. Im Deutschen heißen sie auch „selbstbeschreibende Informationsobjekte“. Sie setzen sich aus einer beliebigen Inhaltskomponente (Einzelobjekt, Container, Liste u. ä.) und einem vorgeschalteten, mit der Inhaltskomponente verbundenen “Header” zusammen. Der Header kann selbst aus verschiedenen Teilen zusammengesetzt sein. Er beginnt in der Regel mit einer neutralen Beschreibung, welche Merkmale und Attribute im Header erwartet werden können.

Ein Header beinhaltet im Allgemeinen folgende Attribute, die als Metadaten zum Dokument gehören:

Codes für die Selbsterklärungsfunktion
Hierzu gehören zum Beispiel Anzahl und Reihenfolge der folgenden Attribute, Attributnamen, Attributformate etc., heute meistens in XML definiert und extern in einer DTD oder einem Schema referenziert.
Eindeutige Identifizierung des Objektes
Dies wird in der Regel durch einen „Unique Identifier“, einen eindeutigen Schlüssel für die Identifizierung jedes Objektes gehandhabt. Für Unique Identifier existieren sowohl allgemeine Standardisierungen als auch brancheninterne Festlegungen. Der Unique Identifier wird benutzt, um auf das Objekt zuzugreifen und es als einmalig vorhandenes Dokument zu identifizieren. In der Regel sind im Unique Identifier Entstehungsort und -datum des Objektes mit Uhrzeit kodiert.
Informationen zu Art, Anzahl und Struktur der einzelnen Teile der Inhaltskomponente
Hierunter ist der Aufbau der Inhaltskomponente zu verstehen, die nur aus einem einzelnen Faksimile, aber auch aus einer strukturierten DV–Liste, einem mehrseitigen Dokument oder einem zusammengesetzten Container bestehen kann.
Formatinformationen
Hierzu gehören beschreibende Daten der Erzeugung der Inhaltskomponente. Formatinformationen werden zur Reproduktion der Information ausgewertet (zum Beispiel für Anzeige, Bearbeitung und Druck).
Nutzungsinformationen
Beispiele für Nutzungsinformationen sind Erzeuger, vorgesehene Benutzergruppe, Status der Information oder Verknüpfung auf zulässige Bearbeitungsoperationen.
Schutzinformationen
Hierzu gehören Prüfsummen, Zugriffsschutzmerkmale, gegebenenfalls eine elektronische Signatur und andere Attribute.
Referenzinformationen
Referenzinformationen beinhalten die Zugehörigkeit zu anderen Objekten wie Folgeseiten, vordefinierte Dokumentklassen, Ersatz anderer Dokumente durch ”logische Löschung”, Notizen, Versionsmanagement, Hintergrund-Faksimile etc.
Inhaltliche Informationen
Das sind beschreibende Attribute und Ordnungsmerkmale, die in der Regel in der Verwaltungsdatenbank für den direkten Zugriff benutzt werden. Sie dienen im Header für Prüfungs-, Wiederherstellungs- und Anzeigefunktionen.

Die Attribute können auch ausgewertet werden, wenn die Verwaltungsdatenbank nicht im Zugriff ist oder das Informationsobjekt in eine Umgebung außerhalb des erzeugenden Systems versandt wurde.

Solche elektronischen Dokumente können als Informationsobjekte auch die Anforderungen der ISO 14721 OAIS Open Archival Information System in Gestalt von „Packages“ wie SIP (Submission Information Package), AIP (Archive Information Package) und DIP (Distribution Information Package) erfüllen.

Elektronische Dokumente werden durch ihren Inhalt, Rechtscharakter und Wert definiert – nicht durch ihre technischen Formate.

Dr. Ulrich Kampffmeyer
Euroforum Seminar „Einführung von Dokumentenmanagement-Systemen“, 1993

Ressourcen

Dokument im Wikipedia-Artikel „Dokumentenmanagement“
Elektronisches Dokument auf Wikipedia

Neuen Kommentar verfassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Titel *

Name *

E-Mail *

Website

Ich stimme zu, dass die von mir eingegebenen Daten einschließlich der personenbezogenen Daten an PROJECT CONSULT übermittelt und dort zur Prüfung der Freischaltung meines Kommentars verwendet werden. Bei Veröffentlichung meines Kommentars wird mein Name, jedoch nicht meine E-Mail und meine Webseite, angezeigt. Die Anzeige des Namens ist notwendig, um eine individuelle persönliche Kommunikation zu meinem Beitrag zu ermöglichen. Anonyme oder mit falschen Angaben eingereichte Kommentare werden nicht veröffentlicht. Zu Nutzung, Speicherung und Löschung meiner Daten habe die Datenschutzerklärung zur Kenntnis genommen.

Ich versichere, mit meinem Kommentar alle gültigen Vorgaben des Urheberrechts beachtet zu haben. Ich habe keine Bilder, Grafiken, Texte oder Links in meinem Beitrag verwendet, die durch CopyRight, Leistungsschutzrecht oder Urheberrecht geschützt sind. Für den Inhalt meines Kommentars bin ich trotz Prüfung und Freischaltung durch PROJECT CONSULT ausschließlich selbst verantwortlich. Meine Rechte am Beitrag werden bei PROJECT CONSULT nur durch die CC Creative Commons by-nc-nd Vorgaben gewahrt.