XEROX: Scanning verändert Buchstaben und Ziffern

6. August 2013 08:00 Uhr | Dr. Ulrich Kampffmeyer | Permalink

Multi-Funktionsgeräte von Xerox verändern beim Scannen Ziffern, Buchstaben und andere textuelle Elemente. Gund hierfür ist das fehlerhaft implementierte Kompressionsverfahren.

Auf seiner Blog-Seite berichtet David Kriesel über den Fehler in der Software, der beim Scannen und Wandeln von Seiten in PDFs mit verscheidenen XEROX-WorkCentre-Geräten auftritt: http://www.dkriesel.com/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning. Betroffen ist der "Normal Modus", der mit JBIG2 Pattern Matching arbeitet und automatisch Zeichen durch bereits zuvor erfasste und erkannte Zeichen ersetzt. Die Dokumente sehen "richtig" aus, enthalten aber falsche Daten. Es ist nur bei einem sehr genauen Vergleich von Ursprungsdokument und erzeugtem PDF feststellbar, dass sich die Zeichen geändert haben. Der sogar im Handbuch dokumentierte Fehler (im "Normal-Modus") existiert offenbar seit einigen Jahren. Die Serie der XEROX-Geräte ist weit verbreitet und so dürften zahlreiche gescannte und archivierte Dokumente betroffen sein.

Der XEROX-Fall nun erschüttert generell das Vertrauen in das Scannen. Wenn schon Fotokopierer/Scanner/Drucker/Fax-Geräte Daten verändern, wie ist es dann generell um die Sicherheit und Richtigkeit der erfassten Informationen bestellt. Die Fehler sind offensichtlich, aber wurden über Jahre nicht bemerkt.

Der XEROX_bug - anderthalb Jahre später :)

uli

23. März 2015 um 10:24

Permalink

Anderthalb Jahre nach der Entdeckung des #XEROX_bug und unserem obigen Post vom August 2013 findet die Story nunmehr auch Nachhall bei den offiziellen Gremien.

Das Bundesamt für Sicherheit in Informationstechnik (BSI) „verbietet“ am 16.3.2015
#JBIG2 Kompression generell
(https://www.bsi.bund.de/DE/Publikationen/TechnischeRichtlinien/tr03138/index_htm.html).

Auch die Schweizer Koordinationsstelle für diedauerhafte Archivierung elektronischer Unterlagen (KOST) lehnt JBIG2 gänzlich ab (http://kost-ceco.ch/cms/index.php?id=312,569,0,0,1,0).

Bei PROJECT CONSULT (http://www.project-consult.de/ecm/in_der_diskussion/das_wiesbadener_urteil_zum_scannen#comment-2657) und in der Fachpresse (http://www.ecmguide.de/news/xerox-fall-wird-nun-amtlich-bsi-aktualisiert-tr-resiscan-20931.aspx) findet dies Widerhall.

Das ursprüngliche Problem, dass in einer bestimmten Einstellung mit niederiger Auflösung und dem JBIG2-Verfahren mit Pattern-Matching für die Erzeugung von PDFs Zahlen- und Buchstabendreher entstanden, ist meines Erachtens zweitrangig.

Drei Thesen:

(1) Der eigentliche Skandal beim XEROX-Fall ist nicht der technische Fehler sondern, daß bei tausenden Installationen niemand über Jahre hinweg etwas gemerkt hat. Soviel zum Thema visuelle Qualitätssicherung beim Scannen. Ein kurzer Blick auf einen Bildschirm ohne dass das Original daneben liegt, langt einfach nicht solche Fehler festzustellen.

(2) Es gibt keine Rechtssicherheit. Sicherheit beim Scannen durch elektronische Signaturen erzeugen zu wollen ist ein Irrweg. Durch das Signieren und Nachsignieren des Dokumentes wird die Ursprungsqualität nicht besser. Nun stellt sich nach der BSI Empfehlung „Kontra“ JBIG2 die Frage, wie all die bereits gescannten Dokumenten zu behandeln sind, die entsprechend der Auflistung in der ursprünglichen TR-03138
ResiScan mit JBIG2 komprimiert worden sind: nunmehr alle und zu dem rückwirkend nicht mehr rechtssicher und vor Gericht als Beweis anzuerkennen?

(3) Verbote helfen nicht. Es geht nicht um ein technisches Problem, sondern um Sorgfalt und Qualität in den Erfassungs- und Verarbeitungsprozessen von Information. Hier müssen anstelle oder zumindest zusätzlich automatische Verfahren der Überprüfung der Lesbarkeit und inhaltlichen Korrektheit implementiert werden. Jedes
Dokument per OCR und Klassifikation nebst Abgleich auswerten. Dies ist sicherer und schneller als manuelle Sichtkontrollen. JBIG2 gleich ganz zu verbieten, schießt außerdem über das Ziel hinaus. Ohne eine Klärung, was mit bereits gescannten Dokumenten zu geschehen hat (siehe 2) und ohne Erklärung, dass es sich letztlich nur um ein Einstellungs- oder Parametrisierungsproblem moderner Scannersoftware
handelt, erzeugt dies wieder Unsicherheit und Angst gegenüber elektronischen Verfahren. Dies ist falsch und kontraproduktiv.

Ulrich Kampffmeyer

Antwort

Ein Kommentar zu “XEROX: Scanning verändert Buchstaben und Ziffern”

Der XEROX_bug - anderthalb Jahre später :)

uli
23. März 2015 um 10:24

Anderthalb Jahre nach der Entdeckung des #XEROX_bug und unserem obigen Post vom August 2013 findet die Story nunmehr auch Nachhall bei den offiziellen Gremien.

Das Bundesamt für Sicherheit in Informationstechnik (BSI) „verbietet“ am 16.3.2015
#JBIG2 Kompression generell
(https://www.bsi.bund.de/DE/Publikationen/TechnischeRichtlinien/tr03138/index_htm.html).

Auch die Schweizer Koordinationsstelle für diedauerhafte Archivierung elektronischer Unterlagen (KOST) lehnt JBIG2 gänzlich ab (http://kost-ceco.ch/cms/index.php?id=312,569,0,0,1,0).

Bei PROJECT CONSULT (http://www.project-consult.de/ecm/in_der_diskussion/das_wiesbadener_urteil_zum_scannen#comment-2657) und in der Fachpresse (http://www.ecmguide.de/news/xerox-fall-wird-nun-amtlich-bsi-aktualisiert-tr-resiscan-20931.aspx) findet dies Widerhall.

Das ursprüngliche Problem, dass in einer bestimmten Einstellung mit niederiger Auflösung und dem JBIG2-Verfahren mit Pattern-Matching für die Erzeugung von PDFs Zahlen- und Buchstabendreher entstanden, ist meines Erachtens zweitrangig.

Drei Thesen:

(1) Der eigentliche Skandal beim XEROX-Fall ist nicht der technische Fehler sondern, daß bei tausenden Installationen niemand über Jahre hinweg etwas gemerkt hat. Soviel zum Thema visuelle Qualitätssicherung beim Scannen. Ein kurzer Blick auf einen Bildschirm ohne dass das Original daneben liegt, langt einfach nicht solche Fehler festzustellen.

(2) Es gibt keine Rechtssicherheit. Sicherheit beim Scannen durch elektronische Signaturen erzeugen zu wollen ist ein Irrweg. Durch das Signieren und Nachsignieren des Dokumentes wird die Ursprungsqualität nicht besser. Nun stellt sich nach der BSI Empfehlung „Kontra“ JBIG2 die Frage, wie all die bereits gescannten Dokumenten zu behandeln sind, die entsprechend der Auflistung in der ursprünglichen TR-03138
ResiScan mit JBIG2 komprimiert worden sind: nunmehr alle und zu dem rückwirkend nicht mehr rechtssicher und vor Gericht als Beweis anzuerkennen?

(3) Verbote helfen nicht. Es geht nicht um ein technisches Problem, sondern um Sorgfalt und Qualität in den Erfassungs- und Verarbeitungsprozessen von Information. Hier müssen anstelle oder zumindest zusätzlich automatische Verfahren der Überprüfung der Lesbarkeit und inhaltlichen Korrektheit implementiert werden. Jedes
Dokument per OCR und Klassifikation nebst Abgleich auswerten. Dies ist sicherer und schneller als manuelle Sichtkontrollen. JBIG2 gleich ganz zu verbieten, schießt außerdem über das Ziel hinaus. Ohne eine Klärung, was mit bereits gescannten Dokumenten zu geschehen hat (siehe 2) und ohne Erklärung, dass es sich letztlich nur um ein Einstellungs- oder Parametrisierungsproblem moderner Scannersoftware
handelt, erzeugt dies wieder Unsicherheit und Angst gegenüber elektronischen Verfahren. Dies ist falsch und kontraproduktiv.

Ulrich Kampffmeyer
Antwort

Neuen Kommentar verfassen

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Titel *

Name *

E-Mail-Adresse *

Website

Ich stimme zu, dass die von mir eingegebenen Daten einschließlich der personenbezogenen Daten an PROJECT CONSULT übermittelt und dort zur Prüfung der Freischaltung meines Kommentars verwendet werden. Bei Veröffentlichung meines Kommentars wird mein Name, jedoch nicht meine E-Mail und meine Webseite, angezeigt. Die Anzeige des Namens ist notwendig, um eine individuelle persönliche Kommunikation zu meinem Beitrag zu ermöglichen. Anonyme oder mit falschen Angaben eingereichte Kommentare werden nicht veröffentlicht. Zu Nutzung, Speicherung und Löschung meiner Daten habe die Datenschutzerklärung zur Kenntnis genommen.

Ich versichere, mit meinem Kommentar alle gültigen Vorgaben des Urheberrechts beachtet zu haben. Ich habe keine Bilder, Grafiken, Texte oder Links in meinem Beitrag verwendet, die durch CopyRight, Leistungsschutzrecht oder Urheberrecht geschützt sind. Für den Inhalt meines Kommentars bin ich trotz Prüfung und Freischaltung durch PROJECT CONSULT ausschließlich selbst verantwortlich. Meine Rechte am Beitrag werden bei PROJECT CONSULT nur durch die CC Creative Commons by-nc-nd Vorgaben gewahrt.