XEROX: Scanning verändert Buchstaben und Ziffern
6. August 2013 08:00 Uhr | Dr. Ulrich Kampffmeyer | Permalink
Multi-Funktionsgeräte von Xerox verändern beim Scannen Ziffern, Buchstaben und andere textuelle Elemente. Gund hierfür ist das fehlerhaft implementierte Kompressionsverfahren.
Auf seiner Blog-Seite berichtet David Kriesel über den Fehler in der Software, der beim Scannen und Wandeln von Seiten in PDFs mit verscheidenen XEROX-WorkCentre-Geräten auftritt: http://www.dkriesel.com/blog/2013/0802_xerox-workcentres_are_switching_written_numbers_when_scanning. Betroffen ist der "Normal Modus", der mit JBIG2 Pattern Matching arbeitet und automatisch Zeichen durch bereits zuvor erfasste und erkannte Zeichen ersetzt. Die Dokumente sehen "richtig" aus, enthalten aber falsche Daten. Es ist nur bei einem sehr genauen Vergleich von Ursprungsdokument und erzeugtem PDF feststellbar, dass sich die Zeichen geändert haben. Der sogar im Handbuch dokumentierte Fehler (im "Normal-Modus") existiert offenbar seit einigen Jahren. Die Serie der XEROX-Geräte ist weit verbreitet und so dürften zahlreiche gescannte und archivierte Dokumente betroffen sein.
Der XEROX-Fall nun erschüttert generell das Vertrauen in das Scannen. Wenn schon Fotokopierer/Scanner/Drucker/Fax-Geräte Daten verändern, wie ist es dann generell um die Sicherheit und Richtigkeit der erfassten Informationen bestellt. Die Fehler sind offensichtlich, aber wurden über Jahre nicht bemerkt.
Der XEROX_bug - anderthalb Jahre später :)
Anderthalb Jahre nach der Entdeckung des #XEROX_bug und unserem obigen Post vom August 2013 findet die Story nunmehr auch Nachhall bei den offiziellen Gremien.
Das Bundesamt für Sicherheit in Informationstechnik (BSI) „verbietet“ am 16.3.2015
#JBIG2 Kompression generell
(https://www.bsi.bund.de/DE/Publikationen/TechnischeRichtlinien/tr03138/index_htm.html).
Auch die Schweizer Koordinationsstelle für diedauerhafte Archivierung elektronischer Unterlagen (KOST) lehnt JBIG2 gänzlich ab (http://kost-ceco.ch/cms/index.php?id=312,569,0,0,1,0).
Bei PROJECT CONSULT (http://www.project-consult.de/ecm/in_der_diskussion/das_wiesbadener_urteil_zum_scannen#comment-2657) und in der Fachpresse (http://www.ecmguide.de/news/xerox-fall-wird-nun-amtlich-bsi-aktualisiert-tr-resiscan-20931.aspx) findet dies Widerhall.
Das ursprüngliche Problem, dass in einer bestimmten Einstellung mit niederiger Auflösung und dem JBIG2-Verfahren mit Pattern-Matching für die Erzeugung von PDFs Zahlen- und Buchstabendreher entstanden, ist meines Erachtens zweitrangig.
Drei Thesen:
(1) Der eigentliche Skandal beim XEROX-Fall ist nicht der technische Fehler sondern, daß bei tausenden Installationen niemand über Jahre hinweg etwas gemerkt hat. Soviel zum Thema visuelle Qualitätssicherung beim Scannen. Ein kurzer Blick auf einen Bildschirm ohne dass das Original daneben liegt, langt einfach nicht solche Fehler festzustellen.
(2) Es gibt keine Rechtssicherheit. Sicherheit beim Scannen durch elektronische Signaturen erzeugen zu wollen ist ein Irrweg. Durch das Signieren und Nachsignieren des Dokumentes wird die Ursprungsqualität nicht besser. Nun stellt sich nach der BSI Empfehlung „Kontra“ JBIG2 die Frage, wie all die bereits gescannten Dokumenten zu behandeln sind, die entsprechend der Auflistung in der ursprünglichen TR-03138
ResiScan mit JBIG2 komprimiert worden sind: nunmehr alle und zu dem rückwirkend nicht mehr rechtssicher und vor Gericht als Beweis anzuerkennen?
(3) Verbote helfen nicht. Es geht nicht um ein technisches Problem, sondern um Sorgfalt und Qualität in den Erfassungs- und Verarbeitungsprozessen von Information. Hier müssen anstelle oder zumindest zusätzlich automatische Verfahren der Überprüfung der Lesbarkeit und inhaltlichen Korrektheit implementiert werden. Jedes
Dokument per OCR und Klassifikation nebst Abgleich auswerten. Dies ist sicherer und schneller als manuelle Sichtkontrollen. JBIG2 gleich ganz zu verbieten, schießt außerdem über das Ziel hinaus. Ohne eine Klärung, was mit bereits gescannten Dokumenten zu geschehen hat (siehe 2) und ohne Erklärung, dass es sich letztlich nur um ein Einstellungs- oder Parametrisierungsproblem moderner Scannersoftware
handelt, erzeugt dies wieder Unsicherheit und Angst gegenüber elektronischen Verfahren. Dies ist falsch und kontraproduktiv.
Ulrich Kampffmeyer