Enterprise Search

Enterprise Search, die unternehmensweite Suche durch alle Speicherorte und Systeme soll dem Endanwender alle notwendigen Informationen über die bisherigen Grenzen der „Insel-Lösungen“ hinweg zur Verfügung stellen.

Enterprise Search ist so auch eine wichtige Komponente im Information Management, die bisher unerschlossene, nicht verbundene Informationsbestände nutzbar machen kann.

Definition aus Wikipedia:

Enterprise Search bzw. Unternehmensweite Suche bezeichnet ein Teilgebiet von Information Retrieval und bezeichnet den Vorgang der computergestützten inhaltsorientierten Suche mit Hilfe einer unternehmensinternen Suchmaschine, welche Content mittels so genannter Crawler indexiert.
Die Suche wird jedoch in der Regel nicht live auf den ursprünglichen Datenquellen durchgeführt, sondern auf dem Suchindex. Dieser Index beinhaltet primär interne Datenquellen wie Dokumente von verschiedenen Datenbanken und Einträge von Dateisystemen.
Treffer oder gefundene Dokumente werden im Kontext der Suchanfrage als Textauszug („Snippet“) angezeigt. Durch diese Vorschau lässt sich schnell die Relevanz der Ergebnisse beurteilen. Durch die fortlaufende Indexierung der einzelnen Datenquellen wird die Aktualität der Resultate (Result Set) gewährleistet.
Aus Sicht von Unternehmen ist der Nutzen von Enterprise Search die Unterstützung der Mitarbeiter bei der Suche nach arbeitsrelevanten Informationen.

Enterprise Search verspricht uns das Wiederfinden aller Informationen des Unternehmens ohne sich vorher über Klassifikation und Ordnung Gedanken machen zu müssen: Mittels Enterprise Search einfach alle Repositories, sprich Speicherorte, automatisiert durchsuchen, um die Informationsstrukturen, die Informationen und die Informationsobjekte automatisch zu indizieren und zu klassifizieren. Der Anwender hat sich an die Mechanismen von Google gewöhnt. Ein Feld für die Suche, eine Ergebnisliste mit den 10 besten Treffern auf der ersten Seite. So sieht der Anwender inzwischen die Welt. Man spricht inzwischen von Google-esque. Facettiertes Suchen mit zahlreichen Feldern tritt in den Hintergrund, zumal es die Möglichkeit gibt, hinter nur einem universellen Suchfeld die anderen Attributfelder zu verstecken und automatisch mit zu durchsuchen. Beim manuellen Erfassen und Indizieren ist das Stöhnen umso lauter je mehr Informationen erfasst oder – sofern automatisch ermittelt – bestätigt werden müssen. Die Qualität der manuellen Erfassung ist vom Komfort der Software, dem Knowhow und Interesse des Anwenders sowie der Tagesform abhängig. 

Dabei kommen auch Ansätze der automatischen Klassifikation zur Verbesserung der Suchergebnisse hinzu. Ebenso wie bei der Erfassung können auch bei der Suche Klassifikationstechniken zum Einsatz kommen, die beispielsweise auch ein Suchergebnis in Form von strukturierten Aktensichten anbieten können. Die Akte wird hierbei auf Basis der gefundenen Inhalte gebildet und nicht wie herkömmlich vordefiniert. Jedoch kann durch die Kombination von automatischer Klassifikation mit vorgegebenen Strukturen ein deutlich besseres Ergebnis als bei einer reinen Suche erzeugt werden.

Die Problematiken mit den Speicherorten, der Relevanz, der Aktualität, den Berechtigungen etc. lassen wir einmal außen vor. Auch die „alten Argumente“ dass man sich auf die Richtigkeit und Vollständigkeit der Ergebnisse nicht verlassen könne, dass man in jedem Fall Ordnung halten müsse, vergessen wir für den Moment – und für die Zukunft. Enterprise Search wird immer besser. Es werden auch hier Beziehungen ermittelt und aus den Informationen, bzw. ihrem Kontext virtuelle Ordnungsstrukturen geschaffen. Die automatische Klassifikation kann nicht nur bei der Erfassung sinnvoll eingesetzt werden – im Vorwege Ordnung schaffen – sondern auch bei der Suche – beim Finden – Ordnung schaffen. Hierbei kann man die automatisierten Verfahren durchaus gegen Taxonomien, Klassifikationsschema, kontrollierte Nomenklaturen etc. laufen lassen und die Automatismen verbessern. Denn letztlich entscheiden nur Qualität und Compliance über die Akzeptanz. (Dr. Ulrich Kampffmeyer, 2014)

Das Zusammenspiel vom Suchen und Finden

Suche (Search)
Es ist nicht bekannt, ob das Ergebnis einer Anfrage (Query) in den Daten vorhanden ist:
Durchsuchen von Metadaten und Inhalten mit Fragen zu unbekannten oder nur vermuteten Treffern. Das Ergebnis ist unbestimmt
Finden (Retrieval)
Es ist bekannt oder zumindest vermutet, dass das Ergebnis einer Anfrage (Query) in den Daten vorhanden ist:
Auffinden über Navigation, Suche in Metadaten, Suche in Inhalten oder Aufruf aus Kontext (Anwendung). Das Ergebnis ist bestimmt.

Sucht man genau nach einem bestimmten Inhalt und erwartet ein eindeutiges, hochqualitatives Ergebnis (genau das eine, richtige, aktuelle Dokument) z.B. Buchhaltung, Produktion u.a. = „Finden“
Sucht man neues Wissen, dessen Vorhandensein und Speicherort nicht bekannt sind (Dokumente, in denen Informationen zur Suchanfrage enthalten sind) z.B. Marktforschung, Forschungsberichte u.a. = „Suchen“

Die benötigten Bedingungen zur Suche nach Inhalten lassen sich mittels folgender Suchkonzepte handlich zusammenfassen.

  • Suche über Metadaten
  • Suche über Inhalte
  • Suche über Kontext und Beziehungen (Semantik)
  • Suche über Konzepte
  • Suche mittels Analytics

Enterprise Search im funktionalen EIM Modell von PROJECT CONSULT 2012

Enterprise Search ist ebenso wie das Finden mit SQL- und Voll-Text-Datenbanken eine wichtige Komponente im Enterprise Information Management.

Enterprise Search erlaubt einfacheres Retrieval von und Zugang zu allen Speicher- und Aufbewahrungsorten der Informationen.
Enterprise Search fordert Records Management und ordnungsgemäße Informationsorganisation mit unbegrenztem Zugriff ohne die ermüdende Aufgabe des manuellen Zuordnens der Metadaten heraus.
Sicherheit, Datenschutz und Vertraulichkeit laufen Gefahr von Enterprise Search ignoriert zu werden, wenn sie nicht ordnungsgemäß implementiert und genutzt werden.

Enterprise Search steht eigentlich für die übergreifende Suche über alle Informationen des Unternehmens, stirbt aber häufig an Schnittstellen, Formaten und Berechtigungsbarrieren.

Dr. Ulrich Kampffmeyer
Update Information Management 2017

Ressourcen