Eine Intranet-Suche „wie bei Google“. Was ist heute möglich, wo liegen die Chancen und Grenzen?

  • Intranet
  • Künstliche Intelligenz
  • Suche

 

Wenn Mitarbeiter gefragt werden, was ein gutes Intranet ausmacht und was in der aktuellen Lösung fehlt und zukünftig verbessert werden soll, so ist eine übergreifende und sehr gut funktionierende Suchmaschine, häufig mit dem Wunsch „wie bei Google“ meist unter den Top 3 Anforderungen beschrieben oder gefordert. Aber was genau heißt „wie bei Google“ und was ist im Rahmen einer internen Intranetsuche heute möglich und sinnvoll? Im Wesentlichen werden mit einer Suchfunktion verschiedene Erwartungen verknüpft, mit dem internationalen Suchgiganten verglichen oder bestimmte Funktionen werden als Standard vorausgesetzt. Die folgenden 3 Aspekte bieten eine Betrachtung Rund um den Vergleich zwischen Google und den aktuellen Enterprise-Suchtechnologien.

Anspruch auf Vollständigkeit & Einfachheit

Die Google-Suche vermittelt das Gefühl von Vollständigkeit. Ob dies an dem extrem hohen Marktanteil im Internet und der damit verbundenen Wirkung „was nicht bei Google ist, ist nicht existent“ oder an dem tatsächlichen Umfang des Suchindexes liegt, sei dahingestellt. Fakt ist, die Nutzer haben den Eindruck von Vollständigkeit und Einfachheit, sodass Sie einfach nur bei Google suchen brauchen, um alles zu finden.

Im starken Kontrast dazu sind Intranet-Suchmaschinen praktisch immer unvollständig, meist sind nicht alle Datenquellen angeschlossen und Informationen müssen zusätzlich an verschiedenen Stellen umständlich gesucht werden. Das gilt auch für die neuen Collaboration-Tools und Social Intranets, welche nicht selten nach der ersten Euphorie ein weiteres Datensilo im Unternehmen bilden. Schlechte Suchergebnisqualität verstärkt zusätzlich die Unsicherheit beim Nutzer und er fragt sich, ob es den Inhalt gar nicht gibt oder nur an der falschen Stelle gesucht wurde. Das Ziel einer zeitgemäßen Intranetsuche muss sein, so viele Datentöpfe wie möglich anzuschließen und an einer Stelle zentral durchsuchbar zu machen. Die größte Hürde sind die meist unternehmensspezifischen Berechtigungskonzepte, die innerhalb der Quellsysteme unterschiedlich sein können, aber von der Suche einwandfrei interpretiert werden müssen. Je nach bestehender IT-Struktur im Unternehmen können diese Anpassungen zum Kostentreiber werden. Aus diesem Grund sind bei narvika die Schnittstellen zu den gängigsten Businessanwendungen bereits inkludiert und über 100 weitere Schnittstellen bestmöglich vorbereitet, um eine schnelle und günstige Umsetzung zu ermöglichen.

Suchergebnisqualität & Personalisierung

Der Nutzer erwartet umgehend persönlich passende, relevante Inhalte und dies unabhängig davon, wie viele Treffer es zu einer Suchabfrage gibt. Die Suchmaschine entscheidet, welcher Inhalt zu der individuellen Abfrage am besten passt und zeigt die Treffer nach Relevanz sortierter Reihenfolge an. Dieses Ranking wird durch vielschichtige Faktoren (Rankingfaktoren) geprägt und kann entlang dieser Faktoren optimiert werden.

Datenqualität
Der offensichtlichste Rankingfaktor ist die Datenqualität der betreffenden Inhalte (klassisch On-Page). Die Suchmaschine muss also entscheiden, welcher Inhalt in einem bestimmten Kontext „wertvoller“, also relevanter ist. Basisarbeit ist hier auf redundante Inhalte zu verzichten und für eine bestmögliche Verschlagwortung der Inhalte zu sorgen. Für Google werden Inhalte sehr aufwendig und kostenintensiv aufbereitet und optimiert. Dieser Aufwand wird bei Intranet-Inhalten meist vernachlässig und ist bei bestehenden Inhalten zu aufwändig nachzuholen. Das führt regelmäßig dazu, dass die Suchergebnisqualität abnimmt, wenn mehr und mehr Inhalte hinzukommen und die Suchmaschine zunehmend Probleme hat, relevante Inhalte zu identifizieren. Aktuelle Suchtechnologien können mittels Maschine Learning bestehende Daten klassifizieren und bspw. zur Autoverschlagwortung verwandt werden.

Externe Faktoren (klassisch Off-page)
Details zu dem Algorithmus bei Google sind gehütete Geheimnisse und werden in der SEO-Szene wiederkehrend und kontrovers diskutiert, aber u.a. hochwertige, externe Links (Backlinks) auf den betreffenden Inhalt und Erwähnungen (Social Signals) sowie die tatsächlichen Sucheingaben sind bekannte Faktoren. Anhand dieser Faktoren wird versucht die Relevanz von Websites allgemein und spezifisch für bestimmte Themen einzuordnen. Diese Möglichkeiten und Einschätzungen entfallen bei den gängigen Intranetsuchmaschinen nahezug vollständig. Am ehesten denkbar ist die Analyse & Berücksichtigung von internen Verlinkungen innerhalb eines Unternehmens, aber sicherlich Bestandteil einer individuellen Projektanpassung.

User Signals
Wie zufrieden ist ein User mit dem Suchergebnis, dem Inhalt zu einer bestimmten Suche? Im Detail ebenfalls kontrovers in der Fachwelt diskutiert, kann man davon ausgehen, dass Google die Nutzerzufriedenheit mit angezeigtem Trefferinhalt analysieren und darüber Rückschlüsse auf die Relevanz des Inhalts zu der Suchanfrage ableiten kann.
Im Bereich der Intranetsuchen sind meist einfache Klickzähler umsetzbar, die häufig geklickten Inhalte entsprechend später bevorzugen. Das Thema ist aber deutlich komplexer und einfache Klickzähler können sich fälschlicherweise selber verstärken, da kein echtes Feedback des Zielinhaltes verarbeitet wird. Gängige Metriken der Webanalyse sind bei Suchmaschinen unter Vorbehalt zu betrachten. Dieser Umstand kann durch unterschiedliche Suchmuster verstärkt werden. Bei Google ist überwiegend die „First pattern search“ relevant, also das Auffinden des erstbesten Inhalts, wohingegen im Intranet häufiger nach „known items“ gesucht wird, also konkret nach einem bestimmten und bekannten Inhalt, der bestenfalls sofort erreichbar ist. Wenig Interaktion mit der Suchanwendung kann daher ein sehr gutes und gewünschtes Zeichen (der Nutzer wird sofort fündig) oder ein schlechtes Zeichen (der Nutzer findet sich überhaupt nicht zurecht) sein.

Suchintention
Suchanfragen sind noch immer stark „Keyword basiert“, sodass die Suchmaschine meist nur einzelne oder wenige Schlagworte ohne weiteren Zusammenhang erhält. Beispiel „Bank“ kann sowohl die Parkbank sein, als auch ein Kreditinstitut, die Suchanfrage ist identisch, aber der Kontext unterscheidet sich signifikant. Google verfügt unstreitbar über derart viele Nutzerdaten (durch Suchanfragen selber, aber auch durch die Verbreitung des Google Chrome Browsers und des Android-Betriebssystems), sodass die einzelne Suchabsicht in einem viel größeren Zusammenhang automatisch abgeschätzt werden kann. Ergebnisse können anhand von der wahrscheinlichsten Suchabsicht personalisiert ausgeliefert werden. Hier hat es eine interne Intranetsuche deutlich schwerer, da grundsätzlich nur ein Bruchteil des Nutzerverhaltens erhoben und analysiert werden kann und darf. Aktuelle Enterprise-Suchmaschinen bieten mittels künstlicher Intelligenz jedoch die Auswahl des Kontextes als Folgeschritt im Suchprozess. Bei dem Beispiel „Bank“ wird dem Nutzer optisch angezeigt, dass es sowohl Treffer im Bereich Finanzen als auch Treffer im Bereich Gartenzubehör gibt. So wird die Suchabsicht nicht aktiv analysiert, aber der Nutzer kann die Suche in dem gewünschten Themenbereich zielgerichtet verfeinern.

Nutzerverhalten und Künstliche Intelligenz
Im Grunde entfällt hier jeder Vergleich, da naturgemäß die Intranetsuche über einen begrenzten Datenumfang, insbesondere zur Analyse des Nutzerverhaltens verfügt. Datenschutz spielt hier eine zentrale Rolle und Daten über das Nutzerverhalten werden stark eingeschränkt, was wiederum die Basis für die Möglichkeiten des maschinellen Lernens reduziert. Auf der anderen Seite kann eine Intranetsuche (auch mit KI) viel spezifischer auf die Unternehmensinhalte optimiert und trainiert werden, sodass viele der im direkten Vergleich auftauchenden Schwächen effizient ausgeglichen werden können.

Suchmanagement & Content-Strategie
Die große Chance der Intranetsuche im Vergleich zur Google-Optimierung. Wie Nutzer auf und mit Google im Detail interagieren, ist für den Inhaltsersteller der Website intransparent und kann nur sehr begrenzt über die eigene Webanalyse und indirekt über Dienstleister abgeschätzt und mit Unschärfe für eigene Inhaltsstrategien oder Optimierungen genutzt werden.  
Ganz anders bei der Intranetsuche und den eigenen Inhalten, wo praktisch alle Daten und Möglichkeiten in einer Hand sind. Mittels Suchauswertungen können alle Ranking-Faktoren, Filter und Inhalte präzise gesteuert und optimiert werden. Einblicke in die meistgesuchten Keywords und Suchanfragen ganz ohne Treffer bilden die Basis für erste Optimierungen.

Aktualität & Schnelligkeit

Suchresultate sind nie in Echtzeit aktuell, auch nicht bei Google. Suchtreffer beziehen sich immer auf einen zwischengespeicherten Stand eines Inhalts und müssen Seitens der Suchmaschine regelmäßig aktualisiert werden. Dabei geht der Crawler in regelmäßigen Abständen über alle Inhalte und aktualisiert den gespeicherten Stand, falls erforderlich. Dieser (Index-)Prozess beinhaltet weitere Schritte, u.a. eine Volltext-Analyse, Verschlagwortung, aber auch die Generierung von Vorschaubildern etc. und kostet Zeit sowie Ressourcen. Daher können die Indexintervalle sehr unterschiedlich sein und korrelieren regelmäßig mit der Sichtbarkeit einer Website bei Google, sodass relevante Websites oder bestimmte Bereiche einer Website häufiger aktualisiert werden als andere.
Im Punkt Management und Ausführung des Website-Crawlings ist Google jenseits aller Vergleichbarkeit, aber im Intranet können neben Websites viele Datenquellen über technische Schnittstellen und APIs direkt angebunden werden, was diese Prozesse vereinfacht und deutlich beschleunigt. Beispiel: Das Crawlen von 5000 Unterseiten einer Website kann mehrere Stunden dauern, während die gleiche Anzahl an Datenbankeinträgen innerhalb von Minuten oder gar Sekunden aktualisiert werden kann.

Suchergebnisse sofort! Eine Suchfunktion funktioniert am besten, wenn man sie überhaupt nicht wahrnimmt. Ein noch weniger sichtbares Feature ist die Performance der Suchfunktion, die Ladezeit der Suchtreffer. Als klarer Erfolgsfaktor monitort und optimiert Google die Ladezeiten im Millisekundenbereich. Nutzer, die (dringend) nach bestimmten Informationen suchen, haben eine äußerst geringe Toleranz gegenüber träge reagierende Trefferlisten und redundantem „Rumgeklicke“. Ob Sie Treffer in 2 Sekunden erhalten oder schon in einer halben Sekunde, ist ein spürbarer Unterschied und wirkt sich nachhaltig auf die Nutzerzufriedenheit aus.

Fazit

Mit unangefochtener Marktmacht und klarem Fokus auf die Websuche ist die Google-Suche in vielen Aspekten nicht mit einer aktuellen Intranetsuche vergleichbar. Insbesondere das Zusammenspiel von weltbester Technologie und umfangreichsten Nutzerdaten ermöglicht tiefgreifende Optimierungen, um eine perfekte Nutzererfahrung immer weiter zu verbessern.
Die gute Nachricht ist aber, dass viele der im direkten Vergleich auftauchenden Schwächen mit einer aktuellen Intranetsuche sehr gut und Datenschutzkonform ausgeglichen werden können. Eine übergreifende Intranetsuche kann alle Inhalte finden, nicht nur Websites, sondern auch die 3fach gepackte und im letzten Winkel auf dem Server abgelegte Excel-Tabelle, alle Ihre E-Mails, sowie Ihren letzten Beitrag im Social-Intranet. Zusätzlich hat man die gesamte Technologie und alle Faktoren „selber in der Hand“, sodass viele Einstellungen innerhalb der Suchmaschine genau auf das Unternehmen angepasst werden können. Sie können selber entscheiden, welche Inhalte relevant sind und so die Suchergebnisqualität selber analysieren und verbessern. Mittels Verfahren des Maschinellen Lernens können sehr große Datenmengen klassifiziert und um eine kontextbezogene Suche jenseits von konkreten Schlagwörtern erweitert werden.

Auch wenn Google mit einer Intranetsuche nicht vergleichbar ist, ist der dahinterliegende Wunsch interne Inhalte so einfach „wie bei Google“ durchsuchbar zu machen sehr gut umsetzbar. Wie und zu welchem Preis man diesem Anspruch an Vollständigkeit und Qualität gerecht werden kann, ist stark von der bestehenden IT-Anwendungen des Unternehmens abhängig. Mit narvika können Sie zum Festpreis inkl. der beliebtesten Schnittstellen starten und die Suchfunktion bei Bedarf um weitere Quellsysteme ergänzen.

Zurück