Benutzerverhalten analysieren

Wie Web-Mining Internet-Daten ausschlachtet

19.10.2009
Von Jürgen-Heinrich  Rohr und Karsten Winkler

In drei Schritten zum Web-Mining

Auf dem Weg zum Web-Mining sollten mittelständische Unternehmen folgende drei Schritte in ihrer Vorgehensweise beachten:

Schritt 1: Vorbereitung und Zielvorgabe

Zunächst ist ein wirtschaftlich relevantes Ziel aus dem Online-Marketing zu formulieren, und entsprechende Erfolgskriterien sind festzulegen. Zum Beispiel wird die Steigerung der Click-through-Rate interner Verweise auf Aktionsartikeln von zwei auf fünf Prozent zur Erhöhung des Umsatzes angestrebt. Ein im Idealfall durch das Management unterstütztes Team, das fachliche und methodische Kompetenz vereint, formuliert anschließend Anforderungen an die Datenbasis, übersetzt das Marketing-Ziel in eine Web-Mining-Fragestellung und plant die Einbettung der Ergebnisse in operative Systeme etwa für nutzerspezifische Artikelempfehlungen.

Schritt 2: Web-Mining-Methode bestimmen

Nach der Festlegung von Ziel, Erfolgskriterien, Budget und Zeitplanung ist die Datenbasis zur Anwendung von Web-Mining-Methoden zu definieren, aus den Quelldatensystemen zu extrahieren und in einer Tabelle zusammenzuführen. Als Ergebnis entsteht eine so genannte analytische Basistabelle, die je Untersuchungsobjekt (etwa Sitzung eines Besuchers oder Kunde) potenziell relevante Informationen und gegebenenfalls eine oder mehrere Zielvariablen enthält. Beispiele für Variablengruppen sind demografische Informationen, Reaktionen auf Online-Marketing-Kampagnen, besuchte Seiten und Inhaltsbereiche sowie angesehene und gekaufte Produkte.

Schritt 3: Web-Mining-Prozess

Foto: SAS

Der typische Web-Mining-Prozess besteht aus folgenden Schritten: Stichprobenziehung, Exploration der Daten, Modifizierung der Daten, Modellierung der Fragestellung und Auswertung der Ergebnisse. Der Anwender im analytischen Online-Marketing modelliert die jeweilige Fragestellung in einem grafischen Prozessflussdiagramm (s. Abb.). Dort repräsentieren Pfeile den Fluss von Daten und Metadaten, während grafische Symbole die jeweils auszuführenden, parametrisierten Prozessschritte (zum Beispiel ein Regressionsverfahren) repräsentieren.

Die Anwendung des besten Modells im Rahmen eines Scoring in Stapelverarbeitung oder Echtzeit wird einerseits durch den Export der Score-Werte in beliebige Datenbanken ermöglicht. Somit können beispielsweise für Kunden Produktaffinitäten (zum Beispiel Kunde kauft häufig Wintersportartikel) oder die Zugehörigkeit zu Kundensegmenten (zum Beispiel Kunde wohnt in einer Großstadt) direkt in der Datenbank des Shop-Systems gespeichert werden.

Ein letzter, wichtiger Aspekt der Modellanwendung ist die Überwachung der Modellgüte operativ genutzter Segmente oder Vorhersagemodelle, um deren "Lebenszeit" nicht zu überschreiten. Es ist beispielsweise wenig zielführend, Kunden für den Rest ihres Lebens als "junge Wintersportinteressenten aus Großstädten" zu klassifizieren, ausgelistete Artikel zu empfehlen oder die Bonität von Kunden anhand eines fünf Jahre alten Modells zu evaluieren.