Datenhaltung in BI-Systemen

Würfeln Sie noch oder wissen Sie schon?

07.07.2010
Von Thomas Recke

Szene 4: Umsatzverteilung würfeln?

Bei drei Kunden lässt sich die Umsatzverteilung auf diese Art noch ganz anschaulich darstellen. Es ist offensichtlich, dass Kunde B der umsatzschwächste Kunde ist, mit dem gerade mal etwa ein Fünftel des Gesamtumsatzes des Unternehmens realisiert wurde. Doch bei einer größeren Anzahl von Kunden reicht es nicht aus, für jeden Kunden die Umsatzzahl anzugeben. Vielmehr muss zu einer bestimmten Umsatzzahl die Anzahl der Kunden angegeben werden, mit denen dieser Umsatz erzielt wurde.

Abbildung 5: Zweidimensionaler Würfel zur Darstellung der Umsatzverteilung.
Abbildung 5: Zweidimensionaler Würfel zur Darstellung der Umsatzverteilung.

Mit dem oben definierten Würfel lässt sich solch eine Darstellung nicht erreichen, da die Größe "Umsatz" keine Dimension des Würfels ist. Die Dimensionen eines Würfels bilden die möglichen Betrachtungsrichtungen auf die im Würfel dargestellten Fakten. Damit können Nutzer auch nur das als Achse in solch einem Diagramm verwenden, was zuvor als Dimension in einem Würfel definiert wurde. Zur Darstellung solch eines Diagramms muss also ein neuer Würfel geschaffen werden, der als eine Dimension den Umsatz enthält. Als zweite Dimension sehen wir den Kunden vor. Jeder Punkt in dem durch diese beiden Dimensionen aufgespannten Raum steht dabei für eine bestimmte Anzahl von Kunden, mit denen ein bestimmter Umsatz erzielt wurde (Abbildung 5).

Abbildung 6: Umsatzverteilung nach Würfel aus Abbildung 5.
Abbildung 6: Umsatzverteilung nach Würfel aus Abbildung 5.

Schiebt man diesen zweidimensionalen Würfel nun entlang der Achse "Kunde" zusammen, ergibt sich eine Darstellung, die sich für ein Diagramm wie in Abbildung 6 verwenden lässt.Für die Lesbarkeit der Darstellung ist allerdings entscheidend, wie die horizontale Achse im Diagramm skaliert ist.

Abbildung 8: Umsatzverteilung zur Kundensegmentierung.
Abbildung 8: Umsatzverteilung zur Kundensegmentierung.

Für jeden Wert in der Würfel-Dimension "Umsatz" wird über der horizontalen Achse ein Balken aufgetragen. Für 1000 Kunden mit 1000 verschiedenen Umsatzzahlen würden in dem Diagramm also 1000 nebeneinander liegende Balken abgebildet - sicherlich keine sinnvolle Darstellung. Also müssen die Umsatzzahlen in Intervallen gruppiert werden, so dass zum Beispiel alle Kunden mit einem Umsatz von 0 Euro bis 50.000 Euro in einem Balken zusammengefasst werden (Abbildung 8).

Abbildung 7: Zweidimensionaler Würfel zur Darstellung der Umsatzverteilung.
Abbildung 7: Zweidimensionaler Würfel zur Darstellung der Umsatzverteilung.

Die Höhe des Balkens verdeutlicht, wie viele Kunden sich in diesem Bereich befinden. Für solch eine Darstellung muss der Würfel jedoch umgestaltet werden (Abbildung 7). In diesem Beispiel ist also ein Eingriff in die Daten-Sicht notwendig, um die Art der Darstellung in der Analyse-Sicht zu beeinflussen. Dies ist eine allgemeine Schwachstelle des Würfelansatzes. Schon in der Daten-Sicht wird festgelegt, welche Objekte später als Dimensionen in Diagrammen zur Verfügung stehen. Im angeführten Beispiel wird in der Regel erst nach Analyse der Daten klar, wie die Umsatzzahlen optimal gruppiert werden sollten.

Um die Umsatzzahlen aber überhaupt sinnvoll analysieren zu können, muss eine erste Gruppierung als Dimension eines Würfels festgelegt werden. Und wenn sich die festgelegte Gruppierung nicht als optimal erweist, müssen Anwender den Würfel erneut angepassen. Hinzu kommt, dass die die Daten nach der Anpassung in der Regel komplett neu in den Würfel eingelesen werden müssen.