Stammdatenmanagement trifft Big Data

Die Rollen von Data Stewards und Data Scientists müssen zusammenpassen

17.04.2014 von Wolfgang Martin
Richtig mit Informationen im Big-Data-Zeitalter umzugehen, ist nicht allein eine Sache der Technik. Unternehmen müssen auch ihre Organisation auf die wachsenden Datenmengen einstellen. Dazu gehören eine ganze reihe neuer Rollen, die im Team gut zusammenspielen müssen.

Bereits vor dem Zeitalter von Big Data war die Frage, wer für welche Daten und ihre Qualität im Unternehmen verantwortlich ist, mehr als essentiell, denn Information entscheidet alles. Es ging schon immer darum, dem richtigen Kunden rechtzeitig das richtige Produkt mit der richtigen Rechnung an den richtigen Ort zur richtigen Zeit in der richtigen Menge zu liefern. Das war und ist die Zielsetzung von Informationsmanagement. Die Wichtigkeit von Informationsmanagement wurde und wird aber nicht immer anerkannt. Wenn Information nicht korrekt, vollständig und rechtzeitig zur Verfügung steht, dann gibt es Prozessabbrüche oder -verzögerungen, Stornos, Retouren, Stillstand, Verärgerung auf der Kundenseite und einiges an Unbequemem und Ärgerlichem mehr.

Nicht die richtige Information zu haben kostet viel Geld, Umsatz und verursacht auch noch Kosten. Prozesse können nur dann (optimal) ablaufen, wenn die Information stimmt. Informationsmanagement tut also Not. Bleibt die Frage, wer für Informationsmanagement zuständig und folglich verantwortlich ist, wenn die Information nicht stimmt.

Foto: Creativa - Fotolia.com

Die Aufgaben von Data Stewards

Die Aufgaben des Informationsmanagements und der Qualitätssicherung von Daten im Unternehmen nehmen immer häufiger Data Stewards wahr. Sie arbeiten im Kontext von Information Governance, die die Regeln und Prozesse definiert, die im Informationsmanagement gelten beziehungsweise ablaufen. So soll sichergestellt werden, dass Information korrekt, konsistent und durchgängig im ganzen Unternehmen angelegt, gemanagt und genutzt wird.

Data Stewards sorgen dafür, dass die Information Governance von allen im Unternehmen bei allen Tätigkeiten beachtet und umgesetzt wird. Diese Aufgabe sollten sie nicht als polizeiliche Kontrollinstanz erfüllen, sondern im Gegenteil als Dienstleister für die Fachabteilungen. Dazu gehören unterschiedliche Tätigkeiten. Data Stewards sollten eine führende Rolle bei der Entwicklung von Datendefinitionen einnehmen. Sie sollten Data Profiling unterstützen, um Fehler in Daten aufzudecken und die Auswirkungen solcher Fehler abschätzen. Sie sollten die Nutzung von Daten propagieren und für Datensicherheit sorgen. Sie sollten auch über die Einhaltung aller Regeln und über die Qualität der Daten mittels Monitoring wachen. Sie sind auch beteiligt, wenn es um die Priorisierung von Datenqualitäts-Maßnahmen geht.

Die Aufgaben von Data Stewards sollten natürlich auch im Rahmen der Unternehmensstrategie und der Unternehmensziele priorisiert werden. So sollte beispielsweise ein Softwareunternehmen, wie es die in Pforzheim ansässige Uniserv praktiziert, den Schwerpunkt der Arbeit von Data Stewards auf die Kundendaten legen, die in den Vertriebs- und Marketing-Prozessen genutzt werden, auf denen das Unternehmen aktuell einen Fokus gelegt hat. Einen Fokus auf Kundendaten ganz allgemein zu legen, wäre hier eine zu unscharfe Vorgabe, die in der Regel nicht zum Erfolg führen wird.

Big Data: Neue Berufsbilder -
Big Data: Neue Berufsbilder
In den teilweise euphorischen Einschätzungen von Markforschern und IT-Unternehmen ist immer wieder die Rede von neuen Berufsbildern, die Big Data mit sich bringen soll. Dazu zählen unter anderem folgende Tätigkeiten:
Data Scientist
Er legt fest, welche Analyseformen sich am besten dazu eignen, um die gewünschten Erkenntnisse zu erzielen und welche Rohdaten dafür erforderlich sind. Solche Fachleute benötigen solide Kenntnisse in Bereichen wie Statistik und Mathematik. Hinzu kommen Fachkenntnisse über die Branche, in der ein Unternehmen beziehungsweise tätig ist und über IT-Technologien wie Datenbanken, Netzwerktechniken, Programmierung und Business Intelligence-Applikationen. Ebenso gefordert sind Verhandlungsgeschick und emotionale Kompetenz, wenn es um die Zusammenarbeit mit anderen Abteilungen geht.
Data Artist oder Data Visualizer
Sie sind die "Künstler" unter den Big-Data-Experten. Ihre Hauptaufgabe besteht darin, die Auswertungen so zu präsentieren, dass sie für Business-Verantwortliche verständlich sind. Die Fachleute setzen zu diesem Zweck Daten in Grafiken und Diagramme um.
Data Architect
Sie erstellen Datenmodelle und legen fest, wann welche Analyse-Tools Verwendung finden und welche Datenquellen genutzt werden sollen. Auch sie benötigen ein umfassendes Know-how auf Gebieten wie Datenbanken, Datenanalyse und Business Intelligence.
Daten-Ingenieur
Diese Aufgabe ist stark auf die IT-Infrastruktur ausgerichtet. Der Dateningenieur ist das Big-Data-Analysesystem zuständig, also die Hard- und Software sowie Netzwerkkomponenten, die für das Sammeln und Auswerten von Daten benötigt werden. Eine vergleichbare Funktion haben System- und Netzwerkverwalter im IT-Bereich.
Information Broker
Er kann mehrere Rollen spielen, etwa die eines Datenhändlers, der Kunden Informationen zur Verfügung stellt, oder die eines Inhouse-Experten, der Datenbestände von unterschiedlichen Quellen innerhalb und außerhalb des Unternehmens beschafft. Außerdem soll er Ideen entwickeln, wie sich diese Daten nutzbringend verwenden lassen.
Data Change Agents
Diese Fachleute haben eine eher "politische" Funktion. Sie sollen bestehende Prozesse im Unternehmen analysieren und anpassen, sodass sie mit Big-Data-Initiativen kompatibel sind. Nur dann lässt sich aus solchen Projekten der größtmögliche Nutzen ziehen. Wichtig sind daher ausgeprägte Kommunikationsfähigkeiten, Verständnis für Unternehmensprozesse sowie Kenntnisse im Bereich Qualitätssicherung und Qualitätsmanagement (Six Sigma, ISO 9000).

Die Organisation von Data Stewards

Data Stewards können mit ihrer Arbeit im Unternehmen starten, auch wenn noch keine ausgefeilte Information Governance besteht. Ein kleines gemischtes Team aus Fachabteilungen und der IT kann mit der Formalisierung von Datendefinitionen und Informationsmanagement-Prozessen und Nutzungsregeln beginnen. Die Mitarbeiter/innen sollten gute Kommunikatoren und Vermittler sein sowie geschickt verhandeln können. Sie müssen nicht unbedingt Vollzeit in das Team delegiert werden, aber man sollte darauf achten, dass genügend Zeit für die Tätigkeit als Data Steward eingeplant wird. Das Einstellen neuer Mitarbeiter für diese Aufgaben hat sich in der Regel nicht bewährt, da Data Stewards das Unternehmen inklusive der informellen Informationskanäle gut kennen müssen, um erfolgreich arbeiten zu können.

Das Team vernetzt sich dann im Unternehmen und identifiziert in den verschiedenen Fachabteilungen und in der IT dezidierte Ansprechpartner. Es hat auf diese Weise auch die Aufgabe, eine funktionierende Partnerschaft zwischen den Fachabteilungen und der IT zu etablieren. Organisatorisch fasst man am besten das Team mit seinen Ansprechpartnern in den Fachabteilungen und der IT in einem Kompetenzzentrum zusammen. Ein solches hat einen Sponsor auf der Führungsebene des Unternehmens und wird von einer Doppelspitze geleitet, einem Mitarbeiter aus der Fachabteilung der als Primus inter Pares agiert, und einem Mitarbeiter aus der IT. Es hat ein Budget, verantwortet das Programm und entwickelt seine Methodologie, die Information Governance.

Data-Steward-Programme stoßen mitunter im Unternehmen auf kulturelle Probleme. Beispielsweise wollen manchmal von einer Fachabteilung Probleme mit schlechter Datenqualität nicht gesehen werden, weil in dieser Fachabteilung die Daten zwar entstehen, aber hauptsächlich an anderer Stelle genutzt werden. Daher hat eine solche Fachabteilung möglicherweise wenig Interesse, in Datenqualität zu investieren. Hier können Data Stewards für Transparenz sorgen und aufzeigen, welche Probleme dem Gesamtunternehmen entstehen und wie man diese Fachabteilung in Sachen Datenqualität unterstützen kann.

Big Data: Handlungsempfehlungen -
Big Data: Handlungsempfehlungen
Was sind die Hauptursachen für Fehlschläge? Und was kann das Projektteam dagegen unternehmen?
Big-Data-Vorhaben konsequent auf die Unternehmensstrategie ausrichten.
Vollständigen Business Case mit Nachweis des Return on Investment erstellen.
Detailliertes Pflichtenheft verfassen und pragmatischen Plan mit Reserven für Unvorhergesehenes ausarbeiten.
Kommunikation zwischen allen Stakeholdern sicherstellen.
Das System schrittweise einführen.
Notwendiges Wissen vorab erwerben oder aufbauen.

Big Data-Analytik

Data Stewards haben die Verantwortung für die Unternehmensdaten und/oder - im jeweiligen Umfang - für Daten aus den Fachabteilungen. Jetzt kommt Big Data. Wie beeinflusst das Management von Big Data die bisherigen Aufgaben und Zielsetzungen von Data Stewards? Schauen wir zuerst auf die Anforderungen von Big-Data-Analytik. Sie erfordert gegenüber der traditionellen Analytik neue Skills und Rollen, die sich organisatorisch gesehen am besten in einem erweiterten BI-Kompetenzzentrum ansiedeln lassen. In einigen Unternehmen wie Amazon, eBay, Facebook, Google, Twitter und anderen, die sich schon einige Zeit mit Big Data beschäftigen, haben sich solche neuen Rollen gebildet, die zusammen ein Big Data-Team ausmachen. Die fünf wichtigsten Rollen in einem solchen Team findet man in einem Vorschlag von McKinsey & Company. Dieser Beitrag beschäftigt sich zwar mehr mit Big Data-Marketingprojekten, aber er ist allgemein genug geschrieben, um auf andere Big Data-Projekttypen übertragen werden zu können. Insbesondere identifiziert der McKinsey-Ansatz Rollen statt Job-Bezeichnungen. Daraus lassen sich dann direkt die notwendige Expertise und die Job-Beschreibung ableiten. Es geht um die fünf folgenden Rollen (Ich habe die amerikanischen Bezeichnungen stehen gelassen):

Die Rollen der Data Explorers und Campaign Experts benötigen Expertisen wie Cognitive Scientists und Behavioral Economists. Solche Expertise ist notwendig, um zu identifizieren, welche Daten für das Projekt wichtig sind und welche nicht. Sie ist auch von großer Hilfe in der Interpretation von Ergebnissen und entsprechenden Umsetzungen. Daher ist McKinseys Rollenmodell so wichtig. Wenn man Aufgaben und Rollen verstanden hat, weiß man, welche Experten man im Projekt braucht.

Die Rollen von Data Scientists

Auf die Data Scientists wollen wir noch genauer eingehen. Das sind Mitarbeiter, die eher in der Business Intelligence angesiedelt sind, mit folgendem weiter detaillierten Profil:

Data Scientists und Data Stewards - ein "Dream-Team"?

Wie arbeiten jetzt das Business Intelligence -Kompetenzzentrum, in dem die Data Scientists sitzen, und das Informationsmanagement-Kompetenzzentrum, in dem die Data Stewards sitzen, zusammen?

Die Schnittstelle bilden die Data Hygienists, die die Aufgaben von Data Stewards in Big Data-Initiativen übernehmen. Hier sehen wir bereits den Unterschied in der Arbeitsweise von Data Stewards. Im Unternehmen sind Data Stewards das ausführende Organ der Information Governance, die unternehmensweit in gleichem Maße für alle Unternehmensdaten Gültigkeit hat. In Big-Data-Initiativen wird die Richtigkeit und Vollständigkeit der Daten pro Projekt jedes Mal neu festgelegt. Es gibt keine durchgängige Data Governance, sondern eine Data Governance, die pro Projekt vor allem von den Data Scientists bestimmt wird.

Unternehmen experimentieren mit Big Data -
Unternehmen experimentieren mit Big Data
Etliche Unternehmen haben mittlerweile Big-Data-Initiativen gestartet. Das ist ein zentrales Ergebnis der neuen „Big Data Analytics“ Studie des Analystenhauses Barc. Dabei sehen die Anwender bereits durchaus den Nutzen, sie sind aber nach wie vor auf der Suche nach konkreten Einsatzszenarien und dem nötigen Knowhow.
Existiert in Ihrem Unternehmen eine Big-Data-Initiative?
n=341
Welche Herausforderungen möchten Sie mit Ihrer/n Big-Data-Initiative(n) adressieren?
n=257
Wer sind die wichtigsten Vordenker/Treiber in ihrem Unternehmen beim Thema Big Data?
n=255
Erwarteter Nutzen 2012 und tatsächlich realisierter analytischer Nutzen 2013
n=167 bzw. n=40
Welche Probleme sehen Sie beim Einsatz von Big-Data-Technologien/-Analysen? 2012 vs. 2013
n=206 bzw. n=322
Wählen Sie bitte alle Technologiearten, die in Ihrem Unternehmen für Big Data genutzt werden bzw. in Zukunft genutzt werden sollen.
n=229

Das kann auch bedeuten, dass manche Big-Data-Projekte komplett ohne Governance ablaufen. Data Scientists argumentieren hier, dass eine Bereinigung der Daten aus den verschiedenen Big-Data-Quellen die analytischen Ergebnisse beeinflussen könnte, weil dann die Daten durch Annahmen der Data Stewards zur Datenqualität verfälscht werden könnten. Auch könnten gerade in Ausreißern wichtige Information stecken, die man im Rahmen von Data Discovery unbedingt bräuchte. Dahinter steht auch der gute Gedanke, dass in Big Data-Projekten die Daten dem Zweck des Projektes zu dienen haben, während im Unternehmen die Daten der langfristig angelegten Unternehmens-Strategie zu dienen haben.

Fazit

Die Aufgabe von Data Stewards ist das Informationsmanagement der Unternehmensdaten und/oder Daten aus Fachabteilungen unter den Rahmenbedingungen der Information Governance - mit der Zielsetzung, den Fachabteilungen qualitativ hochstehende Daten, die leicht zugänglich sind, in der notwendigen Konsistenz zur Verfügung zu stellen. Sie sind auch dafür verantwortlich, die Information Governance kontinuierlich an der Unternehmensstrategie auszurichten. Data Scientists haben die Aufgabe, Big Data in "Big Value" zu wandeln. Sie sind verantwortlich für die Methodologie von Big-Data-Analytik sowie die Kommunikation von analytischen Resultaten gegenüber dem Vorstand und dem gesamten Unternehmen.

Data Stewards haben auch in Big-Data-Initiativen ihre Rolle, nämlich die der Data Hygienists, die sich aber jeweils an den Projektzielen und nicht an der Unternehmensstrategie ausrichtet. Sie spielen in der Big-Data-Analytik die Rolle eines SWAT-Teams, also eines taktisch agierenden Spezialteams, und nicht die strategische Rolle wie im Unternehmen. Insofern sind sie wieder ein Dienstleister, der aber bei Big-Data-Initiativen von den Data Scientists gerufen wird, aber nicht selbständig agiert.