Blogbeitrag von
Christopher Seidel, Cassini Consulting, Spezialist für Business Intelligence
Christopher Seidel
Management Consultant. Spezialist für Business Intelligence.
Datenstrategie implementieren
Ein Leitfaden zur Datenstrategie-Entwicklung

Datenstrategie aber richtig – ein Leitfaden zur erfolgreichen Implementierung

Möglichst schnell einen Sprung zum datengetriebenen Unternehmen schaffen. Möglichst schnell digitalisieren. Möglichst schnell datenbasierte Entscheidungen treffen können und Prozesse optimieren. Diese Ziele setzen sich viele unserer Kunden. Doch wie gelingt ein solcher „Sprung“, oder handelt es sich vielmehr um eine konsequente und genau zu planende Gipfelstürmung? Bedarf es dabei besonderer Herangehensweisen?

In diesem Artikel beleuchten und erklären wir ein von Cassini entworfenes und erprobtes Phasenmodell zur Entwicklung einer Datenstrategie-Basis, die für das Erreichen weiterführender Ziele notwendig ist.  

Die Phasen zur Datenstrategie-Entwicklung in der Übersicht

Phase 1: Status Quo – alle Fakten auf den Tisch

Zunächst ist es wichtig, sich einen Überblick über die Datennutzung und dazugehörige Prozesse und Kompetenzen innerhalb des Unternehmens zu verschaffen. Dazu wird ein mehrgleisiger Ansatz genutzt: Um die vorhandenen Kompetenzen und Werkzeuge zu eruieren, ist es wichtig, die Datenmaturität zu erfassen und zu bewerten. Cassini hat hierzu ein Werkzeug entwickelt, welches mehr als 300 Erkenntnisinteressen umfasst. Diese zeigen sowohl die individuellen Kompetenzen der Befragten als auch die bestehenden Verantwortlichkeiten und Prozesse auf. Auch die Verfügbarkeit und Zugänglichkeit bestehender Technologien und vorhandene Datenarchitekturen werden eruiert. Ein besonderer Schwerpunkt liegt hier auch in der Erfassung der Datensicherheit und Einhaltung von Datenschutzstandards sowie der individuellen Kompetenzen in Bezug auf diese.

Die Erfassung der Datenmaturität erfolgt auf Basis von Stakeholder-Interviews, die in Gruppen oder auch einzeln stattfinden.

Phase 1 Datenstrategie-Entwicklung

Die Informationen aus den Interviews werden mit Systemarchäologie ergänzt, also Analysen unternehmensinterner Dokumente, Datensätze und eingesetzter Systeme. Implizites Wissen der Stakeholder über Prozesse, Daten und Systeme wird durch Shadowing, eine Beobachtungstechnik, bei der die Stakeholder während eines Abschnittes ihrer alltäglichen Arbeit begleitet werden, sichtbar gemacht.

Darüber hinaus werden systematisch alle Use Cases erfasst, die im laufenden Betrieb auftreten. Dies kann mit den Stakeholder-Interviews der Datenmaturitätserfassung gekoppelt werden. Hierdurch entstehen Synergie-Effekte, die bei separater Bestandsaufnahme von Datenmaturität und Use Cases nicht zum Tragen kommen würden. Durch die gekoppelte Erfassung werden Kompetenzen von Stakeholdern gleichzeitig mit ihren Use Cases und ihren Schmerzpunkten bei der täglichen Arbeit aufgenommen. Hierdurch kann identifiziert werden, ob Schmerzpunkte eher Nutzerfehlern oder mangelnden Systemfunktionen entspringen. Dadurch werden zusätzlich zu den funktionalen Anforderungen an das Datensystem auch qualitative Anforderungen ersichtlich. Ebenso werden Weiterbildungsschritte erkannt, die nötig sind, um alle Stakeholder auf eine Kompetenzebene zu bringen.

Einer der ausschlaggebenden Faktoren für den Erfolg dieser Phase liegt in der Auswahl der Stakeholder, die an den Interviews teilnehmen. Um einen repräsentativen Querschnitt durch das gesamte Unternehmen zu erlangen, müssen Stakeholder aus allen Abteilungen vertreten sein, ebenso wie Nutzer des zu entwickelnden Systems. Auch die Personengruppen, die Daten sowohl fachlich als auch technisch bereitstellen, sind zu integrieren.

Nachdem diese Schritte durchlaufen sind, ist eine erste Entscheidungsgrundlage entstanden. Diese basiert auf den Protokollen aller Interviews, einer quantitativen Analyse der Ergebnisse der Datenmaturitätserfassung, der Ist-Analyse und der Anforderungsanalyse. Zudem wird für einen guten Anwendungsüberblick ein Portfolio aller Use Cases erstellt. 

Phase 2 – Quo vadis – Definition des Soll-Zustands

Basierend auf der Ist-Erhebung aus Phase 1 wird der Soll-Zustand in drei Unterphasen gegliedert:

  1. Phase 2a - Prozessuale und organisatorische Fragestellungen werden pragmatisch von strategisch bis operativ zu sinnvollen Maßnahmen abgeleitet.
  2. Phase 2b - Aufgenommene Use Cases werden in einem Portfoliomanagement priorisiert und in einer in einer Roadmap für einzelne Umsetzungsprojekte vorgeschlagen.
  3. Phase 2c - Datenbezogene und technische Fragestellungen werden anhand der tatsächlichen Analysebedarfe beantwortet und in einer modernen, zukunftsweisenden IT-Architektur festgehalten. 

Phase 2a – Prozessuale und organisatorische Fragestellungen

In der folgenden Phase wird auf Basis der in Phase 1 erhobenen Erkenntnissen ein sinnvoller Zielreifegrad der organisationalen Datennutzung, in Abstimmung mit den Stakeholdern, festgelegt. Die Grundlage einer Datenstrategie schafft den Rahmen für die Entwicklung einer Organisation entlang dieser Reifegrade und berücksichtigt dabei sowohl die Ausgangslage als auch eine pragmatische Zielsetzung. Dabei wird das komplexe Ökosystem organisationaler Einflussfaktoren berücksichtigt, welches aus kulturellen, technologischen, organisatorischen und menschlichen Komponenten besteht. Bei der Einordnung des Reifegrads unterstützt das Datenstrategie-Framework, das wir bereits in der Vergangenheit erfolgreich bei verschiedenen Klienten einsetzen konnten.

Phase 2 Datenstrategie-Entwicklung

Das Vorgehen zur Entwicklung einer Datenstrategie geht auf folgende Themen ein:

  1. Vision
    Welche Vision verfolgen wir im Bereich Datennutzung 2025 und 2030?
    Resultat: Es ist eine mittel- und langfristige Datenvision als Orientierung für die Datenstrategie erarbeitet.
  2. Perspektivische Zielbilder
    Welche übergeordneten Businessziele wollen wir durch die Umsetzung der Vision erreichen?
    Resultat: Es sind hinreichend konkrete Business Ziele formuliert, auf die Datennutzung einzahlen soll (z. B. Automatisierungsgrad erhöhen).
  3. Datenkultur und Selbstverständnis
    Welche Art von Datenkultur zahlt auf unsere Zielbilder ein? Wie soll das organisationale Selbstverständnis sein?
    Resultat: Data Culture Canvas und Zielbilder zum Selbstverständnis.
  4. Rollen, Governance & Sicherheit
    Welche Rollen und Prozesse müssen in der Organisation kurz-, mittel- und langfristig verankert werden? Welche Sicherheitsaspekte müssen wie bedient werden?
    Resultat: Implementierbare Rollenmodelle im Rahmen einer Data Governance, sowie Key Security Anforderungen an die Datennutzung und Zugriffe.
  5. Strategische Datenbestand und Datennutzungszielbild
    Welche Daten werden als strategisch relevant definiert und wie sieht das zukünftige Zielbild der Datennutzung aus? Resultat: Strategische Daten sind definiert und ein übergeordnetes Nutzungszielbild existiert (z. B. ab wann Datennutzung sinnvoll ist).
  6. Guiding Principles
    Welche Grundprinzipien (Leitplanken) zum Umgang mit Daten lassen sich aus Vision, Zielbildern und Datenkultur ableiten und sind sinnvoll?
    Resultat: Es sind transparente und organisationsnahe Guiding Principles formuliert.

Die Datenstrategie setzt abstrakte Leitplanken für weiterführende Themen wie Datenkultur, Datenkompetenz, also der Aufbau benötigter Fähigkeiten sowie prozessuale und organisatorische Fragestellungen für das Datenmanagement. Hierbei wird kollaborativ festgelegt, in welchen Bereichen sich ein Investment zur Erreichung nächster Reifegrade pragmatisch lohnt und wie dies spürbar geschäftlich wirksam wird. Ein kollektives Verständnis eines Datennutzungszielbildes wird dabei maßgeblich geprägt, um herauszufinden, wie detailliert die Strategie in Zukunft in den jeweiligen Teildisziplinen operationalisiert werden soll.

Datenstrategie Übersicht

Je nach Rahmenbedingung wird empfohlen, zumindest die Teilbereiche Data Management und Data Literacy detailliert zu betrachten. Über die beiden Themen wird auf etliche Mehrwerte eingezahlt:

  • eine interdisziplinäre Kommunikationsbasis über Daten
  • effizienter Dateneinsatz durch Nutzung von Synergieeffekten
  • Überwinden von Daten-Silos und Insellösungen
  • Erhöhung der Datenqualität
  • Transparenz über fachlichen Inhalt und Herkunft von Daten
  • Sicherstellen von Compliance (z. B. Daten-Sicherheit und DSGVO)
  • Klarheit über Datenhoheit und zentrale Verantwortliche schaffen
  • Erkennen neuer Möglichkeiten und Potenziale datengestützter Entscheidungsfindung

Data Management & Governance
Um Daten einer Organisation zu beherrschen ist oft eine bereichsübergreifende Struktur notwendig. Im Fokus stehen die Erzeugung von Transparenz über die Daten der Organisation, die Verfügbarkeit von Tools zum erfolgreichen Verantworten von Daten sowie die Schaffung von Rollen und Gremienstrukturen, Zielen und ein Netzwerk der „Data Player“. Wir empfehlen Elemente aus etablierten Frameworks, wie DAMA DMBOK, TOGAF und ISO/IEC 38500 zu abstrahieren und zu benutzen.

Data Literacy
Bei Data Literacy, oder auch Datenkompetenz, geht es um die Fähigkeit des einzelnen Mitarbeitenden, kompetent und souverän mit Daten umzugehen, sie mit passenden Werkzeugen zu verarbeiten und im Kontext adäquat einsetzen und bewerten zu können. Data Literacy ist ein oft vernachlässigter, aber unabdingbarer Baustein einer datengetriebenen Organisation. Nur wenn der alltägliche Umgang mit Daten zur Selbstverständlichkeit wird und sich eine Datenkultur in der Organisation herausbildet, können aus Daten nachhaltig Werte entstehen. Im Projekt sollte geprüft werden, wie hoch Notwendigkeit und Bereitschaft zur Schulung sind.

Nach dieser Teilphase sind Bereiche definiert und bewertet die für das Unternehmen relevant sind und somit in den weiteren Phasen für die Entscheidungsfindung genutzt werden kann.

Phase 2b – Priorisierung der aufgenommenen Use Cases und Definition von Umsetzungsprojekten

Um die spätere Implementierung eines PoC möglichst nachhaltig zu gestalten, werden in dieser Phase die Use Cases aus Phase 1  bewertet und analysiert. Für eine systematische Auswahl des umzusetzenden Use Case wird mithilfe einer Priorisierungsmatrix das gesamte Portfolio in einer Aufwands-Nutzen-Analyse bewertet und abgewogen. Hierfür werden in Stakeholder-Workshops Kriterien festgelegt, anhand derer die Priorität eines Use Cases zu bestimmen ist. Diese können z. B. die Häufigkeit, mit der ein Use Case durchgeführt wird, die Kritikalität eines Use Cases und die Kosten, die mit einem Use Case verbunden sind, sein. Auch die Implementierungsgeschwindigkeit der Use Cases und der Aufwand, der mit der Implementierung einhergeht, müssen beachtet werden. Darüber hinaus können weitere Kriterien miteinbezogen werden. Für die jeweiligen Kriterien werden auch die Bewertungsschritte bestimmt, die für die Priorisierung anzuwenden sind. Dies kann z. B. für die Häufigkeit des Use Cases ein Prioritätsraum von „täglich“ – „wöchentlich“ – „monatlich“ – „jährlich“ sein, oder auch die Anzahl an Durchführungen pro Tag. Hierbei ist die Einbeziehung aller Stakeholder wichtig, um einen gemeinsamen Rahmen für die anschließende Priorisierung zu erstellen.

Nach der gemeinsamen Festlegung der Kriterien und deren Ausprägungen im Prioritätsraum wird die Matrix für alle Use Cases ausgefüllt. Danach werden die Use Cases mit der höchsten Priorität identifiziert, im Workshop validiert und abgestimmt. Für die Implementierung eines PoC sollte der Use Case gewählt werden, der einerseits einen großen Nutzen für das jeweilige Unternehmen bzw. Organisation hat und andererseits nicht zu aufwendig in der Implementierung ist. Dies gewährleistet einen direkten Gewinn für den Kunden durch den PoC, ohne dabei den Rahmen des ersten Projektes zu sprengen. Durch die Priorisierung des gesamten Use Case-Portfolios kann außerdem die weitergehende Entwicklung und Implementierung der Datenstrategie so geplant werden, dass der Nutzen direkt maximiert wird.

Als ein „messbares“ Ergebnis dieser Teilphase wird eine schriftliche Dokumentation der Kriterien, ihrer Ausprägungen im Prioritätenraum sowie die vollständige Priorisierungsmatrix vorliegen.

2c - Festlegung der Architektur, Standards und Guidelines

Das Ziel jeder Datenarchitektur ist es, der Infrastruktur des Unternehmens zu zeigen, wie Daten erfasst, transportiert, gespeichert, abgefragt und gesichert werden. Ausgangsbasis für die Definition der Datenarchitektur und die damit verbundenen Standards sowie Zuständigkeiten bilden, die im Vorfeld definierten, strategisch-organisatorischen Ziele, zusammen mit den ausgewählten Use Cases.

Architektur

Basierend auf den jeweils geplanten Anwendungen sowie den dahinterliegenden Prozessen werden passende grundlegende Architekturen vorgeschlagen, die auch miteinander kombiniert werden können. Darüber hinaus werden weitere Rahmenparameter aus der Strategie und Vision in den Entscheidungsprozess für eine Datenarchitektur einbezogen. Dabei kann im Bedarfsfall eine unterschiedliche Gewichtung vorgenommen werden, um z. B. organisatorischen Zielen eine größere Bedeutung beizumessen.

Im Anschluss an die grundlegende Architekturentscheidung (z. B. Lambda, Kappa oder Echtzeitverarbeitung) wird auf Basis der organisatorischen und technischen Rahmenbedingungen die konkrete Architektur definiert. Die konkrete Architektur setzt die grundlegende Architektur um und beinhaltet Systeme und Services, um dies zu erreichen. Hierbei werden weitere, detailliertere Ziele herangezogen, denn diese spielen bei der Auswahl der Systemlandschaft eine entscheidene Rolle, z. B. die Nutzung von Open-Source-Technologien, Wartbarkeit, Wirtschaftlichkeit, Datensicherheit und die Kompatibiltät mit den ggf. bereits vorhandenen In-house Systemen und der eigenen u. U. teilweise zu erhaltenden Landschaft.

In der folgenden Abbildung sind mögliche logische Komponenten einer Datenverarbeitungsarchitektur und deren Zusammenhang abgebildet.

Komponenten einer Datenverarbeitungsarchitektur

In dieser Phase wurden für die Datenstrategie Leitplanken gesetzt, die auf unterschiedliche Bereiche der Prozesse und der Organisation eingehen, z. B. Vision, Datenkultur und Datensicherheit. Dadurch konnten die gesammelten Use Cases mithilfe von Aufwands-Nutzen-Analysen bewertet werden. Auf Basis der Use Cases in der Priorisierungsmatrix und der Leitplanken wurde die dafür passende Architektur sowie Standards und Guidelines ausgewählt und definiert. Diese Ergebnisse bilden die Grundlage, die zur weiteren Umsetzung und Implementierung notwendig sind.  

Phase 3 – Erstellung eines Zeit-Maßnahmenplans (Roadmap) zur Umsetzung

Das Ziel dieser Phase ist die Entwicklung einer Roadmap zur Umsetzung der Datenstrategie. Zunächst müssen die Komponenten der Datenstrategie in einen gemeinsamen zeitlichen Rahmen integriert werden. Dies kann z. B. durch einen Workshop mit relevanten Stakeholdern erfolgen. In dieser Diskussion sind die Dauer der Implementierung der Datenarchitektur, organisatorische Komponenten und die Umsetzung der Use Cases zu berücksichtigen. Erfahrungsgemäß sind zuerst die organisatorischen Komponenten zu klären, bevor weitere Schritte erfolgen können. 

Ein weiteres Element in diesem Schritt ist die Auswahl des ersten zu implementierenden Use Cases, der den maximalen Ertrag hinsichtlich des Zielbilds erbringt. Dessen Auswahl beeinflusst ebenfalls die Entwicklung der Roadmap. 

Zusätzlich wird eine Gesamtkostenübersicht der Entwicklung und des Betriebs des PoC und dessen weitere Skalierung erstellt. Eine Möglichkeit der Kostenerfassung ist das ‚Total Cost of Ownership‘ Prinzip, das die direkten und indirekten Kosten erfasst. Erstere beinhalten z. B. mögliche weitere Anschaffungskosten für Soft- oder Hardware oder administrative Kosten, wohingegen letztere z. B. Kosten zum Applikation Development oder Downtimekosten des Systems umfassen. 

Als Ergebnis produziert dieser Schritt eine schriftliche Dokumentation der Roadmap mit all ihren Komponenten. Diese Roadmap stellt die Basis für zukünftige Projekte dar und soll Impulse für weitere Projektvorhaben liefern. Um den Projektfokus nicht zu verlieren, empfiehlt es sich den Fokus zunächst auf den PoC Use Case zu legen und somit einen MVP für das Unternehmen zu schaffen. Die Operationalisierung der weiteren Roadmap wird dann nach erfolgreicher Einführung durchgeführt.

Phase 4 – Umsetzung des Use Cases (PoCs)

In dieser Phase erfolgt die Implementierung des in den vorhergehenden Schritten definierten Use Cases und des allgemeinen Zielbildes. Die Projektdurchführung erfolgt z. B. nach Scrum, V-Modell oder der Wasserfall-Methode. Auf Basis des ausgewählten Use Cases wird das bisherige allgemeine Zielbild speziell für den PoC detailliert konzeptionell ausgearbeitet, so dass eine finale Zieldefinition und weiter gehende Skalierung des PoC entsteht. Diese Zieldefinition beinhaltet alle Komponenten wie Datenarchitektur oder notwendige Datenquellen. Damit jede beteiligte Person informiert ist, empfiehlt es sich, jeden Bestandteil der Architektur zu dokumentieren. Ein wesentlicher Schritt besteht in der Identifikation der für die Umsetzung notwendigen Daten und verantwortlichen Personen.

Je nach Gesamtarchitektur unterscheidet sich die Auswahl der Software. In den meisten Fällen gibt es vier Standardschritte. Zuerst erfolgt die Datenerschließung. Hier werden diverse Datenquellen erschlossen und automatisiert angebunden. Das Ziel ist eine einheitliche Struktur der Daten. Darauf folgt die Datenprozessierung. In dieser erfolgt je nach Datentyp die Datenverarbeitung mit einer angepassten Datenverarbeitungstechnik (z. B. Streaming oder Batch). Unklarheiten (wie inkonsistente Daten) sind in diesem Schritt mit den verantwortlichen Personen zu klären. Im nächsten Schritt der Datenspeicherung werden die Gesamtdaten in einen analytischen Datenspeicher wie eine SQL-Datenbank integriert. Diese befindet sich entweder On-Premise oder in der Cloud. Der Datenspeicher stellt die Ausgangsbasis für die Berichtsdarstellung dar. Dies erfolgt im letzten Schritt, der Datenvisualisierung. Die Berichtserstellung sollte in enger Absprache mit den verantwortlichen Personen erfolgen.

Als Ergebnis liefert dieser finale Schritt einen technisch laufenden PoC und eine schriftliche Dokumentation aller Komponenten des Systems.

Zusammenfassung

Eine Datenstrategie ist für Unternehmen heutzutage unumgänglich. Dabei ist jede Datenstrategie so einzigartig wie das Unternehmen selbst. Damit die Datenstrategie auf Zielen, Werten und Daten des Unternehmens aufgebaut werden kann, bedarf es eines strukturierten Vorgehens. Das von Cassini entwickelte und erprobte Phasenmodell hilft Ihnen hierbei. Es bietet eine klare Struktur über die Phasen hinweg und stellt sicher, dass alle relevanten Faktoren einbezogen werden, die für die Definition und anschließende Umsetzung der Datenstrategie entscheidend sind. In folgender Abbildung sind nochmals alle Modellphasen und ihre Bestandteile abgebildet.

Zusammenfassung Phasen Datenstrategie-Entwicklung

Seite teilen