Der Weg zu vertrauenswürdigen Daten
Wenn sich Stakeholder bei wichtigen Entscheidungen nicht auf die Daten verlassen können, was bringt es dann, sie zu erfassen, zu speichern und zu sichern?
Mitwirkende: Eduardo Coccaro, Jared Jacobson
Daten sind wie ein Motor. Sie können die Effizienz von Anwendungen steigern, Kundenerkenntnisse liefern, Geschäftsentscheidungen vorantreiben und Produktinnovationen beschleunigen. Wenn Daten richtig verwaltet werden, bilden sie die Grundlage für eine erfolgreiche Automatisierung, maschinelles Lernen und künstliche Intelligenz (KI). Acht von zehn befragten Führungskräften glauben, dass sie mit ihren Wettbewerbern in Konkurrenz darum stehen, Wert aus Daten zu extrahieren. Als Chief Data Officer (CDO) bin ich einer von ihnen.
Obwohl Daten ein immenses Potenzial haben können, können sie auch zu einem enormen Problem werden. Unstrukturierte, isolierte und schlecht verwaltete Datenspeicher ohne einheitliche Strategie sind nicht nur wertlos, sondern gefährlich. Der schlechteste Nebeneffekt von fehlerhaften Daten ist wohl der Vertrauensfaktor – beziehungsweise dessen Fehlen. Wenn sich meine Stakeholder bei wichtigen Entscheidungen nicht auf die Daten verlassen können, was bringt es dann, sie zu erfassen, zu speichern und zu sichern?
Die Auswirkungen fehlerhafter Daten
Fehlerhafte Daten können zu schlechten Entscheidungen, kostspieligen Fehlkalkulationen und negativen Auswirkungen auf alle datengesteuerten Projekte führen. Ein Drittel der IT-Experten hält eine schlechte Datenqualität für den Hauptgrund dafür, dass viele Projekte, die mit KI und maschinellem Lernen zu tun haben, länger als geplant dauern, mehr als erwartet kosten und keine nützlichen Ergebnisse liefern.
Wenn Unternehmen anfangen, interne Daten zu nutzen, stellen viele von ihnen fest, dass ihre Daten nicht so sauber oder zuverlässig sind wie erhofft. Wenn der Fokus nur darauf liegt, bestehende Daten zu nutzen, wird die zuvor erforderliche Arbeit des Erfassens und Verwaltens sauberer Daten übersprungen. In der Vergangenheit haben sich Unternehmen ganz auf das Erfassen von Daten konzentriert und darauf gehofft, dass sich dies bei der Analyse auszahlt. Doch ein schlechter Input generiert einen ebenso schlechten Output, sodass die Qualität der erzeugten Erkenntnisse enttäuschend ist, wenn qualitativ minderwertige Daten analysiert werden.
Gartner berichtet, dass durch fehlerhafte Daten etwa 15 Millionen Dollar verschwendet werden. Dies schließt die Ressourcen – Server, Anwendungen und Expertise – ein, die für die Verwaltung von Daten, die nicht einmal verwertbar sind, verwendet werden. Auch wenn ich mehrere TB an Daten zur Hand habe, bedeutet das nicht unbedingt, dass das die richtigen Daten sind, um daraus die richtigen Erkenntnisse für mein Unternehmen zu gewinnen.
Hinzu kommt noch die Fülle neuer Datenquellen, Datentypen und Risiken. Die Mehrheit der Datenpunkte, die heute auf Servern gespeichert sind, wurde innerhalb der letzten fünf Jahre erstellt, da der Zugriff auf Daten aus Social Media, Verbraucherinformationen, mobilen Endgeräten und IoT-Sensoren ständig wächst. Es stehen nicht nur mehr Daten zur Verfügung, sondern sie werden dank 5G und hochmoderner Rechentechnologie auch schneller erfasst. Das Speichern und Sichern dieser riesigen Datenmenge, von der nur ein Prozentsatz tatsächlich wertvoll ist, kann viel Geld kosten und bringt Sie bei der falschen Handhabung gleichzeitig ins Visier von Compliance-Aufsichtsbehörden oder lässt Sie zum Opfer versierter Hacker werden.
Was sind vertrauenswürdige Daten?
Aus all den oben genannten Gründen hat meine Stelle als Chief Data Officer in der Branche Verbreitung gefunden. Eine Führungskraft zuzuweisen, die alle Daten eines Unternehmens verwaltet und für diese verantwortlich ist, ist entscheidend, um genaue, vertrauenswürdige Daten zu erstellen.
Die meisten Unternehmen wissen nicht, wo sie beim Sichten der angesammelten Daten beginnen sollen. Häufig besteht die Herausforderung darin, wichtige Daten zu identifizieren und zu bereinigen und das Vertrauen der Stakeholder in diese Daten aufzubauen. Mein Ziel als CDO besteht darin, sicherzustellen, dass alle Daten meines Unternehmens die folgenden Kriterien erfüllen:
- Daten müssen sicher sein
- Daten müssen definiert sein
- Daten müssen Qualitätsstandards erfüllen
Die Definitionen für jedes Kriterium unterscheiden sich je nach Unternehmen. Ich verwende diese allgemeinen Definitionen, um diese Ziele zu erreichen:
Sicherheit
Sichere Daten werden durch Verschlüsselung und andere Sicherheitsmaßnahmen geschützt. Darüber hinaus sollten Datenschutz-, Compliance- und andere branchenspezifische Vorschriften eingehalten werden.
Definition
Obwohl es schwierig ist, gemeinsame, unternehmensweite Standarddefinitionen für Datenpunkte zu erstellen, ist dies ein Schlüsselelement für die Vertrauensbildung. Gleichen Sie Ihre Terminologie intern so an, dass Einigkeit darüber besteht, welche Kennzahlen erfasst werden sollen und wie diese definiert sind. Sie können mehrere Definitionen für denselben Typ oder dieselbe Quelle für eine Kennzahl haben, müssen diese aber unterschiedlich definieren, um Klarheit zu gewährleisten.
Qualität
Das variabelste Element bei vertrauenswürdigen Daten ist die Qualität. Ein Einzelhändler kann mit einer Genauigkeit von 95 % bei der Kundenfrequenz zufrieden sein, während ein medizinisches Zentrum möglicherweise eine Genauigkeit von 100 % verlangt. Wenn ich mich mit Stakeholdern zusammensetze, lege ich großen Wert darauf, das benötigte Maß an Datenqualität festzulegen und gleichzeitig in Aussicht zu stellen, was dafür notwendig ist.
Ansprache Ihrer Stakeholder
Vertrauen ist ein Element von Prozessen, wird aber auch von den Stakeholder-Zielgruppen vorangetrieben, die es nutzen. Es gibt drei wesentliche Stakeholder-Zielgruppen:
Superuser
Eine der neuesten, aber wirkungsvollsten Zielgruppen ist die der Superuser. Diese Datenverfechter sind von Natur aus analytisch und möchten sich mit Daten auseinandersetzen, um Veränderungen voranzutreiben. Superuser von Daten möchten relativ eigenständig sein und einen kognitiven Ansatz zur Problemlösung verfolgen können. Statt auf einen Bericht zu warten, erwarten sie einfachen Zugriff auf Dashboards und Tools zur Datenvisualisierung.
Diese neuen Superuser stellen zwar einen kleinen Teil der Nutzer dar, finden sich aber nicht mehr nur in der C-Suite. Im gesamten Unternehmen, von Bereichen mit Kundenkontakt bis hin zur Vorstandsetage, verlassen sich immer mehr Teams auf Daten, um Entscheidungen zu treffen. Diese Superuser helfen Ihnen dabei, die Implementierung im Unternehmen voranzutreiben. Ihre Datenstrategie muss mit diesen Datenanwendern, deren Art der Verwendung von Daten sowie etwaigen Schwachstellen Schritt halten.
Dateneigentümer
Diese Gruppe besitzt die Daten, die analysiert werden. Stellen Sie sicher, dass die Dateneigentümer und ihre Systeme keine fehlerhaften Daten weitergeben. Um saubere Daten im Front-End sicherzustellen, sollten Sie diese bei der Entwicklung von Prozessen und Erfassungsmethoden unterstützen, die auf den Best Practices beruhen.
Halten Sie regelmäßige Meetings ab, um mit Dateneigentümern über Probleme und Schwachstellen zu sprechen. Der soziale Druck, der durch diese Interaktionen erzeugt wird, verpflichtet Eigentümer zu mehr Aufmerksamkeit und liefert ihnen ein besseres Verständnis dafür, wie sich ihre Handlungen auf den gesamten Daten-Lebenszyklus auswirken. Ihre Datenverwaltungsstruktur sollte dedizierte Ressourcen enthalten, die Erfassung, Qualität, Reporting und Governance als einzelne, aber miteinander verknüpfte Funktionen verwalten.
Geschäftliche Anwender
Die Unternehmensleitung muss jeden Plan zur Datentransformation vorantreiben, von der Priorisierung bis hin zum Budget. Die Bedürfnisse und Frustrationen von Führungskräften und Managern im Unternehmen werden jedoch auch Ihre Aufgabenliste bestimmen. Die Zusammenstellung eines vollständigen Data-Governance-Gremiums bringt alle Perspektiven in den Prozess ein. Dabei ist es wünschenswert, eine vielseitige Gruppe aus Mitarbeitern zusammenzustellen, die die technischen Aspekte des Unternehmens repräsentiert und gleichzeitig Unternehmensfürsprecher mit einem Auge fürs Detail und einem Verständnis für Unternehmensanforderungen umfasst.
Versuchen Sie, eine Feedbackschleife zu schaffen, bei der Sie relevante technische Informationen verbreiten und Ihre Benutzer Ihnen wertvolle Erkenntnisse aus dem Unternehmen liefern. Innerhalb dieser Gruppe können Sie Veränderungsprozesse und grundlegende Kontrollen festlegen und ermitteln, welche Programme die Bedürfnisse Ihres Unternehmens optimal unterstützen. Schließen Sie Superuser in diese Gruppe ein, die die Implementierung vorantreiben, Vertrauen fördern und einen Welleneffekt bei der Befolgung der Best Practices erzeugen können.
Die sich verändernde Datenlandschaft
Wir sehen uns einer sich verändernden Datenlandschaft mit neuen Benutzern gegenübergestellt. Als Datenexperten ist es unsere Mission, zuverlässige Daten bereitzustellen und Vertrauen in diese Daten zu schaffen. Auch wenn wir wissen, dass unsere Daten sicher, definiert und von hoher Qualität sind, müssen wir das auch beweisen können.
Mir gefällt die Idee eines ISO-ähnlichen Siegels, das visuell anzeigt, dass Daten überprüft wurden und vertrauenswürdig sind. In Kombination mit einer strengen Versionierung kann dieses Siegel Benutzern helfen, sofort zu identifizieren, welche Daten makellos sind und welche möglicherweise nicht aktuell oder nicht sicher sind. Wenn Sie ein Siegel für Vertrauenswürdigkeit anstreben, benötigen Sie natürlich verlässliche Datenwörterbücher und Metadaten-Kataloge, damit alle dieselbe Sprache sprechen.
Audit-Trails und Berechtigungen, auf die normalerweise aus der Compliance- und Sicherheitsperspektive hingewiesen wird, sind eine weitere Möglichkeit, Vertrauen zu schaffen. Das Wissen, dass die Daten nur von autorisiertem Personal bearbeitet werden, erhöht das Vertrauen in ihre Genauigkeit. Auch wenn manche dies als Zugriffsbeschränkung sehen, können Informationen mit den richtigen Kontrollmechanismen besser demokratisiert werden, ohne sie zu gefährden.
Über all diese Aktivitäten spannt sich der Bogen der Bildung. Datenkompetenz verbindet alle Aspekte miteinander, damit Benutzer ein grundlegendes Verständnis dafür haben, warum Daten so entscheidend sind und wie sie richtig verwendet werden. Wenn Benutzer verstehen, dass bestimmte Rechtschreib- und Formatierungsregeln bei der Eingabe von Kundendaten entscheidend dafür sind, diese Daten in andere Systeme einzupflegen, ermöglicht ihnen das, zur Lösung der Probleme beizutragen.
Ziel: vertrauenswürdige Daten
Woher weiß ich, dass meine Daten vertrauenswürdig sind? Ich sehe, dass sie verwendet werden. Sie werden für die Entscheidungsfindung genutzt und regen Fragen und Diskussionen im Unternehmen an. Ich kann die Nutzung des Dashboards und das Ergebnis besserer Entscheidungen anhand valider Daten messen. Die Vorlaufkosten – Ressourcen, Zeitpläne und Budget – werden für etablierte Unternehmen höher als für in der Cloud geborene Unternehmen sein, aber die Prinzipien sind dieselben. Und genau wie bei guten Daten führt der Aufwand, den Sie in die Abstimmung von Mitarbeitern, Prozessen und Zielen im Front-End investieren, zu einer starken Datengrundlage, die Ihren zukünftigen Erfolg unabhängig von der Branche, der Unternehmensgröße oder den Umsätzen unterstützen kann.
Wo sollten Sie beginnen?
Ähnlich wie bei jedem Transformationsprojekt ist Datenhygiene kein einmaliges Projekt. Sie ist ein fortlaufendes Projekt und die Unterstützung durch Führungskräfte und eine langfristige Vision sind entscheidende Elemente. Sie erfordert ein Framework für das Änderungsmanagement, das sich an eine sich ständig verändernde Datenlandschaft anpassen kann.
Wenn sich Bedürfnisse oder Richtlinien ändern, wirkt sich dies wie ein „Wasserfall“-Effekt auf die im Code integrierte Logik aus. Sie benötigen ein Team, das die gesamte Datenkette durchdenken kann – was ihre Quellen sind und was sie speist –, um die Datenqualität aufrechtzuerhalten. Außerdem muss die Geschäftsleitung den vom Unternehmen angestrebten Weg und die Rolle der Daten auf diesem Weg klar kommunizieren. Und schließlich muss die Geschäftsleitung die Verwaltung der Datenkette zur Priorität machen.
Wo soll man also beginnen? Fangen Sie klein an. Werden Sie das Gefühl der Überforderung los, das mit einem Datentransformationsprojekt einhergehen kann, indem Sie mit etwas Kleinem und Bedeutsamem beginnen. Konzentrieren Sie sich zuerst auf die Daten, die für den Geschäftsbetrieb notwendig sind (Verkäufe, Abwanderung, Auslieferung), und anschließend auf Daten, die Effizienz ermöglichen (Kundenerlebnis, Verbesserung der Geschäftsprozesse, Optimierung der Supply Chain).
Ich betrachte Daten als Produkt, nicht als Service. Infolgedessen gehen wir das Design, die Produktion und die Verbreitung in einem Produktbereitstellungs-Framework an, bei dem Elemente der Qualitätskontrolle, Monitoring und Reaktion feste Bestandteile sind. Erringen Sie den ersten Datensieg, bringen Sie die Menschen dazu, die Daten zu verstehen, zu verwenden und ihnen zu vertrauen, und nehmen Sie sich dann andere Bereiche oder größere Plattformen vor. Wenn Sie neue Programme einführen, können Sie auf dieses Vertrauen setzen.
Sind Ihre Kundendaten bereit für KI?
About the Authors
Chief Information Officer
Juan Riojas
As Chief Information Officer at Rackspace Technology, Juan Riojas is responsible for enterprise-wide data strategy, management, and analytics to meet the need of the business to answer critical questions through time to insight. He has more than 20 years of industry experience successfully migrating data ecosystem across all public clouds, leading to significant business transformation outcomes. Prior to Rackspace, Juan worked for Informatica building their inaugural Data Office and has held various executive leadership roles at Gogo, Dell, Accenture, and Expeditors. A native of Texas, Juan attended Texas A&M International University, where he studied business administration and holds a post graduate degree from Said Business School, Oxford University
Read more about Juan Riojas