Avec la transformation des entreprises, la quantité de données a augmenté et les écosystèmes ne cessent d’évoluer. Ainsi, la nécessité de connecter l’ensemble de l’organisation, pour établir une structure de gouvernance des données qui permette de prendre des décisions commerciales, et de protéger les organisations, devient une priorité pour les entreprises.
Dans ce document, vous découvrirez comment une approche de gouvernance des données connectée qui favorise la collaboration entre la communauté des données et les directions métiers, ainsi que les perspectives de l'informatique et des risques, est primordiale pour générer de la valeur métier.
1. L’évolution de la gouvernance des données
1. 1 . L'importance de la gouvernance des données pour protéger l’entreprise et améliorer la performance
Dans la plupart des organisations, les deux principaux moteurs d'une initiative de gouvernance des données sont l'optimisation des performances et la conformité.
Avec la digitalisation de la plupart des activités, les données sont plus que jamais un actif clé de l'entreprise. Elles permettent de stimuler la performance et développer de nouveaux services et produits innovants grâce à des modèles d'affaires et des connaissances basés sur les données. Les organisations cherchent à capturer, analyser et utiliser les données générées tout au long du cycle de vie des clients pour comprendre davantage leurs besoins. Cela permet également d’avoir une vision claire de la manière dont l'expérience client peut être améliorée en fondant leurs décisions commerciales sur les données. Cette approche axée constitue un fort différentiateur concurrentiel pour améliorer les performances de l'entreprise.
La numérisation des activités donne également lieu à de multiples violations de données très médiatisées et à plusieurs réglementations contraignantes. Certaines sont spécifiques à un secteur (SOX, HIPPA, Bâle III, Solvabilité II, HACCP) et d'autres peuvent être spécifiques à un pays. Par conséquent, les organisations qui font partie de ce secteur ou de ce pays, devront se conformer à ces réglementations. D'autres, comme le RGPD, le CCPA et le LGPD, concerne l'interaction entre votre entreprise et ses clients pour protéger la vie privée et limiter l'utilisation des données (par exemple la réduction, la destruction ou la gestion du vieillissement des données).
La conformité réglementaire, ainsi que les exigences en matière de confidentialité et de sécurité, ont contraint les organisations à définir une gouvernance pour la protection, la sécurité et le stockage des données. Elles doivent également établir des politiques garantissant la protection des données contre les accès et utilisations non autorisés et autres menaces de cybersécurité.
Dans ce contexte, les investissements dans les initiatives liées aux données continuent de croître : 85 % des organisations américaines prévoient d'augmenter leurs dépenses dans les initiatives de gouvernance des données au cours des 12 à 18 prochains mois. (The strategic Role of Data Governance, ESG Survey, Septembre 2022). Cependant, malgré des investissements croissants, 40 % des organisations affirment que les individus au sein de l'entreprise ne font pas confiance aux informations fournies par les données*(Source : Companies lack trusted, governed data to execute on critical business initiatives, Experian, 2020).
Ce manque de confiance vis-à-vis des données a un impact négatif sur les performances de l'entreprise : la gouvernance des données n'est pas considérée comme un défi informatique mais comme un impératif pour l'ensemble de l'entreprise.
Une fois la confiance établie, les données peuvent être partagées sur un marché réglementé afin de générer une valeur commerciale supplémentaire (comme le propose la nouvelle loi European Data Governance Act - pour sécuriser et définir les règles et les rôles pour favoriser l'innovation).
1.2. Construire une approche collaborative de la gouvernance des données pour créer de la valeur
La gouvernance des données était considérée comme une pratique informatique axée principalement sur La classification de grandes quantités de données transactionnelles et la cartographie de leur structure dans les bases de données. Aujourd'hui, les entreprises de premier plan cherchent à savoir comment utiliser leurs données pour fournir des informations et des idées dans le but d'améliorer l'expérience client et de stimuler l'innovation en matière de produits et de services. Elles s'assurent également que l'utilisation des données est conforme aux réglementations applicables et qu'elle est protégée contre les accès non autorisés ou les violations de données.
En conséquence, la gouvernance des données est devenue un exercice plus collaboratif, impliquant plusieurs équipes au sein d'une organisation. Les entreprises menant une gouvernance des données créent des équipes et des processus interfonctionnels pour gérer leurs données d'entreprise. L'idée est de garantir une meilleure compréhension des données disponibles, de leur utilisation et de la manière dont elles peuvent contribuer à améliorer les performances de l'entreprise tout en renforçant la conformité.
1.3. Mise en place d’une communauté autour de la gouvernance des données
La gouvernance des données est un exercice de collaboration impliquant les directeurs des services informatiques, juridiques, de conformité et commerciaux. Elle permet de guider et de superviser l'équipe de gouvernance des données dirigée par le CDO.
Le CDO est responsable du succès de l'initiative de gouvernance des données. Il plaide en interne pour obtenir le financement et la dotation en personnel du programme, surveille les progrès et communique avec les différentes parties prenantes. Selon une enquête publiée par ESG Research, 65% des entreprises américaines déclarent avoir mis en place une équipe dédiée à la gouvernance des données et 25% partagent cette responsabilité entre les départements. Ceci montre que dans la plupart des organisations, la mise en œuvre d'initiatives de gouvernance des données est devenue la nouvelle norme.
Ces équipes en charge de données sont composées d'experts de différents domaines qui collectent, classent et nettoient les données. Ils produisent ensuite des informations et des rapports qui aident les entreprises à prendre les bonnes décisions. Cependant, il peut être difficile d'obtenir le point de vue de l'entreprise : c'est pourquoi, il est important de créer des communautés de données favorisant la collaboration entre les experts en données et les utilisateurs de l'entreprise autour d'intérêts ou de projets communs. Cette collaboration est essentielle à la création d'une culture axée sur les données.
Ces communautés de données créent un environnement immersif pour rendre efficace la collaboration autour des données et des analyses.
2. Créer de la valeur grâce à une gouvernance des données connectée
2.1. Qu'est-ce qu’une “gouvernance des données connectée” ?
La gouvernance des données connectées est conçue pour servir la stratégie, les objectifs et les cas d'utilisation de l'entreprise, tels que l'amélioration des services à la clientèle, des opérations et la prévision des besoins des clients avec des recommandations.
Relier la gouvernance des données aux processus métiers, à l'architecture d'entreprise et à la gestion des risques est essentielle pour accélérer les initiatives de gouvernance des données. Cela permet aux experts des données de comprendre la manière dont tout est connecté et interdépendant d'un point de vue métier et stratégie.
Cette vision globale de l'utilisation et de la transformation des données au sein de l'organisation s'appuie sur un référentiel commun où toutes les données sont stockées avec leurs connexions et interdépendances, ce qui permet aux différentes parties prenantes d'avoir une vue d'ensemble.
“Apprends à regarder. Tu verras que chaque chose est reliée à tout le reste.” Leonardo Da Vinci
Cette approche de gouvernance des données connectées favorise la collaboration entre la communauté des données - regroupant le Data office (CDO, Data Stewards, Data Managers, Data Custodians) et les Data Owners) et d'autres parties prenantes internes qui peuvent aider à clarifier le contexte métier. Elle permet de comprendre la manière dont les applications collectent et transforment les données et d’identifier les risques liés à leur possible utilisation abusive.
2.2. Principaux bénéfices d’un modèle de gouvernance des données connectée
Connecter la gouvernance des données à l'architecture d'entreprise, la gestion des processus métiers et à la gestion des risques et de la conformité, permet aux organisations de mieux comprendre où sont stockées les données, comment elles circulent, comment les personnes utilisent les données dans les processus et comment gérer au mieux les risques et les réglementations.
2.2.1. Relier les données aux processus d'entreprise pour comprendre l'environnement métier
L'un des principaux défis pour le Chief Data Officer et les experts en données est de comprendre l'environnement métier dans lequel les données sont utilisées. Pourquoi capturons-nous ces données, à quoi servent-elles, dans quelle mesure sont-elles essentielles à la réussite de l'entreprise ? Ce sont des questions typiques auxquelles l'équipe chargée des données tente de répondre avec l'aide des utilisateurs métiers.
En reliant la gouvernance des données aux processus métiers, les experts en données peuvent rapidement comprendre comment vont être utilisées les données et répondre à ces questions. Dans de nombreuses entreprises, si un lien clair était établi entre les deux pratiques, les processus opérationnels pourraient accélérer les initiatives de gouvernance des données en fournissant des informations sur la valeur commerciale de l'utilisation des données.
L'exploitation de la documentation des processus peut également être utilisée comme un accélérateur pour construire le glossaire métier, car la plupart des concepts et termes métiers sont définis par les analystes métiers.
2.2.2. Relier les données à l'architecture d'entreprise pour comprendre comment les données sont utilisées et transformées par les systèmes informatiques
Relier les données aux processus métiers est un bon moyen de comprendre le contexte de l'entreprise, mais dans un monde numérique où les processus reposent sur des applications, il est utile de tirer parti de l'inventaire des applications créé par les architectes d'entreprise. Cela permet de comprendre comment les données sont utilisées et échangées entre les applications. Les flux d'applications documentés par les architectes de solutions sont un excellent accélérateur pour construire un lignage de données et comprendre comment les données sont transformées.
En outre, l'utilisation des cartes capacitaires développées par l'équipe d'architecture d'entreprise est un moyen simple de voir si votre programme de gouvernance des données est aligné sur les objectifs de l’entreprise et si elle soutient les capacités stratégiques clés. L'architecture d'entreprise permet également de découvrir comment les systèmes informatiques évolueront (maillage des données, virtualisation des données, etc.) pour maintenir la connaissance des données et exploiter les données qui stimuleront l'innovation.
2.2.3. Connecter les données aux systèmes GRC pour garantir la conformité et limiter les risques
L'un des principaux moteurs d'une initiative de gouvernance des données est de garantir que l'utilisation des données de l'organisation est conforme aux politiques internes et aux réglementations externes.
Favoriser la collaboration entre la communauté des données et l'équipe de gouvernance, risque et conformité (GRC) permet à ces groupes d'identifier rapidement les réglementations. En exploitant l'inventaire existant des risques et des contrôles créé par l’équipe GRC, les acteurs des données peuvent mieux comprendre les risques associés aux violations de données et connaître les contrôles à mettre en œuvre pour atténuer ces risques.
Cette collaboration renforce l’application de la législation sur la confidentialité et la sécurité des données et permet aux parties prenantes de mieux comprendre le niveau de risque associé à chaque type de violation de données. En outre, ils peuvent obtenir un retour d’information sur les incidents liés aux données et leurs impacts potentiels afin de se concentrer sur les risques les plus importants.
3. Faire de vos données un atout stratégique
Toute initiative stratégique de gouvernance des données dépend de la stratégie de l’entreprise, de ses objectifs clés et de ses cas d’utilisation.
Ensuite, la stratégie de gouvernance des données se concentre sur les données nécessaires et prioritaires pour améliorer le service clientèle, les opérations internes ou pour prouver la conformité afin d’éviter d’importantes amendes. L’idée est d’atteindre les premiers objectifs, de manière efficace et agile.
3.1. De la connaissance des données à la maîtrise des données
L’étape suivante consiste à dresser l’inventaire des données prioritaires utilisées par l’organisation. Elles peuvent être stockées dans des bases de données relationnelles, ou dans des fichiers non structurés comme du texte, de l’audio, de la vidéo, ou même dans des datalakes. Cela représente une grande quantité de données qui doivent être organisées, classées par type, source et tout autre critère qui simplifiera la réutilisation de ces dernières. Le catalogue de données est le livrable clé pour regrouper les métadonnées techniques organisées dans des dictionnaires de données et les métadonnées métiers présentées sous la forme d'un glossaire métier.
3.1.1. Construire un catalogue de données plus rapidement grâce à la découverte de données
La création du catalogue de données peut être automatisée à l'aide d'outils de découverte qui vont scanner les sources de données structurées ou non structurées, inventorier toutes les métadonnées utilisées par l'organisation, et identifiées dans ces référentiels de données.
La deuxième étape consiste à organiser et à catégoriser ces données par type, catégorie, domaine d'activité, etc. Cela permet aux personnes de trouver facilement les données, de comprendre leur sensibilité, de voir où elles sont stockées, et plus généralement toutes les propriétés attachées à ces données. Cette phase peut également être partiellement automatisée en utilisant des algorithmes d'apprentissage automatique et d'intelligence artificielle (IA) pour reconnaître automatiquement le type de données et les catégoriser.
Le catalogue de données gère les métadonnées techniques et métiers et s'adresse aux experts en données (gestionnaires de données ou analystes de données). Ils l'utiliseront pour conserver les données ou utiliser son contenu pour créer des rapports d'analyse de données.
Le catalogue de données n'est pas vraiment adapté aux utilisateurs métiers (RH, finance, ventes, etc.) qui ne sont pas des experts du domaine. Le glossaire métier, axé sur les termes propres aux métiers, est plus approprié pour ces utilisateurs.
3.1.2. Partager un glossaire métier pour favoriser la réutilisation des données
Le glossaire métier est un sous-ensemble du catalogue de données. Il est axé sur les termes métiers décrits dans un langage clair et compréhensible par tous. Son objectif principal est de s'assurer que tout le monde dans l'organisation parle le même langage en éliminant toute ambiguïté.
Parfois, les différences peuvent être sémantiques, par exemple une personne peut être appelée « prospect », « client » ou « acheteur ». Dans certains cas, les différences dépendent de l'entité - par exemple, une banque de détail considère le client comme un individu, mais pour une banque d'affaires, le client est une entreprise.
Un glossaire métier est essentiel pour permettre aux personnes de communiquer et collaborer en utilisant le même langage et en partageant une compréhension commune. Il permet de voir comment le vocabulaire peut différer d'un service à l'autre. Un glossaire métier est également le point d'entrée pour la réutilisation des données et le data shopping.
Pour mettre en œuvre des cas d'utilisation métier, les Data scientists peuvent effectuer des recherches dans les glossaires métiers afin d'identifier les données métiers et celles qui pourraient être utilisées. Cela permet d'accéder directement aux données réelles stockées dans les systèmes pour mettre en œuvre de nouvelles innovations d'intelligence artificielle (IA) pour la recherche et le développement (R&D).
3.2 De la connaissance des données à la confiance dans les données
Selon une étude de HFS Research, intitulée "Bad Data is Killing Your Business Transformation Efforts", 75 % des dirigeants d'entreprise n'ont pas une grande confiance dans leurs données et 70 % considèrent les données comme un outil de survie et de croissance du chiffre d'affaires. Cela illustre l'idée qu'avoir confiance dans les données est devenue une priorité pour les équipes de gouvernance des données.
Les organisations doivent se concentrer sur trois leviers clés pour développer la confiance dans les données : l'amélioration de la qualité des données, l'application de la conformité des données et la cartographie du lignage des données.
3.2.1. Accroître la confiance en améliorant la qualité des données
Les problèmes de qualité des données peuvent rapidement impacter la confiance des utilisateurs vis à vis des analyses utilisées pour surveiller les performances de l'entreprise, la qualité des services fournis aux clients ou la pertinence des décisions prises à partir de modèles d'apprentissage automatique. Il est essentiel de mesurer la qualité des données pour s'assurer que tout le monde puisse les utiliser en toute confiance et pour identifier les pistes d'amélioration.
La qualité des données peut être mesurée de plusieurs manières. En général, elle est mesurée en fonction de six dimensions clés : l'exhaustivité, l'exactitude, la cohérence, la validité, l'unicité et l'intégrité. La mesure des dimensions de la qualité des données vous aide à déterminer si vos données peuvent être utilisées en toute confiance ou si un plan de remédiation doit être mis en œuvre avec les règles et les contrôles de données appropriés pour éviter de futures erreurs.
3.2.3. Assurer la conformité des données en mettant en œuvre des politiques et des contrôles
Dans de nombreuses industries et de nombreux secteurs, les entreprises doivent respecter les normes de conformité des données pour préserver la confidentialité des informations sensibles et éviter qu'elles ne tombent entre de mauvaises mains. Les réglementations varient considérablement d'un secteur et d'un pays à l'autre, mais pour être en conformité, les organisations doivent toujours tenir compte des points suivants :
- Quelles sont les réglementations applicables ?
- Quel type de données doit être protégé ?
- Quelles mesures doivent être mises en œuvre pour protéger les données ?
- Quel est le risque de sanctions si ces mesures ne sont pas correctement mises en œuvre ?
Pour éviter l'utilisation abusive des données ou les problèmes de conformité, les organisations doivent définir leurs propres politiques internes. Ces dernières peuvent être stockées dans un référentiel central afin de les mettre à disposition de tous les utilisateurs et mises en œuvre avec des contrôles de données.
3.2.4. Comprendre l'utilisation et la transformation des données en cartographiant le lignage des données.
L'un des principaux défis pour les organisations est de maîtriser le lignage des données, de comprendre comment elles sont utilisées en identifiant le chemin de la source des données à l'emplacement actuel, et la transformation apportée à celles-ci sur ce chemin.
Le lignage des données peut être effectué manuellement à l'aide des connaissances d'experts ou automatisé à l'aide d'outils techniques de lignage des données tels que MANTA. Ces outils peuvent analyser les systèmes et dessiner automatiquement une représentation visuelle du lignage des données avec des capacités de filtrage avancées permettant de voir le bon niveau d'information pour comprendre comment les données circulent entre les systèmes et comment elles ont été transformées.
Ce lignage de données techniques est utile pour les experts des données, mais il est trop complexe pour les utilisateurs métiers. Il doit donc être traduit pour les métiers pour être utile aux utilisateurs professionnels. L'un des principaux défis que doivent relever les organisations est de maîtriser le lignage des données, de comprendre comment les données sont utilisées en identifiant le cheminement depuis la source des données jusqu'à l'emplacement actuel des données, ainsi que les transformations apportées aux données tout au long de ce cheminement.
Les éléments techniques liés aux données (c'est-à-dire les données "client" affichées dans les tableaux de bords et reportings) doivent être résumés en concepts au niveau de l'entreprise. Les transformations techniques qui se produisent dans les systèmes (c'est-à-dire les règles ETL, le code PL/SQL, les programmes COBOL, etc.) doivent être analysées pour documenter la transformation dans un langage simple et propre aux métiers (c'est-à-dire que "ces données client doivent être validées avec des sources externes.
3.3 Vers une culture axée sur les données
Développer une culture de la donnée signifie que la culture organisationnelle donne la priorité à la prise de décision basée sur les données. Les entreprises ayant une forte culture des données ont tendance à avoir des dirigeants qui prennent des décisions basées sur les données. Mais aussi des managers et des collaborateurs qui savent que pour être pris au sérieux, ils doivent présenter des preuves que leurs décisions sont également basées sur les données.
Quatre facteurs clés influencent le développement d'une culture axée sur les données
- Un leadership axé sur les données : La culture des données débute en haut de la hiérarchie, par des dirigeants qui donnent l'exemple. Un leader axé sur les données veillera à ce que celles-ci soient utilisées pour prendre des décisions. À cette fin, il doit soutenir la gouvernance des données en tant qu'initiative stratégique ayant pour objectif d'améliorer continuellement la qualité des données afin de favoriser l'innovation métier et commerciale basée sur les données.
- La maturité des données : La maturité des données dépend de la capacité d'une organisation à gérer les données, en s'assurant qu'elle dispose d'un standard élevé de qualité des données avec tous les contrôles pour le maintenir. Elle exige également que la gestion des données soit alignée sur les objectifs de l'entreprise et qu'elle fournisse le bon niveau de visibilité sur le lignage des données pour comprendre comment les données sont capturées, utilisées et transformées par l'organisation. Un autre élément clé de la maturité des données est la facilité d'utilisation et l'accessibilité des données par les opérations.
- La connaissance des données : La maîtrise des données se traduit par une compréhension parfaite sur la manière d'utiliser les données pour améliorer la qualité de travail. Par exemple, les utilisateurs recourent aux données pour avoir des informations significatives sur les comportements des clients ou pour analyser les tendances du marché. Une autre composante de la culture des données consiste à s'assurer que tout le monde utilise le même langage au sein de l'organisation, pour éliminer toute ambiguïté dans les glossaires métiers ou techniques.
- Le processus de prise de décision : Il est essentiel d'adopter un processus décisionnel centré sur les données pour en tirer le maximum de valeur. Cela peut sembler évident, mais dans de nombreuses organisations, il n'existe pas de processus décisionnel clair et systématique basé sur les données, ce qui conduit à des décisions fondées sur l'instinct ou sur des raisons politiques.
4. Tirer parti d'un outil de gouvernance des données connecté
Pour mettre en œuvre une pratique de gouvernance des données connectée, les CDO ont besoin d'une nouvelle génération d'outils de gouvernance des données qui facilitent la communication et l'alignement à travers l'organisation. Ceci permet d'améliorer la compréhension du contexte métier et commercial concernant l'utilisation des données et d'accélérer le travail des experts des données en connectant les données aux processus métiers et commerciaux et aux systèmes informatiques.
Un outil de gouvernance des données partageant un référentiel unique sur une plateforme commune est essentiel. Il permet de favoriser la collaboration entre les experts en données et les parties prenantes de l'informatique, des affaires, de la conformité et des risques, tout en veillant à ce que tous collaborent pour atteindre des objectifs stratégiques, métiers et commerciaux communs.
4.1. Fédérer les acteurs des données sur une plateforme partagée et collaborative avec un référentiel unique
Pour fédérer la communauté travaillant sur les données et favoriser la collaboration avec toutes les autres parties prenantes internes, il est primordial qu'une source unique d'informations soit partagée dans toute l'organisation. Les outils modernes de gouvernance des données fournissent des flux de travail collaboratifs intuitifs pour accélérer la création et la validation des référentiels et modèles de données.
En outre, la mise en œuvre d'un programme efficace de gouvernance des données nécessite un référentiel unique qui améliore la sensibilisation aux données dans l'ensemble de l'organisation. Il favorise également la culture des données en permettant aux Data scientists et aux utilisateurs de données d'exploiter au mieux les informations sur les données pour stimuler la croissance de l'entreprise.
4.2. Améliorer la productivité des équipes chargées des données grâce à l'automatisation
L'amélioration de la productivité des experts des données est primordiale pour accélérer les initiatives de gouvernance des données. En effet, cela permet de libérer du temps pour se concentrer davantage sur l'analyse et l'utilisation des données que sur la découverte ou la conservation des données.
Par conséquent, les outils modernes de gouvernance des données doivent automatiser la découverte des données et l'initialisation du catalogue de données qui est la première tâche de toute initiative de gouvernance des données. Il faut ensuite utiliser une combinaison d'intelligence artificielle et d'apprentissage automatique pour automatiser la catégorisation des données, identifier les types de données et les organiser par catégorie.
4.3. Prendre des décisions fondées sur les données grâce à des rapports intelligents
Pour prendre des décisions basées sur les données, un outil moderne de gouvernance des données doit fournir à tous les membres de l'organisation les outils nécessaires pour analyser et utiliser facilement les données. Cela permettra ainsi de prendre des décisions avisées fondées sur des informations précises.
Ces outils comprennent des tableaux de bord basés sur :
- Les personas pour surveiller les performances continues des initiatives de gouvernance des données,
- Un portail d'entreprise prêt à l'emploi
- Et des applications mobiles pour partager des informations à travers l'organisation.
L'idée est de s'assurer que tout le monde parle le même langage, et que des rapports prêts à l'emploi soient disponibles pour analyser et comprendre facilement les données.
Discutons !
Contactez-nous pour échanger sur la manière dont nous pouvons vous accompagner dans la mise en place d’un programme de gouvernance des données efficace !