Toutes les questions que vous n’osiez pas poser sur les dark data

Publié le 04/07/2019 par Caroline Rousseau et Thomas LaMonte

Partager cet article

Toutes les questions que vous n’osiez pas-poser sur les dark data

Dark data, dark data, dark data : répétez ces mots trois fois de suite pour voir se matérialiser le nouveau buzzword du monde du Big data.

À part le fait qu’il s’agisse d’un nouvel anglicisme, savez-vous ce qui est le plus effrayant, quand on parle de dark data ? C’est le fait que la plupart des professionnels ne savent pas de quoi il retourne.

Voici quelques statistiques étonnantes : d’après une étude menée par IBM, 80 % des informations commerciales sont considérées comme des dark data. Dans le même ordre d’idée, 93 % de toutes les données seront des dark data : les chefs d’entreprise doivent donc tirer parti de toutes les opportunités dissimulées dans ces données ou se résigner à mettre la clé sous la porte.

Que sont les dark data ?

D’après Gartner, les dark data désignent les informations collectées, traitées et archivées par les entreprises pendant les heures de travail. Ces données sont généralement mises de côté et ne sont pas utilisées à d’autres fins. Mais en clair, qu’est-ce que ça signifie ? 


L’apocalypse des données

Au cours des dix dernières années, le volume d’informations gérées par les entreprises a explosé. Les organisations rassemblent des quantités astronomiques de données sur leurs clients et leurs machines.

Les opérations quotidiennes et les infrastructures produisent des données que les entreprises sont incapables d’interpréter. Et cela ne va pas en s’améliorant.

  • D’après l’étude d’IBM, 90 % des données du monde entier ont été créées au cours des deux dernières années.
  • Aujourd’hui, chaque être humain créé 1,7 Mo de données chaque minute. Multipliez maintenant ce chiffre par 7,6 milliards d’habitants sur la planète.
  • L’Internet des objets est également en pleine expansion et génère de plus en plus d’informations.


Le monde caché des données

Cette surabondance d’informations génère le besoin de faire appel aux Big data, la pratique collective de rassembler toutes les données générées par une entreprise, de les rendre visibles puis de les trier pour prendre de meilleures décisions commerciales.

Qui dit Big data dit dark data, c’est-à-dire les données qui n’ont pas été analysées avant d’être mises de côté. Même les meilleurs outils d’analyse et les stratégies d’informatique décisionnelle ne peuvent pas identifier et transformer toutes les Big data en informations compréhensibles et utiles pour l’entreprise. Certaines passent entre les mailles du filet, dissimulées par les individus, les réseaux ou les machines. Les dark data, c’est ça : l’ombre des Big data.

Bien souvent, elles sont cachées ou même oubliées.

Si nous considérons que les informations constituent une forme de monnaie dans le monde des affaires, une monnaie aussi importante que les investissements physiques, financiers et humains, ces données cachées correspondent à la petite monnaie qui traîne par-ci par-là et qu’on oublie toujours de glisser dans son portefeuille.


Un potentiel négligé

Les dark data désignent des données qui n’ont pas encore atteint leur plein potentiel et qui peuvent être exploitées pour prendre de meilleures décisions et développer l’entreprise.

Récemment, Dell a révélé que 90 % des données sont utilisées une seule fois puis mises de côté. IBM a appuyé ces résultats en indiquant que depuis 2015, 90 % des données créées au cours des 10 dernières années ont été abandonnées. La majorité de ces données sont arrivées à maturité et pourraient être maintenant recueillies pour en extraire tous les bienfaits.

Des exemples de dark data

Pour chaque entreprise, la nature des dark data varie selon le secteur et le type d’informations collectées et traitées.

exemples de dark data

Elles se retrouvent à tous les niveaux d’une entreprise. Chaque individu et chaque service ont leurs propres critères pour définir ce qui constitue une donnée de valeur ou une donnée à abandonner.

La problématique des dark data

Doit-on se préoccuper des dark data ? Oui, absolument.

Si vous ne comprenez pas leur nature, ne cherchez pas à les identifier ou ne voulez pas les traiter correctement, vous encourez les risques suivants :

  • Failles de sécurité : les dark data ne sont pas exploitées et votre entreprise doit tout de même les héberger. Elles sont moins surveillées que les données traditionnelles et la plupart du temps, vous ne savez même pas qu’elles existent. Les pirates peuvent être tentés de s’attaquer à vos dark data, vos employés risquent de les gérer de façon inadéquate et vous aurez du mal à identifier une faille de sécurité si elle concerne ces données cachées.
  • Problèmes juridiques : les dark data sont soumises aux mêmes régulations gouvernementales que les autres types de données de votre entreprise. Par exemple, le Règlement général sur la protection des données (RGPD) indique que les entreprises sont responsables des informations personnelles de leurs employés européens, que ces données soient connues de l’entreprise ou non. Tout avocat vous le dira : blâmer les dark data n’est pas un argument recevable devant un juge.
  • Perte d’avantages concurrentiels : vos concurrents tirent parti de ces dark data. Si votre entreprise est assise sur une montagne de données non exploitées, elle y perd à coup sûr. Plus ces données restent enterrées longtemps, plus elles perdent en valeur.

Est-il possible d’éviter d’accumuler des dark data ?

Pour faire court : non.

Les dark data sont souvent incluses dans les systèmes hérités, isolées dans l’ombre informatique ou dispersées à divers endroits en raison d’un manque d’organisation.

La plupart proviennent de données non structurées :

infographie d'ou proviennent les dark data

Cette information est difficile à gérer et à automatiser et se dissimule plus facilement dans les recoins de votre système de gestion.

En d’autres termes, les dark data sont inévitables.

Et pour certaines données, il est préférable qu’elles restent dans l’ombre. Par exemple, les données de serveur opérationnelles ou les données de production des technologies d’automatisation : ce type de données n’est pas facile à interpréter ni à comprendre, sauf par des individus particulièrement aptes à manipuler les outils technologiques. Même là, ces informations ne seraient utiles que dans des cas très précis. Il convient cependant de les protéger, quelles qu’elles soient.

Analyser les dark data : quels avantages ?

Analyser vos dark data vous apportera de nombreux avantages.

Par exemple, les données associées au réseau sont particulièrement intéressantes. Analysez les performances de sécurité de votre réseau, identifiez les points faibles et optimisez l’utilisation des ressources.

Autre exemple : les données associées aux clients et à vos échanges avec eux. Ce sont des informations souvent sous-utilisées et dispersées dans la base d’informatique décisionnelle.

Pourquoi les PME rechignent-elles à se pencher sur leurs dark data ?

Il y a encore très récemment, les dark data n’étaient pas vraiment prises au sérieux au sein de la plupart des entreprises.

Pourquoi ?

  • Parce que cela impacte les flux de travail.
  • Parce qu’on résiste souvent aux changements structurels : de nouveaux outils, de nouvelles tâches, de nouvelles priorités…
  • Parce que c’est difficile d’expliquer à un directeur ou à une équipe la nature des dark data s’ils n’en ont jamais entendu parler auparavant.

Mais cette conversation est cruciale.

Pour ne pas vous laisser distancer par la concurrence, vous devez passer à l’action, identifier où se trouvent ces données cachées, leur nature et leur utilité pour votre entreprise. Si vous ne faites rien, vos dark data surchargeront vos employés et alourdiront vos processus, ce qui impacte l’efficacité et la durée de vie de l’entreprise.

Par où une PME peut-elle commencer à gérer ses dark
data ?

Les dark data sont invisibles et vous avez probablement oublié où elles se dissimulent. Il faut donc commencer par identifier leur localisation au sein de votre structure.

Pour ce faire, vous avez besoin des bons outils.

Appuyez-vous sur des solutions d’analyse et d’informatique décisionnelle pour localiser les dépôts de données cachées, augmenter la visibilité de l’information au sein de l’organisation et les transformer en outils applicables.

Ces logiciels proposent de nombreux avantages : visualisation des données, reporting, exploitation et stockage.

Cependant, les outils ne suffisent pas. Il est crucial d’agir et d’adapter la stratégie de l’entreprise :

1) Archiver des données “au cas où” n’est plus réaliste. Les données doivent être saisies en considérant leur utilité et leur durée de vie au sein de votre entreprise.

Une donnée n’est pas un quidam indéfini dans une foule, mais un individu à part. Une donnée est un élément qui requiert d’être nommé, suivi et traité correctement.

2) La gestion des données doit devenir une priorité. Les informations sont plus importantes que jamais. La façon dont les entreprises gèrent leurs données peut changer la donne et vous aider à vous distinguer de la concurrence.

Les PME ont l’avantage de pouvoir s’adapter plus rapidement que les entreprises de grande taille et doivent en tirer parti.

Partager cet article


This article may refer to products, programs or services that are not available in your country, or that may be restricted under the laws or regulations of your country. We suggest that you consult the software provider directly for information regarding product availability and compliance with local laws.