Data Mining : l’art d’exploiter la donnée

Terminé le stockage de données sans but. Aussitôt captées, aussitôt stockées, et aussitôt oubliées. L’augmentation des capacités de stockage, via notamment l’informatique dans le nuage, a décuplé les possibilités de capter et de maintenir un flot de données important. Mais l’enjeu aujourd’hui est ailleurs. Il se situe dans l’exploitation de ces données. Le Data Mining est un domaine émergeant, qui pourraient bien modeler la décennie à venir, en allant extraire la connaissance dans ces données sous une forme nouvelle, automatisée, et tournée vers l’avenir. Explication.

Le Data Mining, une approche nouvelle des données

Utiliser l’analyse des données, mais aussi le domaine des statistiques exploratoires, cela n’a pas grand chose de nouveau. Certains n’hésiteront pas à dire que cela fait plus de 20 ans que l’on exploite les données (même plus avec les outils d’aide à la décision des années 90 de Comshare, Arbor, Cognos, etc.). C’est vrai, en partie. Mais le Data Mining apporte en réalité un lot assez conséquent de nouveautés.

  • Le Data Mining n’est pas qu’une “simple” utilisation de formules statistiques. Des procédés issus de l’apprentissage automatique (IA, Machine Learning) mais aussi de la reconnaissance des formes et de l’architecture des bases de données sont utilisés. On s’éloigne donc du champ purement mathématique et statistique ;
  • Le Data Mining s’intègre dans un processus clé au sein de l’entreprise. Au sein de l’organisation, les données sont collectées puis exploitées. Un vrai travail d’appropriation de la collecte, du stockage puis du traitement est nécessaire. Pouvoir traiter de gros volumes de données rapidement devient d’ailleurs un point essentiel ;
  • Le Data Mining, ce n’est pas simplement des tableurs Excel avec des champs “simples”. Depuis plusieurs années, il existe un besoin d’étendre l’analyse à des contenus nouveaux. La fouille des données devient complexe, et intègre notamment l’analyse d’images, de vidéos, et d’un tas d’éléments non-structurés.

Le Data Mining est une valorisation des données par des techniques informatiques et statistiques, qui suit l’évolution technologique forte du moment : généralisation d’internet, capacités de stockage décuplées, nouveaux comportements (réseaux sociaux). Une discipline qui “colle” à la réalité et est une réponse au Big Data.

Quelles applications concrètes avec le Data Mining ?

La prédiction automatisée de tendances et de comportements

L’exploration des données avec une approche Data Mining automatise le processus de recherche d’information dans les grandes bases de données. Des questions qui nécessitaient traditionnellement beaucoup d’attention et de recherches “à la main” peuvent maintenant trouver une réponse rapide. Un exemple ? Le marketing ciblé. Avec le Data Mining, une extraction de données sur les envois promotionnels passés permet d’identifier les cibles les plus susceptibles de développer le retour sur investissement d’une future campagne. Le Data Mining permet donc d’établir un scénario probable, au regard des actions passées.

Cette application peut se faire au-delà du simple objectif commercial. D’autres domaines ont besoin de prévisions. Prévoir la faillite d’une entreprise, le défaut de paiement d’une entreprise partenaire, l’émergence de segments… L’objectif est toujours d’identifier une population susceptible de répondre de manière similaire à des événements donnés. Si vous avez compilé un volume important de données, la réponse (ou une partie de celle-ci) s’y trouve forcément.

La découverte automatisée de modèles encore inconnus

Autre possibilité passionnante offerte par le Data Mining, les outils d’exploration de données peuvent balayer les bases de données et identifier des tendances ou des faits importants encore jusqu’ici cachés, le tout en un temps record. Exemple avec l’analyse des données sur les ventes au détail d’une boutique e-commerce, qui permet d’identifier des produits apparemment sans rapport, qui sont pourtant souvent achetés ensemble. Il est possible avec cette approche de mener aussi une détection des transactions frauduleuses avec des cartes de crédit, et de trouver des problèmes mettant en cause des données “anormales”, c’est à dire dont les valeurs s’écartent trop de “la norme”.

La multiplication des bases de données, qui intègrent des informations sur le marché d’une entreprise, ses clients et ses fournisseurs, entraîne une explosion de l’information. Il existe un réel besoin de disposer d’une analyse rapide et sophistiquée pour disposer d’une vue complète de ces données. Un nouveau saut technologique est nécessaire pour structurer et hiérarchiser les données et en extraire des informations commercialement et stratégiquement utiles. Ces informations tirées des données doivent permettre de répondre à des problèmes spécifiques de l’utilisateur final, mais aussi de prendre des décisions stratégiques de façon sereine. Les outils d’exploration de données qui intègrent une approche Data Mining peuvent faire ce saut, et ils sont déjà disponibles !

Twitter
Visit Us
Follow Me
LinkedIn
Share