2019-12-13

Analyse Prédictive : Améliorez votre Processus Décisionnel grâce à la Data

Jellyfish

Jellyfish Insights

Cet article s’adresse aux lecteurs qui souhaitent adopter de nouvelles pratiques qui les aideront à prendre les bonnes décisions, et à ceux qui veulent découvrir comment les outils issus des data sciences pourront aider certaines professions à s’adapter et répondre aux nouveaux enjeux de cette ère de la data. Je vais vous présenter ci-dessous une méthode concrète et applicable qui vous fournira une prévision basée sur vos données, qui viendra enrichir vos réflexions et affiner vos décisions. On parle ici d’ Analyse Prédictive de la data, de Predictive Analytics ou encore de Forecasting.

Adoptez des pratiques data-driven au quotidien : l’Analyse Prédictive

Tout comme collaboratif ou digital, l’épithète data-driven est devenu ces dernières années la nouvelle religion dans le monde de l’entreprise. Au cours d’une semaine classique, un responsable marketing ou commercial recevra des prières l’incitant à s’y convertir d’une demi-douzaine de canaux différents. Il verra ses contacts Linkedin en chanter les louanges, lira des articles encensant les organisations qui ont d’ores et déjà embrassé ces pratiques, répondra à un commercial prêchant la bonne nouvelle data-driven pour lui vendre son logiciel, entendra ses concurrents clamer leur dévouement à cette nouvelle façon de travailler, et bien sûr écoutera les sermons exaltés de sa hiérarchie sur l’importance de suivre cette voie.

Bien que prolixes sur les bienfaits que peut apporter la data-driveness, tous ces apôtres sont souvent beaucoup plus avares de détails lorsqu’il s’agit d’expliquer concrètement quelles pratiques adopter au quotidien.

Lire aussi : Au fait, ça veut dire quoi être data-driven ?

Qu’est-ce qu’une Analyse Prédictive ?

Pour certain, le terme prédiction risque d’être associé à des pratiques cabalistiques telle que lire dans les feuilles de thé ou compter les vautours sur les collines de Rome. Précisons tout de suite que par prédiction, on entend quelque chose de totalement différent, fondée sur des méthodes scientifiques rigoureuses passées à la postérité et dans le monde de l’entreprise après avoir fait leurs preuves auprès de publics scientifiques.

D’aucuns feront sans doute remarquer que l’on n’a pas attendu l’arrivée des data-sciences pour incorporer au processus de décisions des estimations (le fameux prévisionnel…). Bien qu’une solide connaissance de leurs entreprise, de leurs secteur ainsi qu’une capacité à émettre des hypothèses réalistes inspirées de leur propre expérience permettent quotidiennement aux décideurs de produire ces estimations. La méthode d’analyse prédictive dont nous parlons ici a finalement très peu à voir avec ce que l’on vient de décrire. Pour s’en convaincre, il suffit de rappeler les procédés nécessaires à la réalisation d’une prédiction, pour voir à quels points ceux-ci diffèrent d’une estimation “traditionnelle”.

« Etre data-driven est une question d’actions;  ce n’est pas regarder la donnée, c’est agir grâce à la donnée. »

Les 2 grandes étapes de l’Analyse Prédictive

On peut résumer l’analyse prédictive en deux grandes étapes :

1-  L’extraction des données historiques – les chiffres passés, (par exemple les chiffres des ventes journaliers sur les 3 dernières années),

2- Le traitement de ces données grâce à un logiciel utilisant une méthode de mathématiques appliquées ou de statistiques, afin d’obtenir une prédiction pour la période suivante (dans notre exemple, les chiffres de ventes journaliers pour l’année à venir).

Ce sont bien ces 2 étapes qui constituent une analyse prédictive. Un tel processus est constitutif d’une attitude data-driven non pas simplement parce qu’il utilise la donnée, mais parce qu’il rend la donnée partie prenante du processus de décision, en fournissant une prédiction qui viendra améliorer cette prise de décision. Et on ne le répétera jamais assez, être data-driven est une question d’actions;  ce n’est pas regarder la donnée, c’est agir grâce à la donnée.

Pourquoi intégrer l’analyse prédictive au processus décisionnel ?

Cette façon de produire une prédiction enrichit de plusieurs façons le processus de prise de décisions en permettant de :

1 – Fournir des éléments supplémentaires chiffrés et précis pour étayer les décisions et justifier les orientations

Tout d’abord, les prévisions sont des indications précieuses sur ce qu’il se passe réellement. Si vous avez une idée claire de ce qu’il arrivera si les tendances actuelles persistent, vous êtes conscient des seuils que vous devez dépasser. Ainsi, vous pouvez mettre en place des objectifs détaillés, ambitieux, mais toujours réalistes pour les prochaines périodes. La prédiction peut également servir de signal d’alarme : si les chiffres obtenus ne correspondent pas à vos objectifs business, cela doit vous pousser, vous et vos équipes, à conduire les changements que vous jugerez nécessaires pour redresser la barre.

L’analyse prédictive ne produit pas des vérités indiscutables. Elle fournit des estimations supplémentaires qui doivent faire germer en vous de nouvelles idées et alimenter les discussions stratégiques en cours.

2 – Apporter un avis neutre et indépendant pour dépassionner le processus de décision

Parce qu’elles s’appuient sur des données brutes, des logiciels externes et des méthodes mathématiques impartiales, les prédictions constituent une excellente base de réflexion sur les enjeux stratégiques. Une argumentation basée sur une telle prédiction est moins susceptible d’être perçue comme partiale. Bien sûr la donnée, les logiciels et les méthodes mathématiques doivent pouvoir être remises en question, c’est même conseillé. Et ce d’autant plus qu’il est beaucoup moins périlleux d’aborder la fiabilité des outils de data-science que de mettre en doute les intuitions personnelles de ses collaborateurs, terrain glissant s’il en ait.  L’analyse prédictive contribue donc à rendre la collaboration nécessaire aux prises de décisions non seulement plus rationnelle et plus efficace, mais aussi plus détachée des affects et enjeux de hiérarchie, parfois sources d’auto-censure ou au contraire d’accrochages.

3- Remettre en question ses propres a priori sur l’évolution de l’activité  pour acquérir une perception plus fine des enjeux, et ainsi gagner en assurance dans les actions entreprises

Un bon décideur doit toujours remettre en question sa perception des évolutions de son activité afin d’affiner sa compréhension des enjeux et des leviers disponibles. Or, les prédictions ont ceci qu’elles ne reposent que très peu sur les a priori de leur auteur. Elles peuvent donc jouer le rôle de tiers de confiance pour celui-ci. Confronter son point de vue au résultat d’une analyse prédictive est en effet un très bon moyen d’évaluer les stratégies envisagées afin éventuellement de les corriger, ou au contraire à se conforter sur leur bien-fondé. En réduisant ainsi la part de doute et d’incertitude du décideur, l’analyse prédictive lui permet d’appréhender avec plus de sérénité la prise de risque inhérente à toute action.

Comment réaliser concrètement une Analyse Prédictive ?

Voyons maintenant ensemble comment réaliser une prédiction. Nous prendrons l’exemple d’un site de commerce en ligne dont le directeur marketing ou commercial voudrait prédire le chiffre d’affaire pour l’année à venir, un cas d’usage classique des décideurs data-driven. Il s’agit d’un exemple qui implique des données de web-analytics, domaine d’expertise de Jellyfish et de Reeport, le logiciel que nous développons.

Etape 1 : Récupération des données

La première étape d’une analyse prédictive est celle que vous retrouvez dans beaucoup de processus data-driven : vous devez collecter les données disponibles pour les périodes précédentes. Pour ce faire, prenons l’exemple d’une société qui utilise Google Analytics, l’un des outils de webanalyse les plus répandus. Nous allons utiliser les données des 3 années précédentes, en demandant à Google Analytics de nous fournir les chiffres jour par jour. Voici une capture d’écran de la requête et du résultat obtenu. Nous allons enregistrer ce résultat en tant que TSV et le convertir au format CSV.

On requête sur GA trois ans de données, en demandant une ventilation journalière grâce à la dimension ga:date

On sauvegarde la donnée sous forme de TSV, une variante du format csv que peuvent importer la plupart des logiciels de traitement de données.

Etape 2 : Choisir une solution pour réaliser la prédiction

Cette seconde étape, à savoir réaliser une prédiction en important les données dans un logiciel et appliquer un modèle mathématique/statistique, peut être effectuée de multiples façons. L’analyse prédictive est l’une des tâches classiques des data scientists. Déterminer l’algorithme prédictif le plus adapté en théorie et en pratique pourrait être un sujet d’article en soi. Pour ne pas trop compliquer et rallonger notre propos, nous allons laisser cet aspect de côté pour nous concentrer sur le choix de la solution à utiliser (le logiciel).

Le choix de la méthode statistique utilisée sera de toute façon fortement dépendant du logiciel d’analyse prédictive choisi, puisque à l’opposé des langages de programmation, la plupart des logiciels ne permettent d’utiliser qu’un certain nombre de méthodes prédéfinies. Pour cela nous présenterons les solutions disponibles, qu’elles soient accessibles à tous ou au contraire, réservées aux data analystes les plus chevronnés. Certes, certains dirigeants marketing/ventes ne se reconnaîtront pas dans cette dernière dénomination, mais nous faisons le pari qu’à terme, cette fonction constituera une composante essentielle des futures équipes marketing data-driven. Nous laisserons en revanche de côté les outils les plus avancés qu’utilisent les data-scientists et chercheurs en intelligence artificielle pour nous restreindre aux solutions d’analyse prédictive qui nous semblent adaptées pour un usage occasionnel par des décideurs marketing.

Nous allons donc nous concentrer sur le choix du logiciel, en utilisant pour chaque logiciel une méthode statistique rapide à utiliser parmi celles fournissant une prédiction robuste. On évaluera à chaque fois la facilité de prise en main, la rapidité d’exécution, et bien sûr, la qualité de prédiction possible selon les méthodes disponibles. Par souci de simplicité, nous allons ranger les logiciels dans 4 catégories, auxquelles on ajoutera les langages de programmation :

– Tableurs/feuilles de calcul,

– Logiciel de Business Intelligence (B.I.),

– Logiciel de data-analyse et data-science,

– Langage de programmation de haut niveau,

– Dashboard/tableau de bord.

Effectuons maintenant une prédiction à l’aide de chacun de ces outils et des données précédemment extraites. Ce passage en revue nous permettra de constater les atouts et inconvénients de chaque catégorie, afin de déterminer quels outils vous conviennent le mieux, en fonction des besoins, ainsi que du temps et des compétences disponibles.

Tableur/Feuille de Calcul : Excel

Excel est l’un des outils de bureautique les plus utilisés. Les manipulations sont simples et la courbe d’apprentissage inexistante puisqu’il est omniprésent en entreprise. Cependant, l’ensemble des méthodes proposées pour l’analyse prédictive est plutôt sommaire. La simplicité des modèles disponibles ne permet pas d’obtenir des prédictions adéquates pour d’autres contextes que ceux où l’on se contenterait d’une estimation sur un coin de table à l’aide d’une règle de trois. Excel n’est pas gratuit, mais il est raisonnable de partir du principe qu’il fait déjà partie des raccourcis bureaux de la plupart des dirigeants, considérons donc qu’il n’engendre pas de frais supplémentaires.

Outil de Business Intelligence : Tableau & BI

Tableau 

Tableau a connu une progression spectaculaire ces dernières années dans le monde  de la Business Intelligence. Son interface agréable permet d’importer et de manipuler de la donnée très facilement. Sa plus grande force est aussi sa plus grande faiblesse : il s’adapte à des données de toutes natures sans se spécialiser sur un métier précis. On utilise d’abord l’outil de prédiction disponible au sein du logiciel. Bien que d’usage plus facile qu’un tableur, ses modèles restent trop élémentaires. Tableau permet d’intégrer du code en R, mais la prédiction hérite alors des avantages et inconvénients de la solution R(voir plus bas). Enfin, tableau est payant.

PowerBi

PowerBi est l’un des outil de référence en BI. De prise en main très facile, il permet d’obtenir facilement une prédiction, bien que là encore, on reste sur notre faim concernant la fiabilité de la prédiction. De même, cette solution n’est pas gratuite.

Outil de data analyse : R

R est une des armes de choix de tous ceux qui pratiquent la data-science. Cette solution bénéficie du support d’une énorme communauté et de nombreuses formations en lignes facilement accessibles et gratuites. Cela atténue un peu l’inconvénient une prise en main souvent difficile pour les personnes qui ne sont pas familières avec la programmation et les terminaux de commande. Les fonctions proposées par R sont plus que suffisantes pour répondre aux besoins d’une prévision bien réalisée. Et surtout, R est gratuit et disponible en opensource.

Langage de programmation de haut niveau : Python

Cette fois, nous ne parlons pas de logiciel, mais de langage de programmationPython est, parmi les langages de programmation utilisés pour l’analyse prédictive, l’un des plus facile à prendre en main, et bénéficie d’une large communauté de support en ligne. Les possibilités sont ici infinies et Python autorise une analyse prédictive à la pointe de la technologie, offrant ainsi un niveau de qualité bien supérieur à ce qui est habituellement nécessaire dans le monde de l’entreprise. Vous disposez également de nombreuses bibliothèques proposant des méthodes prêtes à l’emploi, tel facebook prophet, une création des labos de Facebook que l’entreprise a mis à la disposition de la communauté. Néanmoins, pour ceux d’entre vous qui ne sont pas familier avec la programmation et la gymnastique intellectuelle qu’elle implique, la courbe d’apprentissage pourrait être un peu plus raide que pour les solutions précédentes. Python est entièrement gratuit tout comme le logiciel Anaconda qui permet d’utiliser une interface plus agréable pour s’y expérimenter, bien que les difficultés inhérentes à la pratique de la programmation demeurent.

Dashboard/Tableau de bord : Reeport

Apparu récemment sur la scène de l’analyse prédictive, Reeport est un logiciel de tableau de bord (dashboard) de web analytics qui permet maintenant à l’utilisateur de faire de l’analyse prédictive en utilisant des données issues de plateformes tel que Google Analytics ou Adobe Analytics. Les solutions “dashboard”  sont conçues pour faciliter la prise en main par des utilisateurs qui possèdent une expérience marketing/commerciale, et cela grâce à une interface moderne et intuitive. La fonction prédiction ne propose qu’une seule méthode, mais le modèle a été développé spécifiquement pour être adapté au type de données utilisé, afin d’obtenir une prédiction robuste avec un minimum de supervision de l’utilisateur. Un autre avantage de cette solution réside dans le fait que l’extraction des données web analytics est automatisée, ce qui réduit le temps nécessaire et facilite la prise en main. En revanche, elle est elle aussi payante.