Démocratisation de la data dans l'analytics produit
Démocratisation de la data dans l’analytics produit et comment y parvenir
Analytics produit

Démocratisation de la data dans l’analytics produit et comment y parvenir

Last edited: Fév 22, 2022
Glenn Vanderlinden Co-Founder and Strategy Lead @ Human37

Si vous souhaitez exploiter les données pour générer des insights pertinents sur la façon dont les clients utilisent votre produit, une étape essentielle consiste à introduire ces données dans une plateforme d’analytics produit comme Mixpanel. Mais ce n’est pas tout.

En effet, on oublie souvent les mesures supplémentaires qu’il faut prendre pour que toutes les données, une fois collectées, soient optimisées et organisées, et qu’elles puissent ainsi être accessibles à la majorité des employés qui travaillent sur votre produit.

Dans cet article, nous allons examiner à quoi ressemble une structure de données idéale dans le contexte de l’analytics basé sur les événements, que Mixpanel utilise. Nous verrons également comment l’application de cette structure de données aide chaque analyste (de n’importe quel niveau ) à exploiter tout le potentiel du puissant moteur d’interrogation de Mixpanel, et comment cela se traduit par de meilleures chances de transformer ces données en insights clés. Bref, cet article vous aidera à démocratiser vos données en les rendant faciles à analyser.

Qu’y a-t-il dans un nom ?

Entrons dans le vif du sujet. Comme nous l’avons évoqué plus haut, la structure des données est fondamentale lorsqu’il s’agit de rendre celles-ci plus accessibles ou de les démocratiser. Et au centre de cette exigence, il y a la structuration, la dénomination et les propriétés.  Ce principe est également vrai pour des outils de data self-serve , comme Mixpanel. 

La meilleure façon d’en expliquer la raison est de l’illustrer par un exemple.

La requête présentée ci-dessous traite de données d’événements Mixpanel qui ne sont pas bien structurées. Par conséquent, vous pourriez penser, en y jetant un oeeil , que ce que l’on essaie ici d’obtenir est une réponse à une question très complexe.

Données non structurées d’           événements

Mais ce n’est pas t le cas. La requête tente de répondre à une question simple : « Combien d’utilisateurs ont cliqué sur un paywall ? » Ce n’est pas la question en soi qui est complexe, mais la structure de données sous-jacente qui rend la réponse à cette question complexe et difficile à résoudre.

-> Examinons de plus près la dénomination et l’organisation (ou l’absence d’organisation) des données dans l’exemple ci-dessus pour identifier les problèmes.

Le tableau ci-dessous présente 20 événements du projet de tracking. Tous ces événements sont soit des événements spécifiques de type clic sur le paywall (« Paywall Click »), soit des événements du type impression sur le paywall (« Paywall Impression »). Notez également qu’aucun champ « nom de la propriété » (property name) ou « valeur de la propriété » (property value) n’est utilisé dans aucun des événements.

La raison pour laquelle nous obtenons une requête longue et compliquée en tentant simplement de répondre à la question « Sur quel paywall l les utilisateurs cliquent-ils le plus ? » tient aux limitations suivantes de notre structure de données :

  1. Elles comprend dix événements différents qui contiennent chacun une partie de l’information, c’est-à-dire que la moitié des événements sont du type « clic sur le paywall » et l’autre moitié du type « impression sur le paywall »
  2. Elle nous oblige à additionner tous ces événements individuellement
  3. Elle nous oblige à la décomposer par nom d’événement à la fin

Tout cela se traduit par deux exigences problématiques pour les analystes :

  1. Une bonne compréhension de la structure complexe des données sous-jacentes, par exemple savoir qu’il existe 10 événements distincts
  2. Environ 11 clics

À quoi ressemblent des données adaptées à l’analytics

Voyons maintenant comment nous pouvons renommer, ajouter des propriétés importantes et réorganiser les événements dans ce plan de tracking afin de démocratiser l’accès à nos données.

Tout d’abord, nous allons trier les événements en deux catégories. On distingue clairement qu’il existe des événements d’impression et des événements de clics. Dix événements par catégorie pour être précis.

Données d'événements triées

L’étape suivante consiste à renommer les événements et à utiliser au maximum les possibilités de structuration qu’offre le tracking basé sur les événements, notamment l’utilisation des propriétés. 

Pour y parvenir, nous transformons les 20 événements uniques du départ en deux événements uniques : « Impression sur le paywall » et « clic sur le paywall » Chacun n’a qu’une seule propriété, « Type de paywall «, qui peut contenir l’une quelconque des dix valeurs indiquant le type de paywall particulier.

Données d’événements optimisées

Maintenant, réexaminons comment une telle transformation pourrait avoir un impact sur la réponse à la question initiale : « Quel est le paywall sur lequel les utilisateurs cliquent le plus ? » Avec une structure de données optimisée, l’analyste n’aura plus qu’à effectuer les actions suivantes :

  1. Sélectionner un seul événement : « Clic sur le paywall »
  2. Le décomposer par type de paywall : « paywall_type »

Cela signifie que pour répondre à cette demande il ne faut plus que deux clics, soit neuf de moins qu’en utilisant la structure de données précédente. Mais surtout, nous avons éliminé un certain nombre de risques en compilant cette requête. Contrairement à la version précédente de notre plan, ce plan ne nécessite pas que nous sachions combien d’autres événements de clics existent, car tout est parfaitement regroupé dans un seul événement « clic sur le paywall » qui peut être facilement décomposé.

Données d’événement structurées

Pourquoi les données adaptées à l’analytics sont importantes

Pourquoi tout cela est-il important ? Il existe deux raisons principales pour lesquelles ce type d’optimisation est très important :

  1. Les données adaptées à l’analytics contribuent à démocratiser les données. En gros, cela signifie que de nombreux employés différents de l’entreprise peuvent utiliser Mixpanel et jouez avec les données. Les données étant intuitives et quasiment explicites, le risque est réduit grâce à une structure de données optimale, et des profils non techniques peuvent aider à explorer les données pour en tirer des informations. Plus le nombre de personnes pouvant utiliser Mixpanel est important, plus vous avez de chances de trouver des informations intéressantes. En outre, cela signifie également que Mixpanel peut transformer davantage de membres d’une équipe ou d’une organisation en analystes productifs. Mixpanel peut être ouvert aux designers , aux spécialistes de l’expérience client, aux testeurs A/B, aux spécialistes du marketing et même aux équipes de vente pour alimenter leurs opérations quotidiennes et leurs feuilles de route à long terme.
  2. Le but n’est pas d’obtenir des résultats en moins de clics. Enfin, pas exactement. Il s’agit de réduire le risque de commettre des erreurs. Vous pouvez considérer que le nombre de clics est un indicateur de la complexité, et donc du risque. Chaque intervention manuelle, telle que l’ajout d’un événement pour construire une liste exhaustive des possibilités dans le cadre de votre analyse, représente un risque. Notre question « Quel est le paywall sur lequel les utilisateurs cliquent le plus ? » exigeait de l’analyste qu’il additionne non pas sept événements, ni huit ou neuf, mais dix. Exactement 10. Le fait de procéder différemment ruinerait toute l’analyse, probablement sans que l’analyste ne s’en rende compte. Comme principe de base, on peut affirmer que le nombre de clics nécessaires pour effectuer une analyse dans Mixpanel est révélateur de la facilité d’analyse de vos données.

La relation entre les données démocratisées et le développement de produits axés sur les données

Dans cet article, nous avons cherché à nous assurer que la couche de collecte des données favorise la démocratisation des données en optimisant le plan de tracking. Il ne s’agit que de la première étape du processus de développement de produits basé sur la data .

Cependant, il s’agit d’une étape essentielle pour maximiser vos chances de tirer des informations à partir de la data . De la data facile à analyser réduit t le risque d’erreurs et démocratise la data en tant que telle. . En échange, cela augmente vos chances de tirer des informations pertinentes de la data , qui peuvent être utilisées pour construire un meilleur produit et faire croître votre entreprise.

Une base solide est nécessaire en tout. Et dans le cas de Mixpanel, il s’agit d’un plan de tracking bien pensé qui facilite l’analyse de la data .

À propos de Glenn Vanderlinden

Glenn est cofondateur et responsable stratégie chez Human37, une agence implantée à Bruxelles, spécialisée dans l’expérience client basée sur la data. . Human37 vous aide à définir, à concevoir, à mettre en œuvre et à activer votre stratégie de data client personnalisée et évolutive.  L’agence a pour objectif de façonner un monde qui offre une meilleure expérience client aux particuliers.


Obtenez des informations sur la meilleure façon de convertir, d’engager et de retenir vos utilisateurs grâce à la puissanc e de l’analytics produit de Mixpanel. Faites un essai gratuit.

Get the latest from Mixpanel
This field is required.