Google Analytics & RGPD : la proxyfication seul moyen d’être conforme ?

Google Analytics & RGPD : la proxyfication seul moyen d’être conforme ?

Vous l’avez peut-être vu passer: la Commission Nationale de l’Informatique et des Libertés (CNIL)  a publié sur son site officiel des informations complémentaires pour être conforme au RGPD – et cela passe par une méthode de proxyfication.

Dans ce contexte, qu’est-ce que la proxyfication et comment allez-vous pouvoir continuer à tracker et mesurer l’audience de votre site sans risquer de pénalités ?

Pourquoi Google Analytics est jugé non conforme au RGPD

Cela fait 2 ans que la Cour de justice de l’UE a invalidé le Privacy Shield (arrêt du 16 juillet 2020), le dispositif qui permettait d’encadrer les transferts de données personnelles entre l’Europe et les Etats-Unis, estimant que le risque d’accès à ces dernières par les autorités américaines ne respectait pas le droit des ressortissants européens.

Vous connaissez la suite et notamment les événements plus récents : le dépôt de plaintes multiples dans différents Etats-Membres par l’association NOYB a entre autres conduit la CNIL à remettre en cause l’utilisation de Google Analytics par différentes entreprises françaises. 

Pour ne citer que quelques exemples, Sephora et Auchan ont fait l’objet de mises en demeure. Dans les faits, n’importe quel site Web français peut faire l’objet d’un contrôle et écoper d’une pénalité s’il ne met pas rapidement en conformité ses données GA.  

Les 2 soucis majeurs qui ressortent à l’heure actuelle avec GA aux yeux de la CNIL sont donc les suivants : 

  • La non-anonymisation intégrale des données collectées par l’outil de mesure d’audience. Bien qu’une fonctionnalité d’anonymisation des adresses IP soit bien proposée par Google, elle ne couvre pas l’intégralité des transferts et rien ne garantit qu’elle soit effectuée avant l’envoi de la data vers les Etats-Unis… ce qui laisse potentiellement le champ libre aux autorités américaines pour un accès sans protection de la vie privée.
  • Le fait que les données collectées soit hébergées sur les serveurs de sociétés dont le siège est installé aux Etats-Unis. Google s’est d’abord défendu en avançant que la situation était théorique, mais dans les faits, les renseignements américains peuvent obtenir facilement un accès aux données d’une entreprise dont le siège social est sur le territoire.

Le problème est donc double : l’anonymisation n’est pas systématiquement mise en œuvre puisqu’optionnelle ET elle risque d’avoir lieu après le transfert, donc les autorités peuvent avoir accès aux données d’IP en clair (notamment si la requête est initiée depuis le terminal de l’utilisateur; elle n’est dans ce cas pas qu’un critère d’identification, mais aussi de localisation)

Note importante : cela signifie que bien que le focus soit mis sur Google Analytics, tout outil de mesure statistique américain aujourd’hui est concerné par les mêmes questions ! 

La proposition de la CNIL : une méthode complexe de proxyfication

Premier constat de l’autorité française : “une simple modification du paramétrage est insuffisante“.

Et de détailler :

“Une autre idée souvent avancée est celle du recours au « chiffrement » de l’identifiant généré par Google Analytics, ou bien du remplacement de celui-ci par un identifiant généré par l’opérateur du site (…) Les requêtes qui en résultent permettent à ces serveurs d’obtenir l’adresse IP de l’internaute ainsi que de nombreuses informations sur son terminal. Celles-ci peuvent, de manière réaliste, permettre une réidentification de celui-ci et, en conséquence, l’accès à sa navigation sur l’ensemble des sites ayant recours à Google Analytics.

Seules des solutions permettant de rompre ce contact entre le terminal et le serveur peuvent répondre à cette problématique. Au-delà du cas de Google Analytics, ce type de solution pourra également permettre de concilier l’usage d’autres outils de mesure avec les règles du RGPD sur le transfert de données.”

Voilà, c’est posé et on ne peut plus clair. 

Alors que faire ? 

La CNIL préconise une solution pour éviter le contact direct entre le terminal de l’internaute et les serveurs de l’outil. En d’autres termes, elle conseille d’avoir recours à un proxy, donc un serveur mandataire. 

Cette proxyfication doit servir d’étape indispensable de pseudonymisation des données avant leur transfert vers les serveurs de Google (ou autre outil de mesure d’audience dont le siège est aux US).

Pour ce faire et rendre l’ensemble de l’installation conforme, la proxyfication doit assurer qu’en aucun cas une personne ne pourra être de nouveau identifiée une fois les informations transmises.

© CNIL 

Les critères précis pour une proxyfication conforme de votre installation

La CNIL présente plusieurs mesures qu’elle estime nécessaire pour que le processus soit conforme au RGPD : 

  1. L’absence de transfert de l’adresse IP vers les serveurs de l’outil de mesure. 
  2. Le remplacement de l’identifiant utilisateur par le serveur de proxyfication
  3. La suppression de l’information de site référent (ou « referer ») externe au site ;
  4. La suppression de tout paramètre contenu dans les URL collectées (par exemple les UTM, mais aussi les paramètres d’URL permettant le routage interne du site) ;
  5. Le retraitement des informations pouvant participer à la génération d’une empreinte (ou fingerprint), tels que les « user-agents ».
  6. L’absence de toute collecte d’identifiant entre sites (cross-site) ou déterministe (CRM, id unique)
  7. la suppression de toute autre donnée pouvant mener à une réidentification.

Les conditions d’hébergement du proxy font également l’objet de recommandations.

Quelles alternatives si tout cela vous paraît trop complexe ?

Nous recommandons depuis plusieurs semaines de mettre en place dès maintenant un module complémentaire Matomo (basé en Europe), afin de pouvoir collecter de la donnée conforme dès maintenant et migrer complètement si le besoin s’en faisait sentir… et ce sans perte d’historique et avec un système similaire à votre installation actuelle Google Analytics (3 puis 4) !  

Contactez-nous pour en parler, nos experts tracking & Analytics sont à votre disposition pour toute question et besoin d’accompagnement sur ce sujet.

Les Walled Gardens, essentiels pour les annonceurs dans un monde cookieless ?

Les Walled Gardens, essentiels pour les annonceurs dans un monde cookieless ?

Qu’est-ce qu’un Walled Garden ? 

Un Walled Garden (“jardin clos” en français) est un écosystème fermé au sein duquel toutes les opérations sont contrôlées par l’opérateur de cet écosystème.

Si le concept n’est pas né avec Internet, mais dans l’industrie des télécommunications dès les années 70, les Walled Gardens sont aujourd’hui très associés aux GAFA

Apple contrôle l’intégralité de l’écosystème iOS (applications, devices, paiements, données, publicités, vidéo, musique, navigateur…); META, Amazon et Google ont aussi le pouvoir sur toute la chaîne de valeur, de la collecte de la data aux performances partagées. 

Vous l’aurez compris : un Walled Garden est obtenu lorsque les annonceurs sont obligés d’utiliser toute la stack marketing possédée par un acteur à l’écosystème fermé

  • le serveur publicitaire
  • le DCO (Dynamic Creative Optimisation)
  • la CDP (Customer Data Platform)

Leur force est (entre autres) de fournir l’ensemble des fonctionnalités nécessaires à la gestion des campagnes publicitaires et au ciblage… mais sans permettre aux annonceurs d’exporter les données, hors métriques de performance.

Qu’est-ce que cela signifie dans un monde qui tend vers le cookieless, ou du moins vers les cookies first-party ?

Que les Walled Gardens vont d’autant plus gagner en puissance. C’est d’ailleurs pour sortir de la dépendance aux plateformes massives que sont les GAFA que plusieurs initiatives collectives se dessinent dans le monde pour créer leurs propres jardins clos.

Le login commun sur un réseau de sites est l’une des approches privilégiées, car créer soi-même son écosystème demande une force de frappe très importante. 

Le “cas” e-commerce : repenser le message et élargir sa stratégie de consentement aux cookies au login utilisateur

Les sites e-commerçants ont pour particularité d’obtenir systématiquement les informations de contact de leurs clients. Difficile sinon de leur envoyer les produits commandés ! 

Cela ne résout pourtant pas le problème fondamental des traffic managers ou chargés d’acquisition : obtenir un consentement supplémentaire pour utiliser ces données à des fins de marketing. 

Dans un monde de plus en plus orienté “privacy” par défaut, la dimension de confiance et la créativité des annonceurs et spécialistes marketing doivent de plus en plus monter en puissance : 

  • Etre très clair sur l’échange de valeur (c’est-à-dire souligner l’intérêt pour le client à consentir, pas seulement pour la marque)
  • Maximiser le volume de data reçu en exploitant pleinement la possibilité de son analyse
  • Passer d’une approche “vendeur-centric” à un échange réciproque, ce qui devrait conduire à une évolution des messages présentés. “Voici comment nous bénéficions de cet échange, et voici comment vous en bénéficiez aussi”… de quoi changer radicalement de ton après des années de “push” des cookies (“êtes vous d’accord ou non?”) qui repose rarement sur le sentiment pour l’internaute d’y trouver son compte.

Mot d’ordre donc : la clarté. 

Mais cela ne doit pas uniquement se faire dans le cadre de votre politique de cookies ! 

Votre obsession à l’avenir sera d’augmenter le nombre d’utilisateurs authentifiés/logués à votre écosystème ou votre site.  

Par quoi cela passe-t-il ? Une multitude d’éléments que vous avez peut-être déjà mis en œuvre, voire vécus vous-même en tant que consommateur : 

  • prix membres
  • outlet ou ventes privées accessibles contre login
  • offres exclusive
  • gamification réservée aux membres…

Nous avons d’ailleurs publié un article touchant à ces sujets (comment augmenter le taux de consentement et les logins membres sur votre site e-commerce).

En outre, avec des solutions adaptées tels que les CRM et les CDP, la capture de données sur les internautes authentifiés vous aidera à relier les points entre les multiples plates-formes d’interaction avec les clients, y compris entre un réseau boutiques “brick and mortar” et le site e-commerce, contribuant à obtenir une vue unique du client… tout en respectant son consentement.

Une bonne segmentation de cette audience augmente votre capacité à atteindre de nouvelles audiences de manière ciblée, grâce à l’utilisation de mécanismes tels que les audiences similaires dans les réseaux sociaux et les moteurs de recherche, ou les cohortes d’utilisateurs anonymes sur le Web via l’affichage programmatique.

Connaissiez-vous déjà ce concept ? Que pensez-vous des initiatives de création de Walled Gardens sectoriels pour ne pas dépendre uniquement de la data META/Facebook, etc. pour les campagnes ciblées ?

L’explosion du cookieless ? Se préparer et trouver de nouvelles pistes de ciblage (dont Google Topics)

L’explosion du cookieless ? Se préparer et trouver de nouvelles pistes de ciblage (dont Google Topics)

Cookieless : on entend beaucoup ce mot ces temps-ci. Mais qu’est-ce que cela signifie vraiment ? Et comment se préparer à un monde sans cookies lorsque l’on est annonceur ? On va le voir, les cookies ne sont pas voués à tous disparaître et d’autres tactiques sont en cours de déploiement… voire déjà disponibles. 

Pour rappel : les avantages des cookies 

Les cookies first party et les cookies tiers permettent de personnaliser l’expérience de navigation d’une personne en lui proposant du contenu pertinent et qui correspond à ses goûts.

Et pour vous marketeurs ou chargés d’acquisition, de retargeter de manière ciblée les internautes qui ont interagi avec votre site.

Ils garantissent aussi une bonne qualité de navigation : maintien des paniers et des préférences, pré-remplissage des formulaires… 

La différence entre les cookies first party et les cookies tiers

Les cookies first party sont des cookies déposés, stockés et possédés par le site Web que l’internaute visite. Ils permettent au propriétaire du domaine de collecter ses propres données analytiques, de mémoriser les préférences utilisateurs et de fournir des expériences personnalisées à ces derniers.

Ce type de cookies gagne en puissance aujourd’hui, là où les cookies tiers sont voués à disparaître. Ces derniers sont créés et stockés par d’autres acteurs que celui que l’internaute est en train de visiter. 

S’ils sont bien déposés par le site Web en question, ces cookies sont généralement détenus par des organisations tierces (d’où leur nom) et utilisés pour le suivi des publicités intersites, le profilage et le ciblage de l’audience, etc.

Ces derniers sont de plus en plus bloqués par Chrome (Google), et déjà délaissés par défaut par Safari, Firefox ou encore Brave.

Et le cookieless ? 

Parler de “cookieless” revient à décrire un monde pas si loin de nous où les spécialistes du marketing sont de moins en moins tributaires des cookies. Ces derniers étant de plus en plus dépréciés au nom de la vie privée (privacy), il faut trouver de nouvelles manières d’envisager le tracking et d’augmenter les taux de consentement.

Cela étant dit, parler de disparition des cookies est erroné, dans la mesure où ce sont surtout les cookies tiers qui tendent à disparaître. Si la plupart des navigateurs ne supporteront bientôt plus ces derniers, les cookies first-party, eux, peuvent continuer à être utilisés par les responsables de sites Web. 

Le défi désormais ? 

Se concentrer sur de la data first-party collectée avec le consentement de l’utilisateur.

4 manières d’amorcer votre transition 

  1. Améliorez votre collecte de données en first party. L’objectif de ce point est d’améliorer le processus existant de collecte et leur analyse, ainsi que d’en augmenter le volume. Cela vous permettra d’y ajouter un procédé d’extrapolation bien plus fiable ! 
  1. Implémentez une solution solide et fiable de gestion du consentement (CMP), si vous ne l’avez pas déjà fait (notre article à ce sujet est consultable ici).  Et n’oubliez pas de communiquer clairement à vos clients la manière dont vous traitez et protégez leurs données : la confiance fait la différence ! 

3) Menez des tests avec les données secondaires des leaders technologiques du marché. Google et Facebook, pour ne citer qu’eux, permettent d’accéder à des données d’audiences agrégées (mais granulaires) collectées sur leurs plateformes et réseaux respectifs. 

4) Ne mettez pas de côté les audiences tierces de qualité 

Qui dit disparition des cookies tiers ne dit pas forcément disparition des audiences tierces, qui ne reposent pas toutes sur une technologie de cookies.

De FLoC à Topics : se tourner vers Google pour une acquisition ciblée ? 

Google a annoncé l’abandon de sa méthode alternative au cookie tiers, FLoC (Federated Learning of Cohorts). 

Pour autant, une nouvelle initiative se dessine : Topics.

Topics fonctionne en associant un site Web à un thème parent. Puis le navigateur recueille les thèmes les plus fréquemment consultés (de 3 à 5) en fonction des sites Web consultés par l’internaute, avant de les partager avec les domaines visités pour aider les annonceurs à afficher des publicités plus pertinentes… sans avoir besoin de connaître l’historique spécifique de navigation.

© Google. A gauche, un schéma avec des cookies tiers. A droite, Topics

Les tests seront lancés cette année. Restez dans les parages ! 

Marketing Studio complète votre tracking et est RGPD-friendly. Demandez votre démo maintenant 👇


Bien choisir et gérer votre CMP (Consentment Management Platform)

Bien choisir et gérer votre CMP (Consentment Management Platform)

Vous utilisez très certainement une CMP (Consentment Management Platform) pour gérer le consentement aux cookies des visiteurs de votre site Web.

Il existe des CMP gratuites et des CMP payantes (ou gratuites de base avec des options payantes). Dans tous les cas, leur objectif est de permettre aux éditeurs de sites de recueillir le consentement des utilisateurs afin d’exécuter ou non un certain nombre de fonctionnalités. 

Axeptio, Tarte au citron, Sirdata… vous avez l’embarras du choix.

Le souci est que l’on s’est rendu compte ces derniers temps que toutes les CMP ne se valent pas… et que nos clients s’en aperçoivent souvent trop tard.

Aujourd’hui, faire appel à une CMP vise surtout à être capable d’historiser les consentements. En cas de contrôle de la CNIL, cette dernière va vérifier si l’éditeur du site est en possession de l’historique. Sans CMP, avec une approche “from scratch”, vous n’avez tout simplement pas cet historique (“léger” problème, n’est-ce pas ?).

Sur le papier donc, tout va bien, d’autant que les CMP permettent aussi le scan automatique des cookies pour les classer. Notez qu’il faut souvent repasser du temps dessus pour vérifier que tout est au bon endroit : il arrive que des cookies soient mal connectés.

Retour d’expérience : il arrive que notre module Marketing Studio ne reçoive pas la donnée car la solution d’exemption l’avait connectée sur un autre outil que le nôtre. 

Quelle que soit la solution d’ailleurs, cela demande toujours une vérification régulière. 

C’est un point à prendre en compte quand vous évaluez la pertinence de X ou Y CMP pour votre site (gratuite ? freemium ? payante ? pour quel forfait ?). Beaucoup de solutions ne comprennent pas d’accompagnement , hors mails à un service support. Or un account manager est souvent nécessaire. 

Et côté budget ? 

Certaines CMP facturent en fonction du nombre de domaines ou du nombre de visiteurs uniques.

ex One Trust : par ndd

Didomi : trafic

Du côté des outils disponibles gratuitement (Axeptio, Tarte au Citron…), la bannière permet rarement de personnaliser le contenu, l’emplacement, l’image… cela peut poser un souci du côté de la marque (brand), mais aussi de la conversion. Le but est d’augmenter le taux de consentement en personnalisant un maximum ! 

Sirdata se détache par son modèle particulier : la CMP est mise à disposition gratuitement, mais en contrepartie votre audience peut être revendue / retargetée sur d’autres sites.

Quid des statistiques ? 

Le nerf de la guerre pour optimiser sa conversion ! Là encore, les limites sont souvent fortes ou les chiffres biaisés. Pourquoi ? 

Vous allez par exemple avoir accès à  un graphe qui vous livre le taux de consentement, mais ces chiffres ont tendance à rendre ce taux cumulable.

Ex : jour 1, X personnes ne consentent pas

jour 2 : Y personnes ne consentent pas

Les chiffres se cumulent et au bout d’une période donnée, un vrai écart se creuse. Vous risquez d’obtenir des personnes qui achètent à J+4 alors que le refus a eu lieu le 1er jour. 

Cela impacte directement les annonceurs : “je ne comprends pas, j’ai 30% de non consentement et 50% des cas entre GA et mon back-office

Oui, il y a un problème quelque part. 

En réalité, vous avez dans ce cas un taux moyen de 20% de personnes à instant T qui n’ont peut être pas acheté ou achèteront plus tard. Il n’est pas fiable de comparer des transactions sur un mois et un taux de consentement à instant T.

On revient au problème d’écart de données entre le BO et GA. 

Ce qu’il faut retenir de tout cela :

  1. à ce stade les CMP sont surtout utilisées pour être en règle vis-à-vis de la CNIL
  2. en tant que responsable acquisition, il est important de pouvoir évaluer la capacité à pouvoir poser des questions à quelqu’un du côté de la CMP, à trouver les bonnes informations sur la plateforme, à comprendre ce que les chiffres impactent et ne pas s’en tenir à “j’ai 80% de consentement” 
  3. la personnalisation du design peut profondément impacter le taux de conversion (consentement)
  4. les analyses du consentement sont nécessaires pour identifier la part de trafic perdue et prendre les décisions nécessaires… à condition d’opter pour des études sur 6 mois plutôt que sur 1 mois 

La bonne nouvelle, c’est que l’on a 1 an d’historique désormais, ce qui rend les choses beaucoup plus fiables qu’au tout début. 

Nous vous conseillons aussi de ne pas forcément prendre de plateforme gratuite. Optez par exemple pour Didomi ou OneTrust