Vous regardez votre rapport de contenu dans Google Analytics mais, tiens, surprise, la page dont vous souhaitez vérifier le taux de rebond et le nombre de visites apparaît plusieurs fois dans le rapport. Google Analytics voit double ? Triple ? Non. Votre outil de webanalyse fait son boulot, et affiche toutes les URL de votre site qui ont été consultées. Le problème, c'est que certaines visites ont peut-être été réalisées via des URL non-canoniques. Bien les gérer est souvent évoqué pour améliorer son référencement. Leur gestion est sous-estimée dans le cadre de la lecture des rapports Analytics. Pourtant, ces URL dupliquées polluent souvent vos rapports. Voici comment les faire disparaitre.
Qu'est-ce qu'une URL canonique ? C'est grave docteur ?
Les URL canoniques sont les URL que vous voulez que les moteurs de recherche et les visiteurs voient, concrètement, dans leur barre de navigation. C'est l'URL que vous communiquez à l'ami de Mountain View dans votre sitemap. Il est aujourd'hui très simple de déclarer sur chaque page l'URL canonique de celle-ci, c'est à dire son adresse exacte, unique, la seule qui doit faire foi aux yeux des moteurs. Pourtant, vous vous retrouvez fréquemment avec des URL étranges dans Google Analytics. Elles contiennent des variables, des signes de ponctuation, des "utm=campaign_?" ou encore du code qui ne vous dit rien. Comment est-ce possible ?Cela est lié à l'indexation d'URL de suivi, qui ne sont pas pensées pour les moteurs de recherche. Imaginons que vous ayez créé une URL avec des paramètres de suivi pour une campagne Facebook. Un lecteur reprend ce lien et le place sur son site, pour parler de vous. S'il copie l'URL avec les paramètres, alors il créer une seconde version, qui sera indexée, de l'URL de base. Voila comment une page peut être présente dans votre rapport de contenu sous plusieurs formes.
Nettoyer ses rapports de contenu en dé-dupliquant les URL non-canoniques
Google Analytics offre une option peu connue, qui vous permet de choisir les paramètres que vous voulez exclure.Prenons un exemple
- Si votre site utilise la structure de permalien WordPress par défaut qui se repose sur la variable p pour déterminer l'URL de la page, vous ne devez pas exclure le p car il est utilisé par le site pour déterminer une page au contenu unique. http://www.siteweb.com/p=123 est une page différente de http://www.siteweb.com/p=179.
- Si par contre sur votre site e-commerce, des paramètres permettent simplement de filtrer des données sur une page (comme le tri par prix ou le filtre par couleur) alors vous devez exclure ces variables de vos rapports de contenu. Si vous ne faites rien, une nouvelle URL pour la page est créée, mais il s'agit pourtant toujours de la même page, avec des données filtrées, simplement.
La solution consiste à réduire le nombre de lignes dans les rapports en dé-dupliquant les URL qui redirigent vers la même page. Vous avez deux possibilités : personnaliser les paramètres de la vue pour obtenir directement des rapports "propres" ou utiliser les segments pour modifier l'affichage des rapports.En effet, au niveau des paramètres d'une vue, Google Analytics vous offre la possibilité de définir une page par défaut afin que les urls monsite.fr et monsite.fr/index.html soient traitées comme une entrée unique. Vous pouvez également exclure les paramètres de requête de l'url de telle sorte que les urls monsite.fr?delta=2 et monsite.fr?delta=3 apparaissent dans les rapports sous la forme monsite.fr.