Si vous possédez un site internet et que vous analysez régulièrement vos rapports, vous avez sûrement dû voir apparaitre à un moment ou un autre du trafic SPAM sur votre site : des visites soudaines en provenances de site avec l'extension .xyz ou encore du trafic en provenance de sites tels que motherboard.vice.com.

Il s'agit de trafic SPAM, son objectif est de vous inciter à visiter le site en question, mais ce trafic n'a aucun intérêt et risque même de fausser vos données dans vos rapports Google Analytics.

Dans cet article, nous allons voir comment filtrer ce trafic afin qu'il n'apparaisse plus dans vos rapports.

Comment est généré le trafic SPAM ?

Avant toute chose, voyons comment est généré ce trafic SPAM.

Bien souvent, ce genre de trafic ne correspond pas à des visites réels de votre site (ce n'est pas un robot qui se rend sur votre site), c'est pour cela que vous ne trouverez aucune information concernant ce trafic dans vos logs. Les personnes souhaitant afficher un lien dans vos rapports Google Analytics se contentent de notifier la plateforme en utilisant votre Identifiant (UA-XXXXX-YY).

Pour ce faire, ils ont la possibilité d'ajouter votre code sur leur site, ou tout simplement d'effectuer des requêtes http vers Google Analytics en indiquant votre identifiant.

La bonne nouvelle est que Google Analytics est en mesure de détecter l'emplacement où se trouve le code, cette variable est le nom d'hôte (ou hostname en anglais). Nous avons donc la possibilité d'appliquer un filtre afin d'ignorer le trafic.

Rendons nous maintenant dans le rapport nous permettant de voir l'ensemble des noms d'hôtes ayant généré du trafic sur notre site, pour ce faire :

  • Rendez vous dans la section "Audience" de votre interface Google Analytics.
  • Sélectionnez le menu "Technologie".
  • Cliquez sur le rapport "Réseau".
  • Sélectionnez une dimension secondaire et choisissez "Noms d'hôtes".

Vous devriez observer un tableau similaire à celui ci :

Google Analytics SPAM hostname

Vous devriez maintenant être en mesure de voir l'ensemble des noms d'hôtes ayant enregistrés des vues. Si votre site est assujetti à du trafic SPAM, vous devriez observer de nombreux noms d'hôtes sur lesquels vous n'avez pas placer votre code.

Appliquer un filtre pour cacher le trafic SPAM.

Comme indiqué précédemment, il nous est possible de détecter la page où se trouve le code de tracking Google Analytics, nous avons donc la possibilité de filtrer le trafic afin d'afficher seulement le trafic généré a partir des noms d'hôtes autorisés (c'est à dire les emplacements où vous avez effectivement ajouté votre code de tracking), pour ce faire :

  • Rendez vous dans l'onglet Administration de Google Analytics
  • Sélectionnez la vue sur laquelle vous souhaitez appliquer le filtre. Il est fortement recommandé de laisser une vue sans aucun filtre, en effet, si vous faites une erreur lors de la configuration des filtres, les données seront définitivement perdues. Si votre propriété ne comporte qu'elle seule vue, créez en une nouvelle et appelez la par exemple "True Trafic".
  • Cliquez ensuite sur le lien "Filtres" dans le menu.
  • Cliquez sur le bouton "+ Ajouter un filtre".
  • Une fois dans l'interface de création d'un filtre :
    • Indiquez un nom pour votre filtre, par exemple, "Noms d'hôtes autorisés".
    • Sélectionnez le type de filtre "Personnalisé"
    • Sélectionnez le type "Inclure"
    • Dans la select, sélectionnez la valeur "Noms d'hôtes"
    • Dans le champ "Critère de filtrage", ajoutez l'ensemble des domaines sur lesquelles vous avez placé votre code Google Analytics, en les séparants par des |. Cela vous permet d'ajouter différents domaines (par exemple votre interface de paiement). Cependant si vous avez placé votre code uniquement sur votre site, il vous suffit d'entrer votre nom de domaine.
    • Cliquez sur "Vérifier le filtre", afin de voir l'impact de celui ci sur votre trafic.
    • Enfin cliquez sur le bouton "Enregistrer"
Filtre trafic SPAM analytics

Et voila, désormais seul le trafic en provenance des sites autorisés sera affiché dans vos rapports Google Analytics.

Bien que votre vue filtre la grande majorité du trafic SPAM, des petits malins arriveront à contourner ce filtre, vous devrez donc ajouter de nouvelles exclusions si les données reçues vous semble incorrectes, comme par exemple un champ langue mal formaté (par exemple "Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!")