Depuis le début du mois de novembre 2016, nous sommes nombreux à remarquer une nouvelle vague de Spam Google Analytics. Plus précisément des spams de langue.
Dans ce tuto, nous verrons ce dont il s'agit, comment cela se produit et le plus important : comment protéger et nettoyer vos comptes Google Analytics. Ce Spam est apparu le 8 novembre 2016, en pleine période d'élections présidentielles aux USA, et il contient le message suivant :
Secret.ɢoogle.com You are invited! Enter only with this ticket URL. Copy it. Vote for Trump!
Ce texte apparait dans le bloc d'ordinaire réservé aux informations concernant les langues. Ces informations sont envoyées automatiquement à Google Analytics par la plupart des navigateurs web sous forme d’abréviations telles que "fr", "fr-fr", "en-us", etc. ( voir capture d'écran ci-dessous)
Le tout est souvent combiné à des referrals, ayant de multiples Sources comme abc.xyz, brateg.xyz, budilneg.xyz, begalka.xyz, bezlimitko.xyz, bukleteg.xyz, boltalko.xyz, biteg.xyz et d'autres encore.
[rule style="rule-thin" ]
(MAJ du 8 décembre 2016) : Le spam utilise maintenant le referral “motherboard.vice.com“ et la langue “o-o-8-o-o.com search shell is much better than google!“. Notre solution anti-spam continue de fonctionner correctement et aurait prévenu le spam si vous l'aviez déployée auparavant.
(MAJ du 4 décembre 2016) : le spam a diversifié la source de ses referrals dont : “lifehacĸer.com“, “addons.mozilla.org“,“webmasters.stackexchange.com“, “thenextweb.com“ et “reddit.com”. Toutes les solutions présentées dans ce tuto fonctionnent parfaitement contre ces spams.
Comment retirer le Spam de Langue Google Analytics ?
A savoir - une fois enregistré par Google Analytics, il est impossible de changer ou éditer les données. Il n'y a donc aucun moyen d'effacer définitivement ces sessions de votre rapport (ça craint, je sais). Ne baissez pas la tête trop vite, il y'a 2 choses que vous pouvez tout de même faire :
- Empêcher le spam d'infecter vos rapports à compter de maintenant
- Filtrer le spam de vos rapports en utilisant des segments avancés
La première solution est un changement permanent de vos “Vues“ Googles Analytics et s'applique dès que vous la mettez en place.
La seconde est plus flexible et rétroactive. Cependant il faudra ajouter manuellement à chacun de vos rapports le segment avancé créé.
Part 1 - Bloquer le Spam avec un Filtre de Vue
Le Filtre que je propose va filtrer le trafic associé aux Langues contenant 15 caractères ou plus. La pratique montre que les langues renvoyées par les navigateurs comportent généralement 5-6 caractères, et plus rarement 8-9 caractères. Ce qui filtrera uniquement les langues considérées comme spam.
En plus de cela, certains symboles sont invalides pour le champs de langue et peuvent être utilisés pour construire un nom de domaine et donc exclue volontairement (par exemple : “secret,google,com“ ou “secret!google!com“).
Ajouter un Filtre à une Vue est plutôt simple. Rendez-vous dans Administration > Section VUE > Filtres > Bouton "Ajouter un filtre"
L'expression à utiliser sera la suivante :
.{15,}|\s[^\s]*\s|\.|,|\!|\/
Commencez par créer un filtre nommé "Exclure Spam de Langue" comme ci-dessous :
Assurez-vous de bien avoir réglé le Champ de filtrage sur "Paramètres de langue". Vous pouvez ensuite "Vérifier le filtre" plus bas dans la page pour voir l'influence qu'il aurait eu sur les données des jours précédents. N'oubliez pas d' enregistrer.
Si le message suivant s'affiche, pas de panique, cela ne remet pas du tout en question l'efficacité du filtre : Ce filtre n'aurait eu aucun impact sur vos données. Soit sa configuration n'est pas correcte, soit l'ensemble de données échantillonnées est insuffisant.
Part 2 - Filtrer l'historique du Spam grâce à un Segment Avancé
Les filtres de vues (voir Part 1) ne sont pas rétroactifs. Ils commencent à être actifs à partir du moment ou vous les avez mis en place. Pour retrouver des données propres, sans spam de langue, la meilleure solution est d'utiliser des segment personnalisés.
Rendez-vous dans Administration > Section VUE > Segments > Bouton "Nouveau Segment"
Voici un segment personnalisé pour filtrer le fameux spam secret.ɢoogle.com mais aussi tout autre futur spam de langue Google Analytics :
Une fois configuré, sauvegardez le segment. Vous pouvez ensuite l'ajouter à vos rapports Google Analytics en cliquant sur le + comme ci-dessous :
Est-ce que ce sera le premier ET le dernier type de spam de langue dans Google Analytics que nous allons voir ? Il est un peu trop tôt pour le dire étant donné que nous sommes actuellement au milieu de la vague. Toutefois, en mettant en œuvre les conseils ci-dessus, vous serez protégé de la plupart des spams de langue à venir, et pas seulement du spam "secret.google.com ...".
Des informations très utiles, excellent travail.