Statistiques, publicité et traking

Un petit billet technique pour exprimer un ras le bol face à l'évolution de certains sites web. En effet, on constate sur de plus en plus de site qui ont un peu de trafic un ralentissement au chargement des pages. En regardant de plus près, on découvre que ces sites ont tous au moins des marqueurs pour les statistiques, sinon des bannière ou des textes de publicité.

Evolution des bannières

Il y a quelques années, les premières bannière de publicité qui commençaient à apparaître sur les sites, posaient des problèmes à cause du poids des images qui les composaient. Avec la généralisation du haut débis, on pouvait s'attendre à ce que cet inconvénient disparaisse. Que néni, non seulement le poids des bannières a suivi la courbe d'augmentation du débit des connexions des internautes, remplaçant petit à petit les images fixes par des images animées, puis par des animations, mais maintenant se sont carrément des films avec le son qui vous rugis dans les haut parleurs lorsque vous affichez la page.

Principe du traking

En fait, que ce soit des publicité ou des marqueurs invisibles de statistiques, le principe est le même : on veux en savoir le plus possible sur vous. Le serveur de pub ou de stat va donc, s'il est poli, se contenter de demander à votre navigateur tout ce qu'il peut lui donner : type et version du navigateur, liste des plugins installés (flash, acrobat, quiktime, java...), la liste des langues supportées, la résolution de l'écran, le nombre de couleurs affichées, il enregistre également votre adresse ip qui permet de connaître dans certain cas votre localisation géographique (les plus fin sont au niveau de la ville). S'il est moins poli, il va renvoyé un objet embarqué dans la page de type flash ou java, qui va faire les tests complémentaires : votre bande passante notamment pour vous envoyer la plus grosse pub possible.

Tous ces sites de pub ou de stat étant communs à plusieurs sites, ils vont déposer un marqueur (cookie) pour tacher de retracer votre navigation sur le net. Et c'est là que ça commence à se corser. Certaines régies de publicité veulent cibler la pub qui s'affiche sur votre écran, donc en fonction des sites précédemment visité ou du contenu de la page que vous êtes en train de visiter, on cherchera à vous présenter une publicité sur le même sujet (ben oui, si vous cherchez de la doc sur les moteurs, c'est que vous vous intéressez aux voitures). Donc non seulement le site de pub enregistre des données, mais en plus il doit les ré-extraire, aller en chercher d'autres et les interpréter.

Si sur la page, vous avez une publicité qui fait tous ces traitements, vous vous doutez bien que cela va prendre quelques millisecondes de plus. Une page dynamique simple est générée en 30 à 100 ms, si elle est complexe, elle peut mettre 500ms. Lorsque le serveur rame parce qu'il est trop chargé, on dépasse les 2s. On se retrouve donc aux heures de pointe avec des pages qui sont ralenties, non pas par le serveur du site web que vous visitez qui aura construit sa page en 100ms, mais par les serveurs de statistiques ou de pub, qui mettent plusieurs centaines de millisecondes pour répondre. Vous multipliez par le nombre de pub et de marqueurs de statistique, et vous pouvez avoir une page qui met 2 à 4 secondes pour s'afficher alors que vous avez une bande passante se calculant en Méga/s (une page faisant entre 30 et 200 ko).

On se fait tous avoir

Je me suis moi-même fait avoir sur ce blog avec les marqueurs pour le référencement que j'ai mis à gauche, qui bloques le chargement de la page au premier affichage de la journée. Il sont donc vocation à virer de là, dès que je leur aurais trouvé une place où ils ne ralentissent plus la navigation dans ce blog.

Mais il n'y a pas que les pages des sites web. Les fils RSS aussi sont contaminés. En effet, pour savoir combien de personnes lisent le fils rss d'un blog et cliquent sur un lien, certain blogs ne donnent pas l'adresse direct des billet, mais une adresse de redirection qui produit le même genre de statistiques que les marqueurs ou pub. Et hop, encore 1/2 à 2s, à ajouter aux précédentes.

Le traking des internautes est en pleine explosion, malheureusement au dépend du confort de l'internaute, sans qu'il y gagne quoique ce soit. Tout le monde veut savoir qui vous êtes, moi aussi d'ailleur...

Partager Partager ce billet sur les réseaux sociaux

Commentaires

1. Le vendredi 19 janvier 2007, 13:01 par Jean-Marc Liotier

Si vous ne l'avez pas encore fait, courez installer Adblock Plus : adblockplus.org/fr/ - c'est réellement miraculeux, en particulier lorsqu'on utilise des listes de filtres telles que celles proposées à adblockplus.org/fr/subscr...

2. Le vendredi 19 janvier 2007, 20:17 par Cedric Augustin

Je ne doute pas qu'il existe de très bon produits qui inhibent spécifiquement les scripts des publicités ou des marqueurs de statistiques, cependant, cela ne résoud pas le problème énoncé. C'est une réponse individuelle, au même titre que les filtres anti spam dans les clients de messagerie permettent de survivre pour ceux qui reçoivent des centaines de mails par jour, mais ne suppriment absolument pas le problème du spam qui représente près de 85% du trafic mail.

Il faut se poser la question de la perte de confort dans la navigation sur internet pour "tout le monde", en effet ce phénomène est une perte de qualité globale de l'internet sans contre partie. Les investissement pour acroitre la bande passante sont immédiatement consommés en augmentant la taille des pubs et non l'utilisabilité des sites web.

3. Le samedi 20 janvier 2007, 00:17 par Jean-Marc Liotier

Je vous rejoins sur la nécessité de protéger les faibles aussi bien que les forts. Je ne m'en rendais pas compte pour le spam parce que j'ai pour moi même et mes utilisateurs des systèmes exceptionellement efficaces, mais les braves gens de Knujon m'ont ouvert les yeux. J'ai d'ailleurs écrit un billet à ce sujet il y a quelques jours : serendipity.ruwenzori.net...

Ceci dit, le problème du spam est avant tout la pollution ergonomique et sociale. En terme de consommation de ressources et notamment de bande passante il est tout à fait négligeable - et je parle en tant qu'administrateur d'un système de messagerie.

4. Le samedi 20 janvier 2007, 00:53 par Cedric Augustin

Je reconnais bien le langage de techos (dont je suis). Si techniquement, le spam représente quelques Mo, en revanche, il a un coût caché bien plus important que la simple bande passante :
* le système de messagerie n'est plus fiable, puisque de vrais messages peuvent passer en spam. Il y a donc perte de confiance.
* si l'on veut s'assurer qu'il n'y a pas de faux positif, il faut passer chaque jour au moins 5min à parcourir la centaine de spam, sans garantie de les récupérer. Au retour de vacance, c'est en heure que cela se compte.
* Il devient impossible d'utiliser un webmail.
* L'indicateur de message affiché dans la barre des taches est totalement inexploitable, donc on fini par l'ignorer, il faut parfois plusieurs heures pour répondre à un message, sans autre raison.
*Impossible de facilement communiqué par mailing au risque que les messages se retrouvent en spam et donc non lu.

Bien sûr ce n'est que mon expérience personnelle, et il existe quantité de moyens de réduire l'impact, mais c'est autant de coût de licence ou d'heures de configuration et maintenance pour quelque chose de totalement superflue.

Il en est de même pour l'installation des anti spam, anti popup, anti pub... qui doivent tous êtres installés et configurés. Si vous êtes admin, combien cela représente-t-il d'heure par poste, multiplié par le nombre de poste ?

Ajouter un commentaire

Le code HTML est affiché comme du texte et les adresses web sont automatiquement transformées.

Fil des commentaires de ce billet