Comment traquer le traffic des RSS?

Quand on veut mesurer l’efficacité d’une page web, on passe par différentes méthodes (logs serveurs, pixel, cookie, etc…

Mais que se passe t-il dans le cas des RSS ? Dans la mesure où ce sont simplement des flux XML, il n’y a pas de rendu direct du contenu du flux. Donc, pas moyen d’insérer un élément de suivi…

Le blog de Rok Hrastnik contient un article du mois d’août 2005 dans lequel il décrit plusieurs méthodes:

  • Utiliser une URL unique par abonné
  • Utiliser une authentification login/password
  • Utiliser un mécanisme de session ou de cookie dans le script qui génère le RSS (solution anonyme)

Rok Hrastnik évoque d’autres méthodes mais elle semblent basées sur des méthodes serveur avec un traitement BD supplémentaire.

Affaire à suivre puisque RSS est LE média qui connait la plus forte croissance en terme d’usage…

Visual Sciences présente le futur des stats Web

La société de Web Analytics « Visual Sciences » vient de faire un communiqué de presse (du 9 septembre) dans laquelle elle annonce son nouveau système de reporting de l’activité des sites Web de ses clients.
Continuer la lecture de « Visual Sciences présente le futur des stats Web »

Statistiques de site web

Quand on est webmaster, on aime bien savoir combien qui vient sur son site, quelles pages sont vues et combien de temps les visiteurs y passent.

3 technologies sont disponibles pour identifier ce traffic web et créer des rapports pleins de sens et d’explications rationelles:

  • Les logs de serveur Web
    Cette méthode se base sur l’analyse des fichiers de log du serveur Web.
    Chaque serveur Web écrit un fichier journal, ou log, qui consigne chacune des requêtes reçues par le serveur.
    Des programmes tiers comme Webtrends, Urchin ou AWstats analysent ces logs et en tirent des rapports.
  • Les « Web-beacons » ou « mouchards », basés sur Javascript et les cookies.
    Ces outils permettent de placer des marqueurs dans le code HTML d’une page Web et surtout, un appel à une image sur un serveur distant à qui on passe des informations destinées à traquer la page.Exemple:
    Sur mon site toto.com, ma page index.html à un intérêt capital et je veux enregistrer le nombre de fois ou cette page a été vue.
    Le site web (fictif) traquemapage.com offre un service de suivi de page qui s’active en plaçant dans ma page une image à l’adresse alambiquée.
    <img src="http://traquemapage.com/tracker/toto.com" height="1" width="1" />
    Ce code a pour effet d’insérer dans la page une image de la taille d’un pixel (transparent en général) et qui pointe en fait vers une application chez traquemapage.com.
    Cette application reconnait dans les paramètres de l’image que le domaine toto.com fait une demande de suivi de la page en question et enregistre une visite dans sa base de données.
    Par la suite, traquemapage.com offre sans doute une interface Web où des rapports de visites sont consultables, triés par page, par date, par pays, par navigateur Web, etc…Ce genre de système est propsé par des sites gratuits comme freestats.com.Par la suite, on trouve d’autres méthodes plus avancées (et payantes) comme celles proposées par les deux leaders du marché: Omniture et WebsideStory.Cette méthode permet d’ajouter à l’URL de requête de l’image une multitude de paramètres, en passant par Javascript.

    Exemple:
    on veut récupérer l’information sur le type de navigateur utilisé.

         // on recupere le nom du navigateur     var monNav =  navigator.appName;
    
    // on construit la chaine de la balise image qui contiendra l'appel distant à traquemapage.com
    
    var imagestring = '<img src="http://traquemapage.com/tracker/?domaine=toto.com&page=index.html&nav=' + monNav +'" height="1" width="1" />';     // on ecrit la balise image complete dans la page
    
    document.write(imagestring);

    De plus, le Javascript qui définit les éléments à traquer peut aussi écrire des cookies plus ou moins persistants pour identifier des visiteurs et des individus… suivant la politique de respect de la vie privée du site traqué!

  • Les technos dites « de 3ème génération », basées sur un module externe du navigateur (plug-in, ou autre).
    A priori, on passerait par des technos comme Flash , qui stockent des informations dans l’espace dédié à leur plug-in.
    Cela pose un problème de compatibilité, et un parti pris de l’installation d’un module additionel. Dans le cas de Flash, le parc mondial de navigateurs équipés du plug-in ne devrait pas poser de problèmes cela dit.