Blog Horizon

Feedburner, Technorati, Alexa: classement des meilleurs blogs en français

Pourquoi Blog Horizon = des chiffres + 1 mashup

Publié par Didier le Sunday 19. November 2006

Avec mon ami Claude (qui se présentera ultérieurement), nous lançons aujourd’hui - sous forme d’un blog Wordpress - le site BlogHorizon.com dont le but est d’apporter des chiffres sur la blogosphère francophone au moment où sa structuration est en marche (voir SwissBlogPress, French20, etc..).

Ces chiffres sont publiés sur BlogHorizon pour l’instant sous forme d’un classement des 100 premiers blogs sur Technorati. Ce moteur classe purement suivant le nombre de liens. Nous suivons plus de 700 de ces blogs en français (France, Suisse, Belgique, Canada, Afrique, etc…) à ce moment.

Nous avons ajouté à Technorati une comparaison “live” avec Alexa (explication fouillée sur Dico du Net) qui base lui son classement sur le trafic (voir ci-dessous) des sites

L’actualisation de ces chiffres sera régulière par le fil RSS de BlogHorizon: nos logiciels qui tournent en permanence recalculent un classement basé sur de nouvelles informations Technorati toutes les 15 minutes. Nous pensons à ce moment republier un nouveau classement pour un taux de changement entre 5% et 10%: nous l’étalonnons encore afin que cela ne soit quand même pas trop fréquent.

Des billets de commentaires / analyses complèteront les chiffres bruts.

Pourquoi ce mashup BlogHorizon ? 2 raisons essentielles

Raison 1) Différents classements de la blogosphère francophone sont apparus depuis le mois de Septembre: celui d’Edelman, celui d’Alianzo . Les détails complets de leur fonctionnement précis manquent parfois. Blog Horizon se veut très simple dans la méthode : aucun “filtrage” à priori, le classement émerge des seuls chiffres Technorati qui donnent une vue certes partielle (voir ci-dessous) mais fiable sur ce qu’elle traite.

Pour maximiser la transparence, nous publions toutes les informations du classement Technorati qui nous permettent le classement: rang global sur le moteur, blogs référents, nombres de liens. Par ailleurs, pour expliquer les petites différences de nos chiffres avec ceux des moteurs “en live”, nous donnons les dates et heures de nos interrogations.

Ces divers Top100, Top200, etc… ont suscité beaucoup de commentaires et réflexions par exemple chez Loic LeMeur, Olivier Ertzscheid, Pierre Chappaz, Emanuel Parody ou encore Henri Labarre:

Malgré tout, on sent donc qu’il y a un besoin de chiffres même si ils ne donnent que des pistes aujourd’hui et pas forcémment “La Vérité”!

Raison 2) A titre personnel, cela fait un moment sur Media & Tech que je parle des mashups et du web2.0. En général, j’aime autant (plus ?!) faire que dire. D’où BlogHorizon!

Donc, le résultat est un mashup de 2 sources de données qui analysent le web et la blogosphère dans des directions différentes:

  • Technorati qui classe les sites à travers une vision statique: grâce aux liens (la “monnaie” du web 2.0) créés entre les billets. Il y a un billet sur BlogHorizon qui explique le système de classement Technorati. Ce classement Technorati est une vision très endogène de la blogosphère: à qui les blogueurs se lient-ils dans leurs billets. Rien sur leurs lecteurs!
  • Alexa, par contre qui classe les sites Internet (blogs et autres) en fonction du trafic qu’ils reçoivent à travers le panel constitué par les utilisateurs qui ont installé la toolbar Alexa.

Nous reviendrons ultérieurement en détails sur la validité précise de ce panel Alexa: la toolbar Axela est peu utilisée en Europe. C’est pour cela que le classement est établi selon Technorati. Mais, il a un immense avantage: il traite tous les sites de la planète d’une manière uniforme sans que ceux-ci n’aient rien à faire.

En utilisant les chiffres “Traffic Rank” Alexa, on peut donc voir la blogosphère d’un autre angle plus externe aux blogueurs : celui du trafic et de l’audience.

D’autres sources de données analytiques sont prévues au fil du temps dans Blog Horizon: plus d’Alexa, Google, Yahoo, etc…. Les imagettes de chaque blog viennent également d’Alexa.

Encore une fois, ces chiffres sont livrés bruts et sans filtrage.

Par contre, les sites des grands médias (Monde, Figaro, LCI, etc…) n’ont volontairement pas été inclus. Pensez-vous que nous devrions les inclure? Dans le même classement ou de manière séparée?

Par ailleurs, les plates-formes de blogs (u-blog, Bleublog, etc…) ont été laissées: elles aggrègent les liens de leur blog. Elles sont donc très haut placées: devons-nous les retirer?

Au moins pour un point, allez jetez un œil au premier classement publié: il met au 1er rang un jeune blogueur Fred de jeunz.org qui a été “zappé” par les autres classements. En chiffres bruts, c’est pourtant lui qui a le meilleur classement des blogs français sur Technorati: il est actuellement au rang 91 sur Technorati.

Nous ne connaissons, en langue française, que Le Monde qui soit mieux classé (place 18) sur Technorati.

Si vous voyez des trous dans notre classement, faites nous signe: les blogs correspondants seront ajoutés tout de suite!

Voilà, nous espérons que cette tentative d’éclairage de la blogosphère française vous intéressera. Nous allons lire tous vos billets sur le sujet avec beaucoup de curiosité …. et un peu d’angoisse quant à vos jugements!
Source: blog Media & Tech (par didier durand)


where to buy viagrasell viagra onlineorder forms for buying viagrageneric viagra purchasebuy generic viagra american expressdiscount viagra pill salecheap generic viagra substitutebuy viagra online get prescriptionbuy sublingual viagra onlinebuy viagra us pharmacybillig viagrabest buy online price viagrawhat is cialisindian cialis pillsbuy cialis without credit cardcialis sale ukorder cialis lowest pricebest erectile dysfunction pillbuy generic cialis pillsbuy cialis huge discounts onlinebuy cialis drug online rxbuy 10 mg cialisbrand cialis for salebest generic cialis pills pricediscount cialis super activecialis super active onlinelevitra professional prescriptionlevitra professional onlineviagra super active pricecheap viagra super activelevitra free shippingbuy levitrageneric cialis prescriptionbuy generic cialiscialis tabscheap cialis soft tabsdiscount brand viagrabrand viagra onlinegeneric viagra no prescriptioncheap generic viagradiscount cialischeap cialiscialis professional prescriptioncialis professionalorder viagra soft tabsviagra soft tabsbuy cheap viagraviagraviagra professional free shippingviagra professional onlineorder levitrabuy levitraorder vpxlbuy vpxlorder cialis super activebuy cialis super activeorder viagra super activebuy viagra super activebuy cialis professionalorder cialis professionalorder viagra professionalbuy viagra professionalorder generic cialisbuy generic cialisorder cialis onlinebuy cialis onlineorder generic viagrabuy generic viagraorder viagra onlinebuy viagra onlineorder levitrabuy levitraorder viagrabuy viagradiscount ciprociproomnicef pricebuy omnicefaugmentin pricebuy augmentindiscount zoloftbuy zoloftorder prednisolonebuy prednisoloneventolin prescriptionventolindiscount elavilelavilnolvadex pricecheap nolvadexcytotec discountcytotec onlineavodart discountavodart onlineorder cialis professinalbuy cialis professionalorder viagra professinal onlinebuy viagra professional onlineorder viagra onlinebuy viagra onlineorder cialis onlinebuy cialis onlineorder levitra onlinebuy levitra onlineorder propecia onlinebuy propecia onlineorder kamagraorder viagra super activebuy viagra super active onlinebuy cialis soft tabsorder cialis soft tabsorder viagra soft tabsbuy viagra soft tabs

18 commentaires à “Pourquoi Blog Horizon = des chiffres + 1 mashup”

  1. GuiM Weblog écrit:

    Blog Horizon : classement de la blogosph…

    Un autre classement de la blogosphère en français… Blog Horizon #1 (19 Novembre 2006) - Classement Technorati des meilleurs blogs francophones Avec mon ami Claude (qui se présentera ultérieurement), nous lançons aujourd’hui - sous forme d’un…

  2. Gilles Klein écrit:

    Pas compris pourquoi vous Jeunz en tête de ce classement. Sauf erreur de ma part, il ne s’agit pas d’un blog mais d’une plateforme de blog ?

  3. blog horizon écrit:

    Bonjour Gilles,

    Il me semble que jeunz.org est un blog perso, celui de Fred l’admin de la plate-forme http://www.jeunz.fr/blog-gratuit/index.php

    A ce titre, il est très légitimement tout en haut du classement (comme dit, j’hésite pour d’autres plates-formes qui suivent: bleublog, u-blog, etc…

    Ai-je tort?

  4. cedric écrit:

    Comme indiqué ailleurs mais pas de réponse je reposte ici. Jeunz est un blog perso certes mais c’est surtout le blog de la plate forme et du coup un lien est présent sur tous les sites de celle-ci… Sa position dans le classement est donc complètement biaisée !!

  5. blog horizon écrit:

    Bonjour Cédric,

    Je n’avais pas vu ceci: merci de l’info.

    Je vais voir comment traiter le cas pour perfectionner le classement. Si vous en voyez d’autres, n’hésitez pas!

  6. AccessOWeb le Blog écrit:

    Classement des blogs Francophones…

    Après Edelman et Alianzo, c’est maintenant au tour de Bloghorizon de nous donner son classement. Celui-ci est uniquement basé sur le rank de Technorati. On peut également y voir une comparaison avec le rank Alexa. Plus d’explications sur……

  7. JF Ruiz écrit:

    Encore un classement “biasé” comme le souligne cédric.

    Pour moi le classement le plus pertinent cela resterait celui du nombre d’abonné au blog. Faire des liens c’est très facile, avoir une audience c’est pas pareil.

    Donc pour moi un classement intéressant ca serait plus un truc dans le genre de celui là : http://www.ziki.com/people?ziki_order=audience

  8. blog horizon écrit:

    Bonjour Jean-François,

    Il y a effectivement des biais aussi à mon goût: je l’ai signalé dans le billet initial ci-dessus. J’attends juste les réactions pour voir combien considèrent cela comme aussi comme un biais avant de traiter.

    Sinon pour le nombre d’abonnés, on y travaille activement: à suivre tout bientôt…

  9. David Castéra écrit:

    connaitre le nombre d’abonné à un blog me parait assez compliqué même en croisant les multiples sources (feedburner, bloglines, google etc…) d’autant que de nombreux blogs n’ont pas de mesure d’audoence de le fil RSS, je pense aux blogs sous dotclear par exemple qui n’utilisent pas forcément Feedburner ou Xfruits.

    Sans parler des plugins newsletter dont il est impossible de connaitre l’audience si ce n’ets via le propriétaire du site…

    Bref, toutes tentatives de classement des blogs est vouée, sinon à l’échec, du moins à la contestation ;)

    Mais bon, classez classez, il en restera toujours quelque chose…

  10. blog horizon écrit:

    Bonjour David,

    C’est très vrai que l’on part de loin mais je suis sûr qu’il y a un besoin. Il faudra juste être opiniâtre mais, bon, je suis assez tenace de nature.

  11. David Castéra écrit:

    Didier, je ne conteste pas le besoin d’un tel outil de classement. Mais je crois que les critères sont encore à inventer, les technorati, alexa, feedburner et consorts ne donnant qu’une idée approximative de la composition de la blogosphère.

    En tous cas, bonne chance.

  12. Didier écrit:

    Bonjour David,

    Bien d’accord que tout est à inventer: c’est le but. Pour l’instant, je pars avec ce qui existe pour expérimenter. Espérons que la panoplie se complètera et s’affinera en chemin…

    merci des encouragements!

  13. Jean-Luc écrit:

    Et pourquoi ne pas permettre à chacun de composer son propre mashup ?

    A partir du moment où les critères sont clairement affichés, cela éviterait toutes ces discussions stériles (car sans fin) : suivant ces critères appliqués à telles données on obtient tel classement, c’est tout, cela vaut ce que ça vaut mais il n’y pas à ergoter sur la confection.

    Ce ne devrait pas être à BlogHorizon de trancher si les sites des médias, ceux des plateformes de blogs ou des webzines pros doivent figurer ou non dans le classement. Il serait plus logique que BlogHorizon nous fournisse, par exemple au stade actuel, le classement Technorati des sites remplissant ou non les critères suivants :
    - francophone (est-ce une distinction opérée par Technorati ?)
    - français (si c’est possible)
    - tous sites surveillés par Technorati confondus
    - à l’exclusion des sites de médias
    - à l’exclusion des sites corporate des plateformes de blogs (y compris de leurs responsables)
    - à l’exclusion des sites professionnels
    - par catégories (tags privés ou publics, cf blogmarks), en sélection ou exclusion
    - etc.

    Puisque le rank de’Alexia est rapporté, mais sans aucune incidence pour l’heure, on devrait pouvoir constituer notre propre formule de mashup en définissant les coefficients de pondération pour chaque rank, par exemple 50/50% (sauf que le rank Alexia n’étant pas très pertinent pour les sites francophones, on pourrait le minorer singulièrement - en fait, il faudrait tester pour affiner la bonne formule, suivant les préoccupations et l’expérience de chacun).

    Et ainsi de suite en multipliant les sources d’infos et les angles d’analyse : le traffic, les abonnés (mais sources très relatives et un critère pertinent que pour certains sites comme celui de JF), les liens sortants, l’ancienneté des sites, la fréquence de publication, le nombre de commentaires, le ratio nb de commentaires / articles, etc. suivant ce qu’il sera possible d’intégrer et de formuler.

    L’important, c’est qu’il soit possible de déterminer les critères et les formules d’extraction et que ces éléments figurent clairement avec le classement ainsi opéré.

  14. Didier écrit:

    Bonjour Jean-Luc,

    L’idée est bonne!

    Sur le fond, vous semblez suggérer que je mette mes chiffres bruts à disposition pour que chacun refasse ses mashups et propres formules de calcul par dessus.

    Juste? Merci d’avance de me guider encore sur le sujet.

  15. Jean-Luc écrit:

    Pour être plus précis, je suggère que vous nous mettiez ceci en place et à disposition ! Je n’ai en effet aucune vocation à me lancer dans une telle aventure. En revanche, si un site m’offrait cette ressource cela pourrait changer la donne.

    Jusqu’à présent, je ne m’intéressais pas à ces sources de ranking pour la bonne raison que la plupart du temps elles vous livrent une valeur brute que vous ne pouvez comparer avec ce que vous voulez (quand vous parvenez à comprendre de quoi il s’agit !). On voit par exemple souvent affichée la valeur de BlogInfluence sur les sites alors qu’elle ne présente aucun intérêt considérée isolément. Ce qui serait intéressant ce serait de pouvoir la comparer avec d’autres sites qui “comptent” pour nous, suivant nos préoccupations.

    Vous permettez déjà de comparer 100 sites francophones sur cet index Technorati (celui d’Alexia n’étant qu’indicatif).

    Ce qui a retenu mon attention dans votre approche, c’est que vous vous proposez d’opérer en toute transparence de vos sources et de vos critères. Mais en fait on ignore comment vous avez ressortis les 100 “blogs” à partir des sites scannés par Technorati, donc sur la base des 15.000 premiers sites si on observe le rank du 100ème blog francophone ! Est-ce que Technorati vous permet de filtrer par catégories comme sur Alexa, par exemple pour les sites Top > World > Français > http://www.alexa.com/browse?&CategoryID=476 ? Et comment avez-vous opéré ensuite pour écarter les sites francophones qui ne sont pas des blogs ? On a le sentiment que vous avez procédé à une pré-sélection, la constitution d’une première base, que vous pensez affiner progressivement, notamment par les observations des internautes, mais plus par une analyse systématique des 15.000 premiers sites classés par Technorati.

    Il serait pourtant déterminant de pouvoir formuler sur la base la plus exhaustive possible des sites surveillés par Technorati :
    > option par défaut
    - en langue française
    > autres options
    - à l’exclusion des sites de média
    - à l’exclusion des sites corporate des plateformes de blogs (y compris de leurs responsables)
    - à l’exclusion des sites professionnels
    - par catégories (tags privés ou publics, cf blogmarks), en sélection ou exclusion
    - etc.
    Je ne sais pas si vous pouvez exploiter des catégories ou tags existants et comment peuvent être affectés les sites par rapport à ces catégories mais l’idée c’est que l’on puisse savoir ce qu’elles recouvrent, quels sites sont concernés, et que l’on puisse toujours sélectionner/déselectionner un site particulier (avec une case à cocher au niveau de chaque site, l’option individuelle primant sur l’option globale). On pourrait ainsi imaginer choisir d’exclure d’une sélection de base tous les sites de média traditionnels mais d’en retenir tout de même un “de référence” pour situer notre résultat. On pourrait aussi imaginer une sélection tout à fait individuelle, les sites de notre choix (comme sur Alexia on peut comparer 5 sites au choix, sur le même diagramme).

    Une fois qu’on a défini un panel de départ au travers le site (qui enregistre et affiche les critères observés), il reste à préciser sur quels facteurs on va réaliser le classement : liens entrants ou traffic uniquement, ou un mixed, voire d’autres facteurs que le site pourra intégrer/proposer, chacun étant affectable d’un coefficient de pondération (maxi de la formule globale = 100% bien entendu !).

    Si le résultat convient, le site permet de sauvegarder les critères de sélection et la factorisation du classement. A définir aussi les conditions sous lesquelles le classement obtenu pourrait rester d’un accès privé (peut-être la base d’un business model ?), sinon il serait public.

    N’étant absolument pas “ingénieur”, j’ignore ce que cela représente en développement pour la mise en oeuvre. Je ne prétends donc pas vous guider en quoi que ce soit, comme vous m’y invitiez : je spécule seulement à partir de ce que je découvre. J’espère ne pas trop m’égarer ! J’ai essayé de m’en tenir aux deux sources de données initiales pour déjà un peu projeter…

  16. cedric écrit:

    Juste des remarques comme ca en passant encore.

    Didier quand tu dis “il y a tout à inventer” => c’est entièrement vrai mais du coup quel boulot ! ;-)

    Sinon, de ce que j’en lis et du peu que j’en sais, alexa est vraiment critiqué car il ne donne qu’une estimation et celle-ci est très souvent faussée…

    Il y a des blogs très bien classés aussi parce qu’ils ont beaucoup de liens entrant car ces liens sont placés automatiquement (genre design par … thèm édité par…) Si je ne remet pas en cause la qualité de leurs auteurs, je me demande comment prendre cela en compte dans un classement.

    L’idée de croiser le plus de classements différents serait à mon sens la meilleure idée. J’vais moi même fait ce travail en croisant le classement edelman + alianzo + le classement de ziki (qui donnait par hits, lecteurs, et technorati) et cela avait déjà donné quelque chose de bien. Pourquoi aussi ne pas aller voir si mybloglog ne peut pas fournir des données. J’ai l’impression que c’est de plus en plus répandu donc cela fairait un classement assez fidèle non ?

    Voilà c’est tout pour ce matin ;-)

  17. cedric écrit:

    Et encore une remarque tiens, j’y pensais justement sur mon vélo (pour la précisionde la chose).
    Ce qu’il serait intéressant de faire aussi ce serait une sorte de “brand recall” pour les blogs. c’est à dire une sorte d’enquêtes ou les gens diraient juste, en voyant le nom du blog ou son design s’ils le connaissent, s’ils en ont juste entendu parlé, s’ils sont déjà passés dessus…
    Ce serait un moyen pas mal pour voir la portée ce dertains blogs…
    Mais se serait une étude très très compliquée et longue ca c’est clair !

  18. Didier écrit:

    Salut Cédric,

    Là, ce que tu proposes, c’est effectivement beaucoup de boulot…

Laissez une réponse

XHTML: Vous pouvez utiliser ces tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <code> <em> <i> <strike> <strong>