Blog Horizon

Feedburner, Technorati, Alexa: classement des meilleurs blogs en français

Archives pour 'Analyses, commentaires. réflexions' Mot clef

La “Longue Traîne” (”Long Tail”) du Web 2.0 francophone

Publié par Didier le 21st November 2006

Selon le livre de Chris Anderson, La Longue Traîne (”Long Tail”) est la courbe mathématique (distribution en loi de puissance) caractéristique du web 2.0 et de l’économie de l’abondance qui va avec.

Le schéma emblématique son ouvrage est celui-ci

longtail.jpg

Eh bien, il semble que cette distribution mathématique s’applique aussi au classement Blog Horizon des blogs et sites web 2.0 (rang en abscisse, nombre de blogs référents en ordonnée)

longtailfr.jpg

Ne trouvez-vous pas un air de famille entre ces 2 courbes?

Qu’est-ce que cela veut dire?

a) que la blogosphère francophone à son échelle réduite se comporte comme la blogosphère mondiale. Voir les 3 articles séminaux de Clay Shirky, Jason Kottke et Richard McManus sur le même graphique mais à l’échelon mondial. Ils donnent aussi des tonnes d’explications (les lois de puissance sur Internet tout entier, etc…) et de justifications très intéressantes.

b) que, en conséquence, le côté fractal de la Longue Traîne du Web 2.0 évoqué par C. Andersson est donc bien respecté pour la blogosphère française par rapport à sa grande sœur globale: elle suit une distribution des blogs référents très similaire

c) que ainsi que l’explique Clay Shirky “la liberté de choix rend les vedettes inévitables”: les premiers entrants dans la blogosphère française ont influencé les choix de lecture (donc de liens) de ceux qui les ont suivi pour former une répartition très inégale des liens. Henri en a aussi récemment fait la constatation dans son billet sur french20.fr “les blogs ayant la plus grande autorité sont les plus vieux blogs (presque normal)….ces blogs ont un historique d’articles importants (plus de 900 pour les top blogs)”

Clay Shirky dit dans son article que ce genre de distribution s’applique à toutes les dimensions d’analyse d’un système comme Internet ou la blogosphère: liens, trafic, revenus.

Pour les revenus, ce sera une dimension très difficile à mesurer ;-) Par contre, concernant le trafic, on va s’y intéresser prochainement!

Note: la courbe ci-dessus n’est pas une loi de puissance aussi pure que la théorie de la Longue Traîne ne l’annonce mais la similarité initiale était trop frappante pour ne pas l’évoquer dès maintenant! De plus, les prochaines corrections sur la partie gauche suite aux aberrations que vous avez signalées (merci Gilles, Cedric, Emanuel, Netwizz) devraient “redresser” cette courbe vers une véritable loi de puissance.


Publié dans Analyses, commentaires. réflexions | 2 commentaires »

Pourquoi Blog Horizon = des chiffres + 1 mashup

Publié par Didier le 19th November 2006

Avec mon ami Claude (qui se présentera ultérieurement), nous lançons aujourd’hui - sous forme d’un blog Wordpress - le site BlogHorizon.com dont le but est d’apporter des chiffres sur la blogosphère francophone au moment où sa structuration est en marche (voir SwissBlogPress, French20, etc..).

Ces chiffres sont publiés sur BlogHorizon pour l’instant sous forme d’un classement des 100 premiers blogs sur Technorati. Ce moteur classe purement suivant le nombre de liens. Nous suivons plus de 700 de ces blogs en français (France, Suisse, Belgique, Canada, Afrique, etc…) à ce moment.

Nous avons ajouté à Technorati une comparaison “live” avec Alexa (explication fouillée sur Dico du Net) qui base lui son classement sur le trafic (voir ci-dessous) des sites

L’actualisation de ces chiffres sera régulière par le fil RSS de BlogHorizon: nos logiciels qui tournent en permanence recalculent un classement basé sur de nouvelles informations Technorati toutes les 15 minutes. Nous pensons à ce moment republier un nouveau classement pour un taux de changement entre 5% et 10%: nous l’étalonnons encore afin que cela ne soit quand même pas trop fréquent.

Des billets de commentaires / analyses complèteront les chiffres bruts.

Pourquoi ce mashup BlogHorizon ? 2 raisons essentielles

Raison 1) Différents classements de la blogosphère francophone sont apparus depuis le mois de Septembre: celui d’Edelman, celui d’Alianzo . Les détails complets de leur fonctionnement précis manquent parfois. Blog Horizon se veut très simple dans la méthode : aucun “filtrage” à priori, le classement émerge des seuls chiffres Technorati qui donnent une vue certes partielle (voir ci-dessous) mais fiable sur ce qu’elle traite.

Pour maximiser la transparence, nous publions toutes les informations du classement Technorati qui nous permettent le classement: rang global sur le moteur, blogs référents, nombres de liens. Par ailleurs, pour expliquer les petites différences de nos chiffres avec ceux des moteurs “en live”, nous donnons les dates et heures de nos interrogations.

Ces divers Top100, Top200, etc… ont suscité beaucoup de commentaires et réflexions par exemple chez Loic LeMeur, Olivier Ertzscheid, Pierre Chappaz, Emanuel Parody ou encore Henri Labarre:

Malgré tout, on sent donc qu’il y a un besoin de chiffres même si ils ne donnent que des pistes aujourd’hui et pas forcémment “La Vérité”!

Raison 2) A titre personnel, cela fait un moment sur Media & Tech que je parle des mashups et du web2.0. En général, j’aime autant (plus ?!) faire que dire. D’où BlogHorizon!

Donc, le résultat est un mashup de 2 sources de données qui analysent le web et la blogosphère dans des directions différentes:

  • Technorati qui classe les sites à travers une vision statique: grâce aux liens (la “monnaie” du web 2.0) créés entre les billets. Il y a un billet sur BlogHorizon qui explique le système de classement Technorati. Ce classement Technorati est une vision très endogène de la blogosphère: à qui les blogueurs se lient-ils dans leurs billets. Rien sur leurs lecteurs!
  • Alexa, par contre qui classe les sites Internet (blogs et autres) en fonction du trafic qu’ils reçoivent à travers le panel constitué par les utilisateurs qui ont installé la toolbar Alexa.

Nous reviendrons ultérieurement en détails sur la validité précise de ce panel Alexa: la toolbar Axela est peu utilisée en Europe. C’est pour cela que le classement est établi selon Technorati. Mais, il a un immense avantage: il traite tous les sites de la planète d’une manière uniforme sans que ceux-ci n’aient rien à faire.

En utilisant les chiffres “Traffic Rank” Alexa, on peut donc voir la blogosphère d’un autre angle plus externe aux blogueurs : celui du trafic et de l’audience.

D’autres sources de données analytiques sont prévues au fil du temps dans Blog Horizon: plus d’Alexa, Google, Yahoo, etc…. Les imagettes de chaque blog viennent également d’Alexa.

Encore une fois, ces chiffres sont livrés bruts et sans filtrage.

Par contre, les sites des grands médias (Monde, Figaro, LCI, etc…) n’ont volontairement pas été inclus. Pensez-vous que nous devrions les inclure? Dans le même classement ou de manière séparée?

Par ailleurs, les plates-formes de blogs (u-blog, Bleublog, etc…) ont été laissées: elles aggrègent les liens de leur blog. Elles sont donc très haut placées: devons-nous les retirer?

Au moins pour un point, allez jetez un œil au premier classement publié: il met au 1er rang un jeune blogueur Fred de jeunz.org qui a été “zappé” par les autres classements. En chiffres bruts, c’est pourtant lui qui a le meilleur classement des blogs français sur Technorati: il est actuellement au rang 91 sur Technorati.

Nous ne connaissons, en langue française, que Le Monde qui soit mieux classé (place 18) sur Technorati.

Si vous voyez des trous dans notre classement, faites nous signe: les blogs correspondants seront ajoutés tout de suite!

Voilà, nous espérons que cette tentative d’éclairage de la blogosphère française vous intéressera. Nous allons lire tous vos billets sur le sujet avec beaucoup de curiosité …. et un peu d’angoisse quant à vos jugements!
Source: blog Media & Tech (par didier durand)


Publié dans Analyses, commentaires. réflexions | 18 commentaires »

Comment fonctionne le classement Technorati?

Publié par blog horizon le 18th November 2006

Un billet du blog Technorati explique l’algorithme utilisé par Technorati pour classer les dizaines de millions (> 58 millions à ce jour) de blogs qu’il surveille.

Pour chaque blog reconnu par son auteur via la procédure “Claim Blog”, Technorati présente les informations suivantes après avoir rentré l’URL du blog dans la ligne d’interrogation en haut de cette page (où www.bloghorizon est saisi):

Technorati Flashbox

Reprenons les points principaux du billet Technorati qui explique ces informations:

  1. Le rang (1′375 ici) est le nombre de blogs surveillés par Technorati ayant au moins le nombre de blogs (”blogs référents”) en fin de ligne (1′005 ici) qui font un lien vers eux
  2. en deuxième ligne, c’est le nombre de liens (1′919 ici) générés par ces blogs référents vers le blog classé. Seul les liens plus récents que 6 mois (180 jours) sont pris en compte afin de garantir que le blog classé est bien toujours dans la “Conversation actuelle” du web 2.0
  3. 1′005 représente donc le nombre de blogs qui pointent vers le blog classé
  4. 3′149 représente le nombre de liens connus par Technorati vers le blog classé depuis toujours. Ceux-ci englobent et dépassent la fenêtre de 180 jours évoquée plus haut

La fenêtre de 180 jours fait que le classement Technorati d’un blog peut monter ou descendre en fonction du nombre de liens qui ont pointé vers lui dans les 6 derniers mois

Fenêtre Technorati de 180 jours
Dans le cas ci-dessus, le blog suvi voit son classement augmenter car son nombre de blogs et de liens référents augmente visiblement: les liens dans la fenêtre rouge des 180 jours sont plus importants que dans la période précédente à gauche de la fenêtre.
Par contre, si l’auteur publie un billet très populaire, il fait massivement progresser le classement qui chute ensuite drastiquement quand cette pointe extraordinaire sort de la fenêtre des 180 jours qui délimite ensuite une zone normale d’activité du blog.
C’est le cas présenté ci-dessous:
Pointe extraordinaire de liens sort des 180 jours
Point complémetaire: si n blogs ont le même nombre de blogs référents, ils ont le même classement.


Publié dans Analyses, commentaires. réflexions | 3 commentaires »