En anglais cela s'appelle des 'Tagclouds' et WikiPedia en donne la définition suivante : "Un nuage de mots est un affichage visuel des mots-clés (tags) contenus sur un site web"
Vous pouvez ainsi afficher un "pavé" contenant les mots clés contenus sur tel ou tel site (tel ou tel blog) lesquels s'afficheront avec une police d'autant plus grande que leurs occurences seront nombreuses.
Le service en ligne Tagclouds.com vous permet (après une inscription gratuite) de réaliser vos "nuages" à partir de n'importe quel fil RSS : vous pouvez même affiner en choisissant entre 100 et 250 le nombre de mots composant votre nuage ainsi qu'établir une liste de "stopwords", les mots que vous ne souhaitez pas voir figurer dans votre nuage.
Les applications ludiques sont nombreuses et des nuages peuvent être générés à partir de fils RSS existants mais aussi à partir des moteurs de recherche qui vous permettent de générer automatiquement des fils RSS sur telle ou telle requête (technorati par exemple, Jean l'a testé ici).
Autre exemple, voici ce que cela donne pour le fil de syndication d'affordance.
On peut aussi, si l'on est joueur, "gazéifier" des fichiers OPML. J'ai pris les 450 fils que je consulte le plus souvent dans mon aggrégateur et voilà le résultat (la dernière zone de l'URL indique le nombre de mots composant le nuage, vous pouvez la modifier à volonté)
Evidemment, chacun des mots de ces nuages est aussi un lien hypertexte renvoyant vers le billet, le site ou le résultat d'origine. Il s'agit donc là d'une clusterisation à la volée qui vous permet de vous faire vos champs lexicaux sur tel ou tel site et d'inclure ça au titre d'outil complémentaire dans un plan d'analyse, de veille ou de ce que vous voudrez.
Pour le côté poétique de la chose je vous conseille la lecture de ce billet (et plus généralement de ce blog) qui s'interroge sur les enjeux et les usages poétiques de ces nuages de tags et plus généralement des folksonomies, dans l'héritage des problématiques de la littérature et des fictions hypertextuelles. Le tout avec la tête dans les nuages :-)
En fait, je me suis inspiré de l'idée, que je trouve très belle, mais je ne passe pas par TagCloud et les fils RSS. Je me suis fait un petit outil "maison", qui me permet de générer mes nuages comme je veux (et par exemple sans qu'ils soient liés à l'analyse d'un site). Je le mettrai peut-être à disposition si j'ai le temps de le nettoyer un peu...
Sinon, TagCloud est une super idée, mais hélas conçu pour l'anglais et les essais que j'ai pu faire n'étaient pas très conluants sur les sites français (mots outils mal filtrés, etc.). A suivre...
Merci pour le lien vers TagPoetry!
Rédigé par : Jean Véronis | 19 oct 2005 à 20:56
Jean>
*"Je me suis fait un petit outil 'maison'" : je me disais aussi que tes nuages étaient plus "jolis"
*"Je le mettrai peut-être à disposition si j'ai le temps de le nettoyer un peu..." : ça c'est ce qu'on appelle du teasing ;-))
Effectivement l'analyse lexicale semble approximative pour le français (j'avoue ne pas avoir testé en anglais). Ceci étant, en prenant le temps de nettoyer via les listes de 'stop words' on arrive assez vite à de meilleurs résultats.
Rédigé par : olivier | 19 oct 2005 à 21:19
Olivier,
Vous aimez les nuages de mots et vous vouliez qu'on vous en signale d'autres.
Voici un type de nuage qui va être massivement consulté puisqu'il s'agit de la fonction "The Big Picture" du site américain CNet News.com. Un exemple avec leur article
Google's battle over library books
http://news.com.com/2104-1025_3-5907506.html?tag=st.bp
Evidemment, seuls les articles de CNet (+ les sujets et sociétés citées) sont représentés, avec les relations entre eux. C'est donc un peu maigre. Et puis, on ne voit qu'une partie des liens entre eux.
Rédigé par : Emmanuel Barthe | 04 déc 2005 à 17:28
J'ai oublié de préciser dans mon commentaire ci-dessus que la fonction Big Picture de CNet News.com ne résulte pas d'un "tagging" (affectation de mots-clés aux articles) mais apparemment des liens entre articles (et sociétés et sujets). Le résultat est cependant proche (pas identique) et pertinent. Une description de Big Picture se trouve là
http://news.com.com/2030-12_3-5843390.html
Cette fonction est "powered" par Liveplasma.com et fonctionne sous Macromedia Flash.
Rédigé par : Emmanuel Barthe | 04 déc 2005 à 17:56
Emmanuel> Merci. J'avais repéré l'interface de Cnet (cf les commentaires de ce billet : http://affordance.typepad.com/mon_weblog/2005/11/la_meilleure_bi.html)
C'est vrai qu'elle est davantage dans la catégorie des applications "touchgraph-like".
(http://www.touchgraph.com/). Vivement que nos grands quotidiens français s'inspirent de ce genre de choses en tout cas :-)
Rédigé par : olivier | 04 déc 2005 à 19:00