Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Twitter : le hiératique contre le hiérarchique.

Le monde comme il Twitte.
J'utilise Twitter depuis quelques mois. Je n'ai encore pas publié de billet au sujet de ce "nouveau" moyen de communication "temps réel", mais la blogosphère regorge d'analyses sur le phénomène emblématique de la statusphère. Comme pour la dernière "killer-app" rapidement érigée en phénomène de société (il s'agissait de Facebook), on spécule aujourd'hui autour de Twitter, tantôt annoncé comme "révolutionnant l'information", tantôt devant être racheté par Facebook ou Google, tantôt nouveau héraut de la figure du pro-am. Par ailleurs, aujourd'hui tout le monde est "sur" Twitter : des ministères, des administrations des politiques, des universités, des profs (les "tweeatchers"), des étudiants, des journaux, des journalistes ... (sur la dimension académique de Twitter, voir la diapo 39 de mon intervention aux RPIST).
Twitt à Saint-Tropez.
Le monde se twiterrise et Le Monde rend compte de la twitterisation du monde. Pas une catastrophe, pas un séisme, pas un crash d'avion, pas un scandale, pas une élection politique, qui ne soit d'abord révélés et relayés "sur" Twitter. Dernier séisme en date, la mort de M.Jackson qui faillit à elle seule faire s'effondrer les serveurs de la planète (ceux de Google en tête, ce dernier croyant être victime d'une attaque devant la multiplication des requêtes et des twitts sur MJ).
WTF. Wikipédia, Twitter, Facebook : What the fuck ?
De Wikipédia (pilier d'une révolution cognitive, d'un nouveau rapport au savoir) à Facebook (pilier d'une révolution de l'intime, d'un nouveau rapport à notre "identité" en ce qu'elle à d'intime, de public et de privé), de Wikipédia à Facebook il manquait un élément. Celui d'une primo-conversation, une conversation essentielle, planétaire, synchrone, instantannée. Au mieux comme une gigantesque iségoria, au pire comme un aliénant café du commerce. La première victoire de Twitter, c'est d'être devenu (comme Wikipédia et Facebook), un révélateur. Un "corpus", un sujet d'étude scientifique. WTF sont autant de moyens pour les chercheurs (en sciences sociales notamment) de sonder le monde, de disposer d'un formidable terrain d'expérimentation pour qualifier les changements en cours de l'ère numérique. L'une des dernières études scientifiques sur Twitter est celle menée par deux étudiants de Harvard, étude à partir de laquelle Jean-Michel Salaun a bien souligne les effets d'écho entre les usages de Twitter et ceux de Wikipédia, notamment le fait que "la répartition des contributions sur Twitter est plus concentrée que sur Wikipédia, même si Wikipédia n'est pas un outil de communications. Ceci implique que Twitter ressemble plus à un outil de publication unidirectionnel qu'à un réseau de communication pair à pair."
De la hiérarchie à l'hétérarchie.
L'information est brute. Les industries de l'information ont pour métier d'y mettre de l'ordre, par le biais de l'angle choisi pour les "sujets" et par les "choix" éditoriaux. Bref l'industrie de l'information tout entière (de la presse magazine aux moteurs de recherche) est d'abord une industrie de la hiérarchisation.
Avec Twitter, ce qui domine de prime abord c'est l'aspect profondément hétérarchique, à plat, de l'information qui y circule. On parle d'hétérarchie à partir du moment où, dans une organisation, il n'y a pas de "niveau supérieur". C'est Warrren Mc Culloch, l’un des premiers cybernéticiens, qui avait créé ce terme pour décrire certains programmes informatiques. Twitter est donc, de prime abord, une hétérarchie : pas d'éditorialisation, pas de "niveau supérieur" de l'information. Donc, Twitter est littéralement illisible. Parce que sa nature est précisément de ne pas vouloir "mettre en ordre". De ne pas vouloir hiérarchiser. Et pourtant Twitter est lu. Lu par la planète entière et notamment par les médias de l'industrie de la hiérarchisation qui y puisent informations, faits, témoignages, alertes, signaux.
Quel est l'ordre de Twitter ?
Si Twitter est lu (et utilisé) par chacun d'entre nous c'est parce qu'il est néanmoins capable de briser son hétérarchie pour lui donner de la profondeur, et pour se servir de cette profondeur comme d'une hiérarchie. La plupart des medias sociaux utilisent une technique d'éditorialisation déjà largement théorisée en informatique et en sciences sociales : il s'agit de celle du filtrage collaboratif. Les moyens et les instanciations de cette technique sont innombrabbles mais son mécanisme est immuable : on agence l'information, on construit collectivement les hiérarchies éditoriales en fonction du nombre de votes (ou de liens, ou de signalements, ou de mots-clés, ou de folksonomies, ou de Hashtags) vers cette information à l'intérieur d'une communauté d'usage, et ce de manière dynamique (ré-agencement perpétuel) ou statique (à un moment donné). Le filtrage collaboratif, très utilisé notamment dans des systèmes d'information "clôts" (en entreprise par exemple) a changé de nature dès qu'il s'est retrouvé sur le web, et ouvert à des communautés pouvant compter plusieurs millions de membres. Mais revenons à Twitter. L'éditorialisation de Twitter, son filtrage collaboratif, sa profondeur hiérarchique, c'est la capacité que nous avons de construire notre communauté de Followers (littéralement suiveurs) et de décider nous-mêmes des personnes ou des thèmes que nous voulons suivre. C'est là le seul moyen de garder le contrôle et de n'être pas totalement submergé par le flot flux. Mais on le voit, il ne s'agit pas réellement de hiérarchisation (qui s'appuie sur une verticalité) mais plutôt de périphérie, d'horizontalité du cercle de suivants/suiveurs dont et avec lesquels nous décidons de tenir conversation.
De l'hétérarchie au hiéroglyphes.
Twitter débarque donc. Comme tout média, il le fait avec ses codes. Les adeptes de l'IRC des débuts se souviennent des différents modes, des différentes commandes. Les codes de Twitter sont épurés. Mais il n'en restent pas moins déroutants pour le novice : ce sont les fameux Hashtags, mots-clés précédés d'un signe dièse "#" qui pourront être agrégés pour structurer (et non hiérarchiser) une actualité (exemple, le Hashtag pour parler de la mort de M. Jackson était " #MJ "), ou bien encore des RT, ces renvois de Twitts, dans lesquels l'acronyme initial "RT" signale que l'on est en train de reprendre une information (un Twitt) déjà publiée (lequel RT est en général suivi du nom - précédé d'une arobase - du compte Twitter d'où l'on reprend l'info). Ajoutons-y la limitation des messages à 140 caractères et la retraduction systématique des adresses web en des versions abrégées (et donc illisibles), et nous obtenons le genre de truc suivant :

  • "affordanceinfo @sarko @carla RT "MJ est mort" http://bit.ly/Y45brt #WE à eurodisney #MJ #bambi #premierevictimedefredericmitterand"

Soit, vous en conviendrez, pour un individu lambda non adepte ou non-initié auxdits codes, un léger côté hiéroglyphique pour une info ainsi normalement traduisible en langage courant :

  • Olivier E affordanceinfo signale à ses amis Nicolas et Carla @sarko @carla, que Michael Jackson est mort "MJ est mort", info qui circule actuellement partout RT et qui est vérifiable à l'adresse http://www.europe1.fr/Michael-Jackson-des-millions-de-fans-pour-un-dernier-hommage/ http://bit.ly/Y45brt, et info qu'il associe spontanément # au souvenir que ses amis gardent de leur dernier week-end à Eurodisney #WE à eurodisney, tout en s'interrogeant pour savoir s'il existe un rapport de causalité directe entre la mort du chanteur et l'arrivée de Frédéric Mitterand au Ministère de la Culture #premierevictimedefredericmitterand". 

Des hiéroglyphes au hiératique. Twitter ou les stratégies d'évitements de la lecture industrielle.
Ainsi Twitter, dans son affichage, dispose bien d'une dimension hiéroglyphique (pour le profane - qui s'en trouve désorienté -  comme pour l'initié - qui les manipule sans difficultés). Mais ce qui est le plus intéressant dans Twitter, ce sont les stratégies qu'il met en place pour gérer l'infobésité accrue par le temps réel sur lequel il s'efforce de se caler, et ce sans jamais faire appel à de classiques techniques de hiérarchisation (cf supra) mais en préférant faire appel à des stratégies visuelles, cognitives et scripturales d'évitement, de substitution.
Premier exemple : l'utilisation du RT, ou le fait de Re-Twitter une information (un autre Twitt). Il ne s'agit pa là de créer volontairement de la redondance (même si cela y revient in fine) mais bien plutôt de qualifier l'importance d'une information et contribuant à son effet de masse. Traduisez : si je retwitte cette info, c'est qu'elle m'apparaît importante/intéressante. Le fait de la re-twitter vise donc d'abord à lui donner du poids, pour lui permettre d'émerger de l'ensemble. Et l'on retrouve ici cette verticalité, cette hiérarchie qui semblait faire défaut à Twitter.
Deuxième exemple : les Hashtags. Ceux-ci sont le strict équivalent des Folksonomies, c'est à dire un processus de classification collaborative par des mots-clés librement choisis, mots-clés qui, comme pour les folksonomies peuvent aller de l'explicite - #iran-elections - à l'allusif - #MJ (pour Michael Jackson) -, voir au simplement farfelu - #slipsurlatête - ou à l'égocentré - #danielprendlepouvoir.
Troisième exemple : la représentation (cartographique ou imagée), la mise en scène visuelle. C'est là le plus révélateur. Les accrocs à Twitter ne peuvent très longtemps sa satisfaire d'une nombre de followers limité, eux-mêmes ne peuvent se résoudre à brider le nombre de comptes qu'ils souhaitent suivre en temps réel. Ils n'ont alors pas d'autre possibilité que d'être submergés devant l'aspect invasif et ingérable de ce déferlement. Ils passent dont par des applications tierces (Twitter en regorge ... voir notamment le point III "Outils et services" de ce billet) qui permettenr de visualiser les "points chauds" de Twitter, que ces points chauds soient thématiques ("je cherche de quoi on parle beaucoup en ce moment"), conversationnels ("je cherche les gens qui parlent le plus et/ou le mieux de ce qui m'intéresse), ou chronologiques ("je cherche de quoi on a perlé dans les dernières minutes, la dernière heure, ou la dernière semaine). Un seul exemple (au nom programmatique) dans cette dernière catégorie : le site Twitter for busy people.
Moralité : par sa limitation en nombre de caractères, par les codes scripturaux et les interfaces de vidsualisation qu'il utilise, Twitter travaille sur la dimension hiératique de la conversation comme vecteur d'information.
La définition que le Littré donne su terme hiératique est la suivante (il s'agit de la troisième acception du terme) : "Écriture hiératique, signes hiératiques, écriture cursive, qui est une abréviation de l'écriture hiéroglyphique et dont les signes sont dérivés, signe à signe, des caractères hiéroglyphiques." Définition ainsi complétée par Wikipédia : "L'écriture hiératique est en fait le deuxième niveau de simplification des hiéroglyphes, le premier étant les hiéroglyphes linéaires, qui sont des versions simplifiées des hiéroglyphes, mais qui gardent leur valeur représentative. Les caractères hiératiques, eux, ne représentent plus des objets, mais uniquement des signes arbitraires à la manière des lettres d'un alphabet."
Twitter ou l'écriture hiératique vue comme substitutive à l'absence de possibilité de lecture hiérarchisée. D'autre part, et pour reprendre une analyse déjà exposée ici, Twitter me semble, avec sa logique de "Followers",  également emblématique d'un troisième âge de la navigation hypertextuelle, celui de la souscription.

Il y a plusieurs raisons au succès actuel de Twitter.

En plus de celles précédemment décrites, voici celles qui me semblent aujourd'hui essentielles :

  • Sa simplicité.
  • Sa portabilité. = il est aisément déportable dans différents environnements (sous forme de widgets pour des site web ou de clients pour des navigateurs ou des téléphones portables, ou bien de manière plus immersive, comme ce client qui sert du support aux conversations du jeux vidéo World Of Warcraft)
  • Son effectivité. = sa capacité de résonnance (lectures industrielles) et sa capacité à créer du lien (avec l'industrie de l'écriture = les "grands" médias).
  • Son affectivité. = Twitter utilisé pour de petites conversations entre amis. Il s'agit bien ici de lien social.
  • Son unidimensionnalité. = Twitter ne contient que du texte, pas d'image, pas de son, pas de vidéo.

Wikipédia : l'emblème du web 2.0

La vidéo de ma dernière intervention à Poitiers pour parler de Wikipédia est désormais disponible en ligne (le pôvrepoint est lui aussi visible ici ou )
Grand merci au service audiovisuel de la MSHS de l'université de Poitiers et n'hésitez pas parcourir les autres ressources disponibles sur leur chaîne Internet.

<p>&lt;p&gt;&amp;lt;object style=&amp;quot;width:320px;height:260px&amp;quot;&amp;gt;&amp;lt;param name=&amp;quot;movie&amp;quot; value=&amp;quot;http://uptv.univ-poitiers.fr/web/data/flvplayer.swf?file=http://chronos.campus.univ-poitiers.fr/flv/wikipedia-ertzcheid.flv&amp;amp;width=320&amp;amp;height=260&amp;amp;image=http://uptv.univ-poitiers.fr/web/data/vignettes/s068141348.gif&amp;amp;usefullscreen=false&amp;quot; /&amp;gt;&amp;lt;param name=&amp;quot;quality&amp;quot; value=&amp;quot;high&amp;quot; /&amp;gt;&amp;lt;/object&amp;gt;&lt;/p&gt;</p>

Wikipedia et les encyclopédies collaboratives : censurer ou former ? - Wikipédia ou l'emblème du web 2.0

Intervenant(s) : Angel Clémares. Olivier Ertzscheid.

Date de publication : 27/05/2009

Durée : 00h 35min 47s

UPtv, la chaîne internet de l'Université de Poitiers

Wikipédia : former ou censurer ?

D'habitude le mercredi c'est le jour des enfants (piscine, tennis, devoirs, légos, playmobils). Aujourd'hui, exceptionnellement, c'était journée Wikipédia à Poitiers.
Journée intéressante à l'initiative de la MSHS de l'université de Poitiers, nourrie des réflexions croisées de Wikipédiens, de juristes, de journalistes et d'universitaires. La journée était filmée, et devrait être prochainement disponible sur UPtv.
Ma présentation.

Anniversaire Wikipedien.

Anniversaire Wikipédien.
On fêtait il y a peu le dixième anniversaire du dernier des mohicans annuaires et celui du premier des moteurs. C'est aujourd'hui (enfin le 15 Janvier exactement) le 8ème anniversaire de l'un des trois piliers de notre révolution cognitive, j'ai nommé, Wikipédia. Wikipédia aujourd'hui c'est 265 langues et plus de 10 millions d'articles.
Un anniversaire et des projets plein sa besace dont ReadWriteWeb nous révèle l'essentiel :

  • une intégration des contenus wikipédiens au programme Search Monkey de Yahoo! avec l'idée de faire remonter un peu de sémantique dans les résultats de recherche de Yahoo!.
  • un passage à l'échelle conséquent : de 2 Terabits de stockage début 2008, stockage "dédié" aux images, fichiers musicaux ou films, Wikipedia passe en 2009 à 48 Terabits de stockage dédié, grâce à une généreuse donation de serveurs Sun.
  • dans un autre article, Brion Vibber, CTO de la fondation Wikimedia, indique que l'un de ses objectifs à long terme est "to let users upload feature-length, high-quality videos, but in addition to capacity limits he says there are challenges related to getting files in the appropriate format and the physical movement of large files."Autre stratégie, à court-terme cette fois, un partenariat ("integration") avec des sites-média comme FLickR. La première stratégie s'inscrit clairement dans la même logique que celle de la fondation Archive.org (on je rêve d'ailleurs d'un partenariat entre ces deux acteurs). C'est de logique "institutionnelle" qu'il s'agit. La seconde option est davantage dans une logique média, qui joue - intelligemment - sur la complémentarité que rend possible la granularité des ressources du net, pour autant que ladite granularité soit sous-tendue pas une "philosophie" d'ouverture et de partage. Archive.org, Wikipedia.org, FlickRCommons ... c'est l'évidence en marche, le même effet de saisissement qui vous étreint fugitivement lorsque vous trouvez enfin la bonne pièce manquante à votre puzzle.  Mais je m'emporte, revenons à nos moutons anniversaires ...

Le mois prochain ce sont les licences creative commons qui fêteront leurs 6 ans. Une autre evidence. A force de simplicité. L'occasion également de rendre hommage à de glorieux aînés.

Pendant ce temps, Knol publie son 100 millième article knol (voir par exemple le billet d'Actulligence sur le sujet)

(Temps de rédaction de cet article : 1 heure)

Contributions wikipediennes

(nota-bene : suite à la nouvelle mouture de Typepad, les titres des billets d'Affordance seront désormais sans accents, désolé pour les puristes ...)

Il est un vieux débat autour du web 2.0 en général et de Wikipédia en particulier, c'est celui de l'échelle réelle de collaboration et de contribution qui structurent ces deux univers. En d'autres termes, qui contribue "réellement" et qui en profite "simplement".

Un article du Silicon Alley Reminder revient sur une étude déjà commentée ici en Octobre 2006 à propos du nombre de contributeurs réellement actifs dans Wikipédia. L'étude signalée en 2006 indiquait que "50% des modifications sont faites par seulement 0,7% des utilisateurs … soit 524 personnes" et que "les 2% les plus actifs (1400 personnes) ont fait 73.4% de tous les modifications." Pour aboutir à ce résultat, Jimmy Wales avait à l'époque comptabilisé le nombre de modifications ("edit") réalisées sur les articles. La conclusion était que quelques "insiders" (ou "heavy editors") étaient responsables de l'essentiel du contenu de l'encyclopédie.
L'article du Silicon Alley Reminder propose de ne pas compter les "modifications" (edit) d'articles mais plutôt leur nombre de signes (lettres). Et le résultat (à nuancer étant donné que ladite étude est - de l'aveu même de son auteur - simplement empirique) est radicalement différent de celui de Wales : on s'aperçoit que les plus "gros" contributeurs en "nombre de signes" sont plutôt des "outsiders" (utilisateurs non-réguliers), les "heavy editors" se contentant de faire de nombreux "edit" mais essentiellement pour des questions de mise en forme et de calibrage ou de rectification.
OK mais et alors ???
Alors la question qui est ici posée est celle de la nature même du projet d'encyclopédie collaborative. Dans l'hypothèse 1 (celle de Wales), Wikipédia serait en fait une encyclopédie "comme les autres", avec un très petit nombre d'encyclopédistes labellisés et actifs. La seule différence - mais de taille - avec un projet encyclopédique classique étant que lesdits encyclopédistes n'ont pas été choisis ou recrutés es qualites. Soit disons 80 % d'un fonctionnement encyclopédique traditionnel et 20 % d'un fonctionnement "en rupture" avec les modèles éditoriaux traditionnels.
Dans l'hypothèse 2 (celle du Silicon Alley Insider), c'est la situation exactement inverse qui est décrite. Le coeur du projet Wikipédien est serait bien celui d'une collaboration ouverte reposant sur la contribution d'usagers "extérieurs" et non-nécessairement réguliers ou accrocs pour fournir les connaissances et les informations, collaboration ouverte "complétée" par un travail d'édition plus traditionnel (correction, mise en forme, etc ...) effectué cette fois par quelques "heavy editors". Soit 80% de collaboration et 20% de fonctionnement éditorial "classique".

Soit pour résumer :

  • hypothèse 1 : les encyclopédistes sont des gens "à/de l'intérieur"
  • hypothèse 2 : les encyclopédistes sont des gens "à/de l'extérieur"

La fonction crée l'organe.
Au delà des chiffres et des pourcentages, ce débat est important voire essentiel car il reflète et illustre notre rapport au savoir dans un environnement numérique. L'hypothèse 1 serait la preuve qu'au-delà de la forme (innovante) du Wiki, le projet encyclopédique n'a pas réellement changé de nature dans son mode de fonctionnement. L'hypothèse 2, de mon point de vue beaucoup plus séduisante et beaucoup plus réaliste (même si elle demande à être confirmée), indique a contrario qu'en sus du changement de nature de l'objectif encyclopédique, il y a bien également un changement de nature du mode de contribution et d'accumulation des savoirs. Wikipédia procède donc bien d'une nouvelle forme et d'une nouvelle ambition pour le projet encyclopédique du XX1ème siècle, nouvelle forme et nouvelle ambition qui ont su, pour partie, asseoir la rupture qu'elles proposent sur des schémas de fonctionnement éditoriaux ayant déjà fait la preuve de leur efficacité. Et ce n'est pas l'un des moindres intérêts de ce projet que de constater que cette stratégie n'a pas été bâtie et pensée en amont du projet lui-même, mais qu'elle s'est organiquement déployée au fur et à mesure de son avancement. Work in progress. Et si l'on observe Wikipédia comme un organisme numérique en croissance, on vérifie une fois de plus la formule de Lamarck selon laquelle "La fonction crée l'organe."

==============================
Et pour compléter cette petite réflexion (et accessoirement expurger mon agrégateur), une petite revue de liens autour de l'encyclopédie collaborative.

  • et tout d'abord une excellente idée : "Un chercheur, qui soumet un article à la revue RNA Biology, devra également écrire un résumé de ses travaux dans Wikipédia." Source et suite de l'info sur Prosper et ReadWriteWeb.
  • ensuite un article de Pascal Duplessis : "Wikipedia : un objet-problème en information documentation." Rapide extrait pour vous donner envie : "Qui, sans en avoir été longuement averti, peut-il appréhender l’extraordinaire complexité dont fait preuve le deus ex machina à l’œuvre derrière la scène de tout article encyclopédique collaboratif ? Comment imaginer ne serait-ce que le perpétuel mouvement de création et de re-création de l’édifice puisqu’il se fige à l’instant même où on le regarde ? Pour en faire prendre conscience aux élèves, il faudrait un logiciel de type morphing où l’on verrait en l’espace de quelques secondes merveilleuses l’article se développer et se réduire sous l’effet erratique des contributions, varier ses formes du simple au caricatural, laisser et abandonner ses traces, et vivre et mourir en quelques palpitations de son être documentaire."
  • voir également mes voeux de bonne année 2009

(Temps de rédaction de ce billet : 1h30)

Retour vers le futur : Bonne année 2009.

=========================================================
"Dans Wikipédia, la rédaction de 2009, ou plutôt de l'article 2009, a commencé le 18 avril 2004 à 11 heures 12. Cet article a depuis été développé, organisé et plusieurs fois enrichi, vandalisé, corrigé, raccourci, au fil de plus de 370 modifications, toutes archivées. L'histoire de cet article et de ces modifications, cette histoire de presque cinq ans, est donnée à voir ici en moins d'une minute : http://www.lecdi.net/video-wikipedia-2009/video-wikipedia-genese-de-l-article-2009.htm"
Message transmis par Philippe Martin, webmaster et créateur de Lecdi.net
=========================================================

Sans attendre, dès aujourd'hui, écrivons ensemble ce dont demain portera trace.

Bonne année à tous et toutes :-)

Micro, méso et macro-net : les médiasphères et le moteur.

(billet inspiré par quelques rapides tests sur Whostalkin, découvert chez Steve Rubel)

En ce temps-là ...
En ce temps là
, la vie était plus belle simple : on avait les annuaires, les moteurs et les méta-moteurs.
En ce temps-là l'unité de publication était la page (web).
En ce temps-là, ceux qui publiaient sur le net ne publiaient (généralement) QUE sur le net, pas dans les grands médias. Et ceux qui écrivaient dans les grands médias ne publiaient pas sur le net.
En ce temps là, ce qui était écrit, restait écrit, restait fixé.
Et puis ...
Et puis les annuaires disparurent. Ne restèrent que (quelques) méta-moteurs et surtout les moteurs et surtout LE moteur.
Et puis les unités de publication se réduisirent, se fragmentèrent. L'unité ne fut plus seulement la page mais également le billet (de blog), voire le fil (de discussion sur un forum ou de commentaires sur un blog) ou le micro-fil (twitter limite l'unité de publication à 140 caractères). Une unité de publication parfois simplement confinée à une unité de présence en ligne, laquelle unité de présence est elle-même composée des traces éparses (profilaires ?) de notre social stream tel qu'il se constitue par exemple au travers de nos différents profils sur différents réseaux sociaux,
Et puis les instances d'énonciation éditoriales se floutèrent. Publier ici n'empêcherait plus de publier là. Les journalistes écrivent "dans" le web, les blogueurs écrivent "dans" les journaux, passent à la télé. Certains journaux ne sont faits que de reprises d'écrits de blogs (vendredi.info), certains blogs (maître Eolas) jouissent d'une crédibilité supérieure à certains journaux.
Et puis ce qui était écrit par l'un devînt modifiable par l'autre, par tous les autres (Wikipédia). L'auteur, l'autre. Figure gemellaire de l'hypertextualité. Agencements collectifs d'énonciation. La trace céda la place à sa propre traque.
Voilà ce qui changea. Ce qui ne change pas en revanche, pour vous, pour moi, c'est le besoin de s'y retrouver (au sens propre mais également et de plus en plus souvent au sens figuré également ...), d'y trouver parfois simplement "quelque chose", plus rarement "ce que l'on cherche".

Editorialement parlant, on dispose donc désormais de trois "médiasphères" :

  • le micro-net de type twitter mais également composé de nos traces profilaires,
  • le meso-net de type "blogs" individuels et non-institutionnels, ainsi que de la longue cohorte des pages personnelles
  • et le macro-net de type journaux ou chaînes de télé implantés sur le web (libération, le figaro, l'Obs ...)

Machiniquement parlant, pour rendre compte de ce nouveaux paysage éditorial du net, on ne dispose pourtant plus que des seuls moteurs qui, de plus en plus souvent, mal étreignent à force de trop embrasser.
Idéalement, il faudrait pouvoir disposer d'un moteur pour chacune de nos trois médiasphères. Car il va sans dire que la spécificité éditoriale de chacune d'entre elles conditionne à la fois la nature des recherches qui y sont effectuées mais également la nature, la granularité documentaire des résultats qui y figurent. Et l'on se prend à rêver d'un retour des moteurs à curseurs avec un même moteur permettant de régler le "grain" de la recherche depuis les macro-médias du macro-net jusqu'aux micro-médias du micro-net. 

Aujourd'hui, on dispose de :

  • Nano-moteur : pour chercher dans le micro-net. Exemple : WhosTalkin?
  • Meso-moteur : pour chercher dans le meso-net. Exemples : Blogsearch, Technorati, Wikio.
  • Macro-moteur : pour chercher dans le macro-net. Exemple : Google et Google News.

Cette granularité est inédite à cette échelle, et il y a fort à parier que 2009 lui donnera ses lettres de noblesse, l'enracinant comme une composante à part entière du Giant Global Graph. Alors que l'étage supérieur, le macro-net, apparaît aujourd'hui stabilisé, ayant atteint un rythme de croissance optimal, le micro-net et le meso-net continuent d'exploser, sur le même type d'échelle logarithmique que le web à ses débuts. Après la croissance des blogs, c'est aujourd'hui la croissance des réseaux sociaux et des sites de micro-blogging. La valeur de ces deux espaces, du dernier particulièrement, réside dans leur nature conversationnelle. Une conversation certes souvent tenue par des idiots et pleine de bruit et de fureur, mais également une conversation qui aiguille, qui stimule, qui signale, et qui est en tout état de cause le complément aujourd'hui indispensable de la plénitude du net comme médiasphère. Bref une conversation qui mérite d'être indexée et suivie pour pouvoir être ensuite accédée de manière asynchrone, dans la verticalité qu'impose le couperet d'une recherche et non plus simplement dans la linéarité d'un échange.

Signalons pour finir que cette granularité se superpose à une autre granularité préexistante et depuis déjà longtemps consubstantielle au net : la granularité des médias (vidéos, images, audio, texte) qui le composent. C'est à la croisée de ces chemins, à la croisée de cette granularité bipolaire que devront se positionner les acteurs de la recherche d'information pour répondre aux besoins de l'usager du web de 2009 et d'au-delà.

(Temps de rédaction de ce billet : 2h00)

Epistémologie wikipédienne : vérité et vérifiabilité sont dans le bateau du web centripète.

(Nota bene : le titre de ce billet est en compétition pour le festival du plus mauvais titre de billet dans une logique de référencement. Il concourt également dans la catégorie "comment enseigner les règles de l'écriture multimédia à ses étudiants et ne pas se les appliquer à soi-même")

Epistémologie et écosystème sont dans un bateau.
L'épistémologie désigne "l'étude de la connaissance scientifique en général". En philosophie en particulier, elle a pour objet "l'étude critique des postulats, conclusions et méthodes d'une science particulière, considérée du point de vue de son évolution, afin d'en déterminer l'origine logique, la valeur et la portée scientifique (...)."
En tant qu'écosystème informationnel, Wikipédia avance à visage découvert : elle cite ses sources, s'efforce de mettre en avant des sources fiables, "oblige" à les vérifier, s'efforce d'adopter une neutralité de point de vue. Un écosystème par ailleurs récemment analysé dans sa diversité de services, et qui donne à voir un visage relativement monolithique :

Piechartscorrected

Monolithe numérique en ligne donc, même si ce dernier connaît également depuis peu des versions "papier-like" ou même "DVD-like"

Toutes ces choses dites, le débat reste entier autour de la place qu'occupe actuellement ledit écosystème et du modèle qu'il propose. Pour clarifier ce qui suit, je rappelle en préambule tout le bien que je pense de Wikipédia. Ce qui ne m'empêche pas d'être critique.

Vérité et vérifiabilité sont dans un bateau.
Un article de Simson L. Garfinkel dans la MIT Technology Review propose une analyse intitulée : "Wikipedia ans the meaning of truth." L'article revient d'abord sur la contamination opérée par Wikipedia dans l'ensemble des sphères professionnelles et informationnelles : les journalistes s'y reportent, les étudiants y sont accrocs, les enseignants s'y mettent peu à peu, et l'encyclopédie occupe très (trop ?) souvent la première place dans les pages de résultats des moteurs de recherche. Le deuxième point abordé par l'article est celui du "contrat social" wikipédien : pour survivre, l'encyclopédie ne peut se permettre d'être bourrée d'erreurs et de contre-vérités (sinon personne ne la consulterait). La politique de publication qui s'est ainsi progressivement mise en place et la rapidité avec laquelle la plupart des erreurs sont corrigées sont le fondement dudit contrat social. Pour autant, Wikipédia ne repose pas, épistémologiquement parlant, sur une logique de vérité, mais sur une systématisation de la vérifiabilité :

  • "A la différence des lois mathématiques ou scientifiques, la vérité wikipédienne n'est pas basée sur des principes de cohérence ou d'observabilité. Pas davantage qu'elle n'est basée sur le bon sens ou l'expérimentation. Wikipedia a construit un ensemble de standards épistémologiques radicalement différents (...) qui doivent interroger ceux qui sont concernés par le sens traditionnel des notions de vérité et de précision. Sur Wikipedia, la vérité objective n'est pas la plus importante. Ce qui fait qu'un fait ou une information peut être intégrée dans l'encyclopédie est qu'il apparaisse dans une autre publication -- idéalement en Anglais et qui soit disponible en ligne. La ligne officielle de Wikipédia est d'ailleurs la suivante : "La condition d'inclusion d'un article dans Wikipédia est la vérifiabilité, et non sa vérité."."

Et Garfinkel de conclure ainsi son article :

  • "Alors qu'est-ce que la vérité ? (...) En pratique, le standard d'inclusion des articles mis en place par Wikipedia est devenu, de facto, le standard pour la vérité, et depuis que Wikipédia est la source en ligne la plus lue sur la planète, c'est également le standard de vérité que la plupart des gens utilisent quand ils font une recherche sur Google ou Yahoo. Sur Wikipédia, la valeur de vérité de la vérité est la vue concensuelle d'un sujet. (On Wikipedia, truth is received truth: the consensus view of a subject.)"

Rappelons-le ici, Garfinkel reste plutôt enthousiaste et "pro"wikipédia. La raison est simple : il fait partie du trop peu d'enseignants-chercheurs qui ne se contentent pas d'utiliser l'encyclopédie mais qui, dans leur domaine de spécialité, corrigent et complètent les erreurs ou approximations qu'ils y rencontrent.
Ce qui est en jeu dans l'article de Garfinkel, ce sont finalement les répercussions systémiques des modes opératoires qui, par effet de contamination, peuvent s'étendre de Wikipédia au Web dans son ensemble. En d'autres termes, la capacité centripète des forces qui agitent et animent ladite encyclopédie. Dans un ancien billet, j'écrivais de mon côté :

  • "Une autre des grandes forces de Wikipédia, au-delà même des processus de collaboration centrifuges qui animent la communauté des Wikipédiens, ce sont les logiques d'appropriation centripètes qu'autorise l'architecture "ouverte" de l'encyclopédie : les différents outils cognitifs qui fleurissent ces derniers temps autour du projet illustrent bien ces logiques."

Mais tout le monde n'aime pas cet effet centripète. Ainsi Nicolas Carr (qui lui, n'aime pas Wikipédia pour différentes raisons) écrit dans un billet intitulé "Le web Centripète" :

  • "Wikipedia offre un magnifique exemple du pouvoir formel qu'exerce la force centripète du web. La populaire encyclopédie en ligne est moins la "somme" des connaissances humaines (...) que le trou noir de la connaissance humaine. Son coeur : une vaste exercice de copier/coller qui bannit explicitement toute pensée originale ; Wikipédia aspire d'abord les contenus des autres sites, puis leurs liens, puis leur place dans les résultats des moteurs de recherche, puis leurs lecteurs. (...) Les articles de Wikipédia sont devenus les liens externes par défaut de beaucoup de créateurs de contenus, non pas parce que Wikipédia est la meilleure source existante, mais parce que c'est la plus connue est qu'elle est généralement "assez fiable"."

Un réquisitoire comme qui dirait "sans appel" et qui en arrive à la même conclusion que l'article de Garkinkel : le danger n'est pas dans Wikipédia, il est dans les usages naïfs de Wikipédia. Un débat vieux comme le monde (scientifique) : la découverte de la fission nucléaire n'est pas un danger. C'est son instrumentalisation (pour fabriquer des bombes) qui en est un. Wikipédia ne menace personne, sa politique de publication est parfaitement lisible et explicite. Ce qui ne la met naturellement pas à l'abri de la critique.

Wikipédia est un go-between culturel planétaire.
Parce qu'internet, parce que la surcharge informationnelle, parce que l'infobésité, parce que nos comportements connectés, parce que l'émergence de nouveaux modèles d'autorité, parce que, parce que, parce que ... Wikipédia s'est construite et a émergé dans ce contexte là. Elle n'est pas réductible à une encyclopédie classique (argument mis en avant pas ses idolâtres), pas davantage qu'elle ne l'est à une anti-encyclopédie (argument mis en avant par ses détracteurs). Elle est une forme neuve, intermédiaire, de la mise en circulation et de l'agrégation des connaissances.

La formation sur les berges du Styx.
Là où Carr et Garfinkel ont tous les deux raison, c'est que nous sommes tous des Wikipédiens, et parfois presque "malgré nous". Comme nous sommes par ailleurs tous des Googlers. Nous utilisons tous l'encyclopédie et le moteur. Nous ne comprenons pas tous comment ils fonctionnent. Nous ne les alimentons pas tous de manière consciente ou inconsciente, de manière honnête ou détournée. Mais nous les utilisons tous. Nous y sommes tous perméables. Et il n'y a que très peu de chances pour que cela change avec les prochaines générations. Celles-ci seront victime de ce que vous me permettrez d'appeler le talon corps d'Achille numérique. Keskesékessa ? Souvenez-vous d'Achille, de son corps invulnérable une fois trempé dans le Styx, et de son seul point faible, le talon par lequel sa mère le tenait lors de son immersion. Les usagers de l'écosystème numérique de demain seront tous des achilles numériques à l'envers. Ils seront entièrement perméables au mode d'accès, de représentation et d'organisation des connaissances et des informations que leur proposent dès aujourd'hui l'encyclopédie et le moteur. A ces usagers là, il reste une force. C'est leur talon d'Achille : ce petit bout d'eux-mêmes qui ne fonctionne pas uniquement sur des habitus numériques induits, et qui, ce faisant, leur permet d'interpréter ces outils avec la distance critique suffisante. Suffisante ET nécessaire. Alors le dire. Et le répéter encore : seule la formation, seule la formation à une culture de l'information permet cela. La dynamique de propagation des habitus numériques, la façon dont ils modèlent notre monde de manière aussi structurante que parfois pernicieuse, cette dynamique réduit progressivement ce talon d'Achille à une peau de chagrin. L'urgence en termes de formation est réelle. Elle est même vitale.    

(Temps de rédaction de ce billet : 2h15)

Technologies de l'artefact et traçabilité "positive" : l'écriture dans le ciel est-elle soluble dans l'informatique en nuage ?

=======================================
Où il est question de "technologies de l'artefact", "d'éthique hacker", de "perte du sens", "d'intelligence des données", de "traçabilité positive" et de quelques autres babioles ...
=======================================

Ecrans nous offre un beau panorama d'outils relevant du champ des technologies de l'artefact. Fake is a Fake vous permet de détourner (presque) n'importe quel site officiel. L'outil est à la fois robuste et astucieux : il utilise la plateforme Wordpress avec des thèmes (gabarits) reprenant la charte graphique des grands quotidiens (Le Figaro, New-York Times ...) de sites institutionnels (Maison Blanche, Elysée ...) ou événementiels (Pékin 2008 ...).
Dans une autre catégorie, permettant celle-là d'atténuer les technologies de l'artefact par le développement d'une heuristique "technologisée" de la preuve, Logo-Wiki (qui s'inspire de Wiki Scanner) permet de suivre les "Big brother Editors" de Wikipedia, en remplaçant le logo de l'encyclopédie, par celui de la compagnie ou de l'institution à l'origine d'une modification d'article. Pour une démo, voir ici.
Et donc ??
Tout cela fait écho a ce qui s'est raconté lors des dernières rencontres d'Ars Industrialis et notamment à l'intervention d'Alain Mille : il est (heureusement) encore possible d'inventer une ingénierie "positive" de nos traçabilités numériques. Echo également à l'intervention de Peter Norvig indiquant que l'avenir était à une formule du web contenant de moins en moins de "code" et de plus en plus de "données" (le fameux "less code, more data"). Or seul le code, seule l'écriture peut donner "un" sens à l'alignement et à l'empilement des données. Leur seul recoupement ne leur confère que "du" sens, différemment interprétable, différemment "compilable", différemment instrumentalisable, et en tout cas seulement lisible de ceux qui peuvent et pourront disposer d'une agrégation, d'une représentation suffisamment vaste desdites données. Donc accepter de se priver du "code", de le laisser tomber en désuétude, reviendrait - pour nos sociétés numériques - à s'interdire l'écriture et tout ce qu'elle autorise : le détournement parfois, l'explicitation souvent. Et à l'heure où le web se dirige effectivement vers une "intelligence des données", il faut redonner ses lettres de noblesse à l'écriture, au code. A ce titre, le rôle des Hackers est tout à fait salutaire. Ils disposent pour l'instant d'une maîtrise suffisante du code pour interpréter les données d'une manière "différante". Ce faisant, ils offrent une alternative à la fois possible et crédible - parce qu'incarnée - à l'agglomérat mainstream de données dans lequel nous engluent chaque jour davantage les multinationales du net, dans lequel nos pratiques, coupées de l'écriture, nous engluent tout autant. Et c'est probablement dans cette articulation complexe que le Web 2.0 prend sa vraie mesure : en nous offrant des outils nous permettant de ne nous soucier que des contenus, il nous conforte dans l'illusion d'entretenir une écriture alors que nous n'entrons que des données. Web2dizzaster (également repéré par Ecrans) illustre parfaitement ce paradoxe : quand les contenus s'effaceront, quand les données s'effondreront sous leur propre poids, seule subsistera l'écriture, le code. Mais cette écriture en sera réduite à sa plus simple expression : elle ne sera plus qu'ornementale. Et il y aura longtemps qu'en acceptant d'en perdre la maîtrise, nous en aurons perdu la profondeur, nous en aurons perdu le sens.

Et donc pour résumer le tout en une deux trois phrases ? Il faut que le Skywriting (et pas seulement académique ou universitaire) trouve sa place dans l'univers du Cloud Computing. Que "l'écriture dans le ciel" rivalise de présence avec "l'informatique en nuage." Attendons nous sinon, à de très fortes précipitations dans la manière dont nous y prêterons (notre) attention, dans la manière dont cela modèlera toute une économie de l'attention.

// Temps de rédaction de ce billet : 45 minutes //

Printipédia.

L'éditeur, l'encyclopédiste et le moteur.

09102 Bertelsmann vient de sortir une version imprimée de la Wikipédia. Et Techcrunch ReadWriteWeb pose la bonne question : "pourquoi ?" Probablement pour ce que l'on appelle un "coup" d'édition. De quoi faire parler de soi. Pour le reste, il vous en coûtera 19.95 Euros pour 992 pages (en allemand donc). Un euro sur chaque vente sera reversé à la fondation Wikimedia. 19.95 euros pour vous. Un euro pour la fondation. Probablement une douzaine d'euros de marge pour l'éditeur. Le plus intéressant dans cette affaire, le plus vertigineux aussi, c'est que lorsque l'on clique sur l'image de Wikipedia sur le site de Bertelsmann, on se trouve propulsé ... dans l'interface de Google Book Search. Etonnante mise en abyme : plusieurs millions de pages numériques librement accessibles et consultables d'un côté dans Wikipédia. 992 pages papier de l'autre pour presque 20 euros. Et un aperçu de quelques centaines de pages de l'ouvrage papier (je n'ai pas compté combien de pages étaient effectivement disponibles dans Google Book Search ...) gratuitement consultables dans le moteur.
Je résume : un moteur de recherche me permet de consulter gratuitement une partie d'un livre payant, lequel livre est en fait un extrait payant d'un corpus encyclopédique gratuit beaucoup plus large et par ailleurs consultable gratuitement sans passer par les extraits du moteur de recherche gratuit ou l'extrait papier payant. Une aspirine ?

<Update suite au commentaire de Michel> C'est n'est effectivement pas un "extrait imprimé" mais carrément un lexique - par ailleurs entièrement téléchargeable - reprenant les 20.000 entrées les plus lues dans la Wikipédia allemande. Concernant la question des auteurs, je vous renvoie à l'analyse d'Hervé Le Crosnier déjà signalée ici mais noyée dans mon billet de rentrée. </Update>

<Update toujours> Voir aussi la synthèse proposée par Jean-Michel Salaün. </Update>

Google et son pot de Knol.

Knol fait quoi ?

Six mois après les effets d'annonce, Google lance enfin Knol, son projet d'encyclopédie "marchande". A noter au travers des différents billets s'étant fait écho de ce lancement : la possibilité de piocher directement des illustrations dans l'archive des "cartoons" du New Yorker (source), la possibilité d'utiliser différentes licences creative commons (cf copie d'écran ci-dessous), la possibilité "de choisir qui peut éditer vos articles (Ouvert, avec modération ou fermé)" (source), la possibilité d'activer l'affichage de liens publicitaires (ou pas), et le fait que tous les liens sortants seront en NoFollow (source), tirant ainsi les enseignements de ce qui arriva à Wikipedia.

Knol pourquoi ?

Globalement, les différents observateurs s'accordent sur deux points : primo, à la date de lancement de
Knol, on compte essentiellement des articles médicaux (ce qui est tout sauf un signal faible ...), et deuxio, ce projet n'a pas grand chance de concurrencer Wikipedia (seul Christian semble y croire). En revanche, il a de grandes chances de reformater le sens du projet encyclopédique du XXIème siècle vers un alignement, une superposition de deux écritures : l'écriture du "savoir" (écrire pour comprendre) et l'écriture de la publicité (écrire pour être vu).  Pour le reste, j'ai déjà dit tout le mal que je pensais de ce projet ... <Mauvaise foi>Si vous ne me croyez pas, comparez deux entrées tout à fait triviales de l'un et l'autre projet encyclopédique. Pour l'entrée "Toilettes", Wikipedia nous entraîne de l'ancienne cité d'Harappa jusqu'aux derniers avatars défécatoires d'un post modernisme assumé quand Knol nous propose uniquement d'apprendre ... à les déboucher en affichant moult plombières publicités. C'est tout dire :-). </Mauvaise foi> Plus sérieusement, l'approche qui semble mise en avant par Knol est une approche "How To". Comment ... "déboucher ses toilettes ?", "dépister un cancer du sein ?", etc.

Bref, Knol ne me parait pour l'instant pas avoir grand chose à voir avec Wikipedia. Il est par contre tout à fait adapté à l'écosystème Google et devrait lui permettre rapidement de pouvoir "monétiser" une grosse partie du traffic encyclopédique habituellement dirigé (à fonds perdus puisque non publicisés) vers Wikipedia. Ce qui est bien l'objectif premier du projet :-) (un second objectif étant probablement de servir de base de connaissance à Google Health, mais j'y reviendrai dans un prochain billet)

Knol procédural VS Wikipedia déclarative ?

Un positionnement qu'il est intéressant de replacer dans un (très rapide) historique (subjectif) de la "tentation encyclopédique" sur le réseau. Ce genre d'approche - et de tentation - est effectivement consubstantielle au net depuis son origine.

  • Elle émergea très tôt au travers des célèbres FAQs (Foires Aux Questions) : un individu répond "es qualité" (webmaster, éditeur, auteur ou "spécialiste") à sa communauté d'usage, sur des points très ciblés. L'autorité est ici constamment maintenue, affichée, lisible. Le principe est celui d'un ordonnancement, d'une rationalisation pensée, en l'occurence celle des questions les plus susceptibles d'être posées.
  • Passé l'ère des FAQs sur les sites webs, vînt ensuite l'ère des projets "Bidule-Answers" (Yahoo!Answers et consorts) : le principe est ici différent : n'importe qui peut répondre (parfois n'importe quoi) à n'importe qui et sur n'importe quel sujet. La dissolution de  l'expertise est ici totale. Seule compte la temporalité (promptitude, instantanéité) de la réponse. Le principe est celui de l'agglutination (les différentes réponses s'empilent les unes sous les autres) sans autre discrimination que temporelle ou "élective" (il est possible de voter pour telle ou telle réponse).
  • Le troisième temps est celui de Wikipedia. Un palimpseste planétaire de connaissances. Je vous renvoie à la rubrique idoine d'Affordance ou à ma dernière "synthèse" sur cet inépuisable sujet.
  • Le quatrième temps sera celui de Knol, mais il n'enterrera pas pour cela Wikipedia. Car Knol me semble concourir sur un autre terrain. Là où la logique d'accumulation des connaissances dans Wikipedia est clairement déclarative, celle de Knol (même s'il est encore un peu tôt pour être affirmatif et s'il ne s'agit pour l'instant que de pistes d'analyses ...) apparaît plutôt procédurale (question du "comment faire...", "comment dépister ..." ...). Parallèlement à cette macro-approche procédurale (qui n'empêche pas d'avoir des micro-knols déclaratifs sur tel ou tel sujet, tel ou tel concept), l'autre caractéristique de ce quatrième temps est celui de la mise en concurrence des expertises par processus de labellisation de l'auteur (Knol vous "reconnaît" comme expert en s'assurant de la levée de votre anonymat, mais Knol ne vérifie en rien les titres et diplômes dont vous vous parez). Labellisation fantôche donc pour Knol, contre babélisation fantasque pour Wikipedia. L'alibi qualitatif pour Knol, le vertige quantitatif pour Wikipedia. 2 mondes.

Conflits d'intérets en vue ...

L'une des principales questions que Knol va poser dans un très proche avenir est celle du conflit d'intérêt suivant : la "mise en avant" du contenu de Knol au sein des résultats de recherche de Google (nonobstant une prudente mise en avant du NoFollow sur les liens sortants). Sur ce sujet, il faut lire d'urgence l'article de Jason Calacanis (pour qui Google est devenu un authentique fournisseur de contenu - voir aussi la synthèse qu'en fait Martin Lessard), ainsi que l'édito de Wired (ou pour les plus pressés, la synthèse en français de Jean-Marie Le Ray. De fait, il y a de mon point de vue longtemps que Google est devenu un fournisseur de contenus, notamment via ses innombrables rachats (Blogger, YouTube). De fait également, il est tout à fait évident que lesdits contenus des susmentionnés services bénéficient d'un référencement plus "aisé" que d'autres ne gravitant pas dans l'écosystème de services du moteur.

Mythologies.

Google en tant que mythologie contemporaine présente un nombre de plus en plus grand de similitudes avec le mythe de Cronos. Comme lui son histoire commence par une castration : celle de la bibliométrie de Garfield, "amputée" de son rattachement à un circuit de diffusion classique et contrôlé (modèle des revues et de l'évaluation par les pairs) au profit d'un chaos fécond (le web). Comme lui il dévore et ingère ses enfants (Youtube, Blogger, Picasa et tant d'autres furent des petites - ou moyennes - start-ups avant d'être happées par le monstre ...). Comme lui, cette dévoration peut être lue comme le symptome d'une crainte : celle de voir l'un de ses enfants se retourner contre lui une fois atteint son âge adulte. Comme lui, il envoie l'essentiel de ses frères moteurs dans les profondeurs du Tartare, le laissant seul à son hégémonie (parts de marché et de traffic). La fin de l'histoire de Cronos est connue, celle de Google reste à écrire, mais (et j'arrête là avec les analogies mythologiques), il est clair - et le lancement de Knol ne fait que le confirmer - qu'il ne peut y avoir que trois issues à une telle appétence : soit le contrôle total, en amont et en aval, de l'accès à l'information et à la connaissance ; soit un final façon la grande Bouffe, c'est à dire l'effondrement de l'ogre sous le propre poids de son appétence ; soit la naissance d'un fils échappant à cette appétence qui à son tour, pourra tuer le père. Et dans cette dernière option (je reprends là mon analogie mythologique), je verrai bien Wikipedia en mère nourricière, telle Gaïa soustrayant un certain Zeus à l'appétit de son père, et du ventre de laquelle naîtront les initiatives sur le terreau desquelles une nouvelle mythologie s'écrira, une nouvelle génération de moteurs naîtra (songez à Trueknowledge ou encore Powerset, moteurs "sémantisés" travaillant avec Wikipedia comme base). 

Knol encore ...

Pour approfondir et/ou mesurer rapidement les principaux tenants et aboutissants du bidule : voir le billet très complet de Danny Sullivan et celui d'Astrid Girardeau dans Ecrans. A lire également les impressions de FredCavazza pour qui "Knol pourrait bien officialiser la création d’une nouvelle catégorie d’outils de publication qui apportent une information différente des blogs et wikis : un résumé ou plutôt une aggrégation / synthèse réalisée par un auteur identifié." De mon point de vue ces outils existent déjà. La "nouveauté" ne me semble pas résider dans la capacité d'aggrégation et le rattachement à un auteur identifié, mais plutôt dans la cohabitation des deux écritures susmentionnées (écriture du savoir et de la publicité), cohabitation qui ne se fait plus en terrain "neutre" (comme dans certains blogs par exemple), mais au sein d'un projet "labellisé" encyclopédique, qui confère donc à cette cohabitation une légitimité a priori. Heureusement, tous les a priori sont discutables ... 

Ci-dessous une copie d'écran des fonctionnalités proposées lors de la création d'un Knol.

Knol

Et puis pour finir sur un clin d'oeil ... le meilleur moyen de découvrir Knol, c'est encore de consulter l'article de Wikipedia qui lui est consacré :-) (et tout particulièrement les liens figurant en référence de l'article). Une chose est sûre en tout cas, les dîner de knols vont se multiplier ;-)

Dinerdeknol

Un dernier Knol mot.

Une dernière chose encore. Knol n'est pas un projet encyclopédique. Il ne vise pas la connaissance. Parce que la connaissance ne peut pas être la seule mise en concurrence des savoirs (le principe de Knol est que plusieurs "knols" concurrents peuvent être rédigés sur un même sujet, la prime allant au plus accédé, comme c'est l'usage dans l'écosystème Google). La connaissance est avant tout la définition et l'acceptation d'un concensus.  « Le savoir affecte forcément une forme circulaire : c’est en effet la seule manière de se représenter un ensemble de données diverses tel que chacune renvoie à toutes les autres et ait perspective sur toutes les autres. (...) Ce savoir n’est pas simplement cumulatif (...) mais circulaire parce qu’il y a une circulation du savoir d’un point quelconque à tout autre point possible. Sans doute cette circulation se fait elle le long de certains axes perspectifs qui seront par habitude plus fréquentés que d’autres à l’intérieur du tout, mais dont la commodité ne tient jamais finalement qu’à un état momentané du savoir, à un équilibre météorologique métastable. » Varet G., Histoire et savoir - Introduction théorique à la bibliographie : les champs articulés de la bibliographie philosophique. Paris, Les Belles Lettres, 1956.

Le pot de Knol est d'abord et avant tout un pot de miel publicitaire. Et on n'attire pas les mouches nouveaux encyclopédistes avec du vinaigre.

C'est la rentrée ...

Allez, hop hop hop, au boulot. Fini de lézarder. D'autant qu'il s'est passé plein de choses en deux mois ...

Côté encyclopédies :

  • la série rafraîchissante d'Ecrans sur "Inside Wikipedia". Episode 1 : Wikilove. Episode 2 : Wikipompiers. L'intégralité de la série à lire ici.
  • A ne pas manquer, le regard d'Hervé (Le Crosnier) sur l'édition papier de la Wikipedia par Bertelsman et la rémunération de ses ... 90 000 auteurs ...
  • Et puis bien sûr, lancement par Google de son projet encyclopédique baptisé Knol. Gardez patience, le prochain billet y sera entièrement consacré ;-)

Côté Moteurs (enfin ... surtout côté Google ...) :

  • A ne pas manquer : un article de Chris Anderson dans Wired sur l'âge du Petabyte et son héraut (Google). Article court, brillant et relativement impossible à résumer puisqu'il montre en une seule page quels sont les liens entre les théories scientifiques, la fin des théories scientifiques, le moteur de recherche Google, la puissance calculatoire, les avancées de la génomique, l'informatique distribuée, la nouvelle "science des données" et quelques autres trucs encore. Allez, filez le lire et vous comprendrez certainement un peu mieux la manière dont chacun d'entre nous est relié à la machine. 
  • un débat chez Google France sur l'économie numérique avec une conclusion d'Eric Besson. A écouter notamment vers la 67ème minute le point de vue des intervenants (entreprise) sur un aspect du débat autour de la net neutrality (taxation des recettes publicitaires sur internet). J'ai simplement retenu que pour Eric Besson, le fait d'envisager de "prioriser par exemple des données relatives à la télésanté" n'est pas nécessairement une atteinte au principe de neutralité du net. Pour les autres aspects - cruciaux - de la Net Neutrality, voir par exemple ce billet de Martin Lessard : "étrangler le Net".
  • Alors que Google croyait en avoir définitivement fini avec le Google Bombing, voilà-t-y-pas que le Google Bombing ressurgit dans l'outil Google Trends.
  • Pour ceux qui s'en inquiéteraient, Google se porte - toujours - financièrement très bien : chiffres complets ici et résumé sur Zorgloob. Côté "part de trafic", ça va aussi.
  • Un très bon dossier documentaire réalisé par 3 étudiants du cycle supérieur de l'INTD : "Les rapports de Google avec la justice" (.pdf). La première partie du dossier est une recension des procès et actions en justice contre Google, la seconde se focalise davantage sur l'exploitation des données personnelles. Très utile pour avoir une vision "fine" d'un justiciable pas comme les autres.
  • Dans la série "publicisons, publicisons, il en restera toujours quelques chose", LiveSearch (Microsoft) s'installe dans la motorisation de Facebook. (Rappelons pour mémoire que Google motorise - et constitue la régie publicitaire de - MySpace). Voir aussi pourquoi Jérôme Charron s'en félicite.
  • Pour les Googlophiles anglophobes, découverte de Goopilation, un blog qui traduit en français les billets de l'ensemble des blogs officiels de Google.
  • Et puis, et puis ... en septembre 2005, Google faisait disparaître de sa page d'accueil la mention du nombre de pages indexées, laissant les compteurs de notre imaginaire collectif baguenauder librement. Dans un billet en date du 25 Juillet, sur son blog officiel, Google annonce que son crawler a franchi une étape ("a milestone") : 1000 milliards d'adresses uniques détectées, ce qui, comme le rappelle Jean Véronis n'est pas la même chose que le nombre de pages indexées, mais qui est "déjà très impressionnant". Au-delà de son effet subliminal dans l'inconscient collectif (= "c'est Google qui a la plus grosse" ... base d'index), cette annonce révèle ce qui est l'un des tournants marquants dans l'histoire des moteurs de recherche : la principale difficulté, le principal objectif, n'est plus la capacité à atteindre un grand nombre de données (et à les réactualiser en temps réel), mais bel et bien la capacité à faire le tri entre le bon grain et l'ivraie, entre ce qui doit être indexé et ce qui ne doit pas l'être. Soit un retour à la raison d'être et aux fondements de leur algorithmie.
  • En parlant d'algorithmie justement, du côté de Yahoo! on semble s'intéresser de près à la mode des moteurs à la carte. Mais si souvenez-vous, ces moteurs "construits par l'internaute" et faisant de chacun de nous un autarcithécaire en puissance. Yahoo! a donc lancé le service BOSS (Build Your Own Search Service). Pour ne pas répéter ce que d'autres ont très bien décrit, allez lire le billet de Jérôme Charron sur le sujet. La stratégie de Yahoo! paraît claire : étant donné que le monde compte nombre d'excellents développeurs plein de bonnes idées, et étant donné qu'actuellement aucun d'entre eux ne peut bénéficier d'un équivalent de la base d'index de l'un des grands moteurs majeurs, il s'agit donc de leur offrir un accès à cette base, de les laisser bidouiller en postulant qu'il y aura probablement dans le lot une bonne ou une très bonne idée dont on pourra alors librement s'inspirer. Et dans le cas contraire, pendant qu'ils font joujou chez Yahoo!, ils ne vont pas monter de projet concurrent ;-).
  • La dérive des continents documentaires (voir ici) se poursuit, avec cette dernière étape clé de la synchronisation de nos moments connectés / non-connectés : après GoogleDocs et GoogleReader, c'est GMail et GoogleCalendar qui devraient être accessibles via GoogleGears. Rappelons, pour tenter de clarifier la "stratégie" de Google en la matière, que la synchronisation de ces applications est l'un de piliers incontournables du "webtop" ou du "WebOS", webtop dont on reparlera plus bas dans ce billet de rentrée.
  • L'une des dernières études du PewInternet nous apprend que si en 2002 seulement un tiers des internautes utilisaient un moteur de recherche pendant leur journée connectée, ils sont maintenant la moitié à le faire (49%). Les autres "habitudes" sont (de la plus à la moins fréquente) : l'e-mail, la recherche en ligne, la consultation d'actualités ("checking news"), et la consultation de la météo.

Côté Moteurs, outils ET bibliothèques :

  • Je vous l'avais annoncé avant les vacances, la bibliothèque municipale de Toulouse est désormais sur FlickR. Pour les détails et les motivations de cette (remarquable) opération, voir le message posté sur biblio-fr. Une Flickerisation des bibliothèques qui fait flores (6 à ce jour) comme en témoigne cette nouvelle initiative lue chez André Gunthert : "la George Eastman House est le premier grand musée de photographie à mettre en ligne en libre accès dans la section des Commons de Flickr plusieurs extraits de ses collections." Sans oublier, comme le rappelle Patrick Peccatte en commentaire du billet d'André, "les institutions présentes sur Flickr qui présentent des fonds intéressants mais pas sous le régime des Commons, comme la Biblioteca de Arte-Fundação Calouste Gulbenkian." Je croie qu'il y a là l'amorce d'un mouvement de fond (et de fonds ;-), dont l'impact à moyen terme pourrait être assez semblable à celui des projets de numérisation (Google Books).
  • et puis bien sûr, l'annonce de la numérisation de la BM de Lyon par ... Google. Là encore, un peu de patience, c'est le sujet d'un prochain billet.

Côté bibliothèques ...

  • Le discours de Barak Obama : sources, références et larges extraits à lire chez Jean-Michel Salaun.
  • Côté bibliothèques ET revues : Valérie Pécresse (ministre enseignement supérieur) et son copain Bruno Racine (BnF) avaient bien caché leur jeu. Le ministère de l'enseignement supérieur vient d'annoncer le déblocage de 10 millions d'euros pur la création d'une archive pour les revues de recherche françaises. L’objectif de cette archive est de conserver sur le long terme les revues scientifiques qui ont un faible usage. Cette archive sera sous la responsabilité de la BnF qui assurera également l’accès aux articles, sur support papier ou électronique, par son service de fourniture de documents. Ah ben non désolé. Fausse alerte. C'est pas en France. C'est au Royaume-Uni. A mettre en balance avec l'approche et l'existant hexagonal.
  • Et puis les diaporamas du dernier congrès de l'ABF (blog du congrès) sont regroupés en ligne sur le site de l'ABF.

Côté livre/document/lecture numérique :

  • André Gunthert nous livre une belle analyse d'un beau concept : la lecture exportable (ou les affres d'un copyright en bout de course). De mon côté je prolongerai bien l'analyse d'André en indiquant que ce qu'il décrit à juste titre comme une lecture exportable est en fait la réalisation concrète la plus proche de l'idée originale de transclusion (chez Ted Nelson - père fondateur de l'hypertexte - la transclusion désigne des contenus non plus "inclus" mais situés simultanément à divers endroits, sans altérer pour autant leur localisation originale ... pour plus d'infos voir sous le lien précédent).
  • L'iPhone devient liseuse : Virginie Clayssen rappelle à quel point la nouvelle pourrait être d'importance pour le décollage et la structuration d'un marché du livre électronique.
  • A lire : les enjeux du livre au format de poche, une étude de 8 pages de la DEPS, qui ne se termine pas par hasard sur "la perspective numérique", au moment où l'on parle de plus en plus d'une date limite de consommation des livres sous forme papier.
  • Et pendant que l'on réfléchit de plus en plus activement ici ou là sur l'avenir de la chaîne du livre à l'heure du numérique, le rouleau compresseur continue d'avancer : Amazon met la main sur AbeBooks (via Hervé Bienvault)

Côté biblio-scientométrie

  • la face cachée de la bibliométrie existe, et plus simplement au sens figuré. Pour organiser - selon des critères bibliométriques (taux de citation / date de parution de l'article / ... )  - les résultats issus d'une interrogation de la base Medine, imaginez que la liste desdits résultats soit ... une liste de visages dont le froncement des sourcils ou le sourire (ou l'absence de sourire) seont autant d'indicateurs vous permettant d'anayser lesdits résutlats et de mieux vous y orienter. Pas clair ? OK, une image :
    Facebib
  • le site reprend en fait la théorie des visages de Chernoff (voir ici ou pour une définition de ladite théorie) en l'adaptant aux usages scientométriques et en la faisant "tourner" sur une base d'articles scientifiques (PubMed). Gadget diront certains. Sûrement. Sûrement. Aussi sûrement que cela ouvre autant de pistes du côté d'une "humanisation" littérale des résultats de recherche. La source : ici. Pour jouer avec : .

Côté Science 2.0

Côté Web 2.0 ...

  • une petite bibliographie autour du web 2.0 mêlant articles scientifiques, thèses, ouvrages et études diverses, le tout accessible gratuitement.
  • Une jolie mise en image des différents services sociaux autour du web 2.0.
  • Je vous ai souvent parlé (en conclusion de ce billet par exemple) de l'inexorable avançée d'un mouvement d'externalisation de nos mémoires (intimes ET documentaires), lequel, conjugué à une informatique ambiante (everyware) et à une redocumentarisation du monde (internet des objets) et de l'homme (l'homme est un document comme les autres), donne littéralement corps à un hypercortex planétaire. Le résultat à court terme - 2040 -, et en termes beaucoup plus clairs (:-) est expliqué dans un édito du 16 Juillet de Wired, édito chroniqué, résumé et traduit sur InternetActu : "La machine unique pour les relier tous".
  • Prenez la plus grosse base de donnée iconographique gratuite de la planète (FlickR). Prenez ensuite l'une des toutes premières agences commerciales de diffusion de photo (Getty Images). Imaginez un accord entre les deux permettant à la seconde (Getty) de piocher à volonté dans la première (FlickR) pour en revendre le contenu en reversant 20 à 40% de la somme récoltée au photographe amateur. Et vous aurez un système gagnant-gagnant et un exemple très parlant de la manière dont les pro-am deviennent un incontournable levier de l'économie de la longue traîne.

Côté Web 2.0 et après ...

  • Après le Web 2.0, il y a naturellement le cloud computing. Hervé Le Crosnier signe un papier lumineux sur le sujet dans le Monde Diplo. Didier Durand signale un intéressant white paper d'évangélisation (technique) en provenance de chez Amazon : Cloud Architectures (.pdf)
  • Après le web 2.0, il y a aussi le webOS, soit la migration du Desktop (bureau comme interface du disque dur) vers le webtop (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack rédige sur le sujet un article de référence qui récapitule les enjeux et les ambitions de cette nouvelle migratio numérique des contenus et des comportements associés : "The future of the Desktop".
  • Après le web 2.0, il y a l'explosion des contenus gourmands (en bande passante) : voir les chiffres de la dernière étude Cisco, rapportés par Eric Baillargeon. Et de manière corrélée, il y a un phénomène de "dés-appropriation" de plus en plus systématique des contenus demandés par les internautes : voir le billet de Techcrunch rapportant le régne annoncé du "tout streaming". Là encore une nouvelle étape de la dérive des continents documentaires, dans laquelle après avoir confié nos contenus à des sites externes (tout en gardant une possibilité d'archivage en-ligne), nous prenons de plus en plus l'habitude de consommer des contenus comme de simples services, sans appropriation réelle ni possibilité de conservation ou de stockage. Bref, nous faisons avec Internet ce que nous faisions hier avec la télé, avant que l'on invente les magnétoscopes. Sauf que sur Internet, c'est pas très facile de réinventer le magnétoscope, comme en témoigne les mésaventures du service (excelletissime) Wizzgo. Espérons avec Jean-Michel que "S'il y a beaucoup de mythes dans le Web 2.0, il y a aussi beaucoup de préjugés chez les médias traditionnels, à commencer par croire que l'on peut retarder l'expression d'une demande explosive."

Côté énervements récurrents :

  • la fausse bonne idée de l'université entreprise, à lire sur le site de SLR ... pendant ce temps, Valérie Pécresse distribue les médailles en chocolat comme autant de labels vides de sens (et de financements ...)
  • les vraies-fausses promesses de maître Darcos. (= Episode 1 : on va supprimer plein de postes, mais en échange on va revaloriser la grille des salaires. Episode 2 : on va supprimer plein de postes. Euh ... oui oui, on va aussi revaloriser la grille des salaires. Mais pas tout de suite hein ? Episode 3 : relire l'épisode 2)
  • "L'autonomie" (financière) souhaitée des université est vraiment - mais alors vraiment - une notion à géométrie variable.
  • et dans la série "faisons fonctionner de nouveaux trucs avec tous les défauts des anciens machins", je vous recommande la lecture de "l'ANR pour les nuls" sur le site de Sauvons la Recherche.
  • Tout cela nous rappelle que la loi LRU a 1 an. A lire sur EducPros, un rapide bilan des opérations. A remarquer : seulement 9 universités (sur 85) ont décidé de mettre en place les fameux comités de sélection en lieu et place des anciennes commissions de spécialistes. Ce manque d'engouement n'est pas nécessairement la preuve d'un désaveu du système proposé (par les comités de sélection). Simplement le résultat d'un calendrier de mise en place à la hussarde et le symptôme d'un très grand flou dans le "comment concrètement" faire tourner ces nouveaux comités de sélection. Le résultats c'est que la plupart des université, déjà très occupées à mettre leur CA aux nouvelles normes, n'ont pour le moment pas eu vraiment le temps de s'occuper de la mise en place de ces comités. C'est à la fin de cette année universitaire que l'on pourra réellement juger sur pièces, même si de mon côté, mon opinion est faite ... Et par souci d'impartialité, le bilan de la loi LRU, côté communiqué officiel :-)
  • Sans archive(s) pas de mémoire, sans mémoire pas d'Histoire. Le petit monde de l'archivistique est depuis peu en butte à de sévères bouleversements qui engagent tout un pan de notre mémoire collective. Voir ici et là.
  • Edvige et Cristina. La France en (très) bonne place pour les prochain BigBrother Awards. Voir (parmi d'autres) : Politis, Le Monde, le point de vue de Jean-Marc Manach, l'article d'EDRI avec les liens vers les parutions du JO et d'autres couvertures presse. Ils en parlent aussi : l'ADBS. Au moins, cette affaire aura donné lieu, sur France Inter, à un téléphone sonne d'anthologie :-(
  • Et toujours à l'affiche, "les cages de la république".

Côté People et Blogosphere :

  • ce dont tout le monde a parlé cet été c'est la guerre entre blogueurs et journalistes. Rappel des faits.
  • Le départ de Versac tout comme la sortie de route classement de FredCavazza sont d'ailleurs peut-être assez symptômatique d'un changement d'époque. Car outre-atlantique aussi, Francis Pisani nous apprend que Jason Calacanis himself annonce son retrait blogosphérique. Je suis de mon côté depuis longtemps convaincu que les blogs auront permis l'émergence de nouvelles formes de parole (et de prise de parole), côté scientifique notamment, et qu'ils se dirigent lentement mais surement vers une hybridation de plus en plus marquée (voir les exemples très éclairants choisis par Narvic).
  • Et puis le choc de l'été sur les blogs sciences de Wikio : André Gunthert dégringole à la troisième place et Jean Véronis fait une entrée fracassante directement à la seconde (place). De mémoire d'homme, seule Samantha Fox avait, à l'époque du Top 50, réussi une telle entrée. M'est avis qu'avec de tels challengeurs qui ne respectent même pas la pause estivale, ma première place va rapidement être remise en question. Assez bizarremement, ni Closer, ni Gala ni Voici n'ont fait leur "une" de cet événement pourtant incountournable.

Côté identité numérique :

  • A l'heure où la gestion de la réputation numérique est chaque jour plus centrale pour le simple quidam, elle revêt, pour le futur potentiel président des Etats-Unis une importance plus que vitale. On lira donc avec intérêt sur le blog VerbalKint, la stratégie mise en place par l'équipe de campagne de Barak Obama pour contrer les rumeurs en temps réel. Intéressant de noter également l'évolution qui, depuis la dernière élection présidentielle américaine, avait marqué l'avènement des blogs comme outils de lobbying, et qui se décline aujourd'hui sur le mode de la gestion de la réputation. Comme dans la "vraie vie" des "vrais gens" pour qui les blogs, après être devenu un outil d'expression central, sont aujourd'hui l'un des principaux axes de leur visibilité numérique et de ce qui s'y rattache.

Côté "ça peut toujours servir" :

Côté Agenda :

Côté lectures :

Côté visionnage :


Ce qui me frappe dans tout ça ...

Comme dans la nouvelle de Borges, "Funes ou la mémoire", le mouvement d'externalisation de nos mémoires, documentaires et intimes, nous mène droit vers une société à l'hypermnésie latente, activable. Avec Google dans le rôle de Funes, et de son côté, pas la moindre aspiration à s'enfermer dans une pièce vide pour ne plus rien "enregistrer".

Bonne rentrée à tou(te)s :-)

(Sources : sous les liens // Temps de rédaction de ce billet : 2 mois ;-)

Les cahiers au feu ... et les fils RSS au milieu

Comme promis, un petit billet "revue de liens" pour expurger mon agrégateur avant de partir en vacances.

Côté Moteurs (et un peu au-delà) :

  • Difficile de passer à côté du "big deal" passé entre Yahoo! et Google suite à la tentative avortée de rachat de Yahoo! par Microsoft. Pour une synthèse, voir notamment ce qu'en disent Adscriptor, Techcrunch, Média & Tech, Francis Pisani, Techcrunch France, ReadWriteWeb et (plus synthétique) Le Monde. Quelques analystes avaient, dès le départ de l'affaire, souligné que l'offensive de Microsoft avait de forte chances d'échouer au profit de Google. Ce dernier tire effectivement une nouvelle fois son épingle du jeu en renforçant une position déjà outrageusement hégémonique sur le marché de la publicité en ligne. De son côté, Yahoo! sauve (provisoirement ?) les meubles en renflouant ses caisses, mais le "coup" porté par cette affaire est en train de bousculer grandement (et durabement ?) la structure (et l'autorité) de son exécutif ...
  • Microsoft (pour se remettre du fiasco Yahoo ?) vient donc officiellement de s'offrir Powerset, moteur plus sémantisé que réellement sémantique (comme je tente de l'expliquer dans les 75 000 signes rédigés pour le séminaire INRIA IST'2008). L'argumentaire mis en avant dans le billet du blog de Microsoft est celui du renforcement du moteur Live.com (qui est clairement à la ramasse par rapport à Google et Yahoo) grâce à la mise en avant de la compréhension du contexte et de l'implicite. Bref, Microsoft entre officiellement dans la course au web sémantique. 
  • On pouvait déjà faire plein de choses avec Google et ses services (ou ceux qu'il a rachetés). On peut désormais en faire encore plus. Celui-ci a en effet annoncé qu'il allait se lancer dans le marché (juteux et stratégique) de la mesure d'audience et du "média-planning". Un créneau jusqu'ici propriété quasi-exclusive de Nielsen Online et ComScore (qui en tremblent déjà ...) ou Médiamétrie dans l'héxagone. Inutile je pense d'en rajouter une couche sur le fait qu'en gagnant (ce n'est pas encore fait et comme le souligne Emmanuel Parody c'est le marché de masse qui est d'abord visé ...) le marché de la mesure d'audience, Google devient un peu plus l'alpha et l'oméga d'une certaine représentation du web. Cette nouvelle corde à son arc est cependant parfaitement "logique" pour au moins deux raisons : primo l'infrastructure dudit Google, son nombre colossal de serveurs, et l'ampleur des données qu'il recueille et dont il peut librement disposer, deuxio, l'atout stratégique et l'effet de levier que représente un outil planétaire de mesure d'audience pour (mieux) vendre (encore plus) de la publicité aux annonceurs. Le service porte le doux nom de Google Ad Planner.
  • Google (ben oui, encore ...) se lance dans une opération de communication de maintien de la neutralité du Net. A l'heure où l'on constate partout (y compris en France - loi Hadopi - et au Canada mais aussi aux Etats-Unis avec la très récente annonce d'une purge du réseau Usenet) la transformation des FAI en auxiliaires de police, Google à donc annoncé (sans fournir de date ni de nom de service, ni de détails ...) : "le développement d’outils qui permettront aux internautes de vérifier par eux-même si leur fournisseur d’accès à Internet (FAI) intervient d’une manière ou d’une autre sur leur connexion." (via Ecrans) L'alpha et l'oméga disais-je ... A propos, plus largement, de la loi Hadopi (parenthèse ci-dessus), il existe heureusement encore quelques dangereux anarchistes pour tenir un discours vivifiant et cohérent sur la question du copyright et du logiciel libre.
  • Le web invisible connaît un deuxième recul très significatif. Après l'annonce (par Google) d'une indexation possible des données contenues derrière certains formulaires de recherche, c'est désormais Adobe qui annonce que le format Flash sera indexable par les moteurs. Comprenez : Adobe va mettre à disposition de Google et Yahoo! (pourquoi pas de Microsoft ? Parce que Microsoft développe sa propre technologie concurrente à Flash : Silverlight) un player spécifique qui permettra de naviguer "dans" les sites en flash et d'en indexer certains éléments au passage. Pour le reste, voir le billet de Techcrunch d'où je tiens l'info, les Questions/Réponses de Google WebmasterCentral et la FAQ d'Adobe. La question de l'indexation (et du référencement) des sites en Flash est un vieux serpent de mer pour les référenceurs. Avec ce nouveau système, c'est un pan entier du web qui va à son tour émerger dans les pages de résultats des moteurs. Les avis des analystes sont par ailleurs assez partagés sur l'intérêt et la nouveauté relative de cette indexation.

Côté Réseaux sociaux :

  • Marc Andreessen (fondateur de Netscape et actuel gourou de Ning) rejoint l'exécutif de Facebook. Bonne pioche dans tous les cas et rapprochements probables ou nouvelle concentration à venir de ce côté là.
  • Une bibliographie sur la question des réseaux sociaux par l'une des meilleurs spécialistes de la question, Danah Boyd.
  • Un entretien avec Pierre Bellanger (PDG Skyrock) à propos du "premier réseau social d'Europe" (Skyblogs) dans lequel tombe une (de mes) idées reçues : "La totalité (des blogs) est active. Tout blog qui n'a pas été modifié ou consulté dans les derniers 90 jours est automatiquement supprimé. Près de 10 000 blogs sont ainsi fermés chaque jour, tandis qu'il s'en crée plus de 30 000. La plate-forme est un réseau vivant. Pas de cimetière de blogs ou de profils chez nous !"

Côté web 2.0 :

Côté bibliothèques :

Côté Wikis et Wikipédia :

Côté "livre et numérique" et livres numériques :

Côté Web sémantique :

Côté bibliométrie et indicateurs scientifiques :

  • un rapport sur l'usage statistique des citations (.pdf) et son résumé en français sur le site de Sauvons la recherche. Le rapport plaide clairement en faveur d'une théorie de la relativité générale des indicateurs statistiques scientifiques là où la plupart des "décideurs" y voient l'alpha et l'oméga de toute politique d'évaluation digne de ce nom. Pour les autres, il est toujours possible de faire joujou avec ce genre d'outils.

Côté lectures :

  • le dernier Livre Blanc de Christophe Asselin/Digimind sur la "Réputation Internet". Avec notamment quelques buzz digitaux disséqués et l'indication de "stratégies" pour les anticiper, les démonter, les relancer, les contrôler. Du simple veilleur au consultant en communication de crise, ce Livre Blanc devrait amplement satisfaire son lectorat.
  • LA bible du documentaliste et du bibliothécaire : le Traité de Documentation de Paul Otlet, sous-titré "Le livre sur le livre". C'était en 1934. Et on n'a guère fait mieux depuis.
  • Pour se faire plaisir (et se faire un peu peur dans la veine du 1984 d'Orwell), la dernière nouvelle de Cory Doctorrow : Little Brother. Librement téléchargeable.

Côté ressources pédagogiques :

  • Un vrai cours en ligne de Laurent Jenny sur l'Histoire de la lecture (avec bibliographie, exercices et tout et tout)
  • Prenez des textes scientifiques "fondateurs" et faîtes-les analyser par des scientifiques d'aujourd'hui pour mieux comprendre leur impact et leur inaltérable actualité : c'est la très bonne idée du projet Bibnum, pour l'instant encore à l'état de maquette, mais dont on souhaite qu'elle prenne très rapidement son essor (et qu'elle s'ouvre au-delà des 4 domaines qu'elle entend pour l'instant couvrir - math, physique, chimie, biologie -  les SHS constituant un formidable terrain de jeu pour ce genre de mise en perspective).

Et pour finir, un petit lien du Week-End :-)

C'est wikipédie qui l'est : vers une guerre de position.

La phase 5 de la bataille encyclopédique est engagée. Rappel des faits.

  • Round 1 : phase d'observation. Les grandes Dames encyclopédiques observent d'un oeil distant (et parfois sarcastique) l'essor de la toute petite Wikipédia.
  • Round 2 : l'offensive. Devant l'engouement suscité et le succès (ou la renommée) avérée de la petite encyclopédie qui monte qui monte ... les grandes Dames fourbissent leurs armes. Les arguments de bonne foi et - plus fréquemment - de mauvaise foi sur la ligne éditoriale, la fiabilité, la nature même du projet pleuvent.
  • Round 3 : la contre-offensive. C'est la fameuse querelle des anciens et des modernes avec la très sérieuse revue Nature dans le rôle d'arbitre et un opposition point à point entre la fiabilité des informations publiées dans Wikipedia et dans Britannica. Le résultat de cet arbitrage n'en a toujours pas fini d'être commenté mais il démontre que d'un strict point de vue qualitatif, les reproches adressés à Wikipedia ne tiennent pas.
  • Round 4 : l'alignement. Puisque le modèle contributif-collaboratif-ouvert mène la danse, puisque les usagers en redemandent, puisque l'encyclopédisme d'usage est entré dans les moeurs, les grandes Dames se décident à s'y mettre. De son côté, Wikipedia tire également les enseignements d'un encyclopédisme plus "traditionnel" et réfléchit sérieusement à des stabilisations ponctuelles de certains de ses articles en même temps qu'elle fait le choix du papier comme support de cette fixation (pour plus de détails, voir mon dernier billet sur le sujet).

Voilà où nous en sommes (à peu près ...) aujourd'hui. Mais il ne vous a pas échappé qu'un match ne se joue pas en 4 rounds (sauf par KO), et le cinquième s'annonce également épique. Alors que les critiques commencent à leur tour à pleuvoir sur les virage collaboratif de l'encyclopédie Larousse ( et notamment), Hubert nous apprend que Britannica se lance dans le tryptique collaboratif. Je copie-colle un extrait du billet d'Hubert :

  • "une version totalement ouverte dans sa consultation pour que les journalistes ne citent plus seulement Wikipédia, et une version qui intégrera 3 niveaux de contenus : ceux créés par les utilisateurs, par un pool d’experts et le contenu de la dernière édition de la Britannica elle-même."

Ne serait-ce ma mauvaise foi galopante, je me hasarderais à écrire que vouloir satisfaire tout le monde est parfois le plus sûr moyen de ne contenter personne. A lire l'intégralité du billet d'annonce de Britannica ainsi que l'article s'en faisant écho sur Wired, ce qui me saute aux yeux, c'est que l'argumentaire principal derrière ces mutations encyclopédiques n'est pas - ou alors à la marge - une réflexion sur la nature même du projet encyclopédique au XXIème siècle. Ce qui motive cet habillage collaboratif, le "nerf de la guerre" c'est - du côté des grandes Dames - la course à l'audimat, la course à l'attention. Derrière cette course il y a une évidence contingente : la meilleur encyclopédie du monde ne vaut rien si elle n'est pas lue. Mais à la manière des charades à tiroirs, cette contingence en cache une autre : être lu est une chose, être lu par des prescripteurs en est une autre. Or les principaux prescripteurs de l'économie de l'attention, ses principaux relais, sont aujourd'hui les journalistes et les bloggeurs. Ainsi donc derrière l'accès gratuit de Brittanica pour les "web publishers", derrière le lancement très médiatique du Larousse collaboratif, la  cible visée est transparente, évidente. Le virage collaboratif n'est au mieux qu'un habillage marketing destiné à gagner la seule vraie bataille : celle du positionnement dans les moteurs de recherche. Car derrière ce positionnement se trouve le graal : argent, renommée, notoriété et cercles vertueux - ou vicieux - associés.
Or en ce domaine, on connaît depuis longtemps les liens affinitaires qui lient la première Encyclopédie mondiale (Wikipedia) au premier moteur de recherche (Google). Je m'en suis ici même fait l'écho à de nombreuses reprises. Et cette "guerre de positions" au sens littéral du terme n'en finit pas d'affoler. Dernière polémique en date, celle des entreprises du CAC 40 ou plus exactement des agences de relations publiques qui vivent sur leurs dos, lesquelles s'émeuvent de la place prise aujourd'hui par Wikipedia dans ... les relations publiques. Le dernier article d'Ecrans est là-dessus aussi remarquable qu'édifiant : "Wikipedia terrorise le CAC 40."
Alors ? Alors Wikipedia a - à mon sens - permis d'instaurer un virage radical dans la définition du projet encyclopédique (encyclopédisme d'usage). Les autres grandes Dames ont - d'aussi loin que les articles mentionnés dans ce billet permettent d'en juger - fait l'économie de cette réflexion de fond au profit ... d'une recherche du profit.  Fait l'économie d'une réflexion sur le Projet Encyclopédique dont elles sont porteuses, pour la quête d'une viabilité économique concernant la diffusion de leur encyclopédie. Autre chose qui me frappe dans tout cela, c'est une inversion des "literacies." Jusqu'ici, les "références encyclopédiques" étaient un exercice et un passage obligé pour l'étudiant, le chercheur, l'amateur. Elles étaient "devant être recherchées". On "se" devait de les rechercher. Elles n'avaient donc pas à se soucier de marketing, faire autorité suffisait. Pour des raisons sur lesquelles je ne vais pas m'étendre (faudrait une thèse là dessus) mais que les habitués de ce blog ont l'habitude de croiser, notre approche de la connaissance a changée en même temps que changeaient les modes de constitution et de transmission de cette connaissance. Le résultat c'est que les encyclopédies sont engagées aujourd'hui dans des péripéties dignes des grandes guerres d'éditeurs au moment de l'attribution d'un prix littéraire. Il faut "aller chercher" le chercheur, l'étudiant pour qu'à son tour il soit tenté de renouer avec la tradition de "la-référence-encyclopédique-mais-pas-Wikipedia." Inversion des literacies donc. Parce qu'on ne peut pas éternellement ménager la chèvre et le chou, l'autorité et la notoriété, "être à la fois Jean Dutour et Jean Moulin" comme disait l'autre. Or ce combat est perdu d'avance. Non pas que les encyclopédies n'aient pas les moyens de le mener (toute l'actualité prouve au contraire qu'elles sont toutes disposées à s'offrir ces moyens, si peu nobles soient-ils), mais ce combat n'est pas le leur. Elles n'en maîtrisent ni l'alpha, ni l'oméga. Ce combat, c'est celui des moteurs de recherche qui sont les seuls à disposer de la force de frappe nécessaire pour faire significativement bouger les choses, dans un sens ou dans un autre. Aucune agence de RP, aucun habillage collaboratif n'y changera quoi que ce soit. Quand une encyclopédie (qu'elle qu'elle soit) fait de sa quête de notoriété une ambition première, elle sacrifie nécessairement sa valeur d'autorité. Les encyclopédies qui font aujourd'hui ce pari là oublient une chose simple : la notoriété de Wikipédia est un épiphénomène. La notoriété de Wikipedia n'est qu'un épiphénomène. Cette notoriété ne s'est pas exclusivement construite sur la place manquante des autres encyclopédies dans la sphère numérique. Elle s'est construite sur une propagation massivement partagée de l'indice d'autorité accordé à l'essentiel des articles de La Wikipedia. Rendre accessible est une chose. Etre accessible (au sens propre comme au sens figuré) en est une autre.

<Update du lendemain> Sur le même sujet, voir le billet de Didier Durand qui revient sur l'article d'Ecrans et la - pathétique - "stratégie" de l'agence EuroRSCG. </Update>

Wikipedia vrac ...

Dans le tumulte des actuelles batailles encyclopédiques, Wikipedia continue de donner de la voix.
Côté usages pédagogiques :

  • elle devient l'outil de travail d'une université canadienne : il s'agit pour des étudiants (d'un cours de littérature) de faire accepter leurs travaux en tant "qu'articles de qualité", au prix des nombreux aller-retour "éditoriaux" et des non moins nombreuses corrections et ajustements que cela implique. Une belle logique "gagant-gagnant" puisque la somme des connaissances collectives s'en trouve augmentée, que l'exercice pédagogique est formateur et innovant, et que les lignes de l'enseignement à l'heure des Youniversités (= "l'appropriation des nouveaux médias participatifs dans la transmission des savoirs") se font de plus en plus claires.

Côté expérimentations scientifiques (Via Catalogablog) :

  • Wikipédia est utilisée pour rendre plus efficace la classification de textes, et ce en "extrayant" des données issues de Wikipedia et portant sur le "background knowledge" du contenu des documents à classifier. Référence : Boosting Inductive Transfer for Text Classification using Wikipedia by Somnath Banerjee. HPL-2008-42
  • la même démarche peut être utilisée pour mieux caractériser la catégorisation (clusterization) de courts textes (avec en ligne de mire le rangement "automatisé" de fils RSS dans un agrégateur, sur la base de ladite caractérisation). Référence : Clustering Short Texts using Wikipedia by Somnath Banerjee, Krishnan Ramanathan, and Ajay Gupta. HPL-2008-41

Côté filmographie :

Côté polémique (argumentée) :

Bataille encyclopédique

L'actualité encyclopédique est relativement chargée ...

  • Afin de rivaliser avec Wikipedia, la Britannica lance une opération de communication visant à offrir un an d'accès gratuit à la totalité de l'encyclopédie : il suffit pour cela de s'inscrire ici. Pour obtenir votre abonnement cadeau, il vous faudra cependant justifier d'une activité de "web publisher", c'est à dire disposer d'un site/blog tenu régulièrement. L'idée est donc de profiter de la blogosphère (et assimilée) comme chambre d'écho, afin de ramener du traffic vers la Britannica. Je m'y suis moi-même inscrit et je teste depuis une semaine les ressources de cette grande dame. Et j'avoue rester un peu sur ma faim. Il est vrai que je n'entre pas tout à fait dans le profil de l'usager lambda d'encyclopédies, mais sur des requêtes assez spécialisées, les contenus de la Britannica apparaissent assez maigres au regard de ceux de Wikipedia. In fine, il n'est pas sur que l'opération de communication porte ses fruits étant donné qu'il est par exemple impossible d'offrir aux autres (ceux qui n'ont pas gagné un an d'abonnement gratuit) un lien vers les contenus de ladite Britannica. Bref, le contre-buzz est déjà en marche est il semble évident que la Britannica n'a pas compris la logique de sérendipité qui sous-tend l'économie de l'attention. (voir aussi l'article d'Ecrans)
  • beaucoup plus pertinente (à mon avis) est l'initiative de Larousse qui vient de lancer son encyclopédie contributive. L'article d'Ecrans sur le sujet est limpide et j'en reprends donc les grandes lignes pour ce qui concerne le "modèle" de cette riposte à la Wikipédia : "accès libre à son dictionnaire encyclopédique validé (150 000 articles et 10 000  objets multimédias). Pour consulter l’encyclopédie, il faut s’inscrire et il est possible de fournir ensuite des textes ou des images, tout en restant propriétaire de son œuvre. (...) Chaque volontaire est invité à créer son espace personnel, qui dispose d’une messagerie. Contrairement à Wikipedia, les anonymes sont bannis et les contributions sont sanctuarisées une fois écrites. Pas question d’aller mettre son grain de sel sur un article d’internaute déjà publié." L'interface est en sus beaucoup plus agréable de celle de la Britannica et les futurs contributeurs sont bien guidés, avec par exemple la possibilité d'indiquer un niveau de lecture de leur article (expert, grand public ou junior). Côté contenus en revanche, c'est la même déception (subjective) que pour la Britannica. Une déception certainement biaisée par mon habitude de consultation de Wikipédia, mais les possibilités de navigation me semblent bien en-deça d'une logique d'écriture de contenus multimédia.

Moralités :

  • Dans l'absolu, il est heureux que les marchands d'encyclopédie tentent de devancer les initiatives des marchands/moteurs de recherche. On avait en la matière plutôt été habitué à constater une habitude de suiveurs. Or ces initiatives interviennent alors que, parmi d'autres, le projet Knol de Google en est encore à l'état d'annonce. Quant à savoir si l'amorçage collaboratif prendra ...
  • Dans l'absolu toujours, et alors même que les encyclopédies "classiques" se mettent au numérique - elles y étaient déjà timidement entrées - et surtout au numérique collaboratif, on observe que le leadership du collaboratif numérique (Wikipédia donc) va tenter l'expérience du papier (essentiellement pour renflouer sa trésorerie) une expérience dont on mesurera les enjeux en lisant le billet de Jean-Michel Salaun.

Service de presse : Wikipédia

J'ai reçu il y a déjà longtemps l'ouvrage "Wikipedia : média de la connaissance démocratique" paru chez FYP éditions. Il s'agit d'un ouvrage à plusieurs mains (12 au total) avec Marc Foglia comme contributeur principal. Voici mes notes de lecture ...

  • L'introduction dit bien l'enjeu et la difficulté de cerner le phénomène Wikipédia : "sans doute faudrait-il inventer un mot pour désigner celui qui n'est ni lecteur, ni auteur, ni éditeur, ni usager, et tout cela à la fois. L'inadéquation de notre langage est le signe que quelque chose de nouveau est apparu."
  • Un grand nombre d'angles d'analyse sont abordés dans l'ouvrage, dont celui du fondement "politique" de Wikipédia : "Le libéralisme collectif est une forme de rationalisme avant d'être un collectivisme."
  • L'occasion également de rappeler quelques évidences avec un joli sens de la formule : "En inaugurant un système de production low cost avec lequel aucune encyclopédie existante ne peut rivaliser, elle a bouleversé les circuits traditionnels de l'édition encyclopédique."
  • Plus loin également et sur un autre coeur de polémique : "L'évaluation scientifique se métamorphose en consultation collective."
  • Jolie formule également à propos de la fondation Wikimedia, celle d'un "ordre mendiant de la connaissance."

Côté polémique, l'idée qui m'a le plus fait "cogiter" est celle avancée par l'auteur principal d'un "flat knowledge" (p.124) pour désigner un "savoir qui ne fait aucune priorité entre ses éléments". L'argument est ici correctement présenté et débattu mais on y retrouve la vieille antienne des anti-wikipédia se désolant de retrouver en un même corpus des articles sur la critique de la raison pure et sur Jean-Claude Van Damme. De mon côté je crois tout au contraire que rien n'est plus en relief que Wikipédia. Je crois même qu'aucune réalisation intellectuelle humaine depuis l'aube des temps ne peut s'enorgueillir d'un tel niveau de relief, de profondeur. Cette profondeur n'a rien de philosophique, elle est tout au contraire symptomatiquement pragmatique. C'est une profondeur de projet. Une profondeur d'écriture. La profondeur du formidable palimpseste à l'échelle planétaire que recouvre le projet Wikipédien. "Un palimpseste technologique à la démesure de la Babel mythologique." si vous m'autorisez l'auto-citation :-) Bref rien de plat en la matière. La platitude est en revanche à chercher - et c'est d'ailleurs dans cette direction que nous amène l'ouvrage, mais pas assez explicitement à mon sens - la platitude est en revanche à chercher, disais-je, du côté des usages. De la focale sans profondeur de champ que nous mettons en place en utilisant le moteur de recherche du site Wikipédia. Mais une fois dans LE contenu, le relief s'impose à nous dans toutes les dimensions du texte et dans toutes les possibilités d'exploration de l'hypertexte.
Au final donc, deux regrets :

  • l'ouvrage est complété par les résultats d'un sondage Opinion Way sur la perception de Wikipedia, sondage qui ne nous apprend rien (mais alors vraiment rien) et dont les résultats ont du tomber alors que l'ouvrage était déjà dans les rotatives vu la manière dont il est mis en page.
  • l'absence d'une bibliographie explicite (les références sont noyées à la fin de l'ouvrage au milieu des notes) avec à plusieurs reprises des affirmations qui gagneraient à être plus directement "sourcées".

Mais un ouvrage qui se lit vite et bien, et dont - ce qui n'est pas le moins important - la lecture est agréable nonobstant les inévitables cassures qu'entraîne son écriture à plusieurs mains. Le tout avec une argumentation parfois un peu rapide mais toujours stimulante et qui ne tombe jamais dans le travers de la polémique inutile.
Merci donc au service de presse de FYP éditions :-)

La fracture amicale.

"La nouvelle fracture numérique opposera les gens disposant d'un réseau d'amis et ceux sans amis. L'ancienne fracture numérique entre les riches (ceux disposant d'une connexion internet) et les pauvres continuera d'exister." La citation (repérée par TechCrunch) est de Robert Scoble. Si cette "formule" m'intéresse c'est parce qu'elle traduit assez bien la manière dont, in fine, les logiciels sociaux (qui, rappelons-le, sont bien plus que les simples "réseaux sociaux") ont durablement transformé la nature de notre rapport au web.
<Parenthèse> Dire que les logiciels sociaux ont transformé la nature de notre rapport au web, n'est pas du tout la même chose (et est à mon avis beaucoup plus juste) que d'affirmer - comme on le lit un peu trop souvent - que les réseaux sociaux ont changé la nature du web </Parenthèse>
Il me semble qu'aujourd'hui, dans l'essentiel de nos pratiques, la socialisation dans sa dimension expérientielle première, est devenue au moins aussi importante que les trois activités qui firent la spécificité du primo-web, c'est à dire la navigation-lecture (browsing), la navigation-recherche (searching) et naturellement l'écriture (au sens large de "production de contenus"). Ce qu'ont permis les logiciels sociaux c'est le transfert de logiques de socialisation grégaires depuis des espaces clos et dédiés (les forums ou groupes Usenet) vers des espaces réellement réticulés, c'est à dire largement distribués au travers du moindre espace d'écriture ou de navigation.
Cette réflexion en appelle une autre. Il n'est pas aujourd'hui sur le web d'espace de production de contenus numériques qui n'échappe à l'angle d'une analyse "conversationnelle", "socialisante". On n'écrit plus, on ne publie ou ne produit plus aujourd'hui de contenu simplement pour être présent, pour occuper un espace, ou pour être bien "positionné" mais tout au contraire pour confronter ou pour souscrire. On écrit, on publie, on produit pour engager un débat. Pour "se" confronter aux autres. Pour maintenir et établit un contact. De toutes les fonctions du langage théorisées par Jakobson, c'est la fonction phatique qui est au coeur de l'ensemble des socialisations numériques, y compris (et surtout ?) de l'écriture-socialisante qui couvre  (par exemple) l'immense majorité des productions de la blogosphère.
Comme nouveaux totems de cette dominance du phatique, citons les trackbacks ou rétroliens (qui en inversant la polarité des liens pour la première fois dans l'histoire de l'hypertexte, contribuèrent largement à disséminer ladite fonction phatique et à en faire l'un des tout premiers horizons d'attente de l'écriture numérique courante). Citons également l'incontournable et parfaitement totémique "poke" de Facebook
Pour autant, et dès que cette confrontation se trouve inscrite dans un processus collaboratif assez large impliquant un nombre significatif de personnes, on retombe très largement dans les anciens et classiques shémas auctoriaux et éditoriaux. Des shémas "étagés" dans lesquels les fonctions de représentativité et de leadership sont réaffirmées comme essentielles. La présumée "sagesse des foules" n'est que l'exercice d'une démocratie numérique rigoureusement équivalente au système politique dans lequel nous évoluons. La seule différence (de taille) vient de son amorçage : les "leaders", les "gourous", les "éditeurs", les "auteurs" ne sont pas élus dans une logique de représentativité en assumant une charge "par délégation", mais ils sont les promoteurs ... à l'origine de leur propre promotion. Une promotion dans le meilleur des cas au service d'un projet ou d'une parole, et dans le pire des cas au seul et unique service d'un égotisme forcené. Les autres, tous les autres y souscrivent au sens littéral du terme. Ils écrivent, publient, discutent, débattent "en dessous", dans les limbes palimpsestiques de ces nouveaux espaces de socialisation numérique. La fonction phatique ne prime plus. Le "poke" redevient "private joke".
Le web, quelle que soit sa dénomination ("world wide web, world live web, world life web"), sa numérotation (1.0, 2.0 ...) demeure un espace rhizomatique mais devient de plus en plus organique ; son organisation confine à l'organique. Les liens unissant des contenus y côtoient désormais les relations unissant des personnes. Cette corporéité nouvellement incarnée n'est pas simplement métaphorique. Elle traduit un changement de nature radical. L'erreur serait de croire que ce changement de nature est également un changement d'objet. Le web est et demeure une artefacture technique. L'erreur serait de ne chercher qu'à questionner cette artefacture. Le web n'est qu'un vecteur. Le changement concerne tout au contraire notre rapport individuel et intime à la socialisation. Notre rapport à l'autre.
Il y a quinze ans de cela, des scientifiques, des universitaires, se posaient la question de savoir quels documents/contenus pouvaient être numérisés. La réponse est aujourd'hui connue : il n'est aucun contenu qui ne résiste à la numérisation, rien qui ne puisse être numérisé ou numérique. Rien qui ne puisse être re-présenté "sous forme" et "au format" numérique. Pro forma. Ce qui est vrai des documents/contenus le sera-t-il également pour les individus et les relations interpersonnelles ?
Ce n'aura pas été le moindre mérite de Facebook et consorts que de permettre que ces questions soient posées. Les réponses seront là aussi évidentes. Dans 15 ans. Ou peut être moins. D'ici là nous aurons grand besoin de sociologues pour nous aider à bâtir la science du web.

(Temps de rédaction de ce billet : 2h30)

Faut-il stabiliser Wikipédia ?

L'édito de Bertrand le Gendre sur le site du Monde en date du 15 Mars, laissait entrevoir le pire : "Faut-il brûler Wikipédia ?" Le genre de titre incendiaire à vous mettre en émoi toute la communauté des Wikipompiers. Heureusement, il ne fallait y voir qu'une accroche vendeuse : le fond de l'article propose enfin le bon éclairage du phénomène (tout au moins en ce qui concerne le traitement par la presse quotidienne du phénomène wikipédia) : regarder WIkipédia comme une "nouvelle écologie de la connaissance" et non pas comme un épouvantail (épouvantable ?) éditorial planétaire. Et donc en écho à ce bel édito, Florence Devouard répond sur son blog à quelques questions qui sont au coeur de la capacité qu'aura Wikipédia à faire vivre et prospérer ladite écologie, sans se surexposer aux pathétiques effets de serre assouliniens. Cette question c'est celle de la "protection en édition" et de la stabilisation de certains articles. Le billet de Florence Devouard permet de replacer cette question dans "l'histoire" de l'encyclopédie et ouvre de nouvelles pistes dont les résonnances théoriques sont nombreuses et fécondes pour ceux qui s'intéressent aux documents numériques en général et aux processus éditoriaux les régentant en particulier :

  • La mise en place de différents "flags" (=drapeaux) qui sont les "bandeaux d'alertes" (non neutre, manque de source, ébauche etc...), et le système des "articles de qualité" (processus d'identification de BONS articles sur Wikipédia, par la communauté; articles identifiées en haut à droite des articles par une petite étoile dorée) si elle se systématise, pose la question croisée de l'émergence et de la validation par une communauté de pairs.
  • la question de la version qui doit être visible par défaut (celle flagguée et qualitativement "certifiée" ? la plus récente ?) renvoie aux interrogations sur le versioning, qui est le coeur de la dimension palimpsestique avérée de l'ensemble des documents et des documentations numériques.
  • La question enfin du droit et de la responsabilité éditoriale du flaggueur : dans le contexte mouvant et dans la temporalité particulière du numérique, dans un projet dont l'inachèvement programmé  est consubstantiel à son existence même, le processus de sélection et de validation peut-il être empreint de la même notion de responsabilité que dans un processus éditorial plus classique ?

Beaucoup de questions, peu de réponses pour l'instant, mais bien des perspectives passionnantes qui se confirment. En ce qui me concerne (et pour autant qu'on me demande mon avis), je pense que Wikipédia ne peut pas faire - et elle ne le fait d'ailleurs pas - l'économie d'une systématisation de cette "stabilisation", de ce fléchage des versions "les plus établies". Par ailleurs je pense que sa dynamique propre doit laisser au premier plan ce "work in progress", laissant se déployer un encyclopédisme d'usage. A chacun de faire son chemin. Plus les sous-bassements invisibles de la "Wikipédia stabilisée" seront nombreux et systématisés, plus ils auront capacité à se présenter "en référence" tout en s'effaçant devant la dynamique du projet, plus le lecteur avancera dans la sécurité, tout en préservant cette inclinaison particulière de la sédimentation encyclopédiste à la mode de Wikipédia.

Dans Politis

A lire dans le dernier numéro de Politis (n°989, 14 Février), le résultat d'une entrevue avec Christine Tréguier à propos de Wikipédia. L'article s'intitule "Les savoirs en ligne de mire". J'y reviens sur quelques-uns de mes "dadas" : encyclopédisme d'usage, babélisation des expertises, dérive des continents documentaires ... J'apprends à la lecture de l'article que Larousse devrait ouvrir en Mars son encyclopédie en ligne à des contributeurs extérieurs, des "gens de qualité qui veulent se faire connaître" avec cependant une "distinction claire entre les contenus Larousse et les autres".
Politis
Promis, après Ecrans, Libération et Politis, je vais essayer de me faire interviewer par des journaux de droite ;-)

"Apprendre de Wikipedia" par Henry Jenkins.

Henry Jenkins est un des illustres professeurs du MIT (oui je sais, pléonasme ...). Son dernier podcast traite de la manière dont Wikipedia peut éclairer l'usage que nous faisons des nouveaux médias. Plus précisément : "What Wikipedia can teach us about new media literacies". Cela dure une heure et quart et Jenkins développe entre autres quelques arguments que j'avais plus brièvement et moins talentueusement avancés dans ma récente entrevue à ce sujet.
Extraits (en vrac et très approximativement) :

  • Wikipédia (WP) n'est ni bonne ni mauvaise (mais elle pourrait le devenir si nous décidions de ne pas en parler à nos étudiants).
  • WP permet d'ouvrir et d'observer le procédé de constitution et de distribution des connaissances.
  • Interroge les concepts de crédibilité, d'autorité, de "large contribution", de "technologie d'appropriation", de "culture du don" et de "culture du jeu"
  • Il faut développer (c'est ce qu'ils font au MIT) des outils autour de WP permettant aux jeunes de mieux s'approprier non pas l'encyclopédie, mais les connaissances qui y circulent (notamment en y distinguant ce qui relève de la propagande et ce qui relève de l'information ou de la connaissance).

Au final un exposé qui va bien au delà de Wikipédia et resitue notamment les nouvelles compétences médiatiques ("media literacies") dans le cadre d'une culture de la participation (l'un des thèmes de recherche de Jenkins) et la fracture entre les "digital natives" et les "digital immigrants".

Wikipedia demain.

Ca bouge en ce moment pas mal autour de Wikipedia, qui vient de fêter (le 15 Janvier) ses 7 ans d'existence (bon anniversaire donc). Hasards du calendrier, j'ai récemment été contacté par deux journalistes. La première interview est à lire (version longue) sur Ecrans et (version courte) sur Libération. La seconde devrait paraître dans l'un des prochains numéros de Politis. A chacune des journalistes j'ai indiqué que, selon moi, l'avenir de Wikipédia passait nécessairement par une phase de stabilisation. S'il est aujourd'hui clair que le projet encyclopédique a changé de nature (il fait cohabiter des expertises et des contenus hétérogènes), qu'il a changé de temporalité (il se fait en temps réel), qu'il a changé d'ossature (il n'est plus bâti sur une organisation des connaissances a priori), et changé d'autorités (phénomène de babélisation des expertises), il faut que Wikipedia continue et accélère le mouvement qu'elle a déjà amorcé en "marquant", en "signant", en stabilisant une partie du formidable corpus qui la constitue, et il faut qu'elle reste dans le même temps une oeuvre et une forme ouverte "à tous", "à tout" et "pour tous". Une opinion récemment confirmée par l'interview sur Swissinfo de Florence Devouard (présidente de la fondation Wikipedia) et dans laquelle elle pointe 3 prochaines évolutions de Wikipédia, dont la première va dans le sens que je viens d'indiquer :

  • "(...) Quelque chose dont on parle depuis deux ans et demi: les versions stables. L'idée est de pouvoir identifier des versions comme étant validées, de proposer aux utilisateurs la possibilité de voir la version courante et la dernière version reconnue comme étant à peu près correcte. Deuxième innovation (...) la possibilité de se faire un petit fichier pdf ou une version papier d'un ensemble d'articles. (...) C'est le Wiki to print. Troisième innovation (...) la possibilité d'intégrer dans Wikipédia des vidéos et de les éditer de façon collaborative, comme un texte wiki. C'est-à-dire que les gens auront accès à une vidéo et pourront la changer de façon collaborative."

Une autre des grandes forces de Wikipédia, au-delà même des processus de collaboration centrifuges qui animent la communauté des Wikipédiens, ce sont les logiques d'appropriation centripètes qu'autorise l'architecture "ouverte" de l'encyclopédie : les différents outils cognitifs qui fleurissent ces derniers temps autour du projet illustrent bien ces logiques. Le dernier en date s'appelle "pédiaphon" : c'est une interface de synthèse vocale qui tourne sur les articles de Wikipédia. Vous entrez un terme de recherche, vous patientez une minute, et vous écoutez (synthèse vocale) une voix (pas encore très mélodieuse mais très audible et compréhensible) vous lire l'article correspondant. Les usages sont aussi innombrables que les voix du Podcast sont impénétrables (mais on pensera en premier lieu aux publics handicapés).
Enfin, il faut en permanence rappeler et se souvenir que l'indépendance de Wikipédia n'est pas acquise. Elle repose sur un modèle de promotion et d'accompagnement de la culture libre ("free culture"), à ne surtout pas confondre avec celui d'une culture gratuite.
(Via Didier Durand et Brouehaha)

Dans Libé

Reprise dans le "Libération" papier d'aujourd'hui - Mercredi - d'une version courte de l'interview accordée l'autre jour à Astrid Girardeau pour le site Ecrans (version longue).

Libe

L'idée exacte derrière le titre était "Penser Wikipédia comme un projet encyclopédique". Mais l'article rétablit l'idée exacte, donc tout va bien :-)

Interview Wikipédia

Astrid Girardeau du magazine "Ecrans" (qui soit dit en passant fait un très bon boulot de mise en lumière d'un grand nombre de phénomènes touchant à la galaxie Internet) m'a interviewé l'autre jour à propos de Wikipédia.
Le résultat est à lire sur Ecrans : "Wikipédia est un projet encyclopédique et un bien commun de l'humanité".

Fini les vacances, c'est la rentrée ...

Côté moteurs/wikipédia/knol :

  • On a donc pas mal parlé avant et pendant les vacances du projet de Google concernant son "encyclopédie" Knol : dans Ecrans, Florence Devouard s'inquiète à raison en rappelant que 50 % du traffic vient directement de Google. Google Blogoscoped y revient également en soulignant l'argument selon lequel Google ne pouvait plus accepter de voir partir tout ce traffic "non-monétisé" vers un site (wikipedia) indiquant qu'il refuserait toujours la publicité.
  • Voir aussi la rapide analyse comparative de ReadWriteWeb entre Knol, Wikia, Wikipedia et Mahalo autour des trois mamelles de l'argent, de l'attention (comme vecteur de monétisation) et de l'altruisme (comme contribution à la somme des connaissances disponibles).

Côté réseaux sociaux, moteurs de recherche et scientométrie :

  • Medline nous avait déjà habitués à son goût des interfaces innovantes. En voici une nouvelle baptisée GoPubMed qui permet, sur la base d'une recherche de faire émerger des "réseaux sociaux" à partir des noms d'auteurs d'articles et de leurs adresses de courier électronique (Via Cismef). En fait, plutôt qu'un réseau social (ce qui est l'argumentaire marketing du lancement de ce nouveau service), c'est bien de scientométrie qu'il s'agit, c'est à dire de la capacité, via un moteur sémantique, de repérer des collaboratoires, des "collèges invisibles", et de cerner en un instant sur un thème donné, l'état des publications en la matière et les chercheurs les plus en vue. Exemple : en entrant le terme "stuttering" (bégaiement) et en cliquant (à gauche dans la rubrique "What") sur "Hot topics", vous visualisez :
    • un "top 20" des auteurs ayant le plus publié sur le sujet
    • un "top 20" des publications classées par pays
    • un "top 20" des journaux dans lesquels on trouve le plus de publications en rapport avec le bégaiement
    • une courbe temporelle vous permettant de visualiser la progression (ou le recul) du nombre de publications par an sur ce sujet
    • une visualisation sous forme de graphe des réseaux de collaboration entre auteurs (répondant à la question "qui publie avec qui ?")
  • c'est à tomber par terre. Et on se prend à rêver d'un tel outil dans le cadre d'un moteur généraliste majeur à vocation scientifique (maiiiis non, pas forcément celui-là, il y a aussi celui-là). Pour mieux comprendre la puissance d'un tel outil : allez le tester, et lisez le communiqué de presse (.pdf).

Côté moteurs tout court :

  • le 7 janvier 2007, il y a donc de cela exactement un an, Jimmy Wales annonçait le lancement de Wikia, le moteur de recherche dont les résultats seraient validés par des humains. Et bien exactement un an plus tard, on nous annonce le lancement de Wikia (en version béta) pour demain, le 7 Janvier 2008 donc. A ce sujet, voir la revue de presse de Christophe Asselin. Le site de la "communauté" wikia est ici, et comme on peut le lire dans le wiki du projet, Wikia compte s'appuyer sur tout l'éventail des technologies de recherche à valeur ajoutée, à savoir la sémantique (= catégorisation), le "réseau social", l'indice de "réputation", et une infrastructure "distribuée". Lancement demain donc, et affaire à suivre de près pour ce nouveau "moteur de recherche open-source collaboratif".

Côté Bibliothèque "2.0" (ou pas ...)

  • Une conférence qui s'est tenue début Novembre à Berkeley sur le sujet des bibliothèques "2.0" avec les supports de présentation accessibles en ligne (supports présentés parfois sous forme classique - un bon vieux powerpoint - parfois sous forme "2.0" - un wiki). Pas de grande nouveauté mais cela vaut le coup de visionner la conférence inaugurale de Meridith Frakas qui embrasse bien la situation (.ppt)
  • l'un des derniers rapports du Pew Internet nous apprend (via 01.net) qu'outre-atlantique, la première raison de fréquentation des bibliothèques est ... le fait d'y trouver une connexion Internet. De quoi largement réalimenter de vieux démons débats, tant sur le taux d'équipement desdites bibliothèques dans notre bel hexagone, que sur la place des technologies d'accès dans ces enceintes et le taux de formation et d'encadrement qui est dévolu à leurs personnels.

Côté Folksonomies & Indexation sociale

Côté néologismes :

  • Saluons l'arrivée de la Zemblanité, exact opposé de la sérendipité et qui désigne "la faculté de faire de façon systématique des découvertes malheureuses, malchanceuses, attendues et n'apportant rien de nouveau." La génèse du concept et sa présentation détaillée sont disponibles sur Urfist-Infos.
  • Saluons (Via Francis Pisani) l'arrivée  de la "mobiquité" : mobilité + ubiquité. Un néologisme qui traduit bien la place de plus en plus importante qu'occupe dans notre société et dans nos comportements informationnels, l'informatique nomade et/ou ambiante.
  • Reste à savoir si ces deux néologismes entreront au panthéon linguistique aux côtés de la blingocratie.

Côté copyright, Fair-Use et autres creative commons

  • Un rapport intitulé : "Recut, Reframe, Recycle: Quoting Copyrighted Material in User-Generated Video" (.pdf). La question posée est de savoir si dans le cadre des sites de médias participatifs donnant lieu à divers remixages (exemple : YouTube), les détournements, parodies, et autres mashups de diverses oeuvres de fiction relèvent - ou non - du cadre du Fair Use (= usage équitable) et échappent donc à la législation du copyright. La réponse du rapport est claire : Oui. Il y a dans ces "oeuvres" de nouveaux éléments (détournement, transformation, remixage) qui les inscrivent dans le cadre de la constitution d'une culture populaire. "Video remix culture does not violate copyright." Les auteurs du rapport rappellent également qu'il est important de sensibiliser aussi bien les "auteurs" que les "remixeurs-amateurs" à la notion de propriété intellectuelle et d'usage équitable, pour que les premiers soient conscients de la richesse que ces remixages peuvent (parfois) apporter à leurs oeuvres, et pour que les seconds travaillent et s'amusent dans le respect de l'oeuvre des premiers. A noter : le site de présentation de l'étude est très bien fait, puisqu'en sus du téléchargement de l'étude proprement dite, il propose également une courte vidéo en rappelant les principales problématiques et conclusions, et propose également de télécharger un fichier excel du corpus de vidéos utilisées. Il propose enfin, pour chaque type de remixage (détournement, critique, débat, illustration, etc ...) les 5 vidéos les plus parlantes. Certaines d'entre elles sont réellement ... parlantes.
  • Et puis vraissemblablement à ne pas rater (je ne l'ai encore pas visionné en entier, mais il est plein d'interviews avec Yochai Benkler et ne peut donc pas être mauvais :-) un documentaire sobrement intitulé "Steal this Film" qui décrypte les enjeux liés à la notion de propriété intellectuelle et plus largement de "diffusion" dans le contexte actuel. Pour les plus pressés, plein d'extraits sur Google Vidéo, pour les autres téléchargement dans plein de formats possibles directement sur le site du documentaire. Il y en a même qui se sont déjà attelés au sous-titrage en français.

Côté traces documentaires identitaires (ou identité numérique si vous préférez) :

  • nos comportements informationnels laissent de plus en plus de place à l'égotisme forcené. Au service de cet égotisme on compte d'ailleurs de plus en plus d'outils tendant à l'illustrer (les divers outils de classement façon "top 50 de quelque chose"), à le renforcer (économie de la réputation), à en faire naître le besoin (via des interfaces navigo-ludiques dont vous êtes le centre et la circonférence), ou à en faire l'alpha et l'oméga d'un modèle économico-sociétal (facebook). C'est l'éternelle histoire de la poule et de l'oeuf.
  • Got dans ses petites cases, nous gratifie d'un éclairant billet sur FOAF (Friend Of A Friend) dont on aimerait effectivement penser que le modèle réellement ouvert qu'il incarne soit l'avenir des protocoles tournant derrière la plupart des réseaux sociaux. Mais je ne peux hélas pas m'empêcher de penser qu'il y a encore bien du chemin à parcourir ... l'heure étant plutôt pour les grosses cylindrées à la centralisation des profils propriétaires ... ce qui doit nous inciter encore davantage a faire plus de place aux initiatives alternatives et technologiquement éprouvées (dont FOAF).

Côté ressources pédagogiques :

Côté voeux, bonnes résolutions et oracles divers :

  • il y a ceux qui ne croient plus aux blogs sous leur forme actuelle (Jean-Michel Salaun et Jean Véronis) ... mais qui continuent heureusement de blogguer :-) De mon coté je reste sur le créneau de l'enthousiasme (peut-être un peu candide), même si - à l'instar des deux précédemment cités - je constate ici et là une raréfaction des pépites blogguesques, nombre de trouvailles ayant visiblement du mal à tenir sur la longueur, ce qu'on aurait du mal à leur reprocher tant il est vrai qu'en dehors d'un projet affirmé de publication (journal, auto-fiction, carnet de recherche, formation à distance), l'exercice du blog est une gymnastique chronophage, et que "le temps de blogguer" n'est pas nécessairement la chose la mieux partagée du monde. Il n'en demeure pas moins qu'en repensant à ce qu'était la pêche informationnelle d'avant et d'après le temps du blog, ce "format éditorial" a tout de même été l'occasion d'entendre de bien belles voix, et de découvrir de fort pertinentes analyses. L'avenir dira ce la forme blog deviendra, mais les potentialités, l'univers de discours offert par une petite quantité de ces "nanopublications" reste pour l'instant et de mon point de vue, essentiel.
  • il y a ceux qui comme Fred Cavazza, se livrent à leur petit exercice de prospective du nouvel an, et ceux qui comme Francis Pisani, font une revue de presse des principaux exercices du genre.

Et mes prédictions à moi ?

  • A l'instar de ce que décrit Christian Fauré à propos du service Twine, je crois que l'ensemble des acteurs majeurs de la recherche d'information (Google, Yahoo! Microsoft) et quelques-uns de leurs challengers (Exalead, Facebook) vont prendre de plus en plus nettement le grand virage de l'hybridation. Une hybridation entre :
    • des espaces et des services collaboratifs,
    • des technologies sémantiques ou sémantisées de représentation et d'agrégation des connaissances,
    • et des algorithmies de recherche "pures" (ou recherche universelle).
  • Je crois que la diversité des contenus va (enfin) atteindre un équilibre longtemps espéré entre le "texte seul" et la vidéo et l'image.
  • Je crois enfin que l'une des grandes questions en terme de recherche (notamment pour les sciences de l'information et de la communication) sera la mise au jour des nouvelles autorités cognitives qui s'articulent aujourd'hui de manière encore un peu floue derrière la monétisation (ou la non-monétsation) des services à base de connaissance (Knol, Wikipedia).
  • De mon côté je retiens comme éléments et tendances majeures de l'année écoulée : les deux nouvelles étapes de la dérives des continents documentaires que sont :
    • d'une part, la synchronisation transparente entre nos activités informationnelles connectées (on-line) et déconnectées (off-line),
    • et d'autre part, la sphère croissante d'indexabilité (notion de "graphe social" pour faire simple) de l'humain au travers de ses innombrables traces documentaires éparses sur le(s) réseau(x).
  • Ce qui me semble frappant au-delà de tout c'est l'avénement imminent et probable d'une nouvelle génération d'algorithmes ayant capacité à représenter sur un même plan des documents toujours plus fragmentaires, des traces identitaires toujours plus documentées, et à transformer toutes ces traces d'attention en vecteurs d'intentions, pour le plus grand bonheur des grandes industries culturelles et des quelques acteurs qui dominent actuellement le marché (et ce au-delà du discours geignard et misérabiliste que s'obstinent à tenir les mêmes industries culturelles). En un mot comme en cent : la redocumentarisation du monde. Il est certain qu'il va falloir être très très très attentif aux Network sciences, car elles seront le creuset plus que probable de cette nouvelle génération d'algorithmes et de modes de représentation, et qu'à mon sens, elles seules ont aujourd'hui la capacité à réunir en un même cadre d'analyse les fronts de recherche les plus innovants, les techniques d'indexation et de représentation du vivant au sens large.
  • Voilà pour le côté vivifiant et optimiste de la chose. Côté pessimiste (mon éternel côté cassandre :-); je crains que nous ne soyons confrontés à une échéance majeure, celle de la médecine personnalisée et/ou médecine "2.0" et/ou médecine désintermédiée. La montée en puissance et la position désormais établie de ces nouveaux prescripteurs planétaires que sont les moteurs de recherche d'une part, la mise à la portée du grand public des technologies de génomique (notamment à des fins d'auto-diagnostic) d'autre part, les rapprochements entre les premiers (moteurs de recherche) et les secondes (sociétés de génomique), et enfin l'engouement de plus en plus explicite chez tous les grands acteurs de l'industrie médicale (et notamment pharmaceutique) pour des modèles de diffusion et d'accès reposant sur du gratuit financé par la publicité va nécessiter, pour le moins, de grands chantiers didactiques si l'on veut éviter d'aller à coup sûr ... droit dans le mur. Va falloir se trouver dare dare un José Bové de la santé comme bien commun de l'humanité. Sinon ...

Bonne année à vous tous :-)

Googlepedia s'appellera "Knol", ou comment monétiser l'autorité

Le dernier billet du blog officiel de Google annonce le lancement prochain, sur invitation seulement, d'une béta version de "knol". Qu'est-ce que "knol" ? Pour mémoire, rappelons que Google, après avoir gagné la guerre de l'information en s'étant de facto positionné comme un guichet unique (dans les usages courants tout au moins) sur l'ensemble des services "informationnels" aujourd'hui disponibles, Google depuis 2004 s'est lancé dans une bataille autrement plus délicate mais également plus essentielle : la bataille de la connaissance. Sa première offensive concerna la connaissance "labellisée", "inscrite", faisant autorité et disposant d'auteurs "in nomine" : ce fut le projet GoogleBooks. Un projet qui donna chair et corps à la notion de "société de la connaissance" qui n'existait jusqu'à lors que dans les arrières cours de la commission européenne ainsi que dans les travaux de quelques scientifiques (Pierre Lévy notamment mais pas exclusivement).
La deuxième offensive est aujourd'hui lancée : "knol" (contraction de "Knowledge") se veut un service encyclopédique "à la manière de wikipédia" qui ne dit pas son nom.
Le mieux est encore de traduire la description dudit service telle qu'elle est livrée sur le blog de Google. Extraits choisis donc (et traduits) :

  • Un projet en quête d'auteurs / d'autorité
  • "Notre but est d'encourager les personnes qui connaissent bien un sujet à écrire un article de référence ("authoritative article") sur ce sujet."
  • "L'idée clé du projet est de mettre les auteurs sur le devant de la scène. (...) Nous pensons que savoir qui a écrit un article aidera de manière significative les usagers à faire un meilleur usage du web."
  • "Un "knol" sur un sujet particulier a vocation à être la première chose que doit lire quelqu'un qui cherche quelque chose à ce sujet sur le web."
  • La toute puissante infrastructure frappe encore
  • "un "knol" est juste une page web (...) Google fournira les outils faciles à utiliser de création et d'édition et hébergera gratuitement les contenus." <= ce dernier point est important pour ne pas dire crucial quand on connaît les difficultés d'hébergement auxquelles est confrontée Wikipédia.
  • Politique éditoriale : pas de politique éditoriale
  • "tous les sujets seront couverts : concepts scientifiques, information médicale, histoire, géographie, produits ("information products"), loisirs ..."
  • "Les gens pourront proposer des commentaires, des questions, des contenus additionnels. Tout le monde pourra voter pour un "knol" ou donner ses impressions. Les knols inclueront des références bibliographiques et des liens vers des informations complémentaires" => c'est ici une différence de taille avec Wikipedia puisque le contenu des articles de sera apparemment pas éditable.
  • Autorité = monnaie
  • "A bon vouloir de l'auteur, un "knol" pourra inclure de la publicité. (...) Google lui reversera alors une part substantielle de ces revenus publicitaires." L'indication de cette part "substantielle", ainsi formulée, peut laisser penser qu'elle sera supérieure à celle traditionnellement reversée via les offres publicitaires standards de Google. Ce qui là non plus n'est pas sans risque, une société commerciale se trouvant de facto en situation de rétribuer des auteurs (scientifiques ou non) sur la base de la notoriété qui sera accordée à leur(s) article(s), ce qui entraînera mécaniquement une course à l'écriture d'articles susceptibles d'être les plus lus, les plus vus, et donc les mieux rétribués. Je vais endosser une nouvelle fois ma panoplie de Cassandre, mais imaginez ce que peut donner un tel système non-régulé dans le cadre, par exemple, des publications en pharmacie ou en médecine, quand on connaît déjà les dérives de certaines publications dans ce domaine, largement sponsorisées par des grands groupes industriels et pharmaceutiques ... (l'exemple choisi par Google pour illustrer son projeet Knol n'est d'ailleurs pas innocent : il s'agit d'un article de médecine traitant de l'insomnie, rédigé par un auteur "faisant" autorité - une prof. de l'université de médecine de Stanford). Si le modèle marchand de la bibliothèque (GoogleBooks) est porteur de grands dangers (prime à l'accès, pas de roulement des fonds, aucune représentativité de l'état des connaissances à l'instant "t", etc.), le modèle marchand de l'encyclopédie - et plus globalement du cycle de validation de l'autorité - l'est tout autant, et peut-être davantage.

Conclusions ?

  • Primo, l'analogisme avec Wikipedia, ou plus précisément avec les projets dérivés en quête d'autorité (Véropédia, Citizendium) est trop frappante pour ne pas être soulignée. Avec son projet knol, Google réalise stricto sensu le projet initial de wikipedia (baptisé Nupedia) : une encyclopédie "populaire" par la couverture des sujets autorisés (= non-exclusivement scientifiques), et reposant sur des experts. C'est bien connu, les bonnes idées n'appartiennent à personne. Mais tous les obstacles ayant fait avorter le projet initial de Larry Sanger (difficulté à mobiliser des experts, difficultés de stockage et d'hébergement ...) sont d'emblée solutionnés par l'effet de la marque Google, et par ses infrastructures hors du commun.
  • Deuxio : Citizendium va avoir du mal à se faire une place au soleil dans l'ombre d'un tel géant ...
  • Tertio : ce lancement de "knol" par Google renvoie à une vision assez fine des attentes de ses utilisateurs.  On avait déjà remarqué la place très particulière et prépondérante - près de 30% des premiers résultats - qu'occupaient les liens Wikipédia dans les résultats des principaux moteurs (voir notamment ici, ici et récemment ), ce qui était en soi la meilleure confirmation possible de l'intérêt du "projet encyclopédique". En développant son propre service, Google régle en une seule fois deux problèmes : celui de l'accusation qui pouvait lui être faîte de survaloriser les liens en provenance de Wikipedia, et - surtout - celui de voir ses utilisateurs sortir de la sphère Google pour s'en retourner sur l'encyclopédie wikipédia, à peine y étaient-ils entrés (dans la sphère Google) : le public est ainsi encore plus captif qu'auparavant, et Google à tout loisir de monétiser, d'analyser et de profiler nos navigations numériques.
  • Quatrièmement : Google va même plus loin en inversant ce risque potentiel (celui de voir ses utilisateurs captifs "migrer" vers un autre service) : "Google ne demandera aucune exclusivité pour ses contenus et les rendra accessibles à tous les autres moteurs de recherche", qui seront donc gentiment invités pour accroître leur propre "pertinence" à renvoyer ... vers un service Google ...
  • Cinquièmement : c'est l'avènement d'une nouvelle forme d'encyclopédisme. Un encyclopédisme non plus savant mais "d'usage" : "L’accès aux documents n’est plus subordonné aux modes de classement et d’organisation. Ce sont les modes de classement et d’organisation qui sont inférés de l’accès au document et de l’analyse de son contenu. On parlera d’un encyclopédisme d’usage à partir du moment où ces parcours de recherche, d’accès et de consultation sont récupérés et réinjectés dans l’organisation de la bibliothèque virtuelle (Internet en est évidemment le premier exemple) pour organiser, à l’aune de ces parcours, les nouvelles données devant être
    classifiées.
    " (p.307 de ma thèse) Le danger ne vient donc pas de ce nouvel avatar du projet encyclopédique, mais de la logique marchande qui le conditionne.
  • sixièmement : le défi que s'apprête à relever Google est d'importance et nous concerne tous, bien au-delà du simple enjeu technologique qui le sous-tend : il s'agit de savoir quelle est la meilleure manière possible de croiser autorité ET notoriété, autrement dit de savoir quelle place accorder à l'autorité au sein d'un principe de classement et d'une représentation du monde reposant essentiellement sur un indice de notoriété. Cet enjeu tient en une phrase dans le billet de Google, mais il prime à mon sens sur tous les autres : "Notre boulot au département "Search Quality" sera de classer (to rank) les knols de manière appropriée quand ils apparaîtront dans les résultats de recherche". En ce domaine, la transition d'un PageRank à un modèle de type TrustRank ne sera pas aisée. Sauf à croire que le test de Turing est résolu, et qu'un "simple" agencement machinique est aujourd'hui en capacité de tracer les frontières de l'autorité dans l'accès de chacun à la connaissance.   

Il ne reste plus qu'à attendre pour voir si l'effet Google jouera à plein, et si "knol" sera le nouveau pilier d'une révélation cognitive en comptant déjà 3. En attendant, il est clair que la stratégie de Google est bien cadrée : "standing on the shoulders of giants" comme l'affirme l'incipit du service Google Books. Asseoir l'autorité de Google (et de ses services) sur la question de la mise en avant "des autorités".

Voir aussi ce qu'en disent : Didier Durand, Read/WriteWeb, Jean-Michel Salaun, Google Blogoscoped (qui insiste également sur les risques de l'impact de ce service sur la neutralité de la recherche)

<Update PUB>Télérama a bien aimé mon billet</Update>
 

La Babel numérique ?

A la lecture de la presse nationale et internationale, à la lecture de la blogosphère, je suis en plus de plus frappé par le nombre d'articles concernant Wikipedia ainsi que par l'éternel retour des arguments développés par les enthousiastes, les sceptiques, et les autres. Dernier en date, l'article d'@si qui revient sur l'épisode du jugement en référé de la fondation Wikimedia (chroniqué ici). Mais revenons-donc à l'article d'@si, qui est un petit chef d'oeuvre rhétorique puisque démarrant sur un crédo "pro-wikipédien" déclinant à l'envie le thème : "certes Wikipédia est le royaume de l'impunité, mais pas davantage que les autres médias", il se termine (mal) sur une lacunaire sentence que je vous livre ici :

  • "plutôt que de s’indigner du laxisme du juge, il faut cesser de célébrer internet comme l’agora universelle, l’espace hyper-démocratique et hautement participatif où chacun serait enfin journaliste, poète, savant, encyclopédiste. Car le culte de l’amateur finira par tuer la culture."

Ou comment commencer un article sur un sujet et le finir sur un autre en expliquant que tout est lié et réciproquement (auquel cas Wikipedia peut également à bon droit être tenue pour responsable de la faim dans le monde, de la guerre en Irak et de la piètre qualité des repas qu'ingurgite mon fils à la cantine). Bon. Chacun pense ce qu'il veut. Mais je voudrais reprendre quelques-uns des arguments de bon sens (avec les fautes de frappe et d'orthographe d'origine) qui n'ont pas tardé à déferler en commentaire (ce qui vous évitera la lecture des trolls, et notamment de la trolleuse wikipédienne en chef) et vous livrer mes propres réflexions :

  • "En l'occurence, un point essentiel a comparer me semble etre le préjudice, notament en nombre de personnes ayant lu l'information litigieuse, et les moyens de la corriger. Pour un journal, une fois le coup parti, c'est irratrapable" La dimension évoquée est ici la temporalité particulière de Wikipédia. Une encyclopédie dont la mécanique d'in-scription est celle de l'instant.
  • Autre illustration de cette temporalité nouvelle des guerres d'éditions wikipédiennes dans cet autre commentaire : "Concernant Wikipedia, en tant que contributeur habituel de ce site, je puis vous certifier qu'il n'est en aucun cas adepte «du refus de toute hiérarchie et du fantasme d’une égalité de tous face au savoir». Sauf, pour le second point, si il s'agit de l'accès de tous les lecteurs. Bien sûr, tout internaute est virtuellement en état de modifier tout article de l'encyclopédie, mais en réalité non, preuve en est que, suite à votre papier, l'article «Élisabeth Lévy» a été un court moment « protégé» pour éviter (si ça devait avoir lieu) les vandalismes. Voir ici : http://fr.wikipedia.org/wiki/Wikip%... " Wikipédia ou le principe de précaution documentaire.
  • Autre illustration de cette temporalité : ""Supposons que j’ajoute à la notice de Daniel Schneidermann sur Wikipédia qu’il se nourrit d’enfants au petit déjeuner" Je viens de faire l'essai ;-). J'ai ajouté la phrase: "Il est connu pour manger des enfants au petit déjeuner" au bio de Daniel Schneidermann sur Wikipédia. Je rafraîchis la page au bout de quelques minutes, et m'aperçois que ma modification n'existe plus, et que j'ai un message. Je clique sur le lien, et voici le contenu du message qui m'est adressé."Bonjour, XX.XX.7.234, (c'est mon adresse IP) Vous avez découvert combien il est facile de modifier et compléter l’encyclopédie Wikipédia. Votre modification a été annulée soit parce qu’elle est non encyclopédique soit parce qu’elle contrevient à nos règles. Merci de faire à l'avenir des contributions constructives et d’éviter de détériorer le contenu. Sachez que tout un chacun est capable de surveiller vos contributions. Les administrateurs ont par ailleurs la capacité de vous empêcher d'écrire dans Wikipédia. Le bac à sable est à votre disposition pour tester la syntaxe de Wikipédia." Le mécanisme d'alerte en temps réel qui se met ici en place témoigne d'une logique du "Little Brothers" en lieu et place d'un Big Brother unique. Ce qui pourrait à terme effectivement apparaître comme inquiétant, si et seulement si le projet documentaire qu'est wikipedia se doublait explicitement d'une dimension politique, ce qui n'est (à mon avis) pas (encore ?) le cas, mais ce qu'un grand nombre de ses opposant déclarés lui reprochent à mots couverts, d'où le faux-débat (à mon avis toujours) à propos d'un "culte de l'amateur", et autres "l'amateur-tuera-l'expert-oui-mais-non-pasqu'on-a-besoin-des-experts-oui-mais-ad-lib".
  • "Ce qui peut poser soucis c'est que l'on ne sais pas si une page donnée a été écrite par une personne compétente ou non. Wikipédia fait le pari que les erreurs sont corrigés par la minorité compétente. On peut ne pas être d'accord mais parler de "religion numérique" et de "dangereuse utopie"? N'est ce pas excessif?" Si, c'est excessif. La question est ici celle des logiques participatives de Wikipédia, et du ratio entre les personnes s'impliquant "tout court" et celles s'impliquant "es qualite". Et nombre des articles scientifiques chroniqués ici même (cf la rubrique wikipedia) attestent que ce ratio n'est ni plus fort ni plus faible que dans d'autres projets de nature collective/collaborative. Dit autrement : il y a quelques vandales, il y a une majorité d'utilisateurs jouant le jeu en toute bonne foi (ce qui ne les met pas nécessairement à l'abri d'une erreur), et il y a une double minorité active : celle des utilisateurs acharnés, qui bâtissent leur propre expertise éditoriale dans un espace dont peut paradoxalement sembler absent tout projet éditorial, et celle des utilisateurs "experts", agissant "es qualité".
  • "Pour ce qui est de la crédibilité de wikipedia (...) un wikisceptique américain du nom de Alex Havalais a fait une expérience intéressante: introduire volontairement des erreurs en des endroits clés. "A son grand étonnement, toutes les fautes ont été rectifiées en quelques heures". Explication: Il est beaucoup plus rapide de corriger les actes de vandalisme que de les commettre. "Cela dissuade les vandales" ,note le journal de Rotterdam." Wikipedia est un entreprise cybernétique. Au sens propre (cf la définition de la cybernétique) C'est à dire qu'elle est gouvernée (= dotée d'un gouvernail, terme sur lequel fut etymologiquement formé le terme cybernétique). Et sa nature cybernétique, c'est son projet éditorial.

D'où au final le titre (interrogatif) de ce billet, et le paradoxe wikipédien ou le pari d'une Babel numérique dont l'inachèvement même atteste de la dynamique de construction de l'ensemble.
Notre monde s'est construit sur les cendres de la Babel mythique (d'un point de vue symbolique hein ? c'est pas parce que j'habite en vendée depuis quelques temps que je me suis mis à fréquenter les églises autrement que dans un but culturel), notre monde s'est construit sur les cendres de Babel disais-je, le nouvel ordre documentaire qui est en train de se construire devra, c'est acquis, une fière chandelle à La wikipédia.

Wikipedia et caetera.

Wikipedia-tribe
Non. Non, n'insistez pas. Je ne reviendrai pas sur les derniers articles et éditoriaux du journal Le Monde (édition du 3 Novembre) à propos de l'encyclopédie Wikipedia. Je me contenterai de vous renvoyer vers le billet de Jean-Michel Salaün qui rappelle justement l'urgence de "réfléchir à un nouvel ordre documentaire", et j'attirerai également votre attention sur le commentaire éclairant de Jean-Daniel Zeller (qui m'avait lors d'un colloque raconté l'histoire de Wikipedia et du griot) :

  • "L'autorité (politique, sociale ou éditoriale, et il peut y en avoir d'autres) ne peut se légitimer qu'à visage découvert.
  • Dans un monde de traçabilité universel, l'anonymat doit probablement devenir un droit. Voir le papier "homo internetus-homo anonymus" du président de l'ISSOC-France, Me Olivier Iteanu, dans la dernière édition de "Société de l'information" no 41/oct. 2007 (www.societesdelinformatio...
  • Dans un projet éditorial tel que Wikipédia un "pseudonymat" me semble acceptable, en tout cas dans une phase de construction."

Pas mieux :-)
Toujours en réaction au même éditorial du Monde, on consultera utilement le blog d'Anthere, qui renvoie vers divers billets certes pro-wikipédiens mais bien argumentés, ainsi que vers le texte (.pdf) de l'ordonnance de référé, texte sur lequel il serait par ailleurs intéressant de pouvoir bénéficier des lumières d'un juriste de profession. Appel donc aux bonnes volontés <Update du lendemain> Et voilà :-) </Update>

Wikipedia-dvertising
Après avoir longtemps brillé par une communication quasi-absente (l'étonnante croissance du site et le bouche à oreille du réseau lui suffisant amplement), la Wikipedia, probablement en réaction aux attaques de plus en plus violentes et surtout de plus en plus médiatisées, change de méthode et se lance dans une grande campagne de promotion, notamment afin de collecter des dons privés pour continuer de subsister et de préserver son indépendance.
On peut ainsi prendre connaissance du spot publicitaire mettant en scène son fondateur (Jimmy "Jimbo" Wales). A voir aussi (via Patrick Lozeau), la bande-annonce du documentaire en préparation sur Wikipédia et baptisé "Truth in numbers : the wikipedia story".

Wikipedia-logue

  • Je n'ai trouvé qu'un seul compte-rendu succinct, amusant et amusé, du récent colloque francophone sur Wikipedia, chez B&C. A noter cependant, les Forums permettant de débattre des points abordés lors du colloque sont encore actifs (mais peu fournis).
  • Le récent colloque Wikisym, organisé sous l'égide de la prestigieuse ACM, nous offre les textes des interventions avec la possibilité pour chacun d'entre eux de poursuivre la discussion via un blog/forum. Ce colloque était dédié non pas à Wikipedia, mais aux wikis en général et aux formidables opportunités qu'ils offrent en matière de travail collaboratif et d'apprentissage. Mais on y trouvera cependant quelques contributions essentielles au débat sur la qualité et l'expertise dans wikipedia :
    • J. F. Ortega & J. G. Gonzalez-Barahona. Quantitative Analysis of the Wikipedia community of users. (.pdf)
    • J. M. Reagle. Do As I Do: Authorial Leadership in Wikipedia. (.pdf) En s'intéressant à la manière dont s'exprime un leadership dans une communauté "ouverte", cet article propose quelques pistes pour une théorie d'un leadership auctorial ("theory of authorial leadership") ... spéciale dédicace à la grande prêtresse internationale de l'autoritativité, qui nous fera un compte-rendu sur son blog, quand elle l'aura ouvert :-)
    • D. M. Wilkinson & B. A. Huberman. Cooperation and Quality in Wikipedia. (.pdf) Attention, cet article est une véritable bombe, et si vous ne devez en lire qu'un, que ce soit celui-là. C'est la suite (et la fin) d'un preliminary paper déjà publié dans la Revue First Monday (signalé ici-même). Je vous en traduis donc le résumé (avec en gras mes propres remarques) : "Nous avons examiné les 50 millions de modifications ("edits") effectuées sur 1,5 million d'articles de la version anglaise de Wikipedia (faut dire qu'ils ont le matériel pour le faire aux HPLabs dans lequel bossent les deux auteurs) et nous avons trouvé que les articles de haute qualité se distinguent par un nombre significativement plus élevé de modifications, d'éditeurs, et d'intensité dans le comportement coopératif, et ce comparés à d'autres articles ayant une visibilité et une ancienneté identiques (l'article nous apprend que la popularité a aussi été mesurée). Ces résultats sont importants parce qu'en d'autres domaines, il a été démontré que plus la taille de la coopération augmente (= le nombre de contributeurs et le  nombre de modifications), et plus une coopération fructueuse est difficile à atteindre et à maintenir. (...)" Le résultat, c'est donc qu'il y a bien un écosystème original du phénomène participatif dans la Wikipedia. Et ça, n'en déplaise à ses détracteurs, c'est une très bonne nouvelle. Allez, comme vous êtes sages, je vous traduis aussi un morceau de la conclusion de l'article :  "Bien que nous n'ayons pas exploré les raisons pour lesquelles Wikipedia réussit là où d'autres entreprises collaboratives ont échoué, on citera parmi les raisons possibles de ce succès : l'efficacité de l'interface wiki, l'accent mis par la communauté wikipédienne sur la coordination et l'organisation, et le détail des processus et règles en vigueur utilisées pour faciliter la coopération." Et là, l'estocade : "Nous avons également montré que bien que Wikipedia soit un système complexe dans lequel des millions d'individualités imprévisibles collaborent au processus éditorial ("éditorial" au sens de "edit" - modification - et pas au sens de "processus éditorial", justement ...), et ce d'une manière non-programmée et non-programmable, la croissance de l'ensemble des articles suit un modèle très simple. Ce modèle implique qu'un petit nombre d'articles,  correspondant à des sujets à forte pertinence ("relevance") ou a forte visibilité, accumulent un nombre disproportionné de modifications, là où la grande majorité des articles doit se contenter d'une activité bien moindre. Les sujets d'une importance particulière ou d'une grande popularité sont ainsi naturellement amenés à bénéficier et à hériter de cette haute-qualité, validant à leur tour la Wikipedia comme un effort collaboratif couronné de succès."
  • Et puis l'Atelier signale un article intitulé : "Creating, Destroying, and Restoring Value in Wikipedia" (.pdf)
  • Et puis (Via Pintini) y'a aussi Véropedia : "un projet collaboratif initié par certains Wikipédiens avec l'objectif de sélectionner le meillieur du contenu de Wikipédia, d'en combler les lacunes éventuelles, de le vérifier et de le sauvegarder pour le futur. Les articles de Veropedia sont stables et ne peuvent être modifiés. Ils assurent une grande qualité, et sont adaptés pour les étudiants, les professeurs et pour tous ceux qui cherchent une information fiable et libre."

(Sources : sous les liens)

VidéoLectures

VideosLectures est un site ayant vocation à héberger des vidéos "scientifiques" (conférences et cours magistraux essentiellement). Si le domaine de l'informatique y est surreprésenté, on y trouvera, à côté, quelques vidéos intéressantes :

En plus des vidéos, la plupart sont associées et synchronisées avec les slides ayant servi lors de la présentation (quel bonheur de pouvoir aller directement écouter "le" slide qui a retenu notre attention). La navigation dans le site est efficace (vidéos les plus vues, navigation par catégories et sous-catégories thématiques, par genre - tutoriel, interview -, par auteur, etc ...)
A vous d'y dénicher votre bonheur :-)
(Via : Savoirs en Réseau)

Outillage wikipédien (encore)

Après ...

Voici venu ... le traceur d'autorité, baptisé Wikidashboard. L'idée est simple, il s'agit comme le rappelle l'article de l'Atelier, "de permettre aux utilisateurs d'établir le lien entre les diverses publications contenues sur le site et leurs auteurs." Pour chaque article de l'encyclopédie (dans sa version anglophone), vous pouvez ainsi obtenir :

  • la liste des contributeurs,
  • le pourcentage de leurs modifications par rapport à l'ensemble,
  • une frise chronologique permettant de repérer à quelles périodes l'article a été le plus ou le moins "édité",
  • et quelques autres choses encore ...

Une option "préférences" permet de paramétrer le wikidashboard et de récupérer, par exemple, les modifications de la dernière année uniquement ou bien en remontant jusqu'au 1er Janvier 2004.
L'ensemble des informations qui alimentent le wikidashboard sont, depuis le début du projet wikipédia, visibles au travers des pages "discussion" et "historique", mais il est délicat d'en extraire une vue synoptique propre à l'analyse ou à l'exercice d'un regard critique. C'est bien là tout l'intérêt de wikidashboard.
Un guide d'utilisation du wikidashboard est disponible ici. Et pour le tester c'est par là.
Inexorablement, en se dotant progressivement d'un appareillage cognitif complet, Wikipedia semble faire avec intelligence son examen de conscience. Bien consciente des critiques qui lui sont adressées et qui portent essentiellement sur la fiabilité des informations délivrées, cet appareillage permet donc de tenir compte de ces critiques, tout en préservant la nature propre du projet wikipédien. Car la pire chose qu'il puisse arriver à Wikipedia (de mon point de vue) est de ressembler à une encyclopédie classique. Elle y perdrait sa nature : celle d'un palimpseste technologique à la démesure de la Babel mythologique. Cette dimension palimpsestique qui en fait à la fois :

  • un outil pratique et à bien des égards remarquable,
  • un objet d'étude passionnant,
  • et une utopie observable.

(Nota Bene : oui, je sais Alithia, vous avez un blog, vous êtes soi-disant professeur de philosophie, vous n'aimez pas du tout wikipedia, et vous devez avoir beaucoup de temps libre pour déposer systématiquement des commentaires rageurs et vindicatifs - et toujours argumentés de la même manière - sur tous les blogs de france et de navarre qui ont l'impudence de publier un billet sur wikipedia. Merci donc de bien vouloir, pour une fois, vous en dispenser.)

Colloque francophone Wikipedia

Le premier colloque francophone sur WIkipédia doit bientôt ouvrir ses portes, et le site du colloque se précise et s'enrichit. On a désormais une visibilité plus claire sur l'organisation des débats et les noms des intervenants. De plus, Laure Endrizzi et Michele Drechsler, en charge du séminaire intitulé "Wikipédia et éducation" ont mis en place sur la page dudit séminaire 4 forums thématiques :

Ceux qui ne peuvent assister aux débats ou qui souhaitent "préparer" un peu le terrain sont invités à y poster les réflexions, commentaires, suggestions. Louable initiative :-) Je suis de mon côté suffisamment convaincu de l'intérêt de l'encyclopédie elle-même ET d'un débat sur ses processus organisationnels pour inviter fortement l'ensemble des collègues enseignants-chercheurs qui me lisent (et les autres également) à venir participer à ce débat, notamment autour du forum "Wikipédia et la communauté scientifique". J'y ai moi-même posté un message (d'autres suivront) indiquant que :

  • je pense que l’un des freins à un engagement systématique des enseignants chercheurs dans Wikipédia (même si wikipédia en compte, et des plus illustres, parmi ses contributeurs), est la non reconnaissance de ce travail en termes académiques. Peut-être serait-il intéressant de mettre en place un modèle de navigation, d’interrogation de l’encyclopédie, qui permette d’accéder par exemple uniquement aux articles rédigés par des universitaires. Un filtre a posteriori. Cela permettrait de ne pas remettre en cause le principe de la libre édition d’articles, mais de le "doubler" par un accès différencié à des contenus validés et/ou rédigés par des universitaires. Je suis personnellement convaincu que tout le monde à quelque chose à y gagner (la communauté des wikipédiens, la qualité globale de l’encyclopédie, les utilisateurs de wikipédia, et les chercheurs eux-mêmes). En outre cela permettrait de "contrer" les vrai-faux-débats qui font tant de mal à la réputation de ce formidable outil au sein même de celle qui devrait pourtant être l’un de ses premiers prescripteurs, c’est à dire la communauté scientifique.

A vous ...

Piliers

Amazon (.fr) fête ses 7 ans (11 ans pour la version américaine).
Google (.com) son 10ème anniversaire.
Et Wikipédia son deux millionnième article dans sa version anglaise.

Outillage wikipédien (suite) : le détecteur de réputation

L'outillage wikipédien décrit dans ce billet vient de s'étoffer un peu plus, ainsi que la problématique déjà très riche de la redocumentarisation. Explications : dans la lignée du détecteur de TRDs (Wikiscanner), permettant de repérer les adresses IP (et conséquemment les personnes et/ou organismes) des contributeurs les plus fâcheux, une équipe de chercheurs a mis au point un détecteur de réputation, un outil qui colore en orange les contributions ou les aspects d'un article "les plus suspects", lequel repérage desdits aspects considère que plus les écrits d'un wikipédiste sont rapidement modifiés/corrigés/effacés, et plus ledit wikipédiste est suspect. Ce qui est en jeu derrière cet outil, c'est donc le repérage d'un "indice de confiance" (trust) rattaché à chaque contributeur, et reposant :

  • non pas sur les qualités propres du contributeur (auquel cas on reviendrait au fonctionnement d'une encyclopédie "classique" mandatant des experts pour sa rédaction)
  • non pas sur la qualité intrinsèque de la contribution (précisément non-mesurable)
  • mais sur la temporalité qui sépare une modification, une édition d'article, de sa relecture, de sa réédition. Ce que les auteurs à l'origine de cet outil appellent un "content-driven reputation" : "les auteurs dont les contributions sont préservées ou étayées par d'autres, gagnent de la réputation."

En d'autres termes, l'indice de confiance (IC) d'un contributeur (a) équivaut à la distance temporelle séparant deux ou plusieurs redocumentarisations d'un même article. Plus cet intervalle de temps est élevé, plus le contributeur est considéré comme fiable.
Pour que cela marche, il faut se reposer sur le fonctionnement et la temporalité complexe de wikipédia, qui veut que l'ensemble des contributeurs se répartissent les rôles à la manière de l'organisation d'une fourmilière, certains traquant plutôt les fautes d'orthographe, d'autres les adresses IP, d'autres - les wikipompiers - se chargeant des guerres d'édition.
Ce qui est intéressant dans cet indice de confiance, c'est qu'il ne repose pas sur la qualité intrinsèque de ce qui est écrit (laquelle est statistiquement ou algorithmiquement invérifiable), mais sur l'interrogation de la densité de la dimension palimpsestique de wikipédia. Je m'explique : plus une écriture est vite recouverte par une autre, et moins elle est fiable. En d'autres termes encore, une non-expertise chasse l'autre, et au final (le ratio d'utilisateurs/nombre de modifications étant statistiquement parlant) l'indice de confiance mesuré semble donner des résultats probants. Cette idée d'un palimpseste vient poursuivre la réflexion que j'avais (brièvement) engagée autour de la notion de souscription et que je vous resitue brièvement (pour la version longue, voir ce billet) :

  • "Sur le web, et particulièrement dans le web dit "2.0", le contenu s'efface derrière l'architecture. Le discours n'est plus ancré dans un dispositif (technologique) mais le dispositif ancre le discours. Il n'est plus "au service" mais "à l'origine" du discours. Il en devient la condition. (...) les développements du (web 2.0 + Social software + RSS) nous emmèneraient vers un "troisième âge" de la navigation : après le browsing et le searching voici venu le temps du "subscribing". On ne navigue plus, on ne recherche plus, on s'abonne, on "souscrit". Notons d'ailleurs que l'étymologie de ce dernier vocable est intéressante : "souscrire", "sub-scribere", littéralement "écrire en dessous", à moins qu'il ne s'agisse d'écriture "sous autorité" : en agrégeant les discours écrits ou postés par d'autres, on est, de facto, placé "sous" une "autorité" qui n'est plus notre."

Ainsi, ce qui fait qu'un auteur/contributeur wikipédiste "fait autorité", c'est sa capacité à résister à la chute palimpsestique, la capacité de ses écrits à demeurer littéralement "au-dessus" des autres.

Bref, une intéressante plongée dans les arcanes de l'autoritativité ("attitude consistant à produire et à rendre public des textes, à s’auto-éditer ou à publier sur le WWW, sans passer par l’assentiment d’institutions de référence référées à l’ordre imprimé"), qui permettra peut-être à terme de distinguer entre auteur et contributeur et de s'affranchir de la notion d'expertise, ou tout du moins de se satisfaire d'une expertise numérique héritière des propriétés de son support (mobile, ouverte, en reconfiguration permanence, cinétique).
Cette approche me rappelle un peu - mais dans un autre genre - celle de la pertinence pour les moteurs de recherche : après n'avoir eu pendant longtemps (je schématise à outrance, pardon aux initiés qui me lisent) que le nombre d'occurence du mot-clé pour mesurer la pertinence d'une page, Google arrive et explique que ce n'est pas le contenu qui fait la pertinence mais le repérage par d'autres (plus une page est liée, plus elle est pertinente).

Au final, cet outil et l'approche qu'il met en place devrait réconcilier les anciens et les modernes qui aiment à se quereller autour des notions d'auteur et d'autorité. Ce qui fait un auteur, classique ou contemporain, c'est la capacité intrinsèque de son écriture à résister à l'épreuve du temps, à se fixer, à se stabiliser, à aller à l'encontre de dynamiques parfois paradoxales, in fine à l'emporter - tout au moins stylistiquement  - sur d'autres (ex : d'autres que Flaubert on écrit des histoires de la petite bourgeoisie provinciale, mais personne d'autre que lui n'a écrit Madame Bovary). Sur le chemin qui lui permettra demain de circonscrire son autorité (et ce faisant celle de ses auteurs) Wikipédia pourrait bientôt faire ainsi un pas décisif, un pas qui l'aidera et aura pour premier effet, selon un cercle vertueux, de mieux circonscrire également son périmètre documentaire et les redocumentarisations ainsi "autorisées".

A signaler : cette recherche peut être rapprochée d'une lignée de travaux qui ont démontré que la "qualité" des articles de Wikipédia dépendait à la fois du nombre de modifications et du nombre de  contributeurs distincts. "Plus un article est modifié par "n" contributeurs différents meilleur il est", ou pour le dire autrement et de manière plus juste, "moins un article est modifié par un grand nombre de contributeurs, meilleur il est", ce qui là encore est une retranscription fidèle de la chaîne d'expertise telle que la révèle par exemple le processus de revue par les pairs : moins un article scientifique soumis est modifié par ses relecteurs experts, plus il a de chances d'être publié, et meilleure est sa qualité scientifique intrinsèque. Ces études ne sont d'ailleurs qu'en contradiction apparente : la dimension palimpsestique est bien présente, mais c'est la capacité d'une édition/modification à être stabilisée sans être à son tour modifiée par un grand nombre de contributeurs distincts, qui détermine la qualité d'un contributeur, et ce faisant des articles/éditions qu'il produit.

A signaler également : l'article (scientifique) à l'origine de ce prototype de détecteur de réputation : 

  • B.T. Adler, L. de Alfaro. A Content-Driven Reputation System for the Wikipedia. In WWW 2007, Proceedings of the 16th International World Wide Web Conference, ACM Press, 2007 (.pdf)

Autorité - Réputation - Expertise : le triangle des bermudes de la qualification de l'information. On n'a pas fini d'en (re)parler ...

(Via : Hubert en commentaire, qui le tenait d'OutilsFroids qui l'avait lu dans Wired)

Outillage wikipédien

Après son moteur heuristique, son détecteur de TRDs (Wikiscanner), voici venu le sismographe wikipédien, baptisé Wikirage, qui permet de savoir quels sont les articles les plus "édités" (=modifiés).

Wikipedia ... L'anti-corpus (un corpus étant par essence ce qui est donné comme fixé, comme stable), qui par ceux-là même qui la bâtissent, se trouve ainsi dotée d'un appareillage, d'une artefacture technique qui donne à l'anti-corpus documentaire les moyens de trasformer son éternel inachévement en une dynamique documentaire inédite.

(Via Read/WriteWeb)

Rentrée des classes

Côté bibliothèques :

  • un tutoriel qui en 15 minutes par jour fera de vous un bibliothécaire 2.0.
  • les supports du congrès ABF Nantes 2007 sont (presque) tous en ligne.
  • un entretien avec Jean-Yves Mollier, à lire dans Télérama, et où il est entre autre question de l'avenir du livre et des bibliothèques. On n'y apprendra pas grand chose rien, mais la justesse de ton et la pondération sont également parfois appréciables :-)

Côté bibliothèques et moteurs :

  • les bibliothèques de l'université de Keio (Japon) rejoignent le programme Google Book Search, qui entre ainsi sur le continent asiatique. 120,000 ouvrages du domaine public sont concernés. Le nombre de bibliothèque partenaires s'établit donc désormais à 26. (Via InsideGoogleBookSearch & le communiqué de presse - .pdf - de Keio). Une étrange affordance au passage en guise de réminiscence, je connaissais le nom de l'université de Keio parce que Ted Nelson, inventeur et précurseur de l'hypertexte et d'une utopie mondiale de la connaissance baptisée Xanadu, Ted Nelson donc y était allé soutenir l'équivalent de ce que l'on nomme ici une "Habilitation à Diriger les Recherches". La signature de cet accord avec Google, dans l'ombre du passage de Ted Nelson à Keio donne à Google Books un étrange aspect d'aboutissement de Xanadu.
  • la bibliothèque de l'université Cornell se joint également au projet Google Book Search. 500 000 des 8 millions de volumes imprimés détenus par ladite bibliothèque sont concernés. Soit donc au total 27 bibliothèques partenaires.
  • Sur le même sujet, ne manquez pas l'article de Paul Duguid dans le dernier First Monday, et le commentaire avisé qu'en fait Jean-Michel Salaun.

Côté OpenAccess :

  • les dépôts OAI francophones en SHS suivent, et c'est tant mieux, une progression lente mais régulière et soutenue : voir le décompte détaillé de Marin Dacos.
  • Plus globalement d'ailleurs, le mouvement de l'open access dans sa globalité suit une courbe dramatiquement (?) ascendante.
  • Ceci expliquant sûrement cela ... la toute puissante AAP (association des éditeurs américains) lance l'initiative PRISM ("Partenariat pour l'intégrité (sic ...) de la recherche en science et médecine"). L'idée est d'alerter le public sur les présumés "risques" de la publication en Open Access. L'attaque est aussi frontale que caricaturale, en pointant les soi-disant "risques d'une censure d'état" liés à une "disparition de l'évaluation par les pairs", ce que personne, même les plus extrêmistes partisans de l'Open Access, n'a j-a-m-a-i-s ne serait-ce que suggéré. On en rirait presque, mais le pouvoir de lobbying de l'AAP est tel que l'on en est plutôt navré et inquiet. Il s'agit en fait de la mise en pratique du plan de guerre contre le libre accès, déclaré en Janvier 2007, pour lequel l'AAP avait eu recours à une agence de relations publiques aux méthodes qui pourraient n'être que tristement célèbres si elles n'étaient pas également largement discutables (désinformation, propagation de fausses rumeurs, etc, etc.). Tout cela est proprement consternant tant les arguments évoqués sont spécieux. Mais tout cela risque surtout de faire de considérables dégâts. Donc, plus que jamais, continuons le combat ... et le prosélytisme ... <Update de 5 minutes plus tard> Via Marlène - qui en parle aussi - je découvre ce billet certes partisan - de l'autre camp - mais qui résume très bien la situation et reprend nombre de réactions blogosphériques à ce sujet </Update>

Côté moteurs :

  • Google ...
  • Google fait preuve d'un appétit dont la constance confine à la boulimie. Voir la liste dressée par Christophe Asselin des acquisitions des derniers semestres. Derrière cet appétit qui peut sembler désordonné, se dessine progressivement une stratégie bien identifiée de positionnement sur le Web OS pour tout type de public et toute taille d'entreprise. De son côté, Henri Labarre nous offre une cartographie synoptique au format .pdf de ladite boulimie.
  • Et puis comme cela ne fait jamais de mal de rappeler quelques fondamentaux, une belle animation flash sur la manière dont fonctionne Google.
  • Google encore qui donne dans le tonitruand, en annoncant l'ouverture des commentaires sur Google News, pour ceux "ayant un lien" avec l'affaire commentée (sic). Nombre de journaux le font déjà, sans qu'il soit besoin de "prouver" avoir un lien quelconque avec l'affaire, mais quand Google touche au modèle média de la presse en ligne, tout le monde s'affole. Techcrunch rappelle les faits dans un billet synthétique. L'immense majorité des observateurs est plus que sceptique, à l'image de Danny Sullivan qui résume l'affaire en un mot : "Weird". Emmanuel Parody dans son analyse à laquelle je souscris entièrement, évoque une "arrogance d'un nouveau genre". Jusqu'au LATimes qui, deux jours après l'annonce, dans une tribue non-signée, compare Google à ... Osama Ben Laden :-(
  • Et les autres ...
  • Technorati s'effondre lentement mais sûrement ...
  • La tendance - ou l'idée que je crois de plus en plus vraie - qui veut que la fabrication de moteurs (indexation, rafraîchissement, parsing et autres technologies) et la fabrication d'interfaces soient deux métiers différents, cette tendance semble se confirmer avec le rapprochement de Groxis (excellentissime interface de Grokker, depuis le temps que je le dis ...) et d'Intellisearch. Pour plus de détails, voir l'article de l'Atelier.

Côté veille :

Côté web :

  • Si le web est implicite, il est aussi granulaire ou plus exactement fractal. Et les Widgets en sont la plus petite unité atomique. Techcrunch nous gratifie d'un billet synthétique sur les origines, les plateformes et les standards de ces petits widgets.
  • L'équipe d'Information Architects nous gratifie de son côté d'une belle carte (.gif) dans le genre "plan de métro", listant un grand nombre d'acteurs et de services du web actuel. Synoptique et fort utile pour repérer quelques "tendances".

Côté réseaux sociaux :

  • Nous nous étions quitté en listant ce que nous savions aujourd'hui des réseaux sociaux, et bien il y a de fortes chances pour que ces réseaux sociaux occupent une très grosse part de l'actualité webienne dans les mois à venir. Avec tout d'abord le coup de poker de Facebook, dont Google a une énorme envie et qu'il pourrait bien tenter de se payer, après que le PDG dudit Facebook a refusé l'offre de Yahoo (1 milliard de $ ...). Si le marché se concluait, Google enterrerait de facto toute possibilité d'émergence en la matière, puisqu'il est déjà par ailleurs installé (motorisation et régie publicitaire attenante) comme moteur officiel de LA plateforme concurrente MySpace. Du côté des trois grands le tableau est donc pour l'instant le suivant :
    • MSN dispose de MySpace. Leader indétrônable pour ce qui est du nombre de teenagers impliqués.
    • Yahoo! (ayant échoué à racheter Facebook) travaillerait sur un projet baptisé Mosh
    • et Google (probablement en train d'essayer de racheter Facebook) aurait de son côté une nouvelle arme fatale baptisée SocialStream (voir le billet de Techcrunch pour plus de détails, et voir aussi le site de présentation du projet SocialStream, présenté comme "réseau social unifié" et dans lequel une large place est faite à la notion de Sérendipité ...). Notons ici encore que sur ce terrain (réseau social "unifié") comme sur d'autres (recherche "universelle") ma petite théorie de la dérive des continents documentaires résiste bien à l'analyse ;-)
    • Si vous êtes un peu perdus, FredCavazza résume tout ça très bien. De mon côté, même si dit comme ça cela peut ressembler à du teasing éhonté, je pense que si FaceBook avait l'intelligence de regarder du côté d'Amazon (et réciproquement), la carte des acteurs plénipotentiaires du web actuel serait entièrement reconfigurée. J'y reviens dans un prochain billet ... enfin si je n'oublie pas et si j'ai le temps :-(
    • Et pour compléter mon dernier billet sur la question, on lira avec intérêt les deux billets que Jean-Michel consacre à cette même question : ici et .
    • Toujours sur le livre des visages (dévisage ?), à lire également la réflexion de François Bon.
    • Pour le côté business, voici une grille très détaillée vous permettant de calculer le retour sur investissement (ROI) d'un réseau social
    • A lire également, les résultats d'une étude menée sur 850 personnes de 54 pays, étude sans prétention scientifique mais qui confirme tout de même quelques orientations, dont la domination de LinkedIn dans la catégorie "réseau social professionnel".
    • On pourra également consulter la liste des réseaux sociaux disponible sur Wikipedia, en complément de celle de Dannah Boyd, ainsi que le rapport d'Avril 2007 de Forrester (.pdf), déjà signalé sur ce blog (pour les plus pressés, voir le récent résumé de Gerry Mc Kiernann)
    • Et puis ... et puis ... et puis il est des programmes de recherche auxquels on aimerait avoir participé ou dont on voudrait avoir eu l'idée, comme celui visant à établir le réseau social ... des superhéros Marvel. Le résultat est à lire sur ArXiv. Avec une grosse déception tout de même, l'étude se base sur l'apparition desdits superhéros au fil des volumes de publication et ne s'intéresse pas aux communautés elles-mêmes (Vengeurs, X-Men, etc.). Impossible donc d'avoir la preuve scientifique que le Fauve ait entretenu une relation avec Miss Hulk :-(

Côté Wikipédia :

  • La polémique (stérile) de l'été.
  • A l'occasion de sa pause estivale, Homo Numericus nous offre trois billets d'analyse sur "l'histoire politique" de Wikipedia, rédigés par Sylvain Firer-Blaess, étudiant de l’IEP Lyon : ici (1), ici (2), encore ici (3), et (4).
  • Un étudiant a mis au point un détecteur de TRDs (Tentatives de Redocumentarisation Déviantes) : pour le tester vous-même, direction le Wikiscanner (tous les journaux en ont parlé - Le Monde, Libé, etc. - mais vous pouvez bénéficier d'un rattrapage de qualité avec l'article de Christophe Deschamps, et d'une ouverture problématique fondamentale chez Jean-Michel Salaun, concernant l'urgence de réinventer le droit à l'oubli)
  • Dans le dernier numéro de First Monday, un autre étudiant s'est penché sur la qualité des citations scientifiques dans l'encyclopédie collaborative, avec deux résultats intéressants : les citations sont pour l'essentiel conformes aux normes académiques, et elles ont tendance à renvoyer majoritairement vers des revues à forte notoriété (Science et Nature en tête), ce qui ne peut effectivement que "contribuer à renforcer la crédibilité" de l'encyclopédie.
  • Et pour prolonger le débat, les 19 et 20 octobre 2007, l’association Wikimédia France organise le premier colloque francophone sur Wikipédia, à la Cité des sciences et de l’industrie sur le thème suivant : "Développer - Valider - Ouvrir". A ce jour, le programme ne fait état que de l'intitulé de 3 "séminaires" sans davantage de contenu ni d'intervenants (un sur les "réseaux d'experts" - tiens, tiens ... - un autre sur les rapports de l'encyclopédie avec le monde de l'enseignement, et un troisième sur l'épineuse question de la validation). A suivre donc ...

Côté identité/identifiants/traçabilité numérique :

  • Après les 3 lois de la robotique, les 7 lois de l'identité numérique. (Via InternetActu)
  • Un billet intéressant sur la gestion des avatars.
  • Naturellement en la matière, la clé résidera dans l'attitude, l'orientation et la marge qu'autoriseront les moteurs sur ces questions. Les habitués d'affordance retrouveront aisément sur ce blog quelques billets concernant la politique de Google en la matière, et durant cet été, Ask a annoncé son service AskEraser permettant aux utilisateurs de ne voir aucune donnée conservée durant leurs recherches. A l'inverse, le moteur Spock entend ficher les individus sur la base des informations collectées par les moteurs. Après un rapide test, il s'avère - heureusement - assez inintéressant (sauf si vous voulez connaître l'âge et le nom des épouses de différents présidents de la république de tel ou tel pays). Un million de personnes seraient ainsi "indexées" dans ce "people specific search engine". En revanche, nul doute que demain, l'un des moteurs majeurs proposera à son tour ce type de recherche.

Côté Outils :

Côté lectures / visionnages :

  • Un numéro du Journal of Computer-Mediated Communication avec notamment une section spéciale de 5 articles concernant les blogs, et quelques autres papiers intéressants autour des réseaux sociaux.
  • Le billet du gourou Nielsen qui a fait couler beaucoup d'encre blogosphérique au début de l'été : "Ecrivez des articles, pas des billets."En (très) gros, Nielsen plaide pour une expertise affirmée, au-delà de la surabondance instantannée d'information qui surgit dans la blogosphère à propos de tout ou de n'importe quoi. L'idée est que - selon Nielsen - si vous voulez affirmer votre expertise et éventuellement la monnayer au prix fort, vous devez écrire des billets longs, privilégier l' "in-depth content". Sébastien Billard résume très bien le tout.
  • « L’impact d’Internet sur l’économie de la presse : quel chemin vers la profitabilité ? » (.pdf) La thèse toute fraîche de Danielle Attias.
  • Et puis pour la bonne bouche, un petit film d'anticipation sur l'avenir du livre, lequel livre, peut-être selon un phénomène de contamination du support, devient de plus en plus "rich"-media.

Côté université :

  • Un très bon numéro spécial (.pdf) du magazine Horizons de l'AIU (Association Internationale des Universités), publié par l'Unesco, et consacré à la thématique du classement, des indicateurs et autres palmarès en vigueur (ou non) dans nos universités. Je vous recommande tout particulièrement la lecture de l'introduction de Jamil Salmi et Alenoush Saroyan, intitulée : "Les classements des universités comme instruments politiques : usages constructifs pour l'enseignement supérieur".
  • Sur le site lautrecampagne.org, une série de 5 entretiens avec des gens concernés et impliqués sur le projet de réforme des universités du gouvernement. Tous les sujets qui fâchent y sont abordés : recrutement, financement, échec en premier cycle, autonomie, etc.

Bonne rentrée à tous et toutes :-)

(Via : l'harassant dépouillement de mon agrégateur ...)

Redocumentarisation d'état.

La nouvelle suivante risque d'infléchir significativement la logique propre de l'encyclopédie Wikipédia.
L'état allemand, plus exactement le Ministère allemand de l'Alimentation, de l'Agriculture et de la Protection des consommateurs, par le biais de l'organisme des ressources renouvelables allemand (FNR : Fachagentur Nachwachsende Rohstoffe), le tout sous l'égide de l'institut (privé) Nova, va former et rétribuer des experts pour alimenter les articles concernant ces questions dans l'encyclopédie. Je ne saurai trop vous recommander la traduction de l'article original relatant la nouvelle. On y apprend notamment que lesdits experts en ressources renouvelables seront d'abord formés à l'utilisation de Wikipédia et à son écologie particulière, les mêmes experts n'ayant que peu l'habitude de voir n'importe qui venir modifier un de leurs articles lorsqu'ils publient dans un magazine ou une revue "classique".
Cet intérêt étatique, ainsi délégué à un institut privé me semble révélateur de plusieurs prises de conscience simultanées, la première d'entre elles étant la reconnaissance du formidable pouvoir prescripteur de Wikipédia dans le cadre d'une économie de l'accès.
En attendant de voir comment la communauté wikipédienne réagira, il faut en même temps souligner les nouveaux risques en temps réel occasionnés par les déviances possibles d'une redocumentarisation déléguée et soumise à rétribution. Tant qu'il s'agit de ressources renouvelables, on aurait effectivement mauvaise grâce à ne pas saluer l'initiative. Mais qu'adviendra-t-il si ce nouveau mode opératoire s'étend à d'autres domaines comme celui de la bio-éthique, de la génétique ou de tout autre sujet "porteur" et/ou "sensible" et/ou engageant d'énormes enjeux commerciaux ? La traçabilité et l'identification des auteurs-experts occupera alors le premier plan, comme dans le modèle schismatique proposé par Citizendium.
En tout état de cause WIkipédia sort aujourd'hui de son orbite pour prendre une nouvelle orientation, pour s'autoriser un nouvel horizon. Elle a déjà montré par le passé sa grande capacité d'auto-régulation, son fondateur sachant intervenir pour mettre en place des solutions moins ouvertes et plus régulées quand cela était nécessaire. Attendons donc de voir ce qu'il en sera de cet incontestable nouveau pallier de la redocumentarisation.

(Via Framablog, signalé par mail par Olivier)

Moteur à la carte wikipédienne

Comme je l'ai déjà écrit à de nombreuses reprises sur ce blog, Wikipédia, est actuellement la "banque de connaissances" la plus riche du web, l'un des 3 piliers de la révolution cognitive en marche et de l'économie afférente.
Il n'est donc pas surprenant que les "gros" moteurs s'y attaquent avec gourmandise, chacun cherchant à valoriser le contenu Wikipédien de diverses manières. On a ainsi eu connaissance des relations troubles l'unissant à Google, ce dernier ayant tendance à "remonter" légèrement ou systématiquement certains résultats en provenance de l'encyclopédie sur des requêtes standard. On a vu récemment Exalead proposer un onglet spécifique pour interroger l'encyclopédie, proposant même de visualiser un nuage de "Tags" représentant l'environnement sémantique de la requête déposée.
Or voici que je découvre via Serial Mapper, le moteur Wikimindmap, un programme permettant d'interroger différentes versions linguistiques de Wikipédia (française, italienne, allemande, anglaise ...) et surtout d'afficher le résultat sous forme de carte heuristique/conceptuelle, de Mindmap donc. Je teste depuis plusieurs jours et je dois dire que l'outil est réellement bluffant. Naturellement, sur toutes les Mindmaps subsiste une part de bruit, notamment pour les requêtes trop génériques. Mais la représentation tout à la fois "à plat" et "orientée" (au sens de "direction donnée") de l'environnement lexical des requêtes est une valeur ajoutée extraordinaire et ce aussi bien pour le chercheur chevronné ou expert qui se délectera de ce fléchage conceptuel pour en tirer le meilleur parti, que pour le novice (de la recherche ou de la chose recherchée) qui se trouvera ainsi doté d'un remarquable outil pédagogique pour progresser plus "sûrement" dans sa recherche.
Courrez le tester et vous m'en direz des nouvelles. Il existe même déjà un petit plug-in permettant d'ajouter Wikimindmap à la liste des moteurs interoogés par Firefox.

Politburo wikipédien

A peine remise de sa dernière TRD (Tentative de redocumentarisation déviante), Wikipédia a encore dû subir les assauts de partisans s'affrontant cette fois non plus au sujet du numéro de l'EPR, mais de la lettre du jeune résistant Guy Moquet. Là encore la page de discussion est un pur moment d'anthologie pour les adeptes de la "génétique textuelle en direct", même si cette fois et contrairement au précédent EPR, l'article n'a pas eu besoin d'être vérouillé.
Signe des temps donc, mais Wikipédia aime à se dessiner à la mode électorale, puisque certains ont même affublé Ségolène Royal du doux sobriquet de "Présidence wikipédienne", selon l'adage voulant "que sa politique soit modifiée (edited) par les gens en temps réel."
Une Wikipédia sur laquelle il est également possible de "voir" la redocumentarisation du monde.

Wikipédiem électoral

Wikipédia s'est donc invitée dans le débat électoral, et plus précisément dans le débat télévisé suite à la polémique au sujet de la "3ème" ou "4ème" génération du réacteur EPR.
Ecrans relate les faits. Ce qui est ici intéressant c'est de voir "à l'oeuvre" un processus de redocumentarisation "déviant" qui traduit le lien complexe entre lecture et inscription dans la temporalité particulière du numérique. Prenons donc l'exemple de l'article sur l'EPR de 3ème génération.
Avant le débat, il était un document "stabilisé" parmi des milliers d'autres. Riche de son information et de ses sources. Un document.
Le temps du débat et dans le futur immédiat qui le suit, il devient un docu-"mo"ment, lieu de transformation et de modifications nouvelles, et en l'occurence partisanes, infondées, frauduleuses. Perd-il pour autant son intérêt ? Non. Ou seulement pour ceux qui "au moment" du débat vont consulter l'article de Wikipédia, et ne maîtrisent donc pas (difficile de le leur reprocher ...) la logique intrinsèque de cette encyclopédie palimpsestique en mouvement perpétuel.
Et le jour d'après, il redevient enfin (grâce à la vigilance et la réactivité du peuple wikipédien) un document stable, inscrit, mais désormais non-immédiatement modifiable par n'importe qui.
Ainsi de cette TRD (tentative de redocumentarisation déviante), il ressort que le document :

  • n'a rien perdu de son intérêt originel, lequel s'en trouve même accru ;
  • s'est enrichi quantitativement (discussions dans l'historique) et qualitativement (ajout de sources "documentées" sur la référence à la 3ème génération) ;
  • dispose d'une "valeur de preuve" qui se trouve enrichie par l'ajout de nouvelles dimensions : celle de la chronique des falsificateurs pris la main dans le sac et celle de l'écho documentaire suscité dans d'autres documents (tel l'article d'Ecrans par exemple)

Au final donc, un document "aug"docu"menté" (effet de la chambre d'écho) et un document "re-"documenté au sens propre (cf l'onglet des historiques et des modifications qui "documente" au sens propre la TRD susmentionnée)
Ce qui doit nous permettre de ne pas oublier que dans "encyclopédie" il y a "cycle" et que comme disait l'autre :  "Ceux qui pensent en rond, ont les idées courbes." :-)

(Repéré via Irène Delse puis Ecrans)

Nouveautés motorisées

Quelques nouvelles rapides de nos chers moteurs :

  • Exalead annonce sur son nouveau blog, la lancement en béta d'une option permettant d'interroger uniquement Wikipédia. La navigation parmi les résultats est très riche, permettant d'afficher un nuage de tags sur le mot recherché dans l'encyclopédie, ou encore de cibler les personnalités liées à la requête (un exemple sur la requête "hypertext" fait ainsi remonter l'ensemble des théoriciens, de Vannevar Bush à Tim Berners Lee en passant par Stuart Moulthrop). De la très belle ouvrage et une réelle valeur ajoutée.
  • Exalead, qui sur un tout autre créneau, se positionne aussi en termes de marketing sur une ligne décalée ... Une ligne qui aussi est la marque de fabrique d'une autre grande marque ...
  • Ask.com pratique l'alchimie algorithmique et fait fusionner ses deux technologies de recherche (Teoma et Direct Hit) pour lancer prochainement l'algorithme répondant au doux nom de code "Edison" (via SearchEngineLand).
  • L'AFP et Google signent un accord pour la diffusion des dépêches via le service GoogleNews. Après la presse belge et quelques autres épineuses affaires, la redistribution de l'accès à des contenus propriétaires par les moteurs semble parvenir à une régulation satisfaisant les deux parties(voir la dépêche AFP).
  • Et puis côté tonitruant, Google encore, rachète DoubleClick.

Parutions ...

Rapidement encore quelques parutions incontournables :

  • Le First Monday d'avril, avec 3 articles essentiels sur Wikipédia, dont un d'un poids lourd dans le domaine de l'analyse des moteurs de recherche au regard de théories et de modélisations issues du monde de la physique, Bernardo A. Huberman qui signe dans ce numéro un papier s'intéressant à l'évaluation de la coopération dans Wikipédia, en montrant que ladite coopération (correspondant aux différentes modifications d'un article - "edits" -) obéit à un mécanisme stochastique simple.

Bibliothèques, données et moissonnage 2.0

Très vite une petite revue de liens :

  • un Wiki sur le futur des bibliothèques, des catalogues et des (méta)données.
  • la biblioblogosphère française s'organise via 2 "méta"agrégateurs : ici (génèse du projet ici) et
  • Visualiser sous forme de nuage de tag les différents éléments du format MARC (âmes bibliothéconomiques sensibles s'abstenir)
  • l'Open Content Index : une tentative de ré-étalonnage bibliographique d'une masse d'informations de plus en plus intéressante mais aussi de plus en plus dispersée.
  • une tentative d'organisation à laquelle contribue également Revues.org via leur dépôt OAI :
    • Reprise du message publié sur Biblio-fr : "Ce dépôt vous propose, à ce jour, les métadonnées de 19359 articles issus de 59 revues de sciences humaines et sociales publiées en ligne sur notre portail. Ces métadonnées sont  structurées en Dublin Core simple. Dans le futur, elles seront enrichies afin d'offrir plus de précision et de granularité
      dans la description des articles et des collections  (Dublin Core qualifié et METS).
      La liste des publications concernées est accessible à l'adresse suivante : http://oai.revues.org/archives.php
      "

Parutions ...

Beaucoup en ce moment parmi lesquelles deux incontournables :

  • First Monday, dont je retiens cette bonne idée d'une synergie possible entre Wikipedia et l'accès public aux résultats de la recherche (open access), la seconde étant "valorisée" par sa présence dans la première, et la première étant "crédibilisée" par des références plus importantes vers la seconde.
  • D-Lib, dont je retiens ce qui me semble être le tout premier article fouillé qui aborde la question de l'évaluation des plateformes d'auto-archivage institutionnelles ("institutionnal repositories") installées dans les universités. C'est ici le cas de la plateforme DSpace implantée à l'université de Cornell qui est disséqué. L'article montre à quel point cette plateforme est sous-utilisée et sous-alimentée, et le cercle vicieux que cela entraîne ("je m'en sers pas puisqu'il n'y a rien" => "je n'y mets rien puisque personne ne s'en sert" => ad lib). Un article incontournable donc puisqu'au delà de l'ombre au tableau qu'il peut apparemment jeter sur les ardeurs des plus enthousiastes défenseurs de l'archivage institutionnel (dont j'essaie d'être), il démontre surtout - à mon avis - qu'au même titre que tout autre projet, et peut-être davantage encore que les autres, la mise en place d'une archive institutionnelle doit être accompagnée et surtout précédée par une active politique de sensibilisation et de formation. Alors seulement il devient possible d'administrer l'évangile sous la contrainte. Sans cela, et sans accompagnement sur ces projets des composantes directement concernées des universités (c'est à dire les SCD -  Services communs de documentation -), il est effectivement à craindre que les archives institutionnelles ne nous rejouent les coup des intranets sous-utilisés. Update : Stevan Harnad, donne son explication de l'échec Cornel(l)ien, et ses solutions dont l'archivage obligatoire)

Michel Serres aime Wikipédia.

Et il dit merveilleusement pourquoi ici.

Si vis pacem, wikipediem.

L'encyclopédisme est-il un exercice ? Un exercice autorisé ? Un exercice d'autorités ?
L'expérience pédagogique menée par un professeur d'université auprès d'étudiants en Master est pour le moins originale et singulière : il s'agit d'éditer 8 articles en les améliorant (et donc en faisant des recherches documentaires, en ajoutant des références bibliographiques, etc, etc.), et d'en écrire un eux-mêmes. Le tout étant noté.
C'est parti. Vous avez 4 heures. Je ne veux plus rien entendre que les feuilles de dictionnaires qui feuilloient et le tapotis de vos doigts sur le clavier qui t'apitoient ...
Quelque chose me dit que cette nouvelle affaire va faire grand bruit auprès des habituels zélés détracteurs de l'encyclopédie ... Il n'y a pourtant pas de quoi ... Le principe même de l'approche encyclopédique de Wikipédia étant le renoncement à l'écriture d'articles "es qualite". De facto, nombre de ses articles, et des meilleurs, sont écrits par des wikipédiens dont on ne se soucie guère de mesurer le nombre de diplômes ou d'années d'études.
Ceci étant, et comme rien n'est jamais simple en matière de modèles éditoriaux émergents, cette affaire est à rapprocher de la dernière prise de position de Jimmy Wales qui, suite à une énième affaire d'un "contributeur qui n'était pas le professeur qu'il disait être", a déclaré que : "les auteurs en ligne pourraient rester anonymes tant qu'ils ne se présenteraient pas comme des professionnels dans leur domaine. Dans ce cas, ils devront produire leurs diplômes."
Prise de position une nouvelle fois remarquable parce qu'elle ne ferme aucune porte en mettant en oeuvre un barrière flottante suffisante pour maintenir à flot la crédibilité de l'ensemble.
Si vis pacem : wikipediem ! Et vive le M.E.N.C.C.A.S.C.C.
(Et Oscar de la "meilleure innovation pédagogique appliquée" au professeur en question, que je remercie à titre personnel, vu que si quelques-uns de mes étudiants me lisent, ils savent ce soir de quoi sera fait leur partiel de demain :-))
(Via Réputation & Information, Technaute)

Diversité des Youniversités

Henry Jenkins, professeur au MIT publie sur son blog une suite à son article "From YouTube to Youniversity" paru (mais payant) dans le Chronicle of Higher Education. Il y souligne l'importance croisée de 5 ouvrages fondateurs d'un changement de paradigme dans l'économie des médias, et plus largement des habitus numériques :

  1. The Wealth of Networks de Yochai Benkler (téléchargeable ici)
  2. Plenitude 2.0 de Grant McCracken
  3. The Long Tail de Chris Anderson
  4. The Future of Work de Thomas W. Malone
  5. Convergence Culture: Where Old and New Media Collide, de lui-même.

Henry Jenkins reprend ensuite l'expression "adhocratie" désignant : "a form of social and political organization with few fixed structures or established relationships between players and with minimum hierarchy and maximum diversity." Soit "l'opposé de l'université actuelle". Et de nous demander d'imaginer des universités fonctionnant à la manière de Wikipédia ou de YouTube afin "de permettre le déploiement rapide d’expertises dispersées et la reconfiguration des champs". Donnant ainsi naissance à une nouvelle unité académique baptisée donc "Youniversity".
Comme Henry Jenkins fréquente le MIT et y enseigne depuis quelques années, et comme il ne s'agit pas là du plus mauvais campus universitaire de la planète, il détaille comment progressivement, à partir de l'héritage croisé de disciplines différentes, les enseignements du MIT à destination des étudiants avancés se sont progressivement construits sur ce paradigme qu'il propose aujourd'hui d'appeler "Youniversity", arguant que : "To educate such students, we don't so much need a faculty as we need an intellectual network."
Et de rappeler qu'il ne s'agit en l'occurence que d'étudiants qui, à l'inverse de ceux qui arrivent actuellement à l'université, ne sont pas des "digital natives". Pour ces derniers, "In such a world, the structural and historical schisms separating media production and critical-studies classes no longer seem relevant."
Tout au long de son billet, et au-delà de l'importance effective accordée à l'appropriation des nouveaux médias participatifs dans la transmission des savoirs (blogs, wikis, etc), il plaide intelligemment pour un modèle de refonte de ce que nous appellerions de ce côté-ci de l'atlantique, les études doctorales, particulièrement dans le champ des "media studies". A méditer.

(Via Francis Pisani)

Architecture de l'information et puissance graphique

Richard Saul Wurman est architecte. Il est également graphiste. Il est l'auteur de (très) nombreux ouvrages dont quelques bestsellers. Il est également à l'origine des conférences TED (Technology Entertainment Design) au cours desquelles des choses passionnantes se racontent :

  • Jimmy Wales en février 2005 à propos du système de gestion de Wikipédia (vidéo)
  • Mena Trott (la mère de Loïc Le Meur ;-) en 2006 à propos du potentiel des blogs (vidéo)
  • Nicolas Negroponte à propos de l'ordinateur portable à 100 $ (vidéo)
  • ... j'en passe et des meilleurs.

Mais revenons-en à Richard Saul Wurman, qui (d'après Wikipedia) a notamment forgé en 1976 le terme "d'information  architect", terme qui prend aujourd'hui tout son sens.
Parmi les oeuvres du bonhomme, je découvre fortuitement le site "Understanding USA" dont la simple présentation en dit suffisamment sur cette discipline qu'est le design informationnel. Site dans lequel je vous recommande tout particulièrement - même s'ils datent un peu, les derniers chiffres mentionnés remontent à 2000 - le chapitre sur les technologies de l'information (aussi disponible en pdf) et celui sur les médias (pdf itou) : ils illustrent de manière parfaitement synthétique nombre des problématiques actuelles concernant l'accès à l'information, la surcharge cognitive, etc, etc.
A redécouvrir.

Contrôle qualité.

En 6 pages, une équipe des HP Labs de Palo Alto s'attache à mesurer l'efficacité qualitative de la coopération sur Wikipédia. Rappel de quelques chiffres : Wikipédia c'est 6 ans d'existence, 6.4 millions d'articles en 250 langues, 236 millions "d'éditions" (= de modifications) et 5.77 millions de contributeurs (source). Un si formidable palimpseste ...
Où l'on apprend (où l'on a la confirmation) :

  • que la qualité des articles est très liée au nombre de contributeurs ("editors") et au nombre de modifications ("edits") de l'article.
  • que Wikipedia se conjugue aussi sur le mode de la longue traîne : "An analysis of editing patterns shows a heavy-tailed distribution of articles, in which relatively few articles having disproportionally high numbers of edits and editors end up at the forefront in terms of quality and visibility."

Pour lire l'article c'est par là => .pdf
(Via CooperationCommons)

Googlepedia : l'évidence de l'oxymore.

L'encyclopédie et le moteur. Comme le titre d'une énième fable numérique, riche d'enseignements.
Car quoi de plus opposé - a priori - qu'une encyclopédie et un moteur de recherche ? A priori seulement car à force d'être un moteur de recherche objectivement excellent, à force de réduire comme peau de chagrin l'espace d'affichage des liens organiques, et en prenant en compte les habitudes de navigation des internautes (qui n'utilisent quasiment jamais le scrolling), à force donc, Google est devenu un moteur de sources : une requête ne donne (en général) pas de réponse directe, mais bien davantage (et bien mieux) une source (en général) pertinente dans laquelle trouver la réponse que l'on cherche.
Et aujourd'hui sur le Net, Wikipedia est LA source. Que l'on s'en plaigne ou s'en réjouisse ne compte pas ici.
LA source et LE moteur.
Et entre eux une histoire d'amour d'affinité compliquée, comme toutes les histoires. Une histoire pour laquelle on dispose désormais de nouvelles preuves (parce que c'est bien connu, il n'y a que des preuves d'amour). LE moteur a tout intérêt à ce que L'encyclopédie soit bien représentée dans ses résultats, au risque d'une surpondération desdits résultats. L'encyclopédie a elle tout à gagner à être bien référencée dans LE moteur, et à ne pas sacrifier la pertinence de ce dernier sur l'autel de sa propre notoriété, logique à laquelle, gagnant en maturité amoureuse, elle se plie volontiers.
Comme dans toutes les histoires d'amour d'affinité, les contraires s'attirent. Et leurs situations financières sont probablement là aussi ce que l'on peut aujourd'hui trouver de plus antagoniste sur le Net. Une fondation soutenue par quelques levées de fonds d'un côté, une bulle spéculative en acier trempé de l'autre. Et les difficultés ou les rumeurs de difficultés que cela entraîne pour l'une**. Et les rapprochements tentants que cela finit par imposer aux deux parties.
La suite de cette histoire, celle qui reste à écrire, c'est celle d'une hybridation :

  • L'hybridation comme une évidence : la même qui fait que c'est aujourd'hui par un moteur que l'on entre en bibliothèque. Que "la bibliothèque hors les murs" est aussi "la bibliothèque hors la visibilité", "la bibliothèque hors l'usager" si elle n'intègre pas son catalogue à celui des moteurs. Ce qui est tardivement et heureusement en cours.
  • L'hybridation plus fine, qui fait que l'encyclopédime est aujourd'hui non plus exclusivement "savant" mais aussi "d'usage" (cf p.307 de ma thèse).
  • L'hybridation beaucoup plus problématique enfin, d'un "bien commun" (wikipédia est ainsi définie dans son argumentaire par Florence Devouard, cf les liens plus bas) et d'une succursale marchande planétaire. Car en matière de "biens communs", on connaît les manières un peu brutales de la pieuvre (cf notamment ce qu'il advînt des livres libres de droits comme autant de biens communs ... mais jusqu'à quand ?)

**Sur l'épisode des supposées difficultés financières de wikipédia voir : ici, ici, ici et (fin de l'histoire) .

Voir aussi à propos du traffic Wikipédien (dont 50% vient de Google et qui devient l'un des 10 sites les plus visités au monde) : Didier Durand, SEORoundTable, Yahoo!News, Steve Rubel.

Psychologie de la collaboration

"l’importance du jeu et du plaisir à l’époque de l’information, à l’opposé de l’éthique protestante du travail qui a prévalu pendant l’ère industrielle." (source)

A mon avis essentiel pour comprendre les mécanismes actuels de la collaboration et de la diffusion de contenus dans les actuels systèmes ouverts (blogs, wikipedia, etc.). "Jeu" et "plaisir" auxquels j'ajouterai le facteur "reconnaissance dans sa communauté".