Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

La fracture amicale.

"La nouvelle fracture numérique opposera les gens disposant d'un réseau d'amis et ceux sans amis. L'ancienne fracture numérique entre les riches (ceux disposant d'une connexion internet) et les pauvres continuera d'exister." La citation (repérée par TechCrunch) est de Robert Scoble. Si cette "formule" m'intéresse c'est parce qu'elle traduit assez bien la manière dont, in fine, les logiciels sociaux (qui, rappelons-le, sont bien plus que les simples "réseaux sociaux") ont durablement transformé la nature de notre rapport au web.
<Parenthèse> Dire que les logiciels sociaux ont transformé la nature de notre rapport au web, n'est pas du tout la même chose (et est à mon avis beaucoup plus juste) que d'affirmer - comme on le lit un peu trop souvent - que les réseaux sociaux ont changé la nature du web </Parenthèse>
Il me semble qu'aujourd'hui, dans l'essentiel de nos pratiques, la socialisation dans sa dimension expérientielle première, est devenue au moins aussi importante que les trois activités qui firent la spécificité du primo-web, c'est à dire la navigation-lecture (browsing), la navigation-recherche (searching) et naturellement l'écriture (au sens large de "production de contenus"). Ce qu'ont permis les logiciels sociaux c'est le transfert de logiques de socialisation grégaires depuis des espaces clos et dédiés (les forums ou groupes Usenet) vers des espaces réellement réticulés, c'est à dire largement distribués au travers du moindre espace d'écriture ou de navigation.
Cette réflexion en appelle une autre. Il n'est pas aujourd'hui sur le web d'espace de production de contenus numériques qui n'échappe à l'angle d'une analyse "conversationnelle", "socialisante". On n'écrit plus, on ne publie ou ne produit plus aujourd'hui de contenu simplement pour être présent, pour occuper un espace, ou pour être bien "positionné" mais tout au contraire pour confronter ou pour souscrire. On écrit, on publie, on produit pour engager un débat. Pour "se" confronter aux autres. Pour maintenir et établit un contact. De toutes les fonctions du langage théorisées par Jakobson, c'est la fonction phatique qui est au coeur de l'ensemble des socialisations numériques, y compris (et surtout ?) de l'écriture-socialisante qui couvre  (par exemple) l'immense majorité des productions de la blogosphère.
Comme nouveaux totems de cette dominance du phatique, citons les trackbacks ou rétroliens (qui en inversant la polarité des liens pour la première fois dans l'histoire de l'hypertexte, contribuèrent largement à disséminer ladite fonction phatique et à en faire l'un des tout premiers horizons d'attente de l'écriture numérique courante). Citons également l'incontournable et parfaitement totémique "poke" de Facebook
Pour autant, et dès que cette confrontation se trouve inscrite dans un processus collaboratif assez large impliquant un nombre significatif de personnes, on retombe très largement dans les anciens et classiques shémas auctoriaux et éditoriaux. Des shémas "étagés" dans lesquels les fonctions de représentativité et de leadership sont réaffirmées comme essentielles. La présumée "sagesse des foules" n'est que l'exercice d'une démocratie numérique rigoureusement équivalente au système politique dans lequel nous évoluons. La seule différence (de taille) vient de son amorçage : les "leaders", les "gourous", les "éditeurs", les "auteurs" ne sont pas élus dans une logique de représentativité en assumant une charge "par délégation", mais ils sont les promoteurs ... à l'origine de leur propre promotion. Une promotion dans le meilleur des cas au service d'un projet ou d'une parole, et dans le pire des cas au seul et unique service d'un égotisme forcené. Les autres, tous les autres y souscrivent au sens littéral du terme. Ils écrivent, publient, discutent, débattent "en dessous", dans les limbes palimpsestiques de ces nouveaux espaces de socialisation numérique. La fonction phatique ne prime plus. Le "poke" redevient "private joke".
Le web, quelle que soit sa dénomination ("world wide web, world live web, world life web"), sa numérotation (1.0, 2.0 ...) demeure un espace rhizomatique mais devient de plus en plus organique ; son organisation confine à l'organique. Les liens unissant des contenus y côtoient désormais les relations unissant des personnes. Cette corporéité nouvellement incarnée n'est pas simplement métaphorique. Elle traduit un changement de nature radical. L'erreur serait de croire que ce changement de nature est également un changement d'objet. Le web est et demeure une artefacture technique. L'erreur serait de ne chercher qu'à questionner cette artefacture. Le web n'est qu'un vecteur. Le changement concerne tout au contraire notre rapport individuel et intime à la socialisation. Notre rapport à l'autre.
Il y a quinze ans de cela, des scientifiques, des universitaires, se posaient la question de savoir quels documents/contenus pouvaient être numérisés. La réponse est aujourd'hui connue : il n'est aucun contenu qui ne résiste à la numérisation, rien qui ne puisse être numérisé ou numérique. Rien qui ne puisse être re-présenté "sous forme" et "au format" numérique. Pro forma. Ce qui est vrai des documents/contenus le sera-t-il également pour les individus et les relations interpersonnelles ?
Ce n'aura pas été le moindre mérite de Facebook et consorts que de permettre que ces questions soient posées. Les réponses seront là aussi évidentes. Dans 15 ans. Ou peut être moins. D'ici là nous aurons grand besoin de sociologues pour nous aider à bâtir la science du web.

(Temps de rédaction de ce billet : 2h30)

Fini les vacances, c'est la rentrée ...

Côté moteurs/wikipédia/knol :

  • On a donc pas mal parlé avant et pendant les vacances du projet de Google concernant son "encyclopédie" Knol : dans Ecrans, Florence Devouard s'inquiète à raison en rappelant que 50 % du traffic vient directement de Google. Google Blogoscoped y revient également en soulignant l'argument selon lequel Google ne pouvait plus accepter de voir partir tout ce traffic "non-monétisé" vers un site (wikipedia) indiquant qu'il refuserait toujours la publicité.
  • Voir aussi la rapide analyse comparative de ReadWriteWeb entre Knol, Wikia, Wikipedia et Mahalo autour des trois mamelles de l'argent, de l'attention (comme vecteur de monétisation) et de l'altruisme (comme contribution à la somme des connaissances disponibles).

Côté réseaux sociaux, moteurs de recherche et scientométrie :

  • Medline nous avait déjà habitués à son goût des interfaces innovantes. En voici une nouvelle baptisée GoPubMed qui permet, sur la base d'une recherche de faire émerger des "réseaux sociaux" à partir des noms d'auteurs d'articles et de leurs adresses de courier électronique (Via Cismef). En fait, plutôt qu'un réseau social (ce qui est l'argumentaire marketing du lancement de ce nouveau service), c'est bien de scientométrie qu'il s'agit, c'est à dire de la capacité, via un moteur sémantique, de repérer des collaboratoires, des "collèges invisibles", et de cerner en un instant sur un thème donné, l'état des publications en la matière et les chercheurs les plus en vue. Exemple : en entrant le terme "stuttering" (bégaiement) et en cliquant (à gauche dans la rubrique "What") sur "Hot topics", vous visualisez :
    • un "top 20" des auteurs ayant le plus publié sur le sujet
    • un "top 20" des publications classées par pays
    • un "top 20" des journaux dans lesquels on trouve le plus de publications en rapport avec le bégaiement
    • une courbe temporelle vous permettant de visualiser la progression (ou le recul) du nombre de publications par an sur ce sujet
    • une visualisation sous forme de graphe des réseaux de collaboration entre auteurs (répondant à la question "qui publie avec qui ?")
  • c'est à tomber par terre. Et on se prend à rêver d'un tel outil dans le cadre d'un moteur généraliste majeur à vocation scientifique (maiiiis non, pas forcément celui-là, il y a aussi celui-là). Pour mieux comprendre la puissance d'un tel outil : allez le tester, et lisez le communiqué de presse (.pdf).

Côté moteurs tout court :

  • le 7 janvier 2007, il y a donc de cela exactement un an, Jimmy Wales annonçait le lancement de Wikia, le moteur de recherche dont les résultats seraient validés par des humains. Et bien exactement un an plus tard, on nous annonce le lancement de Wikia (en version béta) pour demain, le 7 Janvier 2008 donc. A ce sujet, voir la revue de presse de Christophe Asselin. Le site de la "communauté" wikia est ici, et comme on peut le lire dans le wiki du projet, Wikia compte s'appuyer sur tout l'éventail des technologies de recherche à valeur ajoutée, à savoir la sémantique (= catégorisation), le "réseau social", l'indice de "réputation", et une infrastructure "distribuée". Lancement demain donc, et affaire à suivre de près pour ce nouveau "moteur de recherche open-source collaboratif".

Côté Bibliothèque "2.0" (ou pas ...)

  • Une conférence qui s'est tenue début Novembre à Berkeley sur le sujet des bibliothèques "2.0" avec les supports de présentation accessibles en ligne (supports présentés parfois sous forme classique - un bon vieux powerpoint - parfois sous forme "2.0" - un wiki). Pas de grande nouveauté mais cela vaut le coup de visionner la conférence inaugurale de Meridith Frakas qui embrasse bien la situation (.ppt)
  • l'un des derniers rapports du Pew Internet nous apprend (via 01.net) qu'outre-atlantique, la première raison de fréquentation des bibliothèques est ... le fait d'y trouver une connexion Internet. De quoi largement réalimenter de vieux démons débats, tant sur le taux d'équipement desdites bibliothèques dans notre bel hexagone, que sur la place des technologies d'accès dans ces enceintes et le taux de formation et d'encadrement qui est dévolu à leurs personnels.

Côté Folksonomies & Indexation sociale

Côté néologismes :

  • Saluons l'arrivée de la Zemblanité, exact opposé de la sérendipité et qui désigne "la faculté de faire de façon systématique des découvertes malheureuses, malchanceuses, attendues et n'apportant rien de nouveau." La génèse du concept et sa présentation détaillée sont disponibles sur Urfist-Infos.
  • Saluons (Via Francis Pisani) l'arrivée  de la "mobiquité" : mobilité + ubiquité. Un néologisme qui traduit bien la place de plus en plus importante qu'occupe dans notre société et dans nos comportements informationnels, l'informatique nomade et/ou ambiante.
  • Reste à savoir si ces deux néologismes entreront au panthéon linguistique aux côtés de la blingocratie.

Côté copyright, Fair-Use et autres creative commons

  • Un rapport intitulé : "Recut, Reframe, Recycle: Quoting Copyrighted Material in User-Generated Video" (.pdf). La question posée est de savoir si dans le cadre des sites de médias participatifs donnant lieu à divers remixages (exemple : YouTube), les détournements, parodies, et autres mashups de diverses oeuvres de fiction relèvent - ou non - du cadre du Fair Use (= usage équitable) et échappent donc à la législation du copyright. La réponse du rapport est claire : Oui. Il y a dans ces "oeuvres" de nouveaux éléments (détournement, transformation, remixage) qui les inscrivent dans le cadre de la constitution d'une culture populaire. "Video remix culture does not violate copyright." Les auteurs du rapport rappellent également qu'il est important de sensibiliser aussi bien les "auteurs" que les "remixeurs-amateurs" à la notion de propriété intellectuelle et d'usage équitable, pour que les premiers soient conscients de la richesse que ces remixages peuvent (parfois) apporter à leurs oeuvres, et pour que les seconds travaillent et s'amusent dans le respect de l'oeuvre des premiers. A noter : le site de présentation de l'étude est très bien fait, puisqu'en sus du téléchargement de l'étude proprement dite, il propose également une courte vidéo en rappelant les principales problématiques et conclusions, et propose également de télécharger un fichier excel du corpus de vidéos utilisées. Il propose enfin, pour chaque type de remixage (détournement, critique, débat, illustration, etc ...) les 5 vidéos les plus parlantes. Certaines d'entre elles sont réellement ... parlantes.
  • Et puis vraissemblablement à ne pas rater (je ne l'ai encore pas visionné en entier, mais il est plein d'interviews avec Yochai Benkler et ne peut donc pas être mauvais :-) un documentaire sobrement intitulé "Steal this Film" qui décrypte les enjeux liés à la notion de propriété intellectuelle et plus largement de "diffusion" dans le contexte actuel. Pour les plus pressés, plein d'extraits sur Google Vidéo, pour les autres téléchargement dans plein de formats possibles directement sur le site du documentaire. Il y en a même qui se sont déjà attelés au sous-titrage en français.

Côté traces documentaires identitaires (ou identité numérique si vous préférez) :

  • nos comportements informationnels laissent de plus en plus de place à l'égotisme forcené. Au service de cet égotisme on compte d'ailleurs de plus en plus d'outils tendant à l'illustrer (les divers outils de classement façon "top 50 de quelque chose"), à le renforcer (économie de la réputation), à en faire naître le besoin (via des interfaces navigo-ludiques dont vous êtes le centre et la circonférence), ou à en faire l'alpha et l'oméga d'un modèle économico-sociétal (facebook). C'est l'éternelle histoire de la poule et de l'oeuf.
  • Got dans ses petites cases, nous gratifie d'un éclairant billet sur FOAF (Friend Of A Friend) dont on aimerait effectivement penser que le modèle réellement ouvert qu'il incarne soit l'avenir des protocoles tournant derrière la plupart des réseaux sociaux. Mais je ne peux hélas pas m'empêcher de penser qu'il y a encore bien du chemin à parcourir ... l'heure étant plutôt pour les grosses cylindrées à la centralisation des profils propriétaires ... ce qui doit nous inciter encore davantage a faire plus de place aux initiatives alternatives et technologiquement éprouvées (dont FOAF).

Côté ressources pédagogiques :

Côté voeux, bonnes résolutions et oracles divers :

  • il y a ceux qui ne croient plus aux blogs sous leur forme actuelle (Jean-Michel Salaun et Jean Véronis) ... mais qui continuent heureusement de blogguer :-) De mon coté je reste sur le créneau de l'enthousiasme (peut-être un peu candide), même si - à l'instar des deux précédemment cités - je constate ici et là une raréfaction des pépites blogguesques, nombre de trouvailles ayant visiblement du mal à tenir sur la longueur, ce qu'on aurait du mal à leur reprocher tant il est vrai qu'en dehors d'un projet affirmé de publication (journal, auto-fiction, carnet de recherche, formation à distance), l'exercice du blog est une gymnastique chronophage, et que "le temps de blogguer" n'est pas nécessairement la chose la mieux partagée du monde. Il n'en demeure pas moins qu'en repensant à ce qu'était la pêche informationnelle d'avant et d'après le temps du blog, ce "format éditorial" a tout de même été l'occasion d'entendre de bien belles voix, et de découvrir de fort pertinentes analyses. L'avenir dira ce la forme blog deviendra, mais les potentialités, l'univers de discours offert par une petite quantité de ces "nanopublications" reste pour l'instant et de mon point de vue, essentiel.
  • il y a ceux qui comme Fred Cavazza, se livrent à leur petit exercice de prospective du nouvel an, et ceux qui comme Francis Pisani, font une revue de presse des principaux exercices du genre.

Et mes prédictions à moi ?

  • A l'instar de ce que décrit Christian Fauré à propos du service Twine, je crois que l'ensemble des acteurs majeurs de la recherche d'information (Google, Yahoo! Microsoft) et quelques-uns de leurs challengers (Exalead, Facebook) vont prendre de plus en plus nettement le grand virage de l'hybridation. Une hybridation entre :
    • des espaces et des services collaboratifs,
    • des technologies sémantiques ou sémantisées de représentation et d'agrégation des connaissances,
    • et des algorithmies de recherche "pures" (ou recherche universelle).
  • Je crois que la diversité des contenus va (enfin) atteindre un équilibre longtemps espéré entre le "texte seul" et la vidéo et l'image.
  • Je crois enfin que l'une des grandes questions en terme de recherche (notamment pour les sciences de l'information et de la communication) sera la mise au jour des nouvelles autorités cognitives qui s'articulent aujourd'hui de manière encore un peu floue derrière la monétisation (ou la non-monétsation) des services à base de connaissance (Knol, Wikipedia).
  • De mon côté je retiens comme éléments et tendances majeures de l'année écoulée : les deux nouvelles étapes de la dérives des continents documentaires que sont :
    • d'une part, la synchronisation transparente entre nos activités informationnelles connectées (on-line) et déconnectées (off-line),
    • et d'autre part, la sphère croissante d'indexabilité (notion de "graphe social" pour faire simple) de l'humain au travers de ses innombrables traces documentaires éparses sur le(s) réseau(x).
  • Ce qui me semble frappant au-delà de tout c'est l'avénement imminent et probable d'une nouvelle génération d'algorithmes ayant capacité à représenter sur un même plan des documents toujours plus fragmentaires, des traces identitaires toujours plus documentées, et à transformer toutes ces traces d'attention en vecteurs d'intentions, pour le plus grand bonheur des grandes industries culturelles et des quelques acteurs qui dominent actuellement le marché (et ce au-delà du discours geignard et misérabiliste que s'obstinent à tenir les mêmes industries culturelles). En un mot comme en cent : la redocumentarisation du monde. Il est certain qu'il va falloir être très très très attentif aux Network sciences, car elles seront le creuset plus que probable de cette nouvelle génération d'algorithmes et de modes de représentation, et qu'à mon sens, elles seules ont aujourd'hui la capacité à réunir en un même cadre d'analyse les fronts de recherche les plus innovants, les techniques d'indexation et de représentation du vivant au sens large.
  • Voilà pour le côté vivifiant et optimiste de la chose. Côté pessimiste (mon éternel côté cassandre :-); je crains que nous ne soyons confrontés à une échéance majeure, celle de la médecine personnalisée et/ou médecine "2.0" et/ou médecine désintermédiée. La montée en puissance et la position désormais établie de ces nouveaux prescripteurs planétaires que sont les moteurs de recherche d'une part, la mise à la portée du grand public des technologies de génomique (notamment à des fins d'auto-diagnostic) d'autre part, les rapprochements entre les premiers (moteurs de recherche) et les secondes (sociétés de génomique), et enfin l'engouement de plus en plus explicite chez tous les grands acteurs de l'industrie médicale (et notamment pharmaceutique) pour des modèles de diffusion et d'accès reposant sur du gratuit financé par la publicité va nécessiter, pour le moins, de grands chantiers didactiques si l'on veut éviter d'aller à coup sûr ... droit dans le mur. Va falloir se trouver dare dare un José Bové de la santé comme bien commun de l'humanité. Sinon ...

Bonne année à vous tous :-)

Les 4 commandements

Ceux que l'on peut lire sur le site d'Amazon, en référence à la nouvelle interface de ce site, pionnier par bien des aspects : "Shopping, Searching, Saving, and Buying". Simple, basique, efficace, programmatique et tellement caractéristique des comportements informationnels les plus courants.
A mettre en relation avec l'autre trilogie des modes de requêtage sur le net : requêtes transactionnelles, informationnelles, navigationnelles, renvoyant elles-même à l'antique schisme entre browsing et searching, qui lui-même est venu récemment s'adjoindre les services du subscribing.
Shopping, Searching, Saving and Buying. SSSB. Les 4 commandements de nos vies numériques. Ainsi qu'une lumineuse grille d'analyse.
(Via Isbn.wordpress.net)

Du dossier au mot-clé

Le dernier billet de John Udell s'intitule "Tagging and Foldering" et il y pointe une évidence qui me paraît tout à fait éclairante sur les logiques des services en ligne ou off-line que nous utilisons désormais (presque) tous de manière quotidienne : moteurs de recherche, gestionnaire de fichier, courrier électronique, applications bureautiques, etc.
Nous sommes donc passé d'une logique d'organisation par dossier "Foldering" (aaaaah le lointain souvenir de la toute puissance de l'explorateur window$ ...) à une logique d'organisation par mots-clés (tags). Ceci, du côté de nos ordinateurs personnels, a été rendu possible par l'augmentation de la puissance des processeurs (qui, entre autres choses, autorisent désormais une indexation de tous les documents en local et une recherche idoine). L'ensemble des services en ligne ont les tags ou mots-clés comme entrée principale. A titre personnel (rien de général là dedans) j'utilise essentiellement les principaux services de mon quotidien informatique à l'aide d'une entrée "mot-clé" ou "tag", qu'il s'agisse de retrouver un mail, un fil RSS dans mon agrégateur, ou un fichier sur mon mac. Ce mouvement (pour autant qu'il puisse être généralisé un peu au-delà de ma petite personne, ce que je crois), ce mouvement marque également un nouveau stade dans la substitution d'une logique de "searching" à une logique de "browsing", une nouvelle étape qui n'est pas neutre :

  • « Cet article traite du problème de la recherche d’information dans un hypertexte. Dans ce contexte, le processus de recherche est envisagé comme un processus d’inférence qui peut être exécuté par l’utilisateur explorant le réseau hypertextuel (browsing), ou par le système, exploitant alors le réseau hypertextuel comme une base de connaissances (searching). » (...)
    « Browsing : aller d’un endroit vers un objet [going from where to what] (en supposant que vous savez où vous vous trouvez dans la base de données et que vous voulez découvrir ce qu’elle contient à cet endroit). Searching : aller d’un objet vers un endroit [going from what to where] (en supposant que vous sachiez ce que vous cherchez et souhaitiez trouver où cela se trouve dans la base de données). » Lucarella D., « A Model for Hypertext-Based Information Retrieval. », pp.81-94, in Hypertext : Concepts, Systems and Applications, Rizk A., Streitz N., André J. (eds), Cambridge University Press, 1990. Actes de la Conférence Européenne sur l’Hypertexte, INRIA, France, Novembre 1990.

Voilà donc pourquoi ce glissement applicatif de la plupart de nos interfaces, y compris même cognitives, n'est pas neutre : il n'y a pas, peu ou plus d'inférence dans une recherche sur le mode "searching" (reposant sur des "tags"), là où le "browsing" et son organisation arborescente (simple ou complexe) en nécessite. Cette absence trouve son meilleur exemple dans les interfaces utilisant des folksonomies comme point d'entrée : le succès de ces dernières vient du fait qu'elles sont capables de pallier l'absence du mot (symptomatique chez les moteurs de recherche et leur zone de saisie désespérément vide), et le plus souvent l'absence du besoin (de recherche d'information) chez la majorité des utilisateurs : comme on arrive sur ces sites (YouTube, DailyMotion, FlickR et tant d'autres) pour y flâner, sans besoin précis, la pregnance des tags fixés sur cette "imago", cette représentation à peine conscientisée, fait office d'inférence substitutive. Ce mouvement, c'est celui que j'avais déjà tenté de problématiser dans ce billet : après le "browsing", le "searching", c'est celui du "subscribing", un mode opératoire dans lequel :

  • "On ne navigue plus, on ne recherche plus, on s'abonne, on "souscrit". Notons d'ailleurs que l'étymologie de ce dernier vocable est intéressante : "souscrire", "sub-scribere", littéralement "écrire en dessous", à moins qu'il ne s'agisse d'écriture "sous autorité" : en aggrégeant les discours écrits ou postés par d'autres, on est, de facto, placé "sous" une "autorité" qui n'est plus notre."

Sérendipité

L'ouvrage "Voyages et aventures des trois princes de Serendip" est disponible gratuitement et en intégralité sur l'excellent WikiSource. Pour d'autres déclinaisons de la sérendipité, voir par ici ;-)

Le web pas à pas

Le site Walk2Web vous permet d'explorer littéralement "pas à pas" les liens entrants (en vert) et sortants (en bleu) du site que vous choisirez comme point d'entrée. Pas grand intérêt du point de vue de la recherche d'information (les liens présentés sont loin d'être exhaustifs), mais une simple ballabe webienne sous les auspices de la sérendipité qui vous permettra peut-être quelques découvertes. Assurément une curiosité à l'interface soignée (et avec en sus la possibilité de voter et de tagguer les sites proposés).
(Découvert via un billet d'Eric Delcroix)

Le web implicite

Quand on essaie de regarder avec un peu de recul le développement des usages et des applications web, on observe une dynamique très forte : les processus (et leurs applications) "descendent" au niveau de l'usager, et plus exactement, descendent en dessous d'un certain niveau de conscience (notion préciée plus tard dans ce billet).
A l'image des moteurs de recherche qui ne fonctionnent plus sur un modèle "donne-moi ce que je tape" (= simple vérification de l'occurence du mot-clé saisi dans les pages retournées = matching) mais "donne-moi ce que je veux" (adéquation des résultats de recherche au profil de l'usager, ou au profil d'un macro-ensemble de requêtes semblables), la plupart des services web "leaders" ou ceux actuellement les plus générateurs de "buzz" fonctionnent sur ce modèle d'une économie de l'accès, également baptisée "économie de l'attention" (sur ce vocable, voir aussi les principes de "l'Attention Trust").
L'idée est simple et peut être résumée en une phrase : transformer en itinéraire dirigé et centré sur les attentes de l'usager, ce qui était considéré au début du web comme une nuisance (le "lost in hyperspace problem" de Conklin** reliant la notion de "navigation" à celle de "désorientation"). Qui aurait imaginé il y a de cela quelques années qu'un outil, une interface, soit capable sur la base d'une simple requête, de nous fournir en retour non plus de simples "résultats", mais des recommandations, des choix de reformulation, en accord avec nos choix, nos itinéraires ou nos parcours précédents ? Ce qui est frappant dans ce processus aujourd'hui largement plébiscité et qui fait par exemple le succès d'Amazon ou encore des radios "personnalisables" sur le net (Last.fm par exemple), c'est le retour à l'idée première de l'hypertexte telle qu'elle avait été théorisée par V. Bush et par quelques autres pionniers : la parcours, le "chemin" ("trail") importe au moins autant que le lien.
Nous sommes donc passés d'une toute puissance du lien hypertexte, point nécessairement nodal de développement du réseau et des services et outils associés, à une toute puissance du "parcours", de la navigation "qui fait sens", de la navigation "orientée" au double sens du terme.
C'est sans doute en définitive ce mouvement, cette dynamique qui traduit le mieux la transition entre le web 1.0 et le web dit "2.0". Ainsi donc avec l'avènement de ce que l'un des derniers billets de ReadWriteWeb appelle le "web implicite", le rêve de Vannevar Bush d'inventer un système s'approchant le plus possible du fonctionnement de l'esprit humain (c'est à dire, pour faire vite, d'un fonctionnement non pas hiérarchique mais par analogie) semble aujourd'hui atteint, même s'il faut ici placer toute une série d'importants bémols sur les moyens mis en oeuvre pour atteindre cet idéal, lesquels moyens au service de la personnalisation et des systèmes de recommandation ne sont souvent qu'une manière de "monétiser" ces parcours au nom de logiques marketing.
Mais le résultat est là, l'activité de navigation proprement dite descend en dessous d'un certain niveau de conscience, puisqu'au moment où, sur Amazon par exemple, nous "activons" les liens proposés sous forme de recommandation suite à une requête ou une recherche initiale, nous n'avons pas formulé explicitement ce besoin. Au final pourtant, le parcours "aura fait sens" (avec plus ou moins de succès), et l'activité mentale couplant recherche et navigation n'aura plus eu besoin d'être littéralement "déclarative", permettant ainsi de parler d'un web implicite.
Demain probablement, ces mêmes applications, ces mêmes moteurs, sauront et ce sans même avoir besoin d'une requête initiale, d'un "amorçage", sauront ce que nous sommes le plus susceptibles de chercher ou de saisir comme requête selon l'heure de la journée, le lieu de notre connexion ou encore notre environnement. C'est probablement en cela que résidera la troisième révolution du web. Pour cela, il faudra "simplement" :

  • l'application d'un minimum de logique sémantique sur de gigantesques silos de données déjà "profilés" (=le profiling étant la face obscure de la personnalisation),
  • la multiplication déjà en cours de modes d'accès nomades au travers de terminaux et d'interfaces de plus en plus "ambiantes", c'est à dire dissimulés/disséminés dans notre environnement quotidien,
  • le tout sous-tendu par une logique d'accès (sur le modèle algorithmique du PageRank) en phase avec cette macro-économie de l'attention sus-citée.

La langue anglaise étant en la matière plus synthétique et illustrative que la nôtre, on pourrait décrire ce futur web 3.0 par la combinaison de deux termes : Myware + Everyware. "Myware" pour ce cortex collectif, in-vivo. "Everyware" pour une corporéité enfin conquise de cet hypercortex. Et le rêve de Bush prit une toute autre dimension ... Non plus simplement celle d'une hybridation analogique entre l'homme et la machine, mais celle de la possibilité même d'une activité et d'un fonctionnement sub-conscient de l'accès et du traitement de l'information, à l'exacte mesure de cette hybridation. En d'autres termes, l'ultime étape d'un darwinisme documentaire déjà observable.

**(Conklin J., 1987). Hypertext: An introduction and survey. Computer Magazine, 20, 17-41. 

Update : Pour prolonger et/ou ouvrir la réflexion, voir ce billet de Francis Pisani : "Le futur complexe".

Update : Intéressantes remarques de Richard Peirano suite à la lecture de ce billet.


Chercher le silo ... dans la matrice (épisode 2)

(Suite de l'épisode 1 : "Chercher l'aiguille dans le silo à grain")

Si vous avez manqué le début : L'aiguille (notre héroïne), initialement prise dans la botte de foin, se trouve donc désormais enfermée dans un gigantesque silo, la faute à la recherche universelle (le grand méchant), laquelle trouve elle-même son origine dans la dérive des continents documentaires, dérive dont l'une des forces motrices est celle de la redocumentarisation du monde de l'information et de ses diverses instances documentaires.

Le pitch de l'épisode 2 :

  • Axiome 1 : Les espaces informationnels jadis distincts (images, news, textes, etc.) sont aujourd'hui fusionnés et remixés.
  • Axiome 2 : Nos sphères perceptives navigationnelles (= le point de vue d'où l'on se place pour chercher/retrouver/publier de l'information) le sont également : web public, web privé et web intime ne font plus qu'un dans la mesure où leur indexabilité est désormais aux mains des principaux moteurs de recherche
  • Axiome 3 : la redocumentarisation du monde est en marche, et elle s'inscrit dans un continuum documentaire de plus en plus délicat à maîtriser (exemple ici)

Pour un même accès désormais indifférencié à notre aiguille, nous avons donc :

  • un espace documentaire unifié
  • dans lequel l'objectivable le dispute au subjectivé
  • et le tout dans un mouvement perpétuel non a priori régulable de réécriture.

Soit la définition d'un Continuum. Un continuum qui agit comme une matrice.

Or voici brossés à grands traits les horizons documentaires citoyens impliqués dans cette matrice :

  1. Le médical, la santé
  2. le politique
  3. l'administratif

Concernant tout d'abord le domaine médical et celui de la santé : c'est probablement l'un des horizons les plus sombres parce que peut-être plus directement lié que les autres à la notion d'éthique et de déontologie. Et aussi l'un des plus "porteurs" quand l'on voit l'intérêt "prescripteur" que de plus en plus de gens accordent à cet "Internet médical". En la matière, Google n'en est pas à son coup d'essai pour ce qui est de laisser planer le doute sur des ambitions dignes de la meilleure prose d'une Mary Shelley. D'autant que désormais, après le récent mariage de Serguei Brin, l'heureux marié a investi 3,9 millions de dollars dans la société bio-tech de la mariée, une société dont l'ambition affichée est "d'aider les consommateurs à comprendre et à naviguer dans leur génome", et plus précisément "to enable broad, secure, and private access to trustworthy and accurate individual genetic information.". (voir également ce billet pour les déclarations d'Eric Schmidt à ce sujet). Pendant ce temps, Adam Bosworth, vice-président de la firme reprend sur un billet du blog officiel de Google le texte d'une conférence (.pdf) donnée concernant la politique de santé selon Google, billet et conférence au titre évocateur : "Mettre la santé entre les mains du patient." (sic ...). Avec pour cela 3 objectifs : que les patients soient capables de "découvrir" le maximum d'informations possibles sur leurs symptômes (1), qu'ils puissent "agir" pour bénéficier d'un accès direct à des services pouvant les aider (2) et qu'ils puissent faire communauté (3) pour apprendre et transmettre aux autres leur propre expérience (et l'on suppose donc, leurs propres traitements). Quelques mois plus tôt, cet autre billet du même Adam Bosworth avait  en quelque sorte préparé le terrain : "Comment savoir si vous êtes bien soignés ?". Le rassemblement de ces faits les porte au-delà de la simple spéculation ou de la rumeur. (A noter que sur le plan de l'orientation Santé, Microsoft avance également mais à pas -beaucoup -  plus feutrés, notamment via le rachat de moteurs de recherche spécialisés.) A ce rythme là, les meilleurs écrivains de science-fiction passeront sous peu pour de bons historiens.

Concernant ensuite le domaine du politique, je vous renvoie vers ce billet en m'autorisant une auto-citation :

  • "Considérant d'une part la masse d'information relevant de la sphère de l'intime que le moteur collecte et conserve dans une planétaire base de donnée des intentions, et considérant d'autre part sa récente entrée dans une certaine forme de démocratie par le biais d'une institutionnalisation du lobbying politique, il serait alarmant que Google puisse ne serait-ce qu'envisager de prendre le contrôle d'une centralisation du vote, par la biais des machines électroniques à voter. Ce scénario n'a aujourd'hui rien plus rien de fantaisiste. Google dispose des financements, des appuis politiques et de l'architecture informatique qui lui permettraient d'organiser le vote planétaire à l'échelle de chaque pays le désirant. Ce ne serait là ni le premier ni le plus fou de ces rêves de démesure. Nos sociétés occidentales n'hésitent par ailleurs plus - et ce depuis déjà assez longtemps - à confier à des sociétés privées la gestion d'intérêts et d'énergies fondamentales, qui sont le bien commun des 6 milliards d'êtres qui peuplent la planète. Hésiteront-elles longtemps avant de lui confier la démocratie ?"

Concernant enfin la partie "administrative" qui gouverne dans le temps notre vie sociale et leur cohorte de données publiques, une dépêche du GFII nous apprend que Google référencera les données publiques de 4 états américains.

Santé publique, médecine individuelle, données administratives publiques, lobbying politique assumé ... ajoutons à cela :

  • les dernières déclarations tonitruantes d'Eric Schmidt dans le Financial Times (résumées par Jean-Michel) sur le fait que l'appétit de collecte de données personnelles de Google ne s'arrêtera pas tant qu'il ne sera pas capable de répondre à des questions du genre "Que dois-je faire demain ?" ou "Quel travail dois-je choisir" <Update> Un article de Peter Fleisher (responsable de la politique de confidentialité de la firme) dans le Financial Times revient sur les déclarations d'Eric Schmidt pour renverser la vapeur et remettre le bébé dans les mains de l'usager sous couvert de responsabilité. L'argumentaire est à la fois judicieux et imparable et peut-être résumé comme suit : "le seul moyen de vous apporter la réponse que vous souhaitez quand vous tapez Paris, c'est d'enregistrer vos préférences personnelles et l'historique de vos rechercherches et des liens sur lesquels vous cliquez. L'algorithme seul est incapable de choisir la meilleure réponse (un restaurant à Paris, un site historique sur Paris, les horaires de visite de la tour Eiffel, etc.). A vous donc, usagers de faire le choix d'autoriser Google à conserver vos "logs" en vous enregistrant, ou d'accepter des réponses inappropriées et moins pertinentes." Sauf que comme ce billet essaie de le montrer, la question de la conservation des logs de connexion, au regard des nouvelles ambitions et stratégies de la firme, est déjà relativement anecdotique et ne saurait être résumé à une simple logique "gagnant-gagnant" </Update>
  • et la nouvelle devise de Google qui n'est plus "Don't be evil" mais "Search, adds and apps" ("la recherche, la publicité et les applications")

... et nous aurons une idée assez juste de l'urgence de "penser collectivement" notre rapport à l'information et de celle permettant de fixer des cadres clairs et des moyens de contrôle opérationnels face à la sphère d'influence de ces sociétés tentaculaires.

Mais revenons à notre petite théorie de la dérive des continents documentaires, et surtout à notre aiguille, perdue dans une botte de foin elle-même perdue dans un silo, lui-même enfoui dans un continuum matriciel en renégociation constante.
Dans cette tectonique complexe, deux forces sont agissantes :

  • une poussé horizontale, diachronique : celle de la redocumentarisation, reposant elle-même sur une double axiomatique :
    • 1. tout est document
    • 2. tout document est en transformation permanente
  • une poussé verticale, paradigmatique : celle de l'indexabilité croissante de la totalité documentaire du monde,
    • dans laquelle la partie émergée de l'iceberg du web anciennement profond est chaque jour plus importante,
    • d'autant que s'y ajoute cette nouvelle sphère des applications et des usages bureautiques "en ligne" et leur cohorte de documents et de couriels hébergés et partagés, et donc également indexés.

La "matrice", le continuum documentaire alimentant l'immense silo de nos vies numériques appartient d'ores et déjà aux géants du web. Libre à eux d'y lire à livre ouvert en le retournant comme un gant. Et les actuelles lettres de l'Union Européenne n'y changeront pas grand-chose si elles restent isolées.

Chercher l'aiguille ... dans le silo à grain (épisode 1)

C'est d'habitude dans une botte de foin qu'il faut s'en aller "chercher l'aiguille" au petit jeu de la recherche di'nformation. Tâche déjà suffisamment ardue mais pour laquelle on savait jusqu'ici comment s'orienter initialement selon différents critères  : si l'aiguille en question était plutôt une image, on se tournait vers des bottes de foin (moteurs de recherche) d'image, si c'était une actualité, des bottes de foin d'actualité, etc etc.

Bottedefoin

Or voici que depuis peu la botte de foin patiemment localisée par les moissonneurs que nous sommes, se dissout ou plus exactement retourne à l'état de champ, un champ dont on n'aura vraissemblablement plus la possibilité de connaître la configuration. Avec le lancement de Google Universal Search, les continents documentaires sont allés au bout de leur logique de réunification.
A propos de leurs différentes bases de données, les moteurs de recherche et les spécialistes de ces questions ont emprunté une métaphore née dans le monde de l'entreprise pour désigner de gigantesques entrepôts de données, celle de "Silos".

Silo

Reprenons donc les choses dans l'ordre :

  • Google "croise", "mixe" l'ensemble de ses silos (images, blogs, actus, etc) en un seul
  • et il n'est d'ailleurs pas le seul ni le premier à le faire comme le rappelle ce billet de Read/WriteWeb

Les effets et dommages colatéraux ne sont alors pas longs à surgir : Technorati vient d'annoncer un refonte de sa page d'accueil et de l'architecture sur laquelle elle repose pour donner à l'utilisateur un accès unique en entrée de recherche, passant donc lui aussi d'une logique de "bottes de foins" à une logique de "Silo unique" :

  • "First, we've eliminated search silos on Technorati. In the past, you had to know the difference between keyword search, tag search and blog directory search in order to make use of the full power of our site. No more. Starting today, we now provide you a simplified experience. Simply indicate what's of interest to you and we'll assemble the freshest, hottest, most current social media from across the Live Web - Blogs, posts, photos, videos, podcasts, events, and more."

Si vous voulez désormais rechercher un mot-clé uniquement dans le texte des billets postés, il vous faut aller sur un site dédié (http://s.technorati.com/), lequel ne vous est indiqué qu'en haut de la page recherche avancée : autant dire que  l'utilisateur lambda ne s'en servira quasiment jamais. Notons par ailleurs qu'avec cette refonte, le "tag" acquiert de manière confuse un statut de "mot-clé" puisque rien ne permet plus (cf la citation ci-dessus) de déterminer sur les différentes entrées proposées, si c'est de l'un ou de l'autre qu'il s'agit. La simplicité d'usage ici affirmée se fait donc clairement au détriment d'une granularité documentaire et va furieusement contribuer à entretenir une confusion des pratiques de recherche chez l'usager (ce qui, vous me direz, est parfois le cadet de ses soucis, mais quand même ...)

Ce changement d'orientation majeur est lu par bien des analystes comme un enterrement de première classe, à l'origine duquel on retrouve la recherche universelle de Google : Steve Rubel titre ainsi "La recherche de blogs est morte et c'est Google qui l'a tuée." Avec la nouvelle formule de son outil "Trends" (tendances), avec la rumeur - fiable à 99% - du rachat de FeedBurner et la (lente mais sûre) montée en puissance de la capacité de son outil de recherche de blogs, Google s'est effectivement donné les moyens d'enterrer Technorati.

La clef de voûte de cette nouvelle approche de la recherche d'information à l'échelle planétaire est celle de la granularité du continuum documentaire. Un continuum que l'on s'efforce de nous vendre arguant d'une pertinence renouvellée alors que l'on voit mal comment une telle perte de granularité pourrait accroître même un minimum ladite pertinence. Pour l'instant tout au moins, existe-t-il encore plusieurs silos ...

Fin du soliloque sur les silos. (A suivre ...)

Is it a bird ? Is it a plane ?

On a parfois l'émerveillement facile. Voici que je découvre au fond de mon agrégateur, ce billet de l'incontournable Infosthetics pointant vers ce qui à l'air d'être un nouveau "LivePlasma", c'est à dire une interface graphique groupant par affinité et/ou par genre musical des CDs issus de la base du catalogue Amazon. Gadget, marrant et TRES joli. Oui mais là c'est autre chose. Musicovery.com est un véritable Jukebox en mode radio (le titre du site le présente comme "webradio interactive") qui vous permet, selon le principe des moteurs à curseur (mais avec une interface redoutablement souple et efficace) :

  • de choisir entre différents genres musicaux (OK facile ...)
  • de choisir entre différentes périodes, de 10 ans en 10 ans (OK facile aussi ...)
  • de ne choisir que des "tubes" ou que des titres moins connus ("non-hits")
  • de choisir dans un espace cardinal, et de positionner votre curseur selon 4 directions organisées en deux axes
    • dark => positive (axe horizontal)
    • calm => energetic (axe vertical)

En outre le choix est réellement impressionnant, de Schubert aux Ramones.
En plus une fois que vous avez positionné votre curseur selon votre humeur ou l'effet musical souhaité, l'enchaînement se fait tout seul (fini le recours au DJ's pour les soirées entre amis ou les 1/4 d'heure d'hésitation entre le passage de 2 morceaux sur ITunes)
On peut aussi, simplement en cliquant sur le titre d'un album ou le nom d'un artiste, lancer une web radio "affinitaire" sur la base du choix initial.
En outre, c'est l'outil idéal pour illustrer l'idée d'une sérendipité "flottante", celle ou l'on peut réellement faire des découvertes orientées par un premier choix d'amorçage. Tiens comme il est tard, je vous fait même cadeau pour le même prix d'un deuxième concept chic et pas cher. Après celui de la "sérendipité flottante", j'ai nommé "l'apesanteur informationnelle". Bé oui, parce que cet effet de navigation/lévitation dans un espace flottant, fait furieusement penser à une sensation d'apesanteur, bien loin de la linéaire lourdeur de l'affichage sous forme de liste des résultats. Allez, promis, prochainement un article avec mon comprase sur ce coup-là dans lequel on développera l'idée "d'apesanteur informationnelle". En plus cela fera très plaisir à nos relecteurs (reviewers) anonymes qui sont de plus en plus clairvoyants à force de travailler en double aveugle vu que nous devons être (avec mon comparse) les seuls chercheurs dans notre domaine à parler de sérendipité ;-)
Et si quelques-uns de nos chers moteurs arrivaient à faire une interface aussi fluide en mixant l'ensemble de leurs index dans un espace cardinal de ce type là (j'ai déjà plein d'idées :-), je vous fiche mon billet qu'ils emportent le gros lot et que pour le coup la recherche universelle prendrait tout son sens. Imaginez un peu : vous tapez (ou non) une requête, vous choisissez une période, un type de contenu (vidéos, musique, presse, ouvrages, etc ...), vous affinez selon que vous voulez de l'information à caractère commercial ou non, etc, etc ... le tout simplement en déplaçant votre petit curseur.
Bon bien sûr comme tout ça n'est pas fait que pour amuser des maîtres de conférences désoeuvrés, on peut aussi pour chaque titre basculer vers un achat payant dans ITunes, Amazon ou sur Ebay.
On a parfois l'émerveillement facile. Comment cela ? Vous n'êtes pas encore en train de jouer avec ?

Fortuitement fun

C'est de manière tout à fait sérendipiteuse que je découvre cette bande déssinée sur la ... sérendipité.
Tous droits réservés à l'auteur, le génialissime Lewis Trondheim.

Serendiptrond

Yahoo! les bons tuyaux

Huggy_1 Titres alternatifs de ce billet :

  • "Ceci n'est pas une pipe."
  • "Une petite pipe pour Yahoo!, un grand pas pour la recherche d'information ?" (pardon, je n'ai pas pu résister ... et puis c'est vendredi)

Redevenons sérieux ...

Yahoo! vient de lancer un nouveau service baptisé Yahoo!Pipes. Traduisez : "Yahoo!Tuyaux." L'idée est de mettre à disposition de tous une interface graphique simplissime asez simple permettant de faire de la programmation, un peu sur le modèle des "Pipes Unix"

  • "Un "pipe" (tuyau) est un canal de communication entre deux programmes, reliant la sortie de l'un à l'entrée de l'autre. L'idée (à la base de la philosophie Unix) est de réaliser des tâches complexes en chaînant plein de programmes simples ensembles." Grand merci Nicolas pour cette lumineuse explication :-)

Donc par exemple, on prend des sources d'information, on les couple, on leur pose une question (un mot-clé), on applique diverses instructions (tri, dédoublonnage, affichages divers), et au final on offre à l'usager un tuyau par un bout duquel il entre un terme et à l'autre bout duquel il ressort  ... de l'information. Voilà pour une "pipe", un "tuyau" orienté recherche d'information. Mais il existe quantité d'autres usages et d'autres applications :

  • illustrer automatiquement tous les articles du New-York Times à l'aide de photos du service FlickR
  • construire automatiquement un seul fil RSS pour récupérer les résultats de Yahoo! + Google + MSN + Technorati + qui vous voudrez.
  • etc ...
  • <Update>voir d'autres précieux exemples d'usages</Update>
  • <Update encore>Encore une application très intéressante pour récupérer directement des flux RSS automatiquement traduits. </Update encore>

Bref des possibilités quasi-infinies de mettre en place diverses actions relevant de la recherche d'information, sur n'importe quelle(s) source(s), originelle(s) ou composite(s). Et le tout, "relativement" facilement pour un internaute moyen (mais les geeks iront quand même beaucoup plus vite que les autres ...).

Tout cela s'inscrit dans une dynamique de plus en plus nette d'atomisation, de fragmentation, de segmentation du monde de la recherche d'information. Ou plus exactement "des" mondes de la recherche d'information.
Premier monde : Google. 1 moteur. 1 affichage sous forme de liste (ne changeons pas ce qui marche depuis des millénaires)
Deuxième monde : en voici une rapide approche historico-descriptive ...

  • Premier temps : Communautarisation. la vague des signets partagés (l'usager construit, agrège ses sources et le fait partager à une communauté). Les moteurs lui emboîtent le pas et rachètent/proposent leurs propres communautés
  • Deuxième temps : Fragmentation. Celle permise par l'explosion du RSS, qui offre aux chercheurs d'information de tous poils l'accès à une granularité quantitative et qualitative jusqu'ici impossible à atteindre. Les moteurs lui emboîtent le pas et proposent la plupart de leurs "résultats" au format RSS (notamment les "news")
  • Troisième temps : Mixage. C'est l'ère des Mashups. Celui du couplage. Mixage entre services et/ou mixage entre (un) moteur et (un/des)) service(s).
  • Quatrième temps : Personnalisation. Chacun fabrique "son" propre moteur (Google Co-op), choisit "ses" sources, met en place ses "macros" (LiveSearch) ... avec le risque qui se profile des autarcithécaires ...
  • Et cinquième temps donc ... la plomberie, les tuyaux, l'usager-plombier. L'avenir dira si c'est pour le meilleur (automonie, valeur ajoutée, etc.) ou pour le pire (plombier-polonais de la recherche d'information ??). Un cinquième temps qui marque de manière encore plus radicale la rupture entre, non pas simplement contenant et contenu, mais entre contenant, contenu et procédures.

Ces vagues successives sont révélatrices d'une évolution : 

  • des besoins (plus granulaires, plus spécifiques, plus orientés vers des requêtes de proximité - une pizzeria près de chez moi -  ou transactionnelles - le billet d'avion le moins cher - ,
  • des pratiques (nomadisme informationnel, micro-terminaux)
  • des usages (social search)
  • des modèles économiques (segmentation du marché, marchés "de niche")
  • des sources et des autorités constituées, aussi bien dans le monde universitaire (cf les harassants/vivifiants débats sur Wikipédia) que dans le monde marchand (la meilleure agence de voyage du monde, ou en tout cas la plus visitée "n'est que" un moteur qui compile et trie des sources, idem pour la meilleure agence immobilière, etc...) 

L'usager technophile et "early-adopter" (qui s'il peut apparaître aujourd'hui minoritaire, sera clairement majoritaire demain), est donc aujourd'hui convié à évoluer dans une sphère socio-technique dont "on" lui offre de maîtriser les outils, les environnements, les procédures, les techniques. Les données, ainsi soumises ou souscrites, tournent à leur plein rendement pour produire de l'information, ce qui est dans la nature des choses (au moins pour les théoriciens de l'information et de la communication).

(Rappelons au passage l'importance de la transformation du web en base de données dans cette évolution)
Update : Read/WriteWeb est d'accord avec moi sur ce point - ce qui fait plaisir :-) - et développe une approche plus "techniciste"/"procédurale" que la mienne en indiquant que le développement de Yahoo!Pipes est "l'application de l'ancienne sagesse des bases de données relationnelles au monde du web")

Il reste encore à inventer et à déterminer de quelle manière ces phénomènes (mixages, communautarisation, fragmentation, personnalisation, etc.) et les contours du nouvel environnement informationnel qu'ils dessinent (fractal ET rhizomatique), laisseront place à de la "connaissance". Ou comment la(les) connaissance(s) s'y invitera(ont). Question sans réponse pour l'instant, même si je suis convaincu que les bibliothèques et les folksonomistes, s'ils ne les laissent pas filer, ont en main quelques cartes maîtresses.
En tout état de cause, il semble qu'avec ce nouveau service de plomberie, Yahoo! offre à la recherche d'information le chaînon manquant d'une triple hybridation entre usagers, sources et procédures, de la même manière qu'il y a peu, Amazon avec Amapedia, offrit le sien à l'hybridation nécessaire des modes d'indexation.

Pour approfondir  ...

  • et se faire une idée du débat blogosphérique anglo-saxon sur cette nouveauté : voir les liens sortants du billet de SearchEngineLand.
  • Voir également le billet de Read/WriteWeb qui souligne justement que l'avenir est au mixage des fils (RSS).
  • Même Google trouve ça génial !
  • Update : l'info chez Outils Froids & chez Influx
  • Update encore : explication très pédagogique et "pas à pas" chez Toile Filante
  • Update toujours : Robin Good profite de cette plomberie 2.0 pour annoncer la naissance d'une nouvelle pratique : le Newssmastering, déjfinie comme suit : "The opportunity for sustainable filtering and aggregation of online content into niche websites and dedicated information channels." (Via Martin Lessard)

Bug, béta ... beautiful ?

Prenez trois des plus grosses machines financières de la planète. Et leur ambition de s'intéresser aux livres et à leur mise en ligne. Après le temps du bluff ("Je numériserai plus vite et plus que toi"), après le temps du bug ("Si j'affiche un chiffre, vous n'irez pas vérifier, hein ?"), viendra le temps du "beautiful", de l'achèvement, de l'usager. Ce temps semble venu.
Prenons donc Google books et l'annonce de son nouveau visualiseur. Manue s'y connaît, Manue est exigeante, et Manue n'hésite pas à invoquer la presque perfection. Dixit :

  • "un zoom avant-arrière
  • un tourne-page pour les amoureux du livre "à l'ancienne"
  • un ascenseur vertical, avec chargement progressif des pages, pour les amoureux de la lecture dans Word
  • un affichage "plein-écran" pour plus de confort
  • un système de palettes refermables pour les différents services (notice, achat en librairie, etc.)
  • une table des matières en mode texte (parfois un peu limitée, mais bon, elle existe)
  • un lien vers un service de recommandation et vers Google Scholar et toujours ...
  • une interface simple et intuitive
  • le téléchargement de l'ouvrage complet en PDF
  • la recherche de mots dans le livre."

Nous sommes alors le 21 novembre. Que croyez-vous qu'il arriva ? Le 6 décembreMicrosoft annonce le lancement de Live search books. Comme le souligne Olivier Andrieu pour ce dernier service, la grande inconnue reste celle du droit d'inventaire et du nombre précis (ou approximatif) du nombre d'ouvrages effectivement disponibles ... Suivant en cela les pas de son glorieux aîné, Live Search Books donne dans l'opacité totale. Différence notable cependant d'avec le même glorieux aîné, Live Search Books (appelons-le LSB) ne livre que des ouvrages libres de droits, puisqu'il s'appuie sur le travail de numérisation mené par Internet Archive et ses partenaires de l'OCA.  Mais, via les contrats spécifiquement négociés par  Microsoft avec quelques universités, on devrait voir apparaître dans LSB des ouvrages ne figurant pas dans le fond de l'OCA.

Et Yahoo! me direz-vous ? Et bien il semble qu'il ait fort à faire avec une assignation en justice pour concurrence illicite (ça existe ?) à propos d'un éventuel service Yahoo!books. L'assignation provenant de ... Google. Cette affaire est assez étrange, je l'ai trouvée relayée sur TechCrunch mais n'ai pas pour l'instant davantage de sources ou de documents originaux. Si Google s'attaque à Yahoo! sur ce créneau, pourquoi n'assignerait-il pas de même Microsoft ?? Bref, si vous avez des infos là-dessus je suis preneur ... En attendant, revenons à nos deux autres compères.

Après quelques test rapides, le comparatif Google/Microsoft tourne au net avantage du premier. Mais ce que je retiens de tout cela, le point qui me semble le plus essentiel, plus encore que la "presque parfaite" nouvelle interface du service Google Books c'est l'intégration en son sein du service Google Scholar par le biais d"un système de recommandation. Car, chers lecteurs de ce blog, vous finissez par un peu me connaître. Ma monomanie évangélisatrice à l'adresse des bibliothèques et de leurs catalogues peut ainsi se résumer :

  1. la révolution catalographique est en marche.
  2. Il faut servicialiser le catalogue et
  3. tirer toute la puissance des systèmes de recommandation qui deviennent des adjuvants primordiaux dans toute recherche d'information ou de livre (phénomène de sérendipité).

Or cette intégration de Google Scholar dans Google Books, outre qu'elle réunit deux "continents" documentaires jusqu'ici bien arbitrairement scindés (que serait la littérature "savante" sans la littérature tout court ??), cette intégration disais-je, marque une étape décisive pour les trois points sus-cités.
Ce genre de page en est la preuve : pour une édition des oeuvres d'Aristote dans Google Books, on affiche :

  • les ouvrages liés (du même auteur),
  • une liste de mots-clés (assez étranges au demeurant, faut que je me renseigne pour voir d'où ils les sortent ...)
  • des ouvrages qui citent celui recherché
  • des ouvrages/articles universitaires/académiques en lien avec celui recherché.

Je voudais pas faire ma Manue, mais du point de vue de la recherche, de la visibilité documentaire (et en excluant les -très - importantes limitations dues aux inconnues sur le nombre d'ouvrages de chaque service), on est quand même pas loin d'une sorte d'idéal.  Voilà en tout cas de quoi alimenter la toute dernière polémique à propos d'une certaine pratique de l'édition numérique.

Pendant qu'avance inexorablement le modèle marchand de la bibliothèque, modèle auquel même ses plus ardents détracteurs finissent par trouver au moins l'avantage d'exister et d'innover, l'empreinte de la BNUE se fait de plus en plus diffuse, éthérée, absente, telle une arlésienne numérique. Et l'Unesco réfléchit à un (énième ?)  projet de bibliothèque numérique mondiale, centrée sur les documents rares. Tempus fugit. Verba volent scripta manent ...   

(Voir aussi : Vidéo de Brewster Kahle - Internet Archive - disant tout le mal qu'il pense de Google Books)
(Sources : sous les liens ;-)

Anti-bibliothèque

Les systèmes de recommandation ("ceux qui ont aimé/acheté on aussi aimé/acheté ..."), s'ils sont souvent bidonnés, n'en demeurent pas moins d'excellents outils de navigation intuitive et communautaire.
J'ai d'ailleurs souvent l'occasion de plaider pour leur mise en oeuvre à grande échelle au sein de nos chers catalogues de bibliothèques. Le site LibraryThing, en se basant sur les données issues de son propre catalogue (7 millions d'ouvrages tout de même), vient avec humour de mettre en place un système de recommandation inversée baptisé "Unsuggester". Le principe est simple : vous entrez le titre d'un ouvrage que vous avez catalogué ou lu, et il vous affiche les ouvrages les plus "éloignés". Une sorte d'anti-catalogue ou d'anti-bibliothèque qui ne sert strictement à rien, sinon à nous donner à penser sur les logiques de similarité qui guident chaque jour davantage notre accès aux connaissances comme aux biens de consommation courante.
(Via LTechConfidential)

Sérendipité et algorithmie