Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Faites briller les Chromes : Google OS est officialisé.

Le 2 Septembre 2008, à propos du lancement du navigateur Google Chrome, j'écrivais ceci :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. (...) En Avril 1975, deux étudiants américains fondent leur société. Ils l'appellent Microsoft. 10 ans plus tard, en 1985, la première version de Windows débarque sur le marché ... En Septembre 1998, deux étudiants déposent le nom de domaine Google.com. 10 ans plus tard ..."

Presque 2 ans plus tard, le 7 Juillet 2009, Google officialise la sortie programmée de "son" OS, basé sur "son" navigateur Google Chrome :

  • "the operating systems that browsers run on were designed in an era where there was no web. So today, we're announcing a new project that's a natural extension of Google Chrome — the Google Chrome Operating System. Google Chrome OS is an open source, lightweight operating system that will initially be targeted at netbooks."

Le WebOS c'est quoi ??
Le webOS c'est la migration du "Desktop" (bureau comme interface du disque dur) vers le "Webtop" (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack avait rédigé sur le sujet un article de référence qu'il n'est jamais trop tard pour relire : "The future of the Desktop".

Le WebOS c'est quand ??
Pas d'affolement. Ce sera pour la seconde moitié de 2010 selon le billet d'annonce de Google. A  moins ... à moins que Microsoft ne lui grille la priorité lors de la prochaine annonce de son prochain système d'exploitation. Laquelle annonce doit intervenir prochainement. Ce qui conduit à se poser la question de l'opportunité d'une telle annonce de la part de Google, à quelques jours de l'annonce du prochain OS de Microsoft (annonce prévue pour Lundi prochain). Car entre ces deux-là c'est naturellement une éternelle course à l'innovation. Et les effets d'annonce ... s'ils sont opportunément ciblés ...
D'ailleurs, finalement, pas besoin d'attendre 2010 pour expérimenter le WebOS : vous l'utilisez tous les jours : chaque fois que vous consultez vos mails en ligne, chaque fois que vous alimentez un compte FLickR ou DailyMotion, chaque fois que vous travaillez sur un Wiki ou échangez et partagez des documents, chaque fois que vous faîtes une recherche sur Google, chaque fois que vous activez un historique de recherche, chaque fois que vous vous identifiez en ligne pour bénéficier d'un service. Le WebOS, vous y êtes déjà !

Le WebOS de Google ressemblera à quoi ??
D'après le billet de Google, il sera Open Source (ce qui permet à la firme de bénéficier des meilleurs développements et de la meilleure diffusion possible à moindre coût), "légér" (c'est à dire qu'à la différence de ses glorieux aînés dont la longue série des Windows, il ne devrait pas nécessiter des kilo-tonnes de ressource mémoire pour lancer une application de traitement de texte). Il sera "rapide", "simple", et "sécurisé", les éternels 3S ("Speed, Simple & Secure").
L'interface sera "minimale" et l'utilisateur, comme dans Google Chrome, n'aura pas à se soucier de problèmes de virus et autres malwares, c'est Google qui se chargera de tout (en maintenant, par exemple, une liste de malwares). Voilà pour la couche de base.
Les applications seront multi-plateformes : "apps will run not only on Google Chrome OS, but on any standards-based browser on Windows, Mac and Linux thereby giving developers the largest user base of any platform."
Et je l'installe où mon webOS ? Premiers visés, les Netbooks (mini-pcs). Et naturellement l'ensemble de la gamme des cellulaires, sur laquelle Google est déjà positionné avec Android. Deux développements qui ne sont pas indiqués comme concurrents, mais qui bénéficieront nécessairement de passerelles ou de couches communes de développement. Mais pas seulement. Les ordinateurs du bureau "classiques" sont également visés.

Que retenir de tout ça ??

Ce qui est frappant à la lecture du billet de Google, c'est l'insistance mise sur les comportements et les attentes "full-web" des utilisateurs (avoir un ordinateur qui "démarre vite", consulter ses mails, partager des documents, etc ...). Frappant mais loin d'être étonnant : tout cela est la suite logique :

  • de la dérive des continents documentaires,
  • de l'essor (et de l'optimisation) des terminaux de téléphonie mobile (dont naturellement l'I-Phone),
  • de la migration "dans les nuages" de l'ensemble des nos comportements informationnels
  • et, in fine, des programmes et outils les sous-tendant.

D'ailleurs, c'est pas pour faire le malin, mais le 21 Avril 2005, Le Monde reprenait à sa une un billet intitulé : "Le jour où notre disque dur aura disparu." Notre disque dur n'a finalement pas disparu mais (c'était la thèse défendue dans l'article), il s'est entièrement déplacé. Il est aujourd'hui "dans les nuages" (cloud computing). Un peu comme dans la métaphore de l'oignon (déjà utilisée par d'illustres aînés), de couches en couches (d'abord les mails, puis les photos, puis les applications permettant de retoucher les photos, puis les "suites bureautiques", puis le stockage massif de fichiers en tous genres, puis les protocoles de travaux collaboratifs en tous genres, etc ...), de couches en couches, ne reste aujourd'hui de feu notre "environnement de travail de bureau" que l'essentiel : un bouton marche-arrêt, une interface, une clé - celle du moteur-monde -, et une porte - celle navigateur planétaire. C'est précisément cet essentiel auquel Google propose aujourd'hui de s'attaquer.

Par le petit bout de la lorgnette.
L'officialisation du lancement d'un OS Google 100% full-web bâti autour de son navigateur ne surprendra donc pas les analystes, même si certains feindront l'étonnement ou affirmeront ne pas y croire en indiquant qu'il s'agit là pour l'instant d'un simple effet d'annonce. Ce que nous raconte l'annonce de ce prochain webOS, c'est l'inversion totale de la stratégie d'équipement d'une grande firme industrielle. Les deux approches (Microsoft et Google) sont des symétries parfaitement opposées. Microsoft à toujours joué la carte de la périhérie : il s'agissait de fournir le pack complet, de négocier avec les fabriquants pour l'installation par défaut de Windows, bref de faire en sorte d'encercler totalement l'utilisateur pour pouvoir ensuite se recentrer sur les services (mises à jour, nouvelles versions, patchs, anti-virus, etc ...). La stratégie de Google est d'une immuable centralité : Le moteur de recherche était là au départ, et c'est, encore 10 ans plus tard le même moteur qui conditionne l'existence même du navigateur (grâce par exemple à la base de donnée constituée en temps réel sur les différents sites de malwares), comme c'est le même moteur de recherche qui conditionne le futur WebOS. Ce que nous raconte l'annonce de Google Chrome au-delà de l'informatique dans les nuages, c'est que cet OS sera développé pour des utilisateurs qui l'ont (déjà) choisi et resteront libres d'en choisir un autre (liberté illusoire tant ils sont déjà prisonniers consentants de l'écosystème Google). Ce qui là encore est l'exact opposé - et le principal souci - de Microsoft.
Ce qui est fascinant dans tout cela c'est que la stratégie de Google apparaît limpide, à l'unisson de l'évolution actuelle du web. Comme une métonymie assumée autant que programmatique. Comme une boucle qui s'achève. Où comme un étau qui se resserre encore davantage. Sur chacun de nous. Inexorablement.

<Update de 5 minutes plus tard> A noter également comme une magnifique et prometteuse illustration du WebOS, cette annonce d'un système d'exploitation complet et open source tenant, avec l'ensemble de ses applications (un 40aine de logiciels également open source), sur une clé USB à 5$ ... le tout dans le cadre du programme OLPC (One Laptop Per Child) ... On en reparle à la rentrée ... </Update>

Z'en parlent aussi :

L'INA brouille l'image, et c'est dommage.

Je m'étais à l'époque enthousiasmé pour le service "archives pour tous" de l'INA. Et voilà qu'incidemment je découvre plusieurs notables changements concernant la présence web de l'INA.
Primo, un nouveau "portail" public. http://www.ina.fr/ Avec un énorme bandeau de pub (uniquement pour des services de l'INA) clignotant en haut de page (beurk) et un site portail que plus rien ne distingue des sites vidéo grand public tels Dailymotion ... sauf la fadeur du choix graphique d'ensemble (fond bleu, onglets en dégradé de bleu). J'ignore si cela était ou non l'effet recherché (= qu'on ne puisse plus distinguer l'INA de Dailymotion), mais si tel est le cas, j'atteste que c'est réussi.
Plus surprenant, au-dessus de l'immonde bandeau clignotant, un lien vers " Les sites de l'Ina pour : les étudiants, les universitaires et les professionnels", lien qui renvoie vers l'ancien site de l'INA ... mais avec un nouveau nom de domaine disons ... davantage centré sur les professionnels que sur les universitaires : http://www.ina-entreprise.com/.
Et la ma déconfiture continue : l'ancienne page du service archives pour tous, est remplacée par celle-ci, beaucoup plus ... épurée ... et dans laquelle on vous demande d'entrée de choisir entre l'espace "professionnels" ou "universitaires". Les "professionnels" ont alors le choix entre le descriptif de deux service payants. Et les "universitaires" peuvent savoir comment être accrédité pour visiter l'INA ou alors consulter le catalogue. Chouette :-(( Et là je dis "Dommage" car l'ancienne page du service archives pour tous était vraiment un modèle d'érgonomie et de service dans le domaine du web public institutionnel (outre le fait qu'elle avait du coûter bonbon en conception).
Plus surprenant encore, alors que la puissance publique et les intérêts privés passent leur temps à sermonner / fliquer / terroriser l'internaute sur la reprise de contenus dont il ne détiendrait pas les droits, l'INA-entreprise met à disposition un corpus de spots publicitaires dont elle zappe carrément les droits voisins au motif de zone grise (= "on savait bien qu'il eut fallu le faire, mais c'était trop compliqué de retrouver tous les ayants droits") ... pour le moins dommage.
Bref, je suis déçu. Trèèèès déçu. Non pas tant que l'INA joue à plein sur son côté entrepreunarial (ô tempora ô mores ...) même s'il me semble que l'INA est avant tout un EPIC (établissement public à caractère industriel et commercial), mais déçu de voir que la présence nouvelle de l'entreprise-INA sur le net soit infiniment moins efficace, conviviale et innovante que ne l'était son ancienne présence d'institution publique.
Juste un autre exemple de ma déception : il faut désormais aller plonger en bas de page (sous la ligne de flottaison du navigateur), pour retrouver la fonctionnalité ("Mon parcours") représentant en vignettage le parcours de navigation personnalisé sur le site, ce qui n'a dès lors plus aucun intérêt.

Moteur de recherche de signaux

Les moteurs de recherche sont les premiers auxiliaires de notre accès au net. Ceux-ci comptent déjà nombre de profondes mutations, tant en terme de technologie qu'en terme de modèle économique et de poids sur des pans entiers de l'activité du "monde réel". Ils ont successivement joué le rôle : 

  • de moteurs d'accès à des contenus,
  • d'indicateurs de popularité des mêmes contenus (algorithme PageRank),
  • de moteurs de recommandation et de suggestion (fonction "refine search", auto-complétion, etc ...)
  • d'outils d'indexation en temps réel (World Live Web)
  • pour dernièrement intégrer progressivement un part de plus en plus importante de sémantique dans l'affichage (microformats) et dans la recherche des contenus (web sémantisé),
  • tout en restant focalisés sur le carré magique des usages du web (Shopping. Health. Travel. Local), en valorisant et monétisant au maximum les requêtes transactionnelles.

Les mêmes moteurs subissent aujourd'hui une double mutation : celle de l'indexation des profils (la jonction entre moteurs de recherche et réseau sociaux se fera sans aucun doute très prochainement, posant le double problème d'un pan-catalogue des individualités humaines et de la pertinence des profils), et celle de l'indexation du micro-net et de ses micro-contenus (Twitter notamment). Là encore, et indépendamment de la sauce économique à laquelle elle s'accomodera (rachat, intégration), l'intégration de ces micro-contenus ne laisse aucun doute. Elle a d'ailleurs déjà commencée :

L'intégration se fera donc. La question est de savoir comment et pourquoi.
Sur le comment, globalement deux stratégies sont possibles : soit en "isolant" les tweets dans une partie dédiée du moteur de recherche (ce que fit Google avec les blogs en leur réservant un moteur dédié : blogsearch.google.com), soit en les intégrant et en les mixant à l'ensemble des autres résultats. La tendance étant massivement à la recherche universelle et à la fusion de l'ensemble des résultats de recherche, on peut légitimement supposer que c'est la première voie qui sera retenue.
Oui mais à vouloir tout mixer (contenus web, micro-messages, vidéos, news, images ...) on risque la confusion et cela nécessite un art avéré de l'interfaçage (la fameuse "User Experience"). Il est donc également probable que la seconde stratégie soit finalement retenue (= isoler ces contenus dans un onglet et/ou un espace dédié). Bref, on n'en sait rien et on attendra de voir.
Sur le comment toujours, mais dans son versant technique, là encore on notera deux possibilités : soit intégrer progressivement les tweets de quelques comptes (personnes, entreprises ou institutions) "labellisés" comme influents (l'approche qu'à visiblement choisi Microsoft). Soit (ce que fera certainement Google), appliquer la mécanique bien rôdée du PageRank aux Tweets de la même manière qu'aux autres contenus mais avec des niveaux de pondération légèrement différents : les backlinks (liens entrants) pouvant être "remplacés" par les RT, la popularité d'un compte Twitter étant aisément repérable au seul nombre de ses "followers" ou à la mention de son nom (précédé de l'arobase) dans l'ensemble des Tweets.
Des moteurs de recherche aux moteurs de signaux.
Ce qui est aujourd'hui en train de changer dans les notre expérience quotidienne des moteurs de recherche c'est la nature même de la relation qui nous lie à eux. Ils ne sont plus les seuls intermédiaires du début, entre "nous" et "des" contenus. Ils sont devenus des auxiliaires, des adjuvants, des assistants personnels à l'omniscience de plus en plus pregnante (via la personnalisation et la dérive des continents documentaires). Demain, quand l'intégration du micro-net sera passée dans les usages courants (comme l'est l'intégration des news, des vidéos ou des images), demain nous les utiliserons non plus comme moteurs de recherche mais comme moteurs de signaux. Nous n'y chercherons plus des contenus (c'était hier), nous n'y attendrons plus simplement une recommandation et une logique de prescription (c'est aujourd'hui), mais nous voudrons y trouver une qualification de ces contenus. Une qualification qui se voudra la symbiose entre des métriques sociales et comptables.
Un petit Tweet pour un grand bouleversement ?
C'est aux moteurs capables de nous livrer la meilleure qualification que nous souscrirons. Pour y parvenir, la prochaine mue des moteurs de recherche en fera des moteurs de signaux (un Tweet, une modification d'un profil, d'un statut ...). Et particulièrement de signaux "faibles". Ce n'est d'ailleurs pas un hasard si en évoquant les projets de Google en la matière (lancement d'un service de Microblogging search), Marissa Mayer parle de "Clues" (indices) et rapproche cela du Google Trends (tendances). Indices, tendances, signaux. Le meilleur moteur sera celui capable de repérer ces signaux faibles. Ce qui  - si mon analyse est avérée ... - serait à l'échelle de l'histoire des moteurs, un gigantesque bouleversement. L'ensemble des moteurs fonctionnent en effet aujourd'hui sur leur capacité à entériner des signaux forts. Toute leur algorithmie est ainsi pensée : afficher dans les premiers résultats les sites/articles/contenus les plus visibles, les plus cités, les plus commentés, les plus débattus, les plus liés. Depuis l'invention de la bibliométrie dont les fondements ont été implémentés dans l'algorithme du Pagerank, toute l'histoire des moteurs de recherche (et du succès de Google) se tient dans leur capacité à isoler le plus pregnant, le plus visible, le plus "émergé". Une visibilité que nous ne pouvons bien sûr pas "oculairement" percevoir, mais qui est (relativement) simple, limpide, perceptible et "révélable" pour les crawlers du web, comme les phéromones sont naturellement perceptibles aux fourmis. Demain, il leur faudra très probablement être capables de faire l'inverse avec les mêmes critères d'excellence : c'est à dire continuer de jouer leur rôle de localisation de sources (plus personne ne retient aujourd'hui l'adresse d'un site, on tape son nom dans Google et Google, "bookmark" universel, nous livre aussitôt l'adresse du site) ET être également capables de remonter des signaux faibles, c'est à dire des occurences documentaires à faible pertinence absolue mais à forte pertinence relative.

La réalité est pourtant plus compliquée que cela. S'il est vrai que les moteurs de recherche, dans l'héritage de la bibliométrie, ont pour but d'isoler les figures et les contenus les plus "marquants", la bibliométrie (et les moteurs de recherche) a également pour fonction de révéler les réseaux de citation et de collaboration, à savoir ces auteurs, ces contenus nettement moins cités ou liés mais qui, parce qu'ils sont à un moment ou à un autre "associés" aux plus cités, acquièrent une pertinence nouvelle. Il en ira de même pour la collecte de ces signaux faibles. La révélation et l'analyse de leur pertinence aura partie liée avec les contenus et les autorités déjà constitué(e)s, déjà repéré(e)s. En cela, les réseaux sociaux et les sites de micro-blogging constituent de précieux outils de repérage.

Alors quoi ? Alors il est très probable que la prochaine bataille de la pertinence, intégrant le micro-net et ses propriétés spécifiques (fragmentation accrue de ses contenus + "autorités" de plus en plus diluées), se jouera juste en dessous de l'habituelle ligne de flottaison des navigateurs, ligne en dessous de laquelle l'essentiel des internautes ne descend presque jamais consulter les résultats, mais ligne en dessous de laquelle se niche et se nichera toujours davantage la réelle pertinence des résultats, c'est à dire l'adéquation existant entre les signaux faibles détectés et leur corrélation aux contenus et aux autorités les plus saillantes assignées à la requête. Une pertinence qui instrumentalise une apparente sérendipité comme premier auxiliaire de la recherche

Twitter : le hiératique contre le hiérarchique.

Le monde comme il Twitte.
J'utilise Twitter depuis quelques mois. Je n'ai encore pas publié de billet au sujet de ce "nouveau" moyen de communication "temps réel", mais la blogosphère regorge d'analyses sur le phénomène emblématique de la statusphère. Comme pour la dernière "killer-app" rapidement érigée en phénomène de société (il s'agissait de Facebook), on spécule aujourd'hui autour de Twitter, tantôt annoncé comme "révolutionnant l'information", tantôt devant être racheté par Facebook ou Google, tantôt nouveau héraut de la figure du pro-am. Par ailleurs, aujourd'hui tout le monde est "sur" Twitter : des ministères, des administrations des politiques, des universités, des profs (les "tweeatchers"), des étudiants, des journaux, des journalistes ... (sur la dimension académique de Twitter, voir la diapo 39 de mon intervention aux RPIST).
Twitt à Saint-Tropez.
Le monde se twiterrise et Le Monde rend compte de la twitterisation du monde. Pas une catastrophe, pas un séisme, pas un crash d'avion, pas un scandale, pas une élection politique, qui ne soit d'abord révélés et relayés "sur" Twitter. Dernier séisme en date, la mort de M.Jackson qui faillit à elle seule faire s'effondrer les serveurs de la planète (ceux de Google en tête, ce dernier croyant être victime d'une attaque devant la multiplication des requêtes et des twitts sur MJ).
WTF. Wikipédia, Twitter, Facebook : What the fuck ?
De Wikipédia (pilier d'une révolution cognitive, d'un nouveau rapport au savoir) à Facebook (pilier d'une révolution de l'intime, d'un nouveau rapport à notre "identité" en ce qu'elle à d'intime, de public et de privé), de Wikipédia à Facebook il manquait un élément. Celui d'une primo-conversation, une conversation essentielle, planétaire, synchrone, instantannée. Au mieux comme une gigantesque iségoria, au pire comme un aliénant café du commerce. La première victoire de Twitter, c'est d'être devenu (comme Wikipédia et Facebook), un révélateur. Un "corpus", un sujet d'étude scientifique. WTF sont autant de moyens pour les chercheurs (en sciences sociales notamment) de sonder le monde, de disposer d'un formidable terrain d'expérimentation pour qualifier les changements en cours de l'ère numérique. L'une des dernières études scientifiques sur Twitter est celle menée par deux étudiants de Harvard, étude à partir de laquelle Jean-Michel Salaun a bien souligne les effets d'écho entre les usages de Twitter et ceux de Wikipédia, notamment le fait que "la répartition des contributions sur Twitter est plus concentrée que sur Wikipédia, même si Wikipédia n'est pas un outil de communications. Ceci implique que Twitter ressemble plus à un outil de publication unidirectionnel qu'à un réseau de communication pair à pair."
De la hiérarchie à l'hétérarchie.
L'information est brute. Les industries de l'information ont pour métier d'y mettre de l'ordre, par le biais de l'angle choisi pour les "sujets" et par les "choix" éditoriaux. Bref l'industrie de l'information tout entière (de la presse magazine aux moteurs de recherche) est d'abord une industrie de la hiérarchisation.
Avec Twitter, ce qui domine de prime abord c'est l'aspect profondément hétérarchique, à plat, de l'information qui y circule. On parle d'hétérarchie à partir du moment où, dans une organisation, il n'y a pas de "niveau supérieur". C'est Warrren Mc Culloch, l’un des premiers cybernéticiens, qui avait créé ce terme pour décrire certains programmes informatiques. Twitter est donc, de prime abord, une hétérarchie : pas d'éditorialisation, pas de "niveau supérieur" de l'information. Donc, Twitter est littéralement illisible. Parce que sa nature est précisément de ne pas vouloir "mettre en ordre". De ne pas vouloir hiérarchiser. Et pourtant Twitter est lu. Lu par la planète entière et notamment par les médias de l'industrie de la hiérarchisation qui y puisent informations, faits, témoignages, alertes, signaux.
Quel est l'ordre de Twitter ?
Si Twitter est lu (et utilisé) par chacun d'entre nous c'est parce qu'il est néanmoins capable de briser son hétérarchie pour lui donner de la profondeur, et pour se servir de cette profondeur comme d'une hiérarchie. La plupart des medias sociaux utilisent une technique d'éditorialisation déjà largement théorisée en informatique et en sciences sociales : il s'agit de celle du filtrage collaboratif. Les moyens et les instanciations de cette technique sont innombrabbles mais son mécanisme est immuable : on agence l'information, on construit collectivement les hiérarchies éditoriales en fonction du nombre de votes (ou de liens, ou de signalements, ou de mots-clés, ou de folksonomies, ou de Hashtags) vers cette information à l'intérieur d'une communauté d'usage, et ce de manière dynamique (ré-agencement perpétuel) ou statique (à un moment donné). Le filtrage collaboratif, très utilisé notamment dans des systèmes d'information "clôts" (en entreprise par exemple) a changé de nature dès qu'il s'est retrouvé sur le web, et ouvert à des communautés pouvant compter plusieurs millions de membres. Mais revenons à Twitter. L'éditorialisation de Twitter, son filtrage collaboratif, sa profondeur hiérarchique, c'est la capacité que nous avons de construire notre communauté de Followers (littéralement suiveurs) et de décider nous-mêmes des personnes ou des thèmes que nous voulons suivre. C'est là le seul moyen de garder le contrôle et de n'être pas totalement submergé par le flot flux. Mais on le voit, il ne s'agit pas réellement de hiérarchisation (qui s'appuie sur une verticalité) mais plutôt de périphérie, d'horizontalité du cercle de suivants/suiveurs dont et avec lesquels nous décidons de tenir conversation.
De l'hétérarchie au hiéroglyphes.
Twitter débarque donc. Comme tout média, il le fait avec ses codes. Les adeptes de l'IRC des débuts se souviennent des différents modes, des différentes commandes. Les codes de Twitter sont épurés. Mais il n'en restent pas moins déroutants pour le novice : ce sont les fameux Hashtags, mots-clés précédés d'un signe dièse "#" qui pourront être agrégés pour structurer (et non hiérarchiser) une actualité (exemple, le Hashtag pour parler de la mort de M. Jackson était " #MJ "), ou bien encore des RT, ces renvois de Twitts, dans lesquels l'acronyme initial "RT" signale que l'on est en train de reprendre une information (un Twitt) déjà publiée (lequel RT est en général suivi du nom - précédé d'une arobase - du compte Twitter d'où l'on reprend l'info). Ajoutons-y la limitation des messages à 140 caractères et la retraduction systématique des adresses web en des versions abrégées (et donc illisibles), et nous obtenons le genre de truc suivant :

  • "affordanceinfo @sarko @carla RT "MJ est mort" http://bit.ly/Y45brt #WE à eurodisney #MJ #bambi #premierevictimedefredericmitterand"

Soit, vous en conviendrez, pour un individu lambda non adepte ou non-initié auxdits codes, un léger côté hiéroglyphique pour une info ainsi normalement traduisible en langage courant :

  • Olivier E affordanceinfo signale à ses amis Nicolas et Carla @sarko @carla, que Michael Jackson est mort "MJ est mort", info qui circule actuellement partout RT et qui est vérifiable à l'adresse http://www.europe1.fr/Michael-Jackson-des-millions-de-fans-pour-un-dernier-hommage/ http://bit.ly/Y45brt, et info qu'il associe spontanément # au souvenir que ses amis gardent de leur dernier week-end à Eurodisney #WE à eurodisney, tout en s'interrogeant pour savoir s'il existe un rapport de causalité directe entre la mort du chanteur et l'arrivée de Frédéric Mitterand au Ministère de la Culture #premierevictimedefredericmitterand". 

Des hiéroglyphes au hiératique. Twitter ou les stratégies d'évitements de la lecture industrielle.
Ainsi Twitter, dans son affichage, dispose bien d'une dimension hiéroglyphique (pour le profane - qui s'en trouve désorienté -  comme pour l'initié - qui les manipule sans difficultés). Mais ce qui est le plus intéressant dans Twitter, ce sont les stratégies qu'il met en place pour gérer l'infobésité accrue par le temps réel sur lequel il s'efforce de se caler, et ce sans jamais faire appel à de classiques techniques de hiérarchisation (cf supra) mais en préférant faire appel à des stratégies visuelles, cognitives et scripturales d'évitement, de substitution.
Premier exemple : l'utilisation du RT, ou le fait de Re-Twitter une information (un autre Twitt). Il ne s'agit pa là de créer volontairement de la redondance (même si cela y revient in fine) mais bien plutôt de qualifier l'importance d'une information et contribuant à son effet de masse. Traduisez : si je retwitte cette info, c'est qu'elle m'apparaît importante/intéressante. Le fait de la re-twitter vise donc d'abord à lui donner du poids, pour lui permettre d'émerger de l'ensemble. Et l'on retrouve ici cette verticalité, cette hiérarchie qui semblait faire défaut à Twitter.
Deuxième exemple : les Hashtags. Ceux-ci sont le strict équivalent des Folksonomies, c'est à dire un processus de classification collaborative par des mots-clés librement choisis, mots-clés qui, comme pour les folksonomies peuvent aller de l'explicite - #iran-elections - à l'allusif - #MJ (pour Michael Jackson) -, voir au simplement farfelu - #slipsurlatête - ou à l'égocentré - #danielprendlepouvoir.
Troisième exemple : la représentation (cartographique ou imagée), la mise en scène visuelle. C'est là le plus révélateur. Les accrocs à Twitter ne peuvent très longtemps sa satisfaire d'une nombre de followers limité, eux-mêmes ne peuvent se résoudre à brider le nombre de comptes qu'ils souhaitent suivre en temps réel. Ils n'ont alors pas d'autre possibilité que d'être submergés devant l'aspect invasif et ingérable de ce déferlement. Ils passent dont par des applications tierces (Twitter en regorge ... voir notamment le point III "Outils et services" de ce billet) qui permettenr de visualiser les "points chauds" de Twitter, que ces points chauds soient thématiques ("je cherche de quoi on parle beaucoup en ce moment"), conversationnels ("je cherche les gens qui parlent le plus et/ou le mieux de ce qui m'intéresse), ou chronologiques ("je cherche de quoi on a perlé dans les dernières minutes, la dernière heure, ou la dernière semaine). Un seul exemple (au nom programmatique) dans cette dernière catégorie : le site Twitter for busy people.
Moralité : par sa limitation en nombre de caractères, par les codes scripturaux et les interfaces de vidsualisation qu'il utilise, Twitter travaille sur la dimension hiératique de la conversation comme vecteur d'information.
La définition que le Littré donne su terme hiératique est la suivante (il s'agit de la troisième acception du terme) : "Écriture hiératique, signes hiératiques, écriture cursive, qui est une abréviation de l'écriture hiéroglyphique et dont les signes sont dérivés, signe à signe, des caractères hiéroglyphiques." Définition ainsi complétée par Wikipédia : "L'écriture hiératique est en fait le deuxième niveau de simplification des hiéroglyphes, le premier étant les hiéroglyphes linéaires, qui sont des versions simplifiées des hiéroglyphes, mais qui gardent leur valeur représentative. Les caractères hiératiques, eux, ne représentent plus des objets, mais uniquement des signes arbitraires à la manière des lettres d'un alphabet."
Twitter ou l'écriture hiératique vue comme substitutive à l'absence de possibilité de lecture hiérarchisée. D'autre part, et pour reprendre une analyse déjà exposée ici, Twitter me semble, avec sa logique de "Followers",  également emblématique d'un troisième âge de la navigation hypertextuelle, celui de la souscription.

Il y a plusieurs raisons au succès actuel de Twitter.

En plus de celles précédemment décrites, voici celles qui me semblent aujourd'hui essentielles :

  • Sa simplicité.
  • Sa portabilité. = il est aisément déportable dans différents environnements (sous forme de widgets pour des site web ou de clients pour des navigateurs ou des téléphones portables, ou bien de manière plus immersive, comme ce client qui sert du support aux conversations du jeux vidéo World Of Warcraft)
  • Son effectivité. = sa capacité de résonnance (lectures industrielles) et sa capacité à créer du lien (avec l'industrie de l'écriture = les "grands" médias).
  • Son affectivité. = Twitter utilisé pour de petites conversations entre amis. Il s'agit bien ici de lien social.
  • Son unidimensionnalité. = Twitter ne contient que du texte, pas d'image, pas de son, pas de vidéo.

Industries des données ou écritures industrielles ?

En écoutant Bernard Stiegler hier sur France Culture dans l'émission "du grain à moudre", je me disais que dans la gradation technologique qui mène du Fordisme à Google, on pourrait établir le genre de hiérarchie suivante :

  • Première pèriode industrielle (1950-1980) : les technologies du "faire" (ère industrielle). La valeur, ce sont les matières premières utilisées dans les chaînes de production.
  • Seconde période industrielle (1980-1997) : les technologies de l'intelligence (l'ouvrage éponyme de Pierre Lévy est publié en 1993). C'est l'avènement du web, des réseaux comme nouvelle infrastructure industrielle. La valeur se tient cette fois dans la perpétuelle dispersion / ré-agrégation des contenus disponibles. La valeur, c'est le lien hypertexte pour le dire plus simplement.
  • Troisième période industrielle (1998-2003) : les technologies de l'accès. Dont on pourrait poser la naissance en même temps que celle de Google. La valeur est alors celle de la mémoire. Mémoire informatique externalisée. Externalisation de nos mémoires documentaires. Google c'est "La" base de donnée (pour reprendre l'expression utilisée par Stiegler dans l'émission en question)
  • Et (il me semble en tout cas), nous basculons lentement mais sûrement dans une quatrième période industrielle (2003-200?), celle des technologies de la capillarité et de l'artefact, bâties autour de mémoires informatiques industrialisées mais autour également d'une "industrialisation de l'intime" (pour reprendre l'expression d'Alain Giffard) qui se donnent - notamment - à lire dans les réseaux sociaux (en 2003, nombre de réseaux sociaux "majeurs" ont atteint un large public). Le système de valeur que se choisira cette quatrième période industrielle pourrait être directement "indexé" sur la porosité choisie, induite ou subie entre notre identité documentaire (les traces que nous laissons sur le réseau) et notre présence retournée (= la collecte et l'agrégation de ces traces telles qu'elles se donnent à lire une fois remixées par les industries des données - moteurs de recherche et réseaux sociaux en tête). Soit le passage d'une externalisation de nos mémoires documentaires à une externalisation de nos intimités mémorielles documentées. Une autre dimension essentielle de cette monnaie sera très probablement celle du synchronisme, défini comme la capacité à faire correspondre les traces de nos activités et les indices de notre présence en ligne. Les questions qui se posent sont naturellement innombrables. L'une des plus saillantes me semble être celle de l'industrialisation possible du décalage qui existe entre ce que nous sommes, ce que nous voudrions être, et ce que nous donnons à lire de nous dans nos systèmes d'écriture sur les réseaux, dans les traces documentaires et documentées que nous y laissons. C'est probablement là un nouveau "temps" pour nos systèmes d'engrammation. Davantage peut-être que des lectures industrielles (Alain Giffard encore), la préemption de l'ensemble de nos traces connectées et déconnectées par les industriels de l'accès et des données, me semble relever de stratégies d'écritures industrielles.

Et demain ? Avec l'internet des objets ("everyware"), avec le web des données, avec la sémantisation des protocoles de recherche et d'interactions en ligne, avec la frontière abolie entre l'intime, le privé et le public, avec le réagencement permanent et la rémanence sans cesse accrue des synchronismes entre le monde réel et le monde numérique ... l'ère qui s'ouvre devant nous verra probablement la fusion des "anciens" agencements machiniques supportant nos lectures industrielles (moteurs de recherche et réseaux sociaux) en un seul nouvel agencement symbolique, une seule entité, une seule monade calculatoire - qui restera diversement instanciée. Le risque est d'y voir se dissoudre, autour de logiques de souscription quasi-incantatoires, ces agencements collectifs d'énonciation qui bâtirent le web. Une dissolution au profit (et nécessairement "for-profit") de la génération auto-entretenue d'écritures industrielles singularisées.
Economie des écritures industrielles.
Je note par ailleurs en même temps que je l'écris, que la "génération auto-entretenue d'écritures industrielles singularisées" est une définition qui semble parfaitement circonscrire le périmètre et l'enjeu de l'affichage des publicités contextuelles et ciblées (Adwords et Adsense). Depuis déjà 10 ans, l'industrie des données met toutes ses forces dans la bataille pour ne jamais tarir la source des ces écritures industrielles. Elle peut ajourd'hui y déverser en temps réel l'intimité de nos mémoires documentaires et documentées. C'est peut-être la clé d'un web à venir, un web implicite mais dont l'implicite ne s'analysera plus seulement à l'aune des artefact techniques proposés.

Le web (implicite ?) de demain est celui que construisent aujourd'hui les agencements algorithmiques qui permettent la génération auto-entretenue d'écritures industrielles singularisées.

Agenda : rencontre RPIST 2009

Je serai demain et Mardi à Nancy aux Rencontres des professionnels de l'information scientifique et technique.
Voici le titre de mon intervention :
"Science identifiée et scientifiques identifiables : questions et enjeux autour de la maîtrise de l’identité numérique pour les chercheurs et leurs institutions."
Et le résumé :
Qu’appelle-t-on « identité numérique » ? Quelle est sa déclinaison académique ? Que peuvent apporter les réseaux sociaux au débat scientifique et à la diffusion/construction des connaissances ? Quel niveau d’initiative, de contrôle, de présence et de service en attendre ou en exiger ?
La maîtrise et gestion de l’identité numérique sont aujourd'hui des problématiques saillantes du web contributif. Au travers des moteurs de recherche et des réseaux sociaux notamment, de nouveaux vecteurs de socialisation et de transmission des informations et des connaissances se mettent en place.
Dans ce contexte, et dans des lieux virtuels de communication fonctionnant de plus en plus en temps réel, les espaces de la parole et de la communication scientifique - qu’elle émane des individus ou des institutions - doivent trouver de nouvelles dynamiques.
Comment conforter la place de la parole scientifique dans l’iségoria moderne du web ? Comment l’institution et les individus doivent-ils prendre en charge les nouvelles visibilités documentaires offertes par le réseau ? Quels sont les espaces restant à investir ? Quels en sont les outils ? Que proposent-ils ?
Notre exposé s'efforcera d'apporter quelques éléments de réponse à ces questions, en interrogeant les problématiques inhérentes à ces nouveaux modes de socialisation, à ces nouvelles "sociabilités numériques".

En cadeau-bonus et en amuse-bouche, voici la bibliographie de l'intervention :

Le diaporama sera comme d'habitude mis en ligne sur Slideshare, dès qu'il sera terminé, c'est à dire dans la nuit précédant l'intervention ;-)
===============================
By the way ... et même si ce n'est pas le sujet de mon intervention de mardi, j'aimerais bien que quelqu'un m'explique l'étrange politique tarifaire de l'Inist (qui est l'un des principaux diffuseurs de l'IST dans notre bel hexagone) ... politique aussi étrange que le choix du moteur Google CSE et l'affichage systématique de liens sponsorisés sur un site public de diffusion de l'IST ... J'aimerais bien aussi que toutes celles et ceux qui ont payé 15 euros pour avoir accès aux articles de votre serviteur en profitent pour demander leur remboursement sine die.
Inist

Lesdits articles (et quelques autres) étant disponibles gratuitement sur ArchiveSic. Bref, le sujet retenu pour ces rencontres est effectivement bien choisi : "Nouveaux modes de publication scientifique. Relations avec les éditeurs". Messieurs les éditeurs ... tirez les premiers.
J'essaierai de poser la question aux principaux concernés entre deux petits-fours :-)

Du "cloud computing" au "home computing" : comment le web devînt fractal.

Cloud computing.
On connaissait déjà depuis quelques temps l'âge d'or, les promesses (et les dangers) du "cloud computing", de l'informatique dans les nuages. Le réseau internet repose depuis son invention sur une architecture "client-serveur". Le cloud computing permet à chacun de nous d'être les innombrables "clients" (au double sens du terme) d'une gigantomachie dans laquelle Google, Amazon et quelques autres s'affrontent à grands coups de datacenters et autres "fermes de serveurs". C'est là le climax d'une polarisation extrême de l'architecture client-serveur.
Home computing.

Imaginons maintenant que la polarisation s'inverse et qu'au lieu de disposer de quelques giga-serveurs centralisant l'offre de contenus et de données de la planète internet toute entière, nous retrouvions une architecture dans laquelle chacun d'entre nous demeurerait client mais disposerait à part égale de la possibilité de devenir un serveur. Une sorte de forme réinventée et légèrement décalée de l'architecture peer-to-peer (ou le passage par un point nodal externe aux clients connectés reste obligatoire). Imaginons donc que chacun de nos ordinateurs personnels, via son navigateur, puisse devenir son propre serveur et ainsi proposer à des tiers d'accéder librement à son contenu (téléchargement d'images, de films, de musique) voir même auto-héberger des pages web. C'est la prouesse (?) que vient de réaliser le navigateur Opera avec le lancement d'une nouvelle version de son navigateur baptisée "Opera Unite".

Le WebOS enfin réalisé ?

Il y a belle lurette que la guerre des navigateurs fait rage. Il n'est donc pas impossible que cette sortie soit d'abord un coup marketing pour permettre à Opera de sortir de la zone de confidentialité dans laquelle Internet Explorer, Chrome et Firefox le relèguent. Mais. Mais je viens de tester et d'installer Opera Unite avec un camarade de jeux qui a bien voulu en faire de même. Et le fait est que c'est totalement bluffant.
L'avènement de l'informatique dans les nuages a fait du webOS un enjeu central pour les grands acteurs de l'internet. Comme je l'écrivais dans ce billet :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur."

Fractale_1 Le web fractal. Le webOS était donc réalisé, incarné, sur la scène et sous les auspices des quelques géants du cloud computing, de l'informatique distribuée, "dans les nuages", mais tout aussi massivement distribuée que commercialement vérouillée.
Si la poursuite des essais d'Opera Unite demeure concluante, si celui-ci tient toutes ses promesses, c'est à un nouvel avatar du web qu'il va falloir nous habituer. Un web parfaitement et rigoureusement fractal. Chaque navigateur de chaque ordinateur connecté au réseau devenant son propre client, son propre serveur, son propre client-serveur, son propre internet. C'est là tout l'enjeu du Home Computing.

Quelques réflexions à chaud : vers une nouvelle partition des flux numériques.

  • Tout comme le cloud computing adressait - au sens strict - d'énormes problèmes de confidentialité, ses principaux acteurs disposant de tous les moyens et de toutes les ressources pour constituer une base de donnée des intentions à l'échelle planétaire.
  • Si Opera Unite s'installe dans les pratiques, les marchés des industries culturelles et les projets ubuesques "Hadopi-like" risquent fort de n'avoir pas 6 mois mais bien 10 ans de retard. R.I.P. Hadopi. R.I.P. Christine Albanel. R.I.P. Pascal Nègre. Ce pourrait être un électrochoc comparable à celui que représenta l'avènement de peer-to-peer il y a de cela quelques - courtes - années.
  • Dans une telle configuration, impossible - sauf pour Opera ... - de contrôler quelque flux que ce soit, sauf à imposer des fichiers mouchards à tous les ordinateurs individuels de la planète, ou sauf à transformer tous les FAI (fournisseurs d'accès à Internet) en zélés délateurs doublés de Vidocqs des réseaux.
  • Cette nouvelles architecture fractale du Home Computing va également poser, non plus aux autorités politiques, commerciales ou judiciaires, mais bien aux utilisateurs eux-mêmes, d'énormes problèmes de confidentialité et de sécurisation de leurs données personnelles. En poussant à peine un peu les scénarios imaginables, on pourrait même se retrouver dans une situation diamétralement inverse à celle que nous connaissons actuellement, situation dans laquelle les particuliers confieront (pour des raisons de sécurité) leurs données importantes aux des acteurs majeurs du cloud computing, pour laisser le home computing transformer leurs ordinateurs personnels en simples terminaux d'échanges. Une virtualisation totale de l'échage et du stockage numérique, mais avec une nouvelle "partition" (au sens informatique du terme) des espaces et des termes mêmes de l'échange. 

Quelques liens pour une découverte plus approfondie de l'outil et des enjeux :

(Sources : sous les liens // Temps de rédaction de ce billet : 2 heures, tests du navigateur non-inclus :-)


Agenda : congrès ABF 2009

Entre deux relectures de rapports avant les soutenances de stage, deux écritures d'articles et trois réunions techniques pour préparer une rentrée qui s'annonce rock'n roll (400 heures d'enseignement en moins sur les 3500 dont jouissait jusqu'à présent notre beau DUT Infocom), je serai vendredi au congrès 2009 de l'ABF. Depuis l'année dernière, LE congrès du petit monde des bibliothèques s'est doté d'un blog sur lequel (grâce à eux) vous pouvez suivre en temps quasi-réel les débats et les présentations des différents intervenants.
Or donc j'interviendrai Vendredi 12 Juin dans le cadre de la session "Bibliothèques sur le net" avec comme intitulé de présentation : "Le choix de la bibliothèque numérique : entre interface(s) et contenu(s)". En gros (et en 20 minutes) je vais tenter de montrer : 

  • en quoi le numérique amène à repenser les notions d'espace, d'usages et d'architectures d'une manière presque symétriquement opposée à ce qu'elles sont (ces notions) dans la bibliothèque physique.
  • Et de montrer que si les actuelles bibliothèques numériques sont "en-deça" des attentes c'est parce qu'elles les pensent (les mêmes notions) dans la seule continuité de la bibliothèque physique.
  • Je vais aussi tenter de montrer que pour penser "les usages, les espaces et les architectures" (c'est le thème du congrès ABF 2009) il faut partir à la conquête d'une nouvelle grammatologie algorithmique.
  • Montrer que le texte est devenu un lieu technologique bien avant que la bibliothèque ne devienne un lieu virtuel. Que cela en fut même la condition nécessaire, et que nombre de chantiers de bibliothèques numériques semblent aujourd'hui avoir oublié cette vérité première.
  • Montrer que l'enjeu de la bibliothèque numérique de demain est un enjeu d'abord essentiellement topologique : que peut-on dire de la structure globale de la bibliothèque abstraction faite de son périmètre de ressources numériques propres ou distantes ?
  • Montrer qu'il faut sortir de l'effet diligence, parce que "ce ne sont pas les conducteurs de diligence qui ont inventé les locomotives". Et que l'on a aujourd'hui toujours besoin d'inventer la bibliothèque locomotive numérique. 
  • Montrer qu'avant même (ou "au lieu de") se mettre en quête du lieu virtuel idéal de la bibliothèque numérique il faut d'abord prioritairement installer des espaces de voisinnages numériques et permettre aux professionnels de se les approprier. Et que ça ... et ben cela fait déjà près de 4 ans que moi et quelques autres nous le ressassons à satiété (ce qui est presque aussi oxymorique que dur à dire), et que si on ressasse encore pendant 4 ans et ben ... il sera trop tard. Trop tard pour la bibliothèque numérique. Et trop tard pour la bibliothèque et les bibliothécaires tout court.

Voilà. Et donc bien sûr je n'aurai pas le temps de parler du tiers du quart de ce que je viens de vous annoncer parce que je n'ai que 20 minutes et que j'ai déjà 50 slides sur mon pauvrepoint et qu'il va falloir que j'en enlève une bonne moitié. Mais c'est pas grave, ça sera toujours bon à recycler pour un article, un cours ou une formation à venir. C'est aussi pour ça que j'aime être invité dans des congrès ;-)
Allez, à vendredi si le coeur vous en dit et si vous êtes dans le coin.

(Temps de rédaction de ce billet : 30 Minutes)

Is it a bird ? Is it a plane ? No. It's a monopolistic library-bookseller.

La dernière fois que je vous avais entretenu de l'un de mes sujets de prédilection, Google Books, c'était pour me faire l'écho (et tenter l'analyse) de la dernière bombe lancée par Google sur les pauvres casques bleus du commerce du livre :

Nous étions alors en Novembre 2008, et le désormais célèbre Google Book Settlement venait de paraître. Que s'est-il passé depuis ?

Planète Opt-Out.

Le grand numérisateur a tout pris. Livres libres de droits, livres sous droits, livres dans la zone grise et oeuvres orphelines. Tout y est, ou presque. Et même s'il est toujours quasi-impossible d'estimer réellement le nombre d'ouvrage réellement numérisés et disponibles dans Google Books, la fourchette raisonnable se situe entre 7 et 10 millions d'ouvrages numérisés, pas mal pour un projet lancé en 2005.
Et l'heure est désormais aux ultimatums. Soit vous souhaitez jouer le jeu de Google et entrer dans le modèle qu'il propose et qui vous permettra d'être indemnisé pour vos oeuvres (vous avez alors jusqu'au 5 janvier 2010 pour vous déclarer), soit vous décidez de bouder, vous vous réservez le droit d'attaquer Google en justice, et là vous avez le droit de continuer à ne pas toucher d'argent ou si peu, d'entrer en résistance, et là vous avez jusqu'au 4 septembre 2009 pour le faire (la date était initialement celle du 5 mai, mais elle a été prolongée à la demande des associations d'auteurs). Comme le rappelait ActuaLitté le 21 Avril 2009, "éditeurs allemands, autrichiens et Suisses germanophones ont choisi d'accepter le contrat proposé par Google plutôt que d'entrer dans un conflit juridique". D'autres suivront. A n'en pas douter. Il n'y a guère qu'en France (et aussi un peu au Québec), que le SNE et La Martinière décident de se payer le luxe d'un affrontement juridique qui pour en être très noble n'en est pas moins voué à l'échec. Mais au pays de Cyrano, on mise beaucoup sur le panache. La prise de position du SNE est d'ailleurs assez largement ambigüe (pour ne pas dire illisible) dans la mesure ou il recommande tout à la fois aux éditeurs de participer au réglement (settlement) tout en dénonçant le fait que celui-ci est contraire aux principes du droit d'auteur en France (mais cette territorialisation du débat est-elle réellement viable, y compris juridiquement ...) et en maintenant donc une ligne d'affrontement juridique déclaré (tribune détaillée du SNE à lire en .pdf chez Légipresse).

Masse critique.
Alors que les usages de E-books émergent massivement et rencontrent un marché qui dépasse largement les seules "niches" ou certains experts voulaient le cantonner, la question de l'offre, et plus précisément du volume de l'offre s'affirme chaque jour davantage comme absolument cruciale. Et là encore, quand Google décide de faire feu, ce n'est pas quelques dizaines, ce ne sont pas 1000, quelques milliers ou quelques dizaines de milliers d'ouvrages qu'il verse au pot commun, mais bien 500 000 ouvrages libres de droits, lisibles au format E-pub pour la liseuse Sony. Et oui. Car on parle aussi désormais de plateforme technologique. A ma gauche, Amazon, son Kindle et son format. A ma droite, Google, son thesaurus (qui est aussi un trésor) de guerre, et ses partenariats avec la liseuse Sony dans un format (E-pub) non supporté nativement par le Kindle. Le combat des chefs.
Mi-mars 2009, l'e-Book Store de Sony affichait plus de 600 000 livres suite au dernier "versement" de Google. Amazon affiche de son côté plus de 230 000 titres. Il va sans dire que la granularité des deux offres est sans commune mesure, les 500 000 ouvrages de Google étant pour l'essentiel (la totalité ?) libres de droit quand ceux d'Amazon sont pour l'essentiel des ouvrages sous droits. Ceci étant dit, c'est là un bien beau produit d'appel dont on Lionel Maurel ne sait quoi penser :

  • "D’un côté, on peut y voir pour l’instant un progrès dans l’accessibilité aux œuvres du domaine public, qui vont trouver une nouvelle vie par le biais du Reader. Mais plusieurs commentaires envisagent déjà le risques qu’à moyen terme l’accès à ces e-books ne devienne payant, une fois que les liseuses auront trouvé leur public. Et dans ce cas, il y aurait une forme de “privatisation” du domaine public, préjudiciable et d‘autant plus contestable que les originaux papier de ces livres ont été fournis par les bibliothèques partenaires de Google.Notons par ailleurs que visiblement, lesdites bibliothèques partenaires n’ont absolument pas eu leur mot à dire lors de cette transaction avec Sony … une des conséquences directes de l’exclusivité exigée par Google en contrepartie de ses largesses …"

(Voir aussi le mode d'emploi pour la récupération desdits titres, mode d'emploi qui rappelle très justement l'occasion ainsi donnée à Sony d'étoffer un peu son fichier client ...)

Google'Zon & Amaz'oog : l'infanterie et l'artillerie.
L'erreur serait de penser l'opposition frontale entre Google et Amazon comme un affrontement se jouant à armes égales. Cet apparent duopole n'en est pas un. Amazon est dans une logique d'artillerie : il est à la fois son alpha et son oméga, fixant les prix d'une offre qu'il maîtrise de bout en bout pour une tablette qu'il fabrique. Soit une artillerie pensée comme une architecture en vase clôt mais à la puissance de tir phénoménale. Google est dans une logique d'infanterie. Même s'il dispose d'autant de verrous que nécessaire, il laisse les éditeurs monter au créneau et défendre ses positions en leur permettant d'établir une liste indicative de prix de vente dont il déterminera seul lequel doit être in fine retenu. Amazon contrôle son stock, son flux de marché, et fait du prosélytisme autour de sa tablette et de ses formats. Google contrôle "un" stock (qui n'est pas encore "le" stock mais pourrait bientôt le devenir), et avec le Google Book Settlement se met en position de contrôler le marché et ses flux. Sur ce terrain, c'est Google qui a l'avantage sur le long terme, car il dispose des moyens de piloter (au sens cybernétique du terme) l'ensemble de l'offre d'ouvrages sous droits en laissant l'infanterie (auteurs, libraires et éditeurs) essuyer le feu nourri et les pertes qui ne manqueront pas de subvenir dans cette période d'engagement.

Un flux de marché multi-canaux. Autre avantage de poids pour Google, son flux de marché ne se limite pas aux seules tablettes électroniques, c'est toute la chaîne des périphériques (informatiques) et des services (numériques) dont il est en capacité de se servir pour déployer son offre. Google annonce (à l'occasion de la Book Expo America) qu'il se positionnera sur ce marché (celui de la lecture et non du "livre" numérique) d'ici à la fin de l'année 2009. Mais il ne parle pas d'e-books mais bien plutôt de terminaux orientés Web ("web-enabled devices"). Plus d'un million et demi d'ouvrages libres de droits sont ainsi dès maintenant lisibles sur votre téléphone portable (et si vous n'avez pas d'IPhone, vous pouvez quand même "faire comme si" ... ici) Quand Amazon pense "structuration du marché et de l'offre", Google, selon un gimmick bien ancré dans la culture de la firme, raisonne en termes d'offre de service. Ce qui, jusqu'ici, ne lui a pas trop mal réussi ...

Éditeur dans les nuages. Quand Amazon conditionne (une partie de) son marché à l'adoption des Ebooks, Google se moque de savoir si lesdits ebooks constitueront un jour ou non un marché de masse (ou de niche suffisamment rentable). Google s'en moque parce que ce que vise Google ce n'est pas un marché, c'est un écosystème, celui du Cloud Publishing, de l'édition dans les nuages. Et faut-il rappeler qu'il est déjà leader dans le domaine du "cloud computing" ...

BVL. Bureau de vérification de la littérature. Le commandement général de cette infanterie sera assuré par l'algorithmie et l'écosystème de services de la planète Google, mais plus précisément incarné par Michael Healy, récemment nommé à la tête du BRR (Book Rights Registry), cet organisme créé de toutes pièces par Google (et financé par Google ... tant qu'à faire hein ...), et chargé de créer et d’administrer LA base de données des ayants-droits de la totalité des livres concernés par le Google Settlement. 

Le monde se réveille. Avec la gueule de bois.
Ce qui depuis 3 ans paraît évident et nécessaire aux yeux des analystes (dont très modestement votre serviteur) à savoir l'affrontement entre les deux géants Amazon et Google autour d'une offre marchande d'ouvrages n'existant qu'en leur flux numérique, apparaît aujourd'hui subitement dévoilé. Et c'est le New-York Times qui ouvre le bal dans un article daté de son édition du 31 Mai : "Preparing to Sell E-Books, Google Takes on Amazon."

J'ai mal à ma poldoc. ("poldoc" : en jargon bibliothéconomique, désigne la "politique documentaire", c'est à dire le choix des fonds accessibles) Il est un point qui est moins discuté - parce que moins "vendeur" - dans le cadre du Google Book Settlement, c'est la manière dont les ouvrages pourront être mis à disposition des bibliothèques. Et là aussi, fort heureusement, mais peut-être un peu tardivement, on commence à appeler un chat un chat. Il y eut bien sûr le lumineux papier de Robert Darnton (version originale ici) qui dit avec une profondeur d'analyse séduisante, tout le danger potentiel que représente la main mise de Google sur la prescription documentaire :

  • "Après avoir lu l'accord passé entre Google, les auteurs et les éditeurs, et s'être imprégné de sa philosophie - ce qui n'est pas une tâche facile puisque le document s'étire sur 134 pages et 15 appendices-, on en reste bouche bée : voici posées les fondations de qui pourrait devenir la plus grande bibliothèque du monde. Une bibliothèque numérique, certes, mais qui battrait à plate couture les établissements les plus prestigieux d'Europe et des Etats-Unis. De surcroît, Google se hisserait au rand de plus grand libraire commercial de la planète - son empire numérique relèguerait Amazon au rang de boutique de quartier. (...) Google Book Search est sur le point d'inaugurer la plus grande bibliothèque et le plus important magasin de livres de l'histoire. Quelle que soit la manière d'interpréter cet accord, ses dispositions s'imbriquent de manière si inextricable qu'elles s'imposent en bloc. Aujourd'hui, ni Google, ni les auteurs, ni les éditeurs, ni la cour de district de New York ne sont en mesure d'y apporter des changements notables. C'est un tournant majeur dans le développement de ce que nous appelons la société de l'information. Si nous ne rééquilibrons pas la balance, les intérêts privés pourraient bientôt l'emporter pour de bon sur l'intérêt public. Le rêve des Lumières serait alors plus inaccessible que jamais".

Il y a désormais le débat posé en termes clairs, celui de savoir si la partie "bibliothèque" du Google Book Settlement représente ou non une privatisation des "ressources" tout autant que des "fonctions" de la bibliothèque. De mon côté j'avais déjà largement insisté (et je maintiens) sur le risque réel d'un eugénisme documentaire, qui dépasse - à mon avis toujours - et de loin, le seul risque d'une privatisation (au sens anglo-saxon du terme) des fonds documentaires planétaires.

Le plus rageant dans cette affaire c'est qu'en en restant au sein de notre hexagone, on compte, ces 10 dernières années, au moins 3 ou 4 rapports pointant la nécessité stratégique de régler le problème des oeuvres orphelines (via une gestion centralisée), cette fameuse "zone grise" de la littérature, qui constitue le coeur de nombre de collections bibliothéconomiques, zone grise sur laquelle Google a irrémédiablement fait main-basse et dont nous ne commençons qu'à peine à entrevoir les potentialités économiques. C'est ce que rappelle (entre autres choses) cet article du New York Times daté du 4 Avril :

  • "While the registry’s agreement with Google is not exclusive, the registry will be allowed to license to others only the books whose authors and publishers have explicitly authorized it. Since no such authorization is possible for orphan works, only Google would have access to them, so only Google could assemble a truly comprehensive book database.
    “No other company can realistically get an equivalent license,” said Pamela Samuelson, a professor at the University of California, Berkeley, and co-director of the Berkeley Center for Law and Technology.
    "

Le lobbying comme dernière arme ? Nul ne semble aujourd'hui réellement en mesure de rivaliser avec Google sur le marché de la capitalisation (au sens propre) des savoirs et des connaissances. Et ce n'est pas, loin s'en faut une question d'argent. La meilleure preuve est le simple abandon par Microsoft de son outil de recherche de livres. Le même Microsoft qui trouve actuellement bien plus stratégique de financer une chaire de recherche "sur" le Google Book Settlement à la New York Law School institute.

Google Books, volet bibliothèques. Comme je l'écrivais plus haut, si l'actualité se concentre sur le réglement Google, lequel concerne les oeuvres orphelines et les oeuvres sous droit, cela ne doit pas faire oublier que le troisième - et historiquement premier - volet de l'entreprise de numérisation continue d'avancer à grands pas. Ainsi, le 26 Mars, Google a annoncé sur son blog être arrivé au terme du contrat de numérisation "historique" l'unissant à la bibliothèque d'Harvard. Il aura mis 5 ans. Je bloguais alors sur Urfist Infos et j'avais relayé ce qui s'annonçait déjà comme un projet "historique". 5 ans plus tard, sur les 15,8 millions de volumes libres de droit de la bibliothèque, on ne sait toujours pas, ni sur la FAQ d'Harvard, ni dans le billet du blog de Google, combien de volumes sont aujourd'hui rendus disponibles. Il nous faudra nous contenter de ceci "we have digitized and made available (...) many hundreds of thousands of public domain books". Plusieurs centaines de milliers ... On ignore combien mais on mesure l'échelle. On connaît aussi la loi de Moore et l'on observe les mutations en cours de l'objet autant que du marché-livre. Et l'on est comme groggy devant l'enjeu.

Nous y voilà. En novembre 2006, dans un article paru dans la revue Les cahiers du SLF, j'écrivais :

  • "les « moteurs de recherche » ne le sont plus qu’à la marge. Leur véritable activité, la seule génératrice de chiffre d’affaire, est celle de la monétisation publicitaire de l’ensemble du bouquet de services qu’ils offrent : de la découverte ou de la création du besoin jusqu’à sa transformation en acte d’achat, l’ensemble du circuit de consommation est ainsi réalisé en cercle fermé.  La bataille de l’information étant gagnée à leur entier bénéfice – la crise de la presse en ligne en témoigne – les moteurs entrent dans une autre guerre commerciale dont le livre n’est que l’un des premiers retranchements (...)."

Et plus loin dans le même article :

  • "la « monétisation » de l’ensemble des services offerts est inéluctable. Le lancement du tout récent Google Checkout , équivalent du site de paiement sécurisé PayPal, confirme qu’un droit d’entrée sera tôt ou tard prélevé par Google sur l'ensemble de sa panoplie de service, livres y compris. Le seule question est : à quelle hauteur ?"

De colloques en conférences, de grands cénacles en petits comités d'initiés, j'ai répété (avec d'autres ...) depuis plus de 3 ans révolus que Google serait nécessairement libraire, bibliothécaire et éditeur. Et que, nécessairement, cela se ferait beaucoup plus vite qu'on ne pouvait le penser (avant l'obtention de leur diplôme de DUT ai-je encore pris le pari avec mes étudiants de l'IUT de la Roche sur Yon ... pari gagné ;-). Avec d'autres j'ai essayé de convaincre de la nécessité absolue d'une contre-offensive "de poids", sur trois axes :

  1. un portail de recherche fédérée regroupant l'essentiel de l'offre des libraires dits "indépendants",
  2. une réflexion de fond sur les usages, avec la mise en place d'expérimentations à couverture ou à portée nationale.
  3. une bibliothèque numérique qui ne soit pas seulement interface mais d'abord et avant tout contenus, contenus moissonnés pour être d'abord rassemblés, et pour être, ensuite seulement, distribués dans le cadre d'un bouquet de services et d'applications.

3 ans plus tard :

  • le portail de la librairie française "indépendante" n'a jamais vu le jour, et ne le verra probablement jamais. Ou alors - ce qui est pire à mon sens - il finira par voir le jour mais ne sera plus piloté par les acteurs (libraires et idéalement auteurs) mais par les fournisseurs (Hachette et d'autres ...)
  • les études de terrain portant sur les usages s'exhibent dans quelques cénacles et dîners mondains sans qu'aucune dimension stratégique réelle ne leur soit dévolue
  • Gallica intègre depuis quelques mois à peine une offre légale d'ouvrages sous droits dont l'indigence du fonds le dispute à l'inadéquation au public
  • les différents projets de bibliothèque mondiale, universelle ou interplanétaire hésitent toujours entre interface et contenus (et font hélas le plus souvent le choix de la seule interface "à rebond", laquelle vous renvoie vers les contenus ... via d'autres interfaces ...)

La proie et l'ombre. Pendant ce temps, Google avance. Pendant ce temps les dispositifs de lecture électronique, Kindle en tête, s'étendent bien au-delà de leur seul supposé "marché de niche", pendant ce temps, l'ombre tutellaire d'un omnipotent GoogleZon a remplacé la proie que constitua pour lui (et pour d'autres) une politique publique du livre et de la lecture. La récente démission de Benoît Yvert et la nomination d'un remplaçant "par interim" à la tête de la DLL et du CNL atteste du niveau de sanctuarisation à rebours de la réflexion et de l'action culturelle de ce gouvernement.

A l'horizon ...

Reste à Google au moins un épineux problème : celui de la valeur juridique de son "accord" au regard de la législation anti-trust d'une part et au regard de la législation européenne d'autre part. La commission européenne va d'ailleurs bientôt se pencher sur la chose. <Message subliminal> une bonne raison de plus pour aller voter dimanche :-) </message subliminal>

Google libraire. Google bibliothécaire. Amazon éditeur. Amis admirateurs de l'ancienne (antienne ?) chaîne-du-livre-en-un-seul-mot, vous voilà désormais affranchis. La messe est pourtant loin d'être dite. L'avenir donnera lieu a de bien beaux débats, a de bien belles analyses délicieusement partisanes, soulèvera de nouvelles questions essentielles pour ce que l'on appelle - par le tout petit bout de la lorgnette - l'avenir de la prescription documentaire, et qui n'est rien moins - sans lyrisme déplacé - que le simple avenir de la transmission des savoirs et de la culture à l'échelle de la planète. 

Compléments ...

A lire également :

(Temps de maturation de ce billet : 2 mois // Temps de rédaction de ce billet : 8 heures ... soit deux - grosses - soirées ...  // Sources : sous les liens avec une mention et un merci particulier à Virginie et Hervé pour leur veille attentive)

Bienvenue à l'université low-cost.

"Et si la prochaine bulle spéculative était celle de l'université ?" C'est le titre d'un article du Chronicle of Higher Education. La scène se passe aux Etats-Unis.

En 25 ans, 440% d'augmentation des frais d'inscription dans les universités privées.

"Avec les frais de scolarité et de logement, les frais de dizaines d'universités privées ("private colleges") atteignent maintenant 50 000 $ par an (...). Selon le National Center for Public Policy, au cours des 25 dernières années, les frais de scolarité ont augmenté en moyenne de 440 pour cent - plus de quatre fois le taux d'inflation et près de deux fois le taux des soins médicaux. Patrick M. Callan, le président du centre, a averti que les étudiants à faible revenu trouvent l'université inabordable."

1000 $ par semaine pour aller à l'université.  Et l'article de poser une question aussi crue que révélatrice : "la plupart des familles se demandent si cela vaut encore la peine de payer 1000 $ par semaine pour envoyer leurs enfants à l'université privée."
La totalité de l'article est très instructive dans le contexte actuel, soulignant notamment que les prêts étudiants sont (partiellement à cause de la crise du crédit) une solution désormais inefficace (rappel : les mêmes prêts que le gouvernement français s'aprête à mettre en oeuvre, exemples , et ). Il rappelle également que ce sont les classes moyennes qui ont été les vaches à lait de ce mode de financement des universités, les mêmes classes moyennes dont les enfants se voient aujourd'hui privés de "bonnes" universités (privées) pour cause de frais trop élevés.
Face à cela les universités publiques ("public universities") peinent pourtant à tirer leur épingle du jeu (les frais de scolarité y avoisinent tout de même les 25 000 $ par an ...), notamment du fait de leur "mauvaise réputation" (elles sont de fait et depuis longtemps "réservées" aux étudiants des classes les plus défavorisées).

Le danger des universités "low-cost".

On voit donc émerger de nouveaux types d'universités. Des universités "en ligne". Ce qui pourrait être un bien. Mais qui n'en est pas un. En effet la logique de développement de ces universités en-ligne ne correspond pas à une volonté réelle de mettre en place un nouveau rapport à l'enseignement, mais bien d'une logique "low-cost". Et ce danger là est bien réel. On est ici à des années lumières d'une politique volontariste de télé-enseignement et de mise à disposition de ressources organisées, dont le projet OpencourseWare du MIT reste l'exemple fondateur. Ce dont il s'agit dans ces nouvelles universités low-cost se situe dans une pure logique comptable : rassembler des ressources d'enseignement aujourd'hui aussi nombreuses qu'hétérogènes sur le Net, et y attacher la délivrance de diplômes. A ce titre, l'annonce par l'ONU du lancement de "l'université du peuple" me semble hélas davantage relever d'une logique low-cost que d'un réel projet pédagogique structuré.

Le Net et la formation à distance : quant ton meilleur ami devient ton pire ennemi.
La délivrance de grades ou de diplômes universitaires ne saurait évidemment s'accomoder d'une simple collation, d'une seule agglomération de ressources hétérogènes distantes. Arena sine calce. Du sable sans chaux. Pour avoir une valeur, le télé-enseignement, la formation à distance (FOAD), doivent être déployés en relai ou en appui d'un enseignement en présentiel (soit sur une année, soit sur un cursus "long"). Il est par ailleurs évident que le coût de mise en place d'un dispositif efficace et "canonique" de FOAD est au départ très élevé (par rapport à un dispositif d'enseignement classique = prof + tableau + chaises) et que les bénéfices (financiers) ne peuvent en être tirés qu'à long ou moyen terme. Une séquence pédagogique en ligne est longue à construire, à concevoir, à réaliser. Et elle ne correspond en rien à une séance pédagogique (un cours) "classique". Et elle nécessite d'abord de former les enseignants qui seront en charge de la concevoir autant que de l'administrer (car oui, même et surtout en ligne, on a encore besoin d'enseignants résidents). Et je ne parle ici même pas des dispositifs d'évaluation en ligne (sauf à faire passer des QCM à moitié bidons à tous les étudiants en attente de diplôme, ce qui est hélas de plus en plus souvent le cas, y compris dans les universités et les cours en présentiel ...). Si l'on veut proposer en ligne des formations réellement diplômantes, il y faut a minima la présence d'une équipe pédagogique (un peu) stable, d'un projet d'enseignement (un peu) cohérent, et de dispositifs d'évaluation (un peu) concertés.

L'erreur du centre et de la périphérie. Pour le dire autrement, ce serait, à mon avis, une erreur catastrophique (déjà hélas moultes fois commise) de penser l'enseignement à distance et autres ENT (environnements numériques de travail) comme des dispositifs centraux alors qu'ils n'ont de pertinence qu'à la périphérie, alors que leur rôle est précisément d'aider les étudiants à circonscrire la périphérie des services d'enseignement et de ressources identifiées et organisées auxquelles ils ont accès. Ce n'est qu'à cette condition que nous parviendrons à relever le défi de la connaissance et de la formation en ligne, que nous parviendrons à imaginer des universités fonctionnant à la manière de Wikipédia ou de YouTube afin "de permettre le déploiement rapide d’expertises dispersées et la reconfiguration des champs".

<Update de 10 minutes plus tard> Sur le sujet (place des dispositifs technologiques dans l'enseignement à l'université) voir également l'analyse de Jean-Michel Salaun, notamment le passage suivant :

  • « Je ne crois pas à la fin du cours traditionnel, dispensé devant des étudiants (tout comme je ne crois pas à la fin du codex). Ces dispositifs ont fait la preuve de leur efficacité depuis des millénaires. Prétendre que des étudiants ne sont plus capables, ou simplement moins capables qu'autrefois, d'y soutenir leur attention est une spéculation qui mérite démonstration. Sans doute il y a nombre de questions à se poser en ce sens et nombre de techniques pédagogiques à réviser, mais prendre l'affirmation pour un acquis est dangereux.. et bien peu scientifique. » (...) « Les terminaux mobiles (cellulaires, blackberries, PC portables), sont des concurrents directs des professeurs sur la captation de l'attention en cours si l'on donne accès au réseau dans les amphithéâtres, car ils permettent d'échapper électroniquement au dispositif physique. L'université ne doit pas si facilement abandonner ses dispositifs traditionnels. En effet, le risque est que l'attention perdue ne se reporte pas sur l'apprentissage, mais sur bien d'autres activités qui permettent de dégager du temps de cerveau disponible pour des annonceurs. Le cerveau des étudiants est comme celui de chaque humain, facilement distrait. »

</Update>

Opportunisme à courte vue. Mais dans un monde ou tout va si vite, dans une gouvernance universitaire de la performance et de la rentabilité, il est hélas à craindre (on le constate déjà) que cette réflexion soit totalement escamotée dans une seule logique d'opportunisme à courte vue : les ressources numériques existent, elles sont légion, pour la plupart gratuites, elles permettent d'alléger considérablement les moyens (humains et logistiques). Fonçons donc dans la brèche ouverte par ces universités low-cost. Et accesoirement dans le mur.

(Addendum : sur le modèle américain de l'enseignement supérieur et ses nombreuses tentatives de déclinaison nationales, voir notamment cet article (.pdf) // Temps de rédaction de ce billet : 1h30)

Aïe

Hadopi

Wikiopole n'est pas que du pipole.

(le titre de ce billet ne veut rien dire, c'était juste pour la sonorité :-)

Avec l'aide du RTGI (qui est aujourd'hui ce qui se fait de mieux dans le domaine de la visualisation dynamique de larges corpus de données), et à l'occasion de la sortie de son classement mensuel, Wikio et ses très actifs WikioLabs, lancent Wikiopole, une interface de visualisation de la blogosphère et de ses liens. J'aime particulièrement la possibilité d'isoler par un code couleur les liens entrants, sortants et/ou réciproques.
Galaxyaffordance

Nota-Bene : le TouchgraphBrowser permet également de visualiser de semblable manière les liens qui "font réseau" autour d'un site ou blog donné, mais celui-ci ne bénéficie pas du corpus structuré (catégories Wikio) sur lequel tourne le Wikiopole, laquelle structuration permet une vision plus "fine" de certaines relations.

La souris dans le lapin.

Voilà de quoi remotiver des armées de numérisateurs en herbe : le magazine Playboy annonce la mise en ligne de l'intégralité de ses archives de 1954 à 2006. 53 numéros sont pour l'instant intégralement accessibles.

(Via Etienne Mineur, le dernier blog et Brouehaha)

Cataloguing error

Voilà l'exemple parfait que je cherchais pour mon cours de catalogage. C'est l'erreur de catalogage à l'ère industrielle. 57 000 titres sont portés disparus.
(Merci à Virginie pour le lien)

Les cons ça ose tout. C'est même à ça qu'on les reconnaît.

Fallait oser. Oser la loi Hadopi. Oser la coupure de l'Internet sans autorité judiciaire. Tant il est vrai que ... que le titre de ce billet.
Que dire de plus que ce qui a déjà été écrit, dessiné, analysé, disséqué, rapporté ... au sujet de cet archétype de la Fausse Bonne Idée (FBI) qu'est la loi HADOPI ?? Rien. Juste vous rappeler ou vous faire partager les analyses les plus - à mon sens - pertinentes sur la question.
Et tout d'abord l'image valant à elle seule 1000 mots :
Msg_industrie_divertissement_de_masse

(Source)
Et comme l'humour est le premier des pédagogues et que Brazil est un grand film, il vous faut naturellement voir sourire encore un peu avec ceci :

.

La vraie bonne idée dans tout cela, la seule, elle vient de Jamendo, qui annonce officiellement le "remerciement gradué" et enverra :

  • Premier avertissement : "un mail de remerciement à tout internaute qui aura téléchargé un des 200 000 titres disponibles gratuitement sur son site. Ce mail incitera l’internaute à partager la musique avec ses amis."
  • Deuxième avertissement : "une lettre de remerciement et un “kit du complice” constitué d’autocollants et de documentation à ses plus fidèles téléchargeurs qui pourront ainsi promouvoir leurs artistes et la musique libre."
  • Au bout de trois, on vous offre l'abonnement Internet : "Les multi-récidivistes ne seront pas oubliés : HADOPI veut suspendre leur abonnement Internet ? Jamendo le leur rembourse ! En effet, chaque internaute ayant réussi à convaincre un lieu public (bar, restaurant, …) de devenir un espace de culture libre avec Jamendo PRO, sera remercié par le remboursement d’un mois de son abonnement Internet."


Hadopi comme un symptome.
Celui d'une gouvernance. Une gouvernance malade des lobbys, malade du copinage, malade de l'image du chef et de l'inféodation caporaliste qu'elle fait émerger, malade d'obstination. L'idée fixe comme programme. La méthode F.U.D. comme seul argumentaire. La tableau d'honneur et le benchmarking bidonné comme seule pédagogie. Et l'obstination.

Obstination ad absurdum. Il ne suffit pas ...

Il suffit de l'avis d'un ami, il suffit du pouvoir d'un lobby dans lequel on compte quelques amis ou sur lequel on compte bientôt pouvoir compter, pour qu'une ânerie d'alcôve qui n'aurait jamais du dépasser le statut d'éructation de fin de soirée arrosée se trouve propulsée au rang "d'idée de l'année", telle la liberté (de couper) guidant le peuple (malhonnête). Et que dès lors, le gouvernement s'y obstine, s'y englue, s'y enferre, s'y enferme. Sidérant. D'autant plus sidérant que comme le rappelle Ecrans, "Contrairement à ce qui a été voté, il y a quelques jours par les députés, la CMP a décidé que l’internaute continuera à payer sa connexion en cas de coupure de son accès à Internet. Elle a également supprimé l’amendement, déposé par Alain Suguenot, qui proposait l’amnistie des internautes poursuivis sur des faits remontant à plus de 6 mois."

Hadopire. Personne n'a de mots assez durs pour qualifier la caporalisation rampante du net. Alain Suguenot (UMP) dans un email adressé à tous les députés après l’une des soirées de débat sur la loi HADOPI à l’assembléee nationale, écrit ceci : "Ce n’est pas la création que l’on protège. Ce sont les principes généraux du droit qu’on assassine."

Foin de diatribe, un peu d'analyse que diantre ! Soit. Mais d'abord un peu de pédagogie avec ce remarquable "digitalmeme" qui reprend l'historique contextualisé de la loi "création et Internet". Or donc maintenant ainsi avisé, précipitez-vous chez Dominique Lahary, sage et vertueux taulier d'une non moins sage et vertueuse Interassociation qui dit, sur ce sujet comme sur d'autres ou (encore) d'autres d'ailleurs parfaitement connexes, l'essentiel en quelques amendements et communiqués. Précipitez-vous également chez Piotrr, qui devant un projet de loi stalinien, fait très lucidement son auto-critique, et nous convie à signer le pacte des libertés numériques du réseau des pirates. Profitez de vos précédentes précipitations pour vous arrêter un moment chez Philippe Quéau et penser la résistance, celle d'un domicile numérique inviolable

Et puis il y eut le 9 Avril. Le jour des "socialists Ninjas". Compte-rendu de séance sur Pc-Impact. Le 9 Avril au matin, Hadopi est ratifiée par le sénat. Le 9 Avril après-midi, Hadopi est ratiboisée à l'assemblée. Arrêtsurimages raconte : "Adoptée quelques heures plus tôt par le Sénat, la dernière mouture du projet de loi Création et Internet, dit "loi Hadopi", a été rejetée sur les bancs de l'Assemblée nationale, à 21 voix contre et 15 voix pour." Crac. Boum. Hue.

Ninja 

Des députés socialistes planqués derrière une colonne de l'auguste assemblée qui se dévoilent au moment du vote pendant que leurs copains du gouvernement sont en train de s'empiffrer de frites à la cantoche

Fritesalacantoche

Beau comme l'antique et tout à fait conforme aux règles en vigueur dans l'hémicycle (voir les détails chez Maître Eolas). Vivifiant comme l'entrée de Sébastien Chabal en impact player à la fin d'un France-Australie d'anthologie. Roublardise ? Certes. Mais une roublardise qui répond à une forfanterie, celle de l'avant 9 avril, avec une loi votée à la sauvette par 16 députés.

Il y eut donc un avant 9 Avril.

16_gugus_hadopi_assemble_nationale_vote2

Il y aura un après 9 Avril.

Fin_hadopi_small1 

Mais n'allez pas croire que tout est fini. Ces gens-là ont l'obstination chevillée au corps. Prochain épisode le 27 Avril. Dans la coulisse législative, on s'arrête à remettre le couvert, pendant que dans la coulisse des intérêts financiers, l'après-Hadopi se prépare : si la castration numérique s'avère inopérante, ce sera la main au portefeuille, le prélèvement à la source. Mais pour quelle offre ? Pour quels usages ? De tout cela, étrangement, il n'est encore guère question. Cette série de débandades parlementaires n'aura donc pas suffit à signer la mort politique de la loi Hadopi. Le plus grave est que quelque soit l'issue parlementaire finale (on peut hélas supposer que les "Government Texas Rangers" ne se laisseront pas (sur)prendre une deuxième fois par les Socialists Ninjas), quelle que soit cette issue donc, le projet politique de l'Hadopi restera comme le stigmate d'un profond divorce. "Si la démocratie étatique ne s'accomode pas d'Internet, l'Internet démocratique se fera sans l'Etat."

Maintenant, et comme le rappelle Lionel Maurel, "il s’agit pour tous les acteurs intéressés d’en tirer la leçon et de construire de nouvelles solutions, par le jeu des contrats, sans plus attendre l’arrivée d’un Godot législatif qui ne viendra pas."

<Update du lendemain> Voir également l'excellent billet de Maître Eolas qui, après en avoir remis une couche sur le grand bazar législatif répressif engendré par l'application de la loi, pointe le fait que le vrai danger ne vient pas tant de l'Hadopi que de la CPD, la Commission de Protection des Droits. </Update>

(Temps de rédaction de ce billet : 4 heures // Sources : sous les liens)

Google private Life : The Wall.

Quelques infos et commentaires un peu en vrac autour de l'ogre préféré ...

Des photos et des hommes ...
Google a mis depuis quelques temps en ligne l'intégrale des photos du magazine Life, y compris les clichés non publiés par le célèbre magazine. Un appétit insatiable, un fonds documentaire qui semble inépuisable et ... un mur de fortification du "GoogleNet" qui se construit pierre après pierre. Lesdites photos par exemple ne sont pas indexables par d'autres moteurs de recherche comme le signale Philip Lenssen. On pourra m'objecter que puisque les frais incombent à Google et que l'initiative de la mise en ligne lui revient, il n'est pas aberrant que celui-ci s'arroge certains droits. Sauf que. Sauf que ces photos relèvent d'une dimension clairement patrimoniale. Elles sont un bien commun. Et à ne pas y prendre garde, en ce domaine documentaire comme en d'autres, on risque de se retrouver avec un acteur privé en situation de diffusion et d'exploitation exclusive de tout un tas de biens communs de l'humanité. On constatera que c'est dommage. Mais il sera déjà trop tard. Il existe pourtant bien d'autres approches ... Mais encore faut-il que les bibliothèques pourvoyeuses aient les moyens d'en être à l'initiative ...

"Rendre l'information universellement accessible" ... et après ?
Ce mur infranchissable aux autres (moteurs) que Google est progressivement en train de bâtir autour de son corpus, de "son" web, est symptomatique d'un renversement dans la philosophie l'idéologie de la marque, ou à tout le moins d'un retour à un principe de réalité comptable. Renversement déjà remarqué par plusieurs analystes. Je crois que le temps du "tout service, tout gratuit" chez Google sera bientôt révolu. Plus globalement, je crois également que le gimmick "rendre l'information universellement accessible" sera prochainement remplacé par un autre. Jusqu'ici Google ne nous avait pas habitué à préserver un pré carré de manière aussi ostentatoire. Attitude d'autant plus étrange que l'on ne peut pas dire que la concurrence motorisée soit à son apogée. Alors quoi me direz-vous ? La faute à la crise ? Je ne pense pas. Je pense que Google à atteint (ou n'est pas loin d'atteindre) "son" objectif : rassembler en une même sphère d'indexabilité des documents, des informations, des biens communs et patrimoniaux de l'humanité, mais également des comportements, des intentions de navigation, de l'intime (cf ma presque mondialement célèbre "théorie de la dérive des continents documentaires"). "Organiser l'information et la rendre universellement accessible". L'information EST organisée. Les dépêches de l'AFP sont estampillées "Hosted by Google", les photos de Life ne sont consultable QUE dans Google, nos emails personnels sont scannés mot après mot par Google pour pouvoir nous afficher des publicités contextuelles, dans les fables d'Esope on peut désormais lire "Le filigrane Google contenu dans chaque fichier est indispensable pour informer les internautes de notre projet et leur permettre d’accéder à davantage de documents par l’intermédiaire du Programme Google Recherche de Livres. Ne le supprimez en aucun cas." L'information EST organisée. Elle est effectivement universellement accessible. Universellement accessible par chacun d'entre nous SUR les serveurs de Google. SUR le GoogleNet.

La recherche est le centre et les services la périphérie. Mais faut se recentrer.
Maigre rayon de soleil dans cet horizon sombrement Googlien, le même Google annonce l'abandon de son projet Palimpsest (voir ici, ou ) dont l'ambition était tout simplement de permettre aux scientifiques du monde entier de stocker gratuitement leurs données volumineuses sur les serveurs de Google, en les rendant du même coup partageables et accessibles pour les autres scientifiques du monde entier ... et accessoirement pour Google. Vous avez dit "bien commun" ?
L'abandon de ce projet n'est d'ailleurs pas isolé. Le moteur "dont le centre est partout et la circonférence nulle part", une formule qui fut à l'époque l'une des clés pour comprendre la stratégie d'entrisme de Google, semble avoir besoin de se repossitionner "autour de" ses services centraux au prix d'un nettoyage des services périphériques. Après Lively et Palimpsest, ce sont Google Video, Google Mashup Editor, Google Notebook, Google Catalogs (service qui eut son importance pour le développement de Google Book Search), Dodgeball et Jaiku qui sont abandonnés ou arrêtés par Google (voir à ce sujet les billets de Zorgloob, Francis Pisani, Philipp Lenssen ...). Google se recentre donc autour de la recherche, et en particulier de la recherche "universelle" (voir le White Paper signalé par Steven Arnold), nouvelle clé de voûte de son écosystème de services.

A quelque crise malheur est bon ...
La crise économique boursière n'est certainement pas étrangère au recentrage de l'ogre de Mountain View. Mais je crois qu'elle n'en est pas la cause profonde, elle n'en est que le déclencheur structurel. "L'occasion" de passer, en 2009, à une nouvelle étape de déploiement, peut-être à une nouvelle stratégie. Il n'est d'ailleurs pas innocent que l'on voir récemment refleurir la rumeur du Google Drive (souvenez-vous), un espace de stockage "personnel", en ligne. L'information EST organisée. L'information est universellement accessible SUR les serveurs de Google. Particuliers, entreprises mais aussi institutions et demain peut-être états s'y retrouvent. En 10 ans, les habitudes sont acquises. Pour la plupart d'entre elles irrémédiablement. Devant l'omniprésence du moteur, devant la qualité des services offerts, devant l'ancienneté des usages individuels et collectifs que l'on en fait aujourd'hui, qui, oui, qui serait prêt à lâcher Google au profit d'autres services si ce dernier proposait un accès payant à certains de ses services ? Peu de gens à mon avis. Alors bien sûr nous n'en sommes pas encore là, mais s'il fallait cette année encore jouer au jeu des prédictions, je dirai que du côté de Google, l'année 2009 sera celle de l'établissement de sa suite bureautique en ligne comme principal sideman du moteur de recherche. Et que pour s'installer définitivement dans les habitudes, il ne manque plus à la suite bureautique en ligne qu'un espace de stockage personnalisé en ligne. Je crois donc qu'on verra bientôt apparaître le fameux GDrive, dont la rumeur court depuis déjà deux ans ... GoogleNet pour l'infrastructure, GoogleWeb pour le guichet unique d'accès à l'information avec son moteur (Google) et son navigateur (Chrome qui vient de sortir de son statut "béta"), GoogleOS pour les usages, usages eux-mêmes archivés dans la ruche mondiale du GoogleDrive.

"... dont le centre est partout, et la circonférence nulle part." comme disait l'autre ...

=====================
Et puis aussi ...
=====================

  • Sur le sujet des photos de Life - mais sous un tout autre angle, voir la tribune d'Augustin Besnier dans Le Monde, lointain écho de préoccupations déjà abordées ici et là ...
  • De manière plus anecdotique, Google offre également la possibilité de télécharger le dictionnaire Littré développé en version open source. Il n'est certes pas le premier à le proposer mais la concentration de services offerts et l'effet de marque jouant à plein, qui se souviendra demain qu'il ne fut pas le premier à le proposer et que l'initiative ne lui en revient pas ? Qui d'ailleurs ira télécharger le Littré ailleurs que depuis Google ?
  • Et puis malgré tous les risques qu'il fait peser sur nous, il y a ces éclairs de génie, ces outils dont la puissance nous émerveille au sens propre, et qui nous laissent entrevoir toutes les potentialités des mises en abyme que permet le web : je parle ici des 14 toiles du musée du Prado qui sont visibles en très haute résolution via Google Earth. Vagabondages vous explique tout, ainsi que Le Monde (et son portfolio dédié). Je ne vais donc pas en rajouter une couche, juste un petit cadeau bonus pour d'autres approches de la perspective muséale : le mur d'images d'ArtScope, avec, (deuxième petit cadeau bonus), en toile de fond, une empreinte de plus en plus forte de ces technologies y compris pour le grand public et sur des corpus non nécessairement patrimoniaux ou artistiques, tel le site "Zoomorama", qui permet de mettre en ligne des photo en haute définition avec là encore des effets de zoom proprement vertigineux. De la larme de Saint-Jean à l'infinie navigation du monde telle qu'elle se déploie dans Google Earth, de 1435 à 2009, derrière cette technologie, derrière ces 14 toiles c'est toute la dimension et toute la puissance dilatoire du web qui se donne à lire, toute la courbure si particulière de l'espace-temps internet, de notre espace-temps numérique, de notre macroscope.

(Temps de rédaction de ce billet : 2h45)

Contributions wikipediennes

(nota-bene : suite à la nouvelle mouture de Typepad, les titres des billets d'Affordance seront désormais sans accents, désolé pour les puristes ...)

Il est un vieux débat autour du web 2.0 en général et de Wikipédia en particulier, c'est celui de l'échelle réelle de collaboration et de contribution qui structurent ces deux univers. En d'autres termes, qui contribue "réellement" et qui en profite "simplement".

Un article du Silicon Alley Reminder revient sur une étude déjà commentée ici en Octobre 2006 à propos du nombre de contributeurs réellement actifs dans Wikipédia. L'étude signalée en 2006 indiquait que "50% des modifications sont faites par seulement 0,7% des utilisateurs … soit 524 personnes" et que "les 2% les plus actifs (1400 personnes) ont fait 73.4% de tous les modifications." Pour aboutir à ce résultat, Jimmy Wales avait à l'époque comptabilisé le nombre de modifications ("edit") réalisées sur les articles. La conclusion était que quelques "insiders" (ou "heavy editors") étaient responsables de l'essentiel du contenu de l'encyclopédie.
L'article du Silicon Alley Reminder propose de ne pas compter les "modifications" (edit) d'articles mais plutôt leur nombre de signes (lettres). Et le résultat (à nuancer étant donné que ladite étude est - de l'aveu même de son auteur - simplement empirique) est radicalement différent de celui de Wales : on s'aperçoit que les plus "gros" contributeurs en "nombre de signes" sont plutôt des "outsiders" (utilisateurs non-réguliers), les "heavy editors" se contentant de faire de nombreux "edit" mais essentiellement pour des questions de mise en forme et de calibrage ou de rectification.
OK mais et alors ???
Alors la question qui est ici posée est celle de la nature même du projet d'encyclopédie collaborative. Dans l'hypothèse 1 (celle de Wales), Wikipédia serait en fait une encyclopédie "comme les autres", avec un très petit nombre d'encyclopédistes labellisés et actifs. La seule différence - mais de taille - avec un projet encyclopédique classique étant que lesdits encyclopédistes n'ont pas été choisis ou recrutés es qualites. Soit disons 80 % d'un fonctionnement encyclopédique traditionnel et 20 % d'un fonctionnement "en rupture" avec les modèles éditoriaux traditionnels.
Dans l'hypothèse 2 (celle du Silicon Alley Insider), c'est la situation exactement inverse qui est décrite. Le coeur du projet Wikipédien est serait bien celui d'une collaboration ouverte reposant sur la contribution d'usagers "extérieurs" et non-nécessairement réguliers ou accrocs pour fournir les connaissances et les informations, collaboration ouverte "complétée" par un travail d'édition plus traditionnel (correction, mise en forme, etc ...) effectué cette fois par quelques "heavy editors". Soit 80% de collaboration et 20% de fonctionnement éditorial "classique".

Soit pour résumer :

  • hypothèse 1 : les encyclopédistes sont des gens "à/de l'intérieur"
  • hypothèse 2 : les encyclopédistes sont des gens "à/de l'extérieur"

La fonction crée l'organe.
Au delà des chiffres et des pourcentages, ce débat est important voire essentiel car il reflète et illustre notre rapport au savoir dans un environnement numérique. L'hypothèse 1 serait la preuve qu'au-delà de la forme (innovante) du Wiki, le projet encyclopédique n'a pas réellement changé de nature dans son mode de fonctionnement. L'hypothèse 2, de mon point de vue beaucoup plus séduisante et beaucoup plus réaliste (même si elle demande à être confirmée), indique a contrario qu'en sus du changement de nature de l'objectif encyclopédique, il y a bien également un changement de nature du mode de contribution et d'accumulation des savoirs. Wikipédia procède donc bien d'une nouvelle forme et d'une nouvelle ambition pour le projet encyclopédique du XX1ème siècle, nouvelle forme et nouvelle ambition qui ont su, pour partie, asseoir la rupture qu'elles proposent sur des schémas de fonctionnement éditoriaux ayant déjà fait la preuve de leur efficacité. Et ce n'est pas l'un des moindres intérêts de ce projet que de constater que cette stratégie n'a pas été bâtie et pensée en amont du projet lui-même, mais qu'elle s'est organiquement déployée au fur et à mesure de son avancement. Work in progress. Et si l'on observe Wikipédia comme un organisme numérique en croissance, on vérifie une fois de plus la formule de Lamarck selon laquelle "La fonction crée l'organe."

==============================
Et pour compléter cette petite réflexion (et accessoirement expurger mon agrégateur), une petite revue de liens autour de l'encyclopédie collaborative.

  • et tout d'abord une excellente idée : "Un chercheur, qui soumet un article à la revue RNA Biology, devra également écrire un résumé de ses travaux dans Wikipédia." Source et suite de l'info sur Prosper et ReadWriteWeb.
  • ensuite un article de Pascal Duplessis : "Wikipedia : un objet-problème en information documentation." Rapide extrait pour vous donner envie : "Qui, sans en avoir été longuement averti, peut-il appréhender l’extraordinaire complexité dont fait preuve le deus ex machina à l’œuvre derrière la scène de tout article encyclopédique collaboratif ? Comment imaginer ne serait-ce que le perpétuel mouvement de création et de re-création de l’édifice puisqu’il se fige à l’instant même où on le regarde ? Pour en faire prendre conscience aux élèves, il faudrait un logiciel de type morphing où l’on verrait en l’espace de quelques secondes merveilleuses l’article se développer et se réduire sous l’effet erratique des contributions, varier ses formes du simple au caricatural, laisser et abandonner ses traces, et vivre et mourir en quelques palpitations de son être documentaire."
  • voir également mes voeux de bonne année 2009

(Temps de rédaction de ce billet : 1h30)

Micro, méso et macro-net : les médiasphères et le moteur.

(billet inspiré par quelques rapides tests sur Whostalkin, découvert chez Steve Rubel)

En ce temps-là ...
En ce temps là
, la vie était plus belle simple : on avait les annuaires, les moteurs et les méta-moteurs.
En ce temps-là l'unité de publication était la page (web).
En ce temps-là, ceux qui publiaient sur le net ne publiaient (généralement) QUE sur le net, pas dans les grands médias. Et ceux qui écrivaient dans les grands médias ne publiaient pas sur le net.
En ce temps là, ce qui était écrit, restait écrit, restait fixé.
Et puis ...
Et puis les annuaires disparurent. Ne restèrent que (quelques) méta-moteurs et surtout les moteurs et surtout LE moteur.
Et puis les unités de publication se réduisirent, se fragmentèrent. L'unité ne fut plus seulement la page mais également le billet (de blog), voire le fil (de discussion sur un forum ou de commentaires sur un blog) ou le micro-fil (twitter limite l'unité de publication à 140 caractères). Une unité de publication parfois simplement confinée à une unité de présence en ligne, laquelle unité de présence est elle-même composée des traces éparses (profilaires ?) de notre social stream tel qu'il se constitue par exemple au travers de nos différents profils sur différents réseaux sociaux,
Et puis les instances d'énonciation éditoriales se floutèrent. Publier ici n'empêcherait plus de publier là. Les journalistes écrivent "dans" le web, les blogueurs écrivent "dans" les journaux, passent à la télé. Certains journaux ne sont faits que de reprises d'écrits de blogs (vendredi.info), certains blogs (maître Eolas) jouissent d'une crédibilité supérieure à certains journaux.
Et puis ce qui était écrit par l'un devînt modifiable par l'autre, par tous les autres (Wikipédia). L'auteur, l'autre. Figure gemellaire de l'hypertextualité. Agencements collectifs d'énonciation. La trace céda la place à sa propre traque.
Voilà ce qui changea. Ce qui ne change pas en revanche, pour vous, pour moi, c'est le besoin de s'y retrouver (au sens propre mais également et de plus en plus souvent au sens figuré également ...), d'y trouver parfois simplement "quelque chose", plus rarement "ce que l'on cherche".

Editorialement parlant, on dispose donc désormais de trois "médiasphères" :

  • le micro-net de type twitter mais également composé de nos traces profilaires,
  • le meso-net de type "blogs" individuels et non-institutionnels, ainsi que de la longue cohorte des pages personnelles
  • et le macro-net de type journaux ou chaînes de télé implantés sur le web (libération, le figaro, l'Obs ...)

Machiniquement parlant, pour rendre compte de ce nouveaux paysage éditorial du net, on ne dispose pourtant plus que des seuls moteurs qui, de plus en plus souvent, mal étreignent à force de trop embrasser.
Idéalement, il faudrait pouvoir disposer d'un moteur pour chacune de nos trois médiasphères. Car il va sans dire que la spécificité éditoriale de chacune d'entre elles conditionne à la fois la nature des recherches qui y sont effectuées mais également la nature, la granularité documentaire des résultats qui y figurent. Et l'on se prend à rêver d'un retour des moteurs à curseurs avec un même moteur permettant de régler le "grain" de la recherche depuis les macro-médias du macro-net jusqu'aux micro-médias du micro-net. 

Aujourd'hui, on dispose de :

  • Nano-moteur : pour chercher dans le micro-net. Exemple : WhosTalkin?
  • Meso-moteur : pour chercher dans le meso-net. Exemples : Blogsearch, Technorati, Wikio.
  • Macro-moteur : pour chercher dans le macro-net. Exemple : Google et Google News.

Cette granularité est inédite à cette échelle, et il y a fort à parier que 2009 lui donnera ses lettres de noblesse, l'enracinant comme une composante à part entière du Giant Global Graph. Alors que l'étage supérieur, le macro-net, apparaît aujourd'hui stabilisé, ayant atteint un rythme de croissance optimal, le micro-net et le meso-net continuent d'exploser, sur le même type d'échelle logarithmique que le web à ses débuts. Après la croissance des blogs, c'est aujourd'hui la croissance des réseaux sociaux et des sites de micro-blogging. La valeur de ces deux espaces, du dernier particulièrement, réside dans leur nature conversationnelle. Une conversation certes souvent tenue par des idiots et pleine de bruit et de fureur, mais également une conversation qui aiguille, qui stimule, qui signale, et qui est en tout état de cause le complément aujourd'hui indispensable de la plénitude du net comme médiasphère. Bref une conversation qui mérite d'être indexée et suivie pour pouvoir être ensuite accédée de manière asynchrone, dans la verticalité qu'impose le couperet d'une recherche et non plus simplement dans la linéarité d'un échange.

Signalons pour finir que cette granularité se superpose à une autre granularité préexistante et depuis déjà longtemps consubstantielle au net : la granularité des médias (vidéos, images, audio, texte) qui le composent. C'est à la croisée de ces chemins, à la croisée de cette granularité bipolaire que devront se positionner les acteurs de la recherche d'information pour répondre aux besoins de l'usager du web de 2009 et d'au-delà.

(Temps de rédaction de ce billet : 2h00)

Le codex ... dans le volumen

C'est assez fascinant d'observer le dialogue des formes et des supports. Après l'arrivée des écrans "plats" puis "souples", après l'arrivée des téléphones et des ordinateurs ultra-plats, voici venu un nouveau "concept", le portable enroulable ou plus exactement "l'ordinateur bâton". Soit un volumen avec un codex informatique à l'intérieur. Nous n'en sommes encore qu'au stade du concept, mais quelque chose me dit que ce concept là a de l'avenir. Vertigineux :-)

Le marché du livre comme algorithme (suite ...)

Suite du billet de l'autre jour. Je m'étais arrêté à la page 7 du document mis en ligne par l'ARL (.pdf). Les 13 pages restantes concernent le "volet bibliothèques" de l'accord passé par Google avec les éditeurs. On y apprend que :

  • Google délivrera un PAS (Public Access Service) gratuit à toutes les "bibliothèques publiques" (nous verrons ci-après que la dénomination a son importance ...) qui en feront la demande. A partir de là il sera possible de consulter le texte intégral des ouvrages de la zone grise depuis les postes informatiques de ladite bibliothèque. 
  • Avec ce PAS, si vous voulez imprimer des pages, on Google vous demandera une somme "raisonnable" (sic) : "A user can print pages of material viewed on the PAS terminal for a “reasonable” per-page fee"
  • Pour déterminer ce qu'est une "bibliothèque publique", et pour le secteur de l'enseignement supérieur, Google se base sur la classification Carnegie. Si vous ne correspondez pas aux critères de ladite classification, Google pourra vous offrir 1 PAS pour l'équivalent de 10 000 étudiants. Si vous êtes dans les critères de ladite classification, ce sera 1 PAS pour 4000 étudiants. Et si vous en voulez plus ? "Google (...) can agree to expand the PAS service by making additional terminals available for free or an annual fee, but the settlement provides no further details on the terms for this expansion." Donc ce sera possible. Et ce sera gratuit. Ou pas. Ca dépendra. Ce sera du cas par cas. Qui à dit "diviser pour mieux régner ?". Bref, faudra négocier avec Google. 

Bilan ? C'est un PAS de plus vers un pas de trop. Je connais un certain nombre de marchands du temple de l'édition scientifique qui vont ressentir comme un léger malaise à voir l'ombre du géant de Mountain View venir s'étendre inexorablement sur leur pré carré. Car après la PAS, vient l'ISD (Institutionnal Subscription Database). Et oui.

  • l'ISD c'est le fait que chaque institution va pourvoir acheter, toujours pour les mêmes oeuvres de la zone grise, un abonnement institutionnel pour offrir l'accès à l'ensemble de ces textes à l'ensemble de ses usagers. C'est à dire le principe même des bouquets numériques que contractent actuellement les bibliothèques (universitaires notamment) avec les grands éditeurs scientifiques. Cet accès aura naturellement une durée limitée et devra être périodiquement renouvelé.
  • OK mais combien ça va coûter ces abonnements ? Et bien, là encore, c'est Google et lui seul qui va algorithmiquement fixer le prix. Enfin pas tout à fait. C'est Google et le Book Rights Registry (BRR), c'est à dire le fameux registre d'enregistrement des oeuvres encore sous droits. Sauf qu'en l'état, il faut rappeler que c'est Google qui crée et finance seul ledit BRR et que l'on ne sait rien de ce que sera sa composition ... Et donc, les critères pour déterminer le prix d'un abonnement institutionnel sont : "the pricing of similar products and services available from third parties; the scope of the books available in the ISD; the quality of the scan (sic ...); and the features offered as part of subscription." Plus loin on apprend également que le prix : "will be based on the number of full-time equivalent (FTE) users. For higher education institutions, FTE means full-time equivalent students."

Moralité : c'est ce que l'on appelle vérouiller ses positions. Phase 1 : google crée le marché. Phase 2 : Google prend le marché. Phase 3 : Google en fixe les règles. Phase 4 : Google n'a plus qu'à ramasser les copies les contrats ... Parce que dans toute cette histoire, vous n'avez pas oublié qu'au départ il y avait le projet Google Books ... un projet dans lequel des bibliothèques confiaient à Google des ouvrages dont certains font partie de la fameuse zone grise. Et c'est là que commence la lecture des dernières pages du document de l'ARL. Dans le prochain billet, je vous raconterai comment Google va réaliser le coup du chapeau. C'est à dire faire finalement payer aux bibliothèques l'accès aux ouvrages de leur fonds propre.
A suivre :-)

(Temps de rédaction de ce billet : 1h00)

"Les cons ça ose tout."

" ... c'est même à ça qu'on les reconnaît " disait le maître. Diego Maradona et Lutz Heilman osent tout. Le premier, nous apprend Zorgloob, a demandé (et obtenu !!!) des versions locales de Google et de Yahoo!, qu'elles ne fassent plus apparaître de résultats sur la requête "Diego Maradona." La page suivante est donc collector : à vos copies d'écran, car c'est à ma connaissance la première fois dans l'histoire de l'Internet qu'une telle disparition est opérée.
Le second (via le toujours excellent Ecrans et de ReadWriteWeb), Lutz Heilman, 42 ans, aujourd’hui député au parlement fédéral du parti die Linke (La Gauche), et ex-agent de la fameuse police secrète est-allemande (Stasi), a demandé et obtenu la fermeture immédiate et ce deux jours durant, de la version allemande de Wikipedia (enfin pas tout à fait mais presque).

Deux réflexions croisées :

  • c'est la première fois qu'un particulier obtient l'application aussi radicale et disproportionnée d'un tel "effacement".
  • seuls des états avaient jusqu'ici réussi à faire plier de tels mastodontes, et la négociation n'avait pas porté sur le terrain judiciaire mais uniquement sur le plan ... financier.
  • cela laisse songeur sur plein de plans ...

Et une morale façon "vieux con des neiges d'antan" : on n'effacera jamais les livres. On peut les censurer, les brûler, les détruire, les pilonner mais les effacer ... jamais. Et si vous voulez lire une belle histoire à ce sujet, vous pouvez vous précipiter sur Globalia.

Le petit lien du Week-End

Micro-média et granularité documentaire illustrée.

Epistémologie wikipédienne : vérité et vérifiabilité sont dans le bateau du web centripète.

(Nota bene : le titre de ce billet est en compétition pour le festival du plus mauvais titre de billet dans une logique de référencement. Il concourt également dans la catégorie "comment enseigner les règles de l'écriture multimédia à ses étudiants et ne pas se les appliquer à soi-même")

Epistémologie et écosystème sont dans un bateau.
L'épistémologie désigne "l'étude de la connaissance scientifique en général". En philosophie en particulier, elle a pour objet "l'étude critique des postulats, conclusions et méthodes d'une science particulière, considérée du point de vue de son évolution, afin d'en déterminer l'origine logique, la valeur et la portée scientifique (...)."
En tant qu'écosystème informationnel, Wikipédia avance à visage découvert : elle cite ses sources, s'efforce de mettre en avant des sources fiables, "oblige" à les vérifier, s'efforce d'adopter une neutralité de point de vue. Un écosystème par ailleurs récemment analysé dans sa diversité de services, et qui donne à voir un visage relativement monolithique :

Piechartscorrected

Monolithe numérique en ligne donc, même si ce dernier connaît également depuis peu des versions "papier-like" ou même "DVD-like"

Toutes ces choses dites, le débat reste entier autour de la place qu'occupe actuellement ledit écosystème et du modèle qu'il propose. Pour clarifier ce qui suit, je rappelle en préambule tout le bien que je pense de Wikipédia. Ce qui ne m'empêche pas d'être critique.

Vérité et vérifiabilité sont dans un bateau.
Un article de Simson L. Garfinkel dans la MIT Technology Review propose une analyse intitulée : "Wikipedia ans the meaning of truth." L'article revient d'abord sur la contamination opérée par Wikipedia dans l'ensemble des sphères professionnelles et informationnelles : les journalistes s'y reportent, les étudiants y sont accrocs, les enseignants s'y mettent peu à peu, et l'encyclopédie occupe très (trop ?) souvent la première place dans les pages de résultats des moteurs de recherche. Le deuxième point abordé par l'article est celui du "contrat social" wikipédien : pour survivre, l'encyclopédie ne peut se permettre d'être bourrée d'erreurs et de contre-vérités (sinon personne ne la consulterait). La politique de publication qui s'est ainsi progressivement mise en place et la rapidité avec laquelle la plupart des erreurs sont corrigées sont le fondement dudit contrat social. Pour autant, Wikipédia ne repose pas, épistémologiquement parlant, sur une logique de vérité, mais sur une systématisation de la vérifiabilité :

  • "A la différence des lois mathématiques ou scientifiques, la vérité wikipédienne n'est pas basée sur des principes de cohérence ou d'observabilité. Pas davantage qu'elle n'est basée sur le bon sens ou l'expérimentation. Wikipedia a construit un ensemble de standards épistémologiques radicalement différents (...) qui doivent interroger ceux qui sont concernés par le sens traditionnel des notions de vérité et de précision. Sur Wikipedia, la vérité objective n'est pas la plus importante. Ce qui fait qu'un fait ou une information peut être intégrée dans l'encyclopédie est qu'il apparaisse dans une autre publication -- idéalement en Anglais et qui soit disponible en ligne. La ligne officielle de Wikipédia est d'ailleurs la suivante : "La condition d'inclusion d'un article dans Wikipédia est la vérifiabilité, et non sa vérité."."

Et Garfinkel de conclure ainsi son article :

  • "Alors qu'est-ce que la vérité ? (...) En pratique, le standard d'inclusion des articles mis en place par Wikipedia est devenu, de facto, le standard pour la vérité, et depuis que Wikipédia est la source en ligne la plus lue sur la planète, c'est également le standard de vérité que la plupart des gens utilisent quand ils font une recherche sur Google ou Yahoo. Sur Wikipédia, la valeur de vérité de la vérité est la vue concensuelle d'un sujet. (On Wikipedia, truth is received truth: the consensus view of a subject.)"

Rappelons-le ici, Garfinkel reste plutôt enthousiaste et "pro"wikipédia. La raison est simple : il fait partie du trop peu d'enseignants-chercheurs qui ne se contentent pas d'utiliser l'encyclopédie mais qui, dans leur domaine de spécialité, corrigent et complètent les erreurs ou approximations qu'ils y rencontrent.
Ce qui est en jeu dans l'article de Garfinkel, ce sont finalement les répercussions systémiques des modes opératoires qui, par effet de contamination, peuvent s'étendre de Wikipédia au Web dans son ensemble. En d'autres termes, la capacité centripète des forces qui agitent et animent ladite encyclopédie. Dans un ancien billet, j'écrivais de mon côté :

  • "Une autre des grandes forces de Wikipédia, au-delà même des processus de collaboration centrifuges qui animent la communauté des Wikipédiens, ce sont les logiques d'appropriation centripètes qu'autorise l'architecture "ouverte" de l'encyclopédie : les différents outils cognitifs qui fleurissent ces derniers temps autour du projet illustrent bien ces logiques."

Mais tout le monde n'aime pas cet effet centripète. Ainsi Nicolas Carr (qui lui, n'aime pas Wikipédia pour différentes raisons) écrit dans un billet intitulé "Le web Centripète" :

  • "Wikipedia offre un magnifique exemple du pouvoir formel qu'exerce la force centripète du web. La populaire encyclopédie en ligne est moins la "somme" des connaissances humaines (...) que le trou noir de la connaissance humaine. Son coeur : une vaste exercice de copier/coller qui bannit explicitement toute pensée originale ; Wikipédia aspire d'abord les contenus des autres sites, puis leurs liens, puis leur place dans les résultats des moteurs de recherche, puis leurs lecteurs. (...) Les articles de Wikipédia sont devenus les liens externes par défaut de beaucoup de créateurs de contenus, non pas parce que Wikipédia est la meilleure source existante, mais parce que c'est la plus connue est qu'elle est généralement "assez fiable"."

Un réquisitoire comme qui dirait "sans appel" et qui en arrive à la même conclusion que l'article de Garkinkel : le danger n'est pas dans Wikipédia, il est dans les usages naïfs de Wikipédia. Un débat vieux comme le monde (scientifique) : la découverte de la fission nucléaire n'est pas un danger. C'est son instrumentalisation (pour fabriquer des bombes) qui en est un. Wikipédia ne menace personne, sa politique de publication est parfaitement lisible et explicite. Ce qui ne la met naturellement pas à l'abri de la critique.

Wikipédia est un go-between culturel planétaire.
Parce qu'internet, parce que la surcharge informationnelle, parce que l'infobésité, parce que nos comportements connectés, parce que l'émergence de nouveaux modèles d'autorité, parce que, parce que, parce que ... Wikipédia s'est construite et a émergé dans ce contexte là. Elle n'est pas réductible à une encyclopédie classique (argument mis en avant pas ses idolâtres), pas davantage qu'elle ne l'est à une anti-encyclopédie (argument mis en avant par ses détracteurs). Elle est une forme neuve, intermédiaire, de la mise en circulation et de l'agrégation des connaissances.

La formation sur les berges du Styx.
Là où Carr et Garfinkel ont tous les deux raison, c'est que nous sommes tous des Wikipédiens, et parfois presque "malgré nous". Comme nous sommes par ailleurs tous des Googlers. Nous utilisons tous l'encyclopédie et le moteur. Nous ne comprenons pas tous comment ils fonctionnent. Nous ne les alimentons pas tous de manière consciente ou inconsciente, de manière honnête ou détournée. Mais nous les utilisons tous. Nous y sommes tous perméables. Et il n'y a que très peu de chances pour que cela change avec les prochaines générations. Celles-ci seront victime de ce que vous me permettrez d'appeler le talon corps d'Achille numérique. Keskesékessa ? Souvenez-vous d'Achille, de son corps invulnérable une fois trempé dans le Styx, et de son seul point faible, le talon par lequel sa mère le tenait lors de son immersion. Les usagers de l'écosystème numérique de demain seront tous des achilles numériques à l'envers. Ils seront entièrement perméables au mode d'accès, de représentation et d'organisation des connaissances et des informations que leur proposent dès aujourd'hui l'encyclopédie et le moteur. A ces usagers là, il reste une force. C'est leur talon d'Achille : ce petit bout d'eux-mêmes qui ne fonctionne pas uniquement sur des habitus numériques induits, et qui, ce faisant, leur permet d'interpréter ces outils avec la distance critique suffisante. Suffisante ET nécessaire. Alors le dire. Et le répéter encore : seule la formation, seule la formation à une culture de l'information permet cela. La dynamique de propagation des habitus numériques, la façon dont ils modèlent notre monde de manière aussi structurante que parfois pernicieuse, cette dynamique réduit progressivement ce talon d'Achille à une peau de chagrin. L'urgence en termes de formation est réelle. Elle est même vitale.    

(Temps de rédaction de ce billet : 2h15)

Rock&Num at the BnF.

Va falloir s'y faire. Ca bouge à la Bnf. Ca bougeait déjà depuis longtemps me direz-vous. Certes ... Mais là, en plus de bouger, ça communique sur le mouvement :-) Donc :

  • Dans la BnF y'a de l'OAI (et dans Banga y'a de l'eau). Ici : "La Bibliothèque nationale de France a ouvert deux entrepôts OAI              destinés à faciliter l'accès à ses collections et à ses données.             Le premier, OAI-NUM, contient les notices de tous les documents numérisés             et accessibles via les bibliothèques numériques Gallica et Gallica2.             Le second, OAI-CAT, a pour vocation de contenir l'ensemble des notices             des documents de la Bibliothèque nationale de France, numérisés ou             non. Il contient actuellement presque 10 millions de notices." Tous les détails ici. Par ailleurs (spéciale dédicace à mes étudiants qui lisent de plus en plus mon blog depuis que j'y publie les sujets d'examen la veille desdits examens), cette page là est une excellente ressource pour notre cours sur les bibliothèques numériques).
  • Dans WorldCat y'aura le catalogue de la BnF : communiqué sur le site de l'OCLC. Pour Bruno Racine, "The Bibliothèque nationale de France is willing to increase the audience of its cultural heritage materials. We are convinced that the contribution of our entire bibliographic catalogue to WorldCat is likely to enhance the value of the library collections". Les mauvaises langues diront qu'il était temps. Les autres comprendront qu'il faut du temps.
  • Pour la numérisation de masse, y'a une vidéo. Eeeeet oui. Va falloir s'y faire. La BnF c-o-m-m-u-n-i-q-u-e sur ses opérations de numérisation de masse. Et elle le fait de manière intelligente (même si le fond musical est discutable ;-) Alors bien sûr c'est (ce n'est que) de la "comm", alors bien sûr c'est un vrai petit film promotionnel pour les partenaires de la BnF sur ladite numérisation, mais "ça parle" et "ça montre" concrètement ce qu'il y a derrière cette expression étrange qu'est la "numérisation de masse". (info glanée via Jérémie Jeanguenin, digne successeur de Katell aux manettes du blog du BBF). Reste plus qu'à mettre ladite vidéo sur YouTube histoire d'aller au bout de l'opération de communication et de viraliser un peu le machin ;-)

Le web en son reflet motorisé : Google invente le monopolien.

Le 11 Avril 2008 sur son blog Webmaster Central, Google annonçait qu'il allait désormais se donner les moyens d'indexer certaines données disponibles "derrière" un formulaire, faisant ainsi reculer encore un peu le périmètre du web invisible. Comme je l'avais souligné au moment de cette annonce, un certain nombre de paramètres restaient encore dans le flou (quels formulaires ? sur quels sites ? comment ?). Six mois plus tard, sur le même blog, Google vient d'annoncer sa solution partielle au problème : cela s'appelle le First Click Free. Et comme souvent avec Google, c'est une très bonne idée, une idée par ailleurs très simple ... mais une idée que lui seul est en mesure de proposer et d'implémenter de manière significative du fait de sa situation quasi-monopolistique, une idée qui met également en péril une certaine conception du Net. Mais revenons au First Click Free.
De quoi s'agit-il ?
Les webmasters proposant du contenu protégé (par exemple sur le modèle payant par abonnement, comme les grands quotidiens de presse), auront la possibilité d'ouvrir leurs pages "privées" au crawler du moteur. Résultat ? Ce contenu sera indexé par Google, et l'internaute qui arrivera sur cette page depuis Google, y aura accès. Et oui. L'internaute qui arrivera sur cette page depuis Google. Pas "depuis un autre moteur". Google offre comme garantie que l'internaute qui souhaitera consulter les pages liées au contenu ainsi "dé-protégé" ne pourra pas le faire. C'est donc la technique bien connue des marchands d'aspirateurs du siècle dernier qui est retenue : celle du pied dans la porte. Le problème, c'est que ladite fonctionnalité instaure de facto un web à deux vitesses, qui semble contraire au principe que Google se fait par ailleurs fort de défendre, celui de la neutralité du Net en tant que réseau, en tant qu'infrastructure. Pour bien comprendre et sans faire trop long sur le sujet, rappelons que derrière la problématique de la neutralité du Net, la question est de savoir si les fournisseurs d'accès ont ou non la possibilité d'élargir ou de restreindre "sur mesure" la bande passante dédiée à certains sites. Naturellement, dans le cas des First Click Free, Google ne se positionne pas sur le créneau de l'infrastructure (ce qui lui permet de continuer à "militer" pour le maintien d'une neutralité du net), mais sur celui (c'est son métier) des contenus.
Alors en quoi est-ce contraire au principe de neutralité du Net ?
Et bien jusqu'ici, les moteurs se différenciaient par deux points : leur algorithmie, et leur infrastructure technologique leur permettant d'indexer le plus grand volume possible d'informations disponibles et de mettre à jour leur base d'index. Pour le dire différemment, si certains contenus étaient disponibles sur certains moteurs et pas sur d'autres, ce n'était en rien dû au fait que les éditeurs de ces contenus avaient ou non passé un "contrat d'indexation" avec tel ou tel moteur, mais simplement au fait que les routines d'indexation de tel moteur étaient plus efficaces que celles de tel autre. Avec First Click Free, la donne est radicalement changée. Pour la première fois à l'échelle du Net, des éditeurs vont pouvoir contractualiser l'accès à des parties payantes de leur site, avec un seul acteur au détriment des autres.
Tempête dans un verre d'eau ?
Pas vraiment. On savait déjà que les moteurs aimaient bien tisser des liens d'affection, soit avec des services dépendant directement de leur propre écosystème (ex : les vidéos de YouTube et les blogs de Blogger sont légèrement surpondérés dans les résultats de Google), soit avec des services tiers desservant prioritairement leur propre modèle économique (Ebay, Amazon ...). On savait également que les mêmes moteurs prospéraient sur des liens d'affiliation (offre Google Adsense).
Après les liens d'affiliation et d'affection, voici venue le temps des monopoliens.
Ce qui est explicitement proposé aux webmasters (pardon d'insister un peu lourdement), c'est l'indexation exclusive de certains contenus. Jusqu'ici, l'ouverture d'un contenu à un moteur, signifiait également l'ouverture de ce même contenu à tous les autres acteurs de la recherche d'information.
Quelle est la cible ?
Poser la question des (monopo)liens, c'est nécessairement poser la question de la cible d'un tel service. Pas besoin en l'occurence d'aller chercher bien loin. Si certains sites de particuliers ou certains portails d'entreprises peuvent être intéressés par cette visibilité accrue sur des contenus jusqu'ici inaccessibles, c'est (à mon avis) très clairement la presse en ligne qui est visée. Souvenez-vous en la matière de la complexité de l'indexation des contenus de la presse par Google (service Google News). Après les procès intentés par les sites de presse dans différents pays, après les accords passés avec certaines agences, Google ne se contente plus de son pourtant déjà très remarquable coup du chapeau. Prenons la question du côté d'un site de presse généraliste national ; les données sont les suivantes : je veux que mon contenu (y compris une partie de mon contenu payant) soit indexé et visible sur les moteurs de recherche. Je veux cela parce que je n'ai pas le choix et que je ne peux pas me passer du traffic généré par les moteurs. J'avais donc jusqu'ici le choix entre "garder mes contenus fermés à l'indexation" (et donc me priver du traffic qu'ils auraient pu générer), ou "donner mes contenus ouverts" (et là aussi me priver du traffic généré puisque les internautes consulteront lesdits contenus sur Google News plutôt que sur mon propre site). Avec les monopoliens, j'aurai désormais la possibilité d'amener du traffic vers mon site, en contrôlant la visibilité de mes contenus, sans risquer de voir mon audience sur lesdits contenus "déportée" vers les moteurs de recherche et leurs services d'agrégation d'actualités. Cette proposition de Google va donc probablement ravir ou à tout le moins donner du grain à moudre à ceux qui planchent en ce moment sur l'avenir de la presse.
Monopoliens sous conditions.
Si vous n'êtes pas encore convaincus que c'est bien la presse en ligne qui est directement visée, les conditions (Guidelines) fixées par Google (bé oui, en plus il fixe des conditions) devraient achever de vous convaincre. Pour ceux qui choisiront de mettre en oeuvre ces monopoliens, il faudra : (1) "que les internautes qui arriveront sur ces pages puissent voir le texte intégral du contenu", (2) "que le contenu affiché soit identique à celui offert à l'indexation du GoogleBot", (3) "que si la source liée est un article affiché sur plusieurs pages" (ce que font fréquemment tous les sites de presse) "il soit possible de consulter l'intégralité de l'article en une seule page sans qu'on lui demande (à l'usager) de s'enregistrer ou de payer".
Un nouveau contrat de dupe ?
Concrètement, en autorisant ainsi Google à indexer certaines données "privées / payantes" de leurs sites, et même si Google donne comme garantie que les usagers ne pourront pas aller au-delà du contenu ainsi autorisé, rien n'est en revanche garanti sur le comportement du GoogleBot ... à partir du moment où celui-ci disposera du mode d'accès à l'ensemble des contenus payants du site, il y a de fortes chances pour qu'il ne se prive pas de les indexer à des fins que pour l'instant lui seul connaît (même s'il est naturellement toujours possible de "re"-sécuriser des contenus mais vu le volume et l'architecture des grands sites de presse, il y a de grandes chances pour qu'un certain nombre de pages "fuitent" ainsi vers le moteur, et étant entendu que ce qui intéresse Google ce sont précisément ces contenus d'actualité qui lui restaient partiellement fermés).
Et donc ?
Et donc là encore, comme il le fit déjà avec GoogleBooks pour la partie concernant les ouvrages encore sous droits, Google avance, Google fait sans cesse reculer les frontières de l'indexation, Google alimente son coeur de métier sur des logiques tenant à proprement parler de la dévoration. Ceci doit d'autant plus nous interpeller qu'à mon avis (côté obscur de la force) nous n'avons jamais été aussi près de voir émerger demain un authentique GoogleNet se substituant au réseau Internet tel que nous le connaissons aujourd'hui, et que (côté optimiste de la force) d'autres sont en passe de montrer qu'il est possible d'être à la fois visionnaire et tout aussi "malin" que le Cronos du Net.

(Via Google Blogoscoped // Temps de rédaction de ce billet :1h30)

Lier ou ne pallier, là est la question.

Intéressant débat chez Christian Fauré à propos de l'intérêt (ou de l'absence d'intérêt) d'une formalisation des liens hypertextes (tellement intéressant que j'ai moi-même mis 400 pages à ne pas régler définitivement la question). Le billet de Christian est lisible ici, mon commentaire est , Jean-Michel Salaun en a profité pour s'inviter (il a bien fait) et amorcer à son tour un débat avec Christian : .

(Nota Bene pour le lecteur scrupuleux : les ancres hypertextuelles de ce billet sont particulièrement mal choisies, mais c'est justement ça l'objet du débat)

La crise, l'éléphant, les bibliothèques et Google ...

Cela n'aura pas échappé à votre perspicacité : c'est la crise. Côté silicon vallée, itou. Côté brontosaures de l'infor(mation)(matique) : pareil. Et maintenant, fermez les yeux et imaginez ... Imaginez que certaines sociétés (Google par exemple) soient, crise oblige, obligées de se recentrer sur un coeur d'activités lucratives et de délaisser les activités sans profit immédiat. Pire. Imaginez l'inimaginable. Imaginez la faillite de Google. Ouvrez les yeux et réfléchissez : qu'adviendrait-t-il de l'énorme volume d'ouvrages publics numérisés par Google ? Certes, chaque bibliothèque disposerait encore de la copie numérique qui lui est contractuellement remise par ledit Google. Mais le temps de fédérer l'ensemble de ces ressources, de les porter en ligne derrière une interface interrogeable unique, ce temps serait considérable. Ce temps serait autant de temps perdu.
Et c'est ici qu'intervient le Hathi Trust, un "entrepôt numérique partagé" à l'initiative d'un consortium universitaire composé comme suit : University of Chicago, University of Illinois, Indiana University, University of Iowa, University of Michigan, Michigan State University, University of Minnesota, Northwestern University, Ohio State University, Penn State University, Purdue University, University of Wisconsin-Madison, University of California system. Trois de ces universités sont les leaders du projet : Michigan, Indiana, Californie.
L'ambition du projet ? Tout simplement considérable : il s'agit de rassembler les ouvrages mais également les journaux numérisés dans les bibliothèques, sur la base initiale du "corpus" Google mais en envisageant des extensions, y compris auprès d'éditeurs pour des fonds encore sous droits. Il s'agit encore de fournir une solution sécurisée de stockage, de préservation et d'accès à long-terme. Il s'agit enfin d'étendre ce processus aux entrepôts institutionnels des unviersités, à condition que la phase initiale du projet soit couronnée de succès. Bref, en un mot, un portail universel de bibliothèque. Et pas un nouveau Worldcat puisque c'est cette fois-ci bel et bien le texte intégral qui est visé et non les "seules" données bibliographiques.
A l'heure actuelle, les compteurs de la numérisation du HathiTrust annoncent les chiffres suivants :

  • 2,091,060 ouvrages  
  • 731,871,000 pages  
  • 78 terabits de données
  • 40,23 kilomètres  
  • 1,699 tonnes  
  • 332,048 volumes (~16% de l'ensemble) dans le domaine public

Ces chiffres prendraient "seulement" en compte les collections numériques de l'university du Michigan et de celle du Wisconsin, "both leaders in mass digitization efforts."
Bon d'accord c'est bien beau, mais et les autres projets de bibliothèque numérique comme l'Open Content Alliance ?
Le HathiTrust annonce que certains de ses "partenaires" sont également impliqués dans l'Open Content Alliance. Et qu'à terme, ils envisagent "d'inclure" l'OCA dans leur portail.
Bon d'accord c'est bien joli, mais, crise oblige, c'est quoi le modèle économique ?
Les partenaires apporteront une cotisation initiale calculée sur le nombre de volumes fournis, plus une cotisation annuelle pour l'entretien desdits exemplaires numériques. Le HathiTrust étant "une extension à visée non-lucrative des bibliothèques qui l'ont fondé", il espère par ailleurs que le partage des infrastructures et des stratégies de numérisation permettra d'atténuer rapidement les coûts spécifiques.
OK. Mais admettons que je veuille bénéficier de l'infrastructure HathiTrust sans nécessairement mettre en accès libre sur Internet certains de mes fonds numérisés ?
Pas de problème. Le HathiTrust mentionne la possibilité technique de mettre en place une "archive noire" (dark archive), même si ce n'est pas la voie qu'il recommande.
Bon ben ça y est, vous m'avez convaincu. Où est-ce que je peux tester cette formidable interface ?
Ah oui mais là euh comment dire, ben en fait ... nulle part. Pour l'instant. Ce qui n'empêche pas les objectifs fonctionnels d'être décrits à court, moyen et long-terme : il y aura un tourne-page, il y aura des watermarks partout (celui de l'institution d'origine, celui de l'agent numérisateur ...), il y aura des API pour adapter le bouzin aux besoins de chaque bibliothèque, il y aura du Shibboleth pour permettre aux publics handicapés d'être reconnus et de bénéficier d'un accès adapté, et ... et ... et ... et il y aura une interface publique. Ce sera une "bétâ" et elle devrait être disponible "début 2009". A moyen terme, chacun (chaque usager ou chaque institution ?) pourra créer ses propres collections. 
Là où le HathiTrust marque incontestablement des points, c'est du côté de la gestion des données bibliographiques (l'envers de la médaille numérique, trop peu mise en avant par Google). Et là c'est du lourd. Une partie des données est déjà là. Le lien avec L'OCLC (Worldcat donc) est déjà négocié, et ce dernier pourra ainsi rapidement référencer les collections du HathiTrust.   

Un petit résumé ?
Un groupement de bibliothèques importantes se regroupent au sein d'un consortium qui est aussi une agence de moyens, sur fonds propres, mais sans s'interdire de faire appel à diverses fondations. L'urgence (et la motivation) pour ce consortium, c'est de partager ses infrastructures, ses documents et ses stratégies pour élaborer un "plan B" face au projet Google. A long terme, il s'agit tout simplement de construire un portail unifié mondial (américain ?) de ressources numériques en bibliothèques : ouvrages libres de droits, rétro-numérisation presse, dépôts insitutionnels, mais là aussi sans s'interdire d'y intégrer une offre sous droits, négociée avec les éditeurs. Il s'agit de faire collection.
Une petite analyse ?
Difficile à ce stade du projet. Ce qui est sûr, c'est qu'aujourd'hui, toute alternative est bonne à prendre. Ce qui est sûr également c'est que toute alternative doit pour pouvoir être crédible, disposer d'une puissance de feu numérique suffisante. C'est le cas les bibliothèques membres du HathiTrust (le choix de l'éléphant comme logo n'est pas neutre). Pouvoir également disposer d'une stratégie et d'un modèle économique clair. Cela semble être également le cas. Le HathiTrust part gagnant sur au moins deux terrains déterminants :

  • par rapport à l'OCLC (worldcat) il mise sur les contenus mais sans que cela se fasse au détriment des métadonnées.
  • par rapport à l'OCA, les bibliothèques restent "entre pairs" : le partage et la mutualisation de ressources en seront probablement facilitées.

Donc ?
Donc satisfaction sans réserve, ne serait-ce que pour l'expression à haute, intelligible et audible voix de l'impérieuse nécessité d'une alternative au projet Google Books. Satisfaction que les bibliothèques reprennent en main de manière concertée et conforme à leurs missions, le chantier de la numérisation de masse, afin de sortir de l'ornière prévisible vers laquelle nous amène le même Google. Satisfaction toujours pour l'aspect "malin" du projet qui retourne les clauses les plus discutables des contrats Google en faveur des bibliothèques (en gros : vous aurez votre exemplaire numérique mais apauvri, et de toute façon vous pourrez pas l'exploiter car vous n'avez pas l'infrastructure suffisante à large échelle). Satisfaction enfin et peut-être surtout, parce qu'en observant ce qui se passe du côté-ci de l'atlantique avec Gallica2 (intégration presse et ouvrages sous droits), il y a ENFIN là un formidable terreau de convergence. Ne reste plus qu'à se mettre au labour.

(Via Urfist Info // Temps de rédaction de ce billet : 2h00)

"Political Streams" ou du classement comme représentation.

Microsoft via ses "labs" lance son interface de visualisation en temps (quasi)réel des tendances, politiques en l'occurence. Cela s'appelle Political Streams et vous propose de voir quels sont les "gens", les "articles" (presse), les billets (blogs), et les pays qui sont au centre de "l'attention" planétaire. L'ensemble s'appuie sur les contenus de Freebase. Tout laisse penser que l'actuel Political Streams se déclinera bientôt sous d'autres formes : Society Streams, Sports Streams, etc ... C'est en tout cas ce que l'on se dit en parcourant la page du projet. On note enfin pour ceux qui n'en seraient pas encore convaincus, que la visualisation, que le rendu visuel en un espace étroit (mais dynamique) d'un ensemble gigantesque de données, est sinon l'avenir, à tout le moins une piste très très très explorée par les différents moteurs de recherche. Les autres projets qui occupent la une des LiveLabs - Seadragon, Photosynth - sont pour l'essentiel dédiés à la représentation de larges corpus en temps réel pour en dégager des motifs, des patterns, des tendances. Voilà pourquoi les classements, tous les classements (de celui de Shangaï à celui de Wikio), passionneront toujours les scientifiques, tous les scientifiques. Parce que toutes les visualisations, toutes les représentations, débutent toujours par un classement. Parce qu'un classement, c'est le début, c'est le niveau 1 de la représentation (le degré zéro de la représentation étant celui de la liste - cf Goody). Un classement est déjà plus, beaucoup plus que la simple liste dont il conserve pourtant l'apparence. Un classement c'est la mise en place de principes dynamiques d'organisation qui révèlent du sens (quand les classement sont bien faits) plutôt que de nous le laisser le construire seuls avec nos listes, ou qui ne révèlent qu'eux-mêmes (quand les classements sont mal faits).

(Info initiale repérée sur DataMining)

Technologies de l'artefact et traçabilité "positive" : l'écriture dans le ciel est-elle soluble dans l'informatique en nuage ?

=======================================
Où il est question de "technologies de l'artefact", "d'éthique hacker", de "perte du sens", "d'intelligence des données", de "traçabilité positive" et de quelques autres babioles ...
=======================================

Ecrans nous offre un beau panorama d'outils relevant du champ des technologies de l'artefact. Fake is a Fake vous permet de détourner (presque) n'importe quel site officiel. L'outil est à la fois robuste et astucieux : il utilise la plateforme Wordpress avec des thèmes (gabarits) reprenant la charte graphique des grands quotidiens (Le Figaro, New-York Times ...) de sites institutionnels (Maison Blanche, Elysée ...) ou événementiels (Pékin 2008 ...).
Dans une autre catégorie, permettant celle-là d'atténuer les technologies de l'artefact par le développement d'une heuristique "technologisée" de la preuve, Logo-Wiki (qui s'inspire de Wiki Scanner) permet de suivre les "Big brother Editors" de Wikipedia, en remplaçant le logo de l'encyclopédie, par celui de la compagnie ou de l'institution à l'origine d'une modification d'article. Pour une démo, voir ici.
Et donc ??
Tout cela fait écho a ce qui s'est raconté lors des dernières rencontres d'Ars Industrialis et notamment à l'intervention d'Alain Mille : il est (heureusement) encore possible d'inventer une ingénierie "positive" de nos traçabilités numériques. Echo également à l'intervention de Peter Norvig indiquant que l'avenir était à une formule du web contenant de moins en moins de "code" et de plus en plus de "données" (le fameux "less code, more data"). Or seul le code, seule l'écriture peut donner "un" sens à l'alignement et à l'empilement des données. Leur seul recoupement ne leur confère que "du" sens, différemment interprétable, différemment "compilable", différemment instrumentalisable, et en tout cas seulement lisible de ceux qui peuvent et pourront disposer d'une agrégation, d'une représentation suffisamment vaste desdites données. Donc accepter de se priver du "code", de le laisser tomber en désuétude, reviendrait - pour nos sociétés numériques - à s'interdire l'écriture et tout ce qu'elle autorise : le détournement parfois, l'explicitation souvent. Et à l'heure où le web se dirige effectivement vers une "intelligence des données", il faut redonner ses lettres de noblesse à l'écriture, au code. A ce titre, le rôle des Hackers est tout à fait salutaire. Ils disposent pour l'instant d'une maîtrise suffisante du code pour interpréter les données d'une manière "différante". Ce faisant, ils offrent une alternative à la fois possible et crédible - parce qu'incarnée - à l'agglomérat mainstream de données dans lequel nous engluent chaque jour davantage les multinationales du net, dans lequel nos pratiques, coupées de l'écriture, nous engluent tout autant. Et c'est probablement dans cette articulation complexe que le Web 2.0 prend sa vraie mesure : en nous offrant des outils nous permettant de ne nous soucier que des contenus, il nous conforte dans l'illusion d'entretenir une écriture alors que nous n'entrons que des données. Web2dizzaster (également repéré par Ecrans) illustre parfaitement ce paradoxe : quand les contenus s'effaceront, quand les données s'effondreront sous leur propre poids, seule subsistera l'écriture, le code. Mais cette écriture en sera réduite à sa plus simple expression : elle ne sera plus qu'ornementale. Et il y aura longtemps qu'en acceptant d'en perdre la maîtrise, nous en aurons perdu la profondeur, nous en aurons perdu le sens.

Et donc pour résumer le tout en une deux trois phrases ? Il faut que le Skywriting (et pas seulement académique ou universitaire) trouve sa place dans l'univers du Cloud Computing. Que "l'écriture dans le ciel" rivalise de présence avec "l'informatique en nuage." Attendons nous sinon, à de très fortes précipitations dans la manière dont nous y prêterons (notre) attention, dans la manière dont cela modèlera toute une économie de l'attention.

// Temps de rédaction de ce billet : 45 minutes //

Je mesure donc je publie ...

Publish or perish. On parle beaucoup ces derniers temps de scientométrie et d'évaluation de la recherche.
Concernant la réforme des universités tout d'abord. Le dernier rapport de l'AERES met les labos de recherche des universités en ébullition : chacun compte ses publis et les publis de ses collègues et autant vous dire que si l'effet recherché par cette grille de lecture était de déclencher une saine émulation, c'est parfaitement raté ...
Même au CNRS (où les gens ont le temps de publier ... ce qui est hélas de moins en moins le cas à l'université, tâches administratives et d'enseignement obligent), l'heure est à la fronde. Voilà pour l'agitation "politique" autour de l'évaluation. Côté scientifique, plusieurs articles et rapports permettent d'avoir une vue plus claire de la situation :

  • "The first mover advantage in scientific publication", publié au début du mois sur ArXiv, montre que quel que soit le champ scientifique concerné, les modèles mathématiques sous-jacents à l'évaluation du facteur d'impact offrent une très nette prime au premier entrant. Un article publié au début d'une thématique scientifique recevra, de toute façon, un nombre significativement plus élevé de citations que les autres. Prime à l'antériorité donc, qui n'est pas nécessairement synonyme de qualité.
  • "Characteristics of Open Access Web Citation Network: A Multidisciplinary Study, presented at COLLNET 2008 (Berlin, July 28-August 1, 2008)"(.pdf) s'intéresse à la manière dont sont cités les publications des journaux en Open Access. Voir le compte rendu de Gabriel sur Urfist Info.
  • La VRS (Vie de la recherche scientifique) publie un numéro dont le dossier central est consacré aux questions d'évaluation : n⁰374 (.pdf). Voir aussi le compte-rendu qu'en fait l'un des auteurs sur son blog.
  • Un numéro entier de la revue Ethics in Science and Environmental Politics est là encore consacré à l'évaluation et aux indicateurs. L'ensemble des articles de ce numéro sont disponibles en accès libre. J'en retiens principalement 3. Primo : "Challenges for scientometric indicators: data demining, knowledge flows measurements and diversity issues" (.pdf) qui plaide pour un "déminage" des données bibliométriques (jolie référence au "data mining") et une ouverture à de nouveaux indicateurs rendant compte de la dynamique actuelle et des nouveaux modes de publications. Deuxio : "Google Scholar as a new source for citation analysis" (.pdf) qui montre la relative priximité des métriques issues de l'ISI (facteur d'impact) et le service offert par Google Scholar (en écho, on pourra relire mes propres considérations sur le sujet). Tertio : "Validating research performance metrics against peer rankings" (.pdf), de Stevan Harnad. Il y revient sur les "promising new online
    metrics such as download counts, hub/authority scores and growth/decay chronometrics" et revient sur l'opportunité offerte par le "UK Research Assessment Exercise 2008" (évaluation nationale de la recherche au Royaume-Uni), programme dans lequel "a full spectrum of metrics can be jointly tested, field by field, against peer rankings."

Et puis si vous n'avez pas le temps pour toutes ces lectures, alors n'en faites qu'une seule : "Du mauvais usage de faux-indicateurs" (.pdf) : une note de recherche passionnante de Yves Gingras dont je vous livre quelques extraits de la conclusion :
Biblio
Et plus loin :
Biblio2

(Temps de rédaction de ce billet : 1h15)

La gestion de contenu en 2038 (ou à peu près)

============================================================================
L’ensemble du patrimoine écrit planétaire étant désormais numérisé, les supports physiques ont été dématérialisés. Bob Toile, matricule Z3950, né le 5 septembre 2008, prend ses nouvelles fonctions chez Amazoog France.
============================================================================

2038. Paris. Il est 9h00 quand Bob Toile franchit les portes de l’entreprise Amazoog France. Il vient d’être nommé BuMPS : Business Manager of Participatory Streams. Son poste consiste à coordonner la diffusion de l’ensemble des flux de données entrant et sortant de l’entreprise. Et pas n’importe quelle entreprise. Amazoog possède l’ensemble des infrastructure du second réseau : Networld2. L’internet de 1ère génération est mort.
Comme tous les BuMPS, William commence par apposer sa main sur l’interdesk : une table de travail interfacée et interactive. Grâce à la reconnaissance biométrique implantée dans l’interdesk, et aux datapuces sous-cutanées de Bob, il voit instantanément s’afficher ses trois Lifestreams, les trois brins de son ADN numérique. Laissant de côté son Personal Stream (PES) et son Public Stream (PUS), il ouvre son Business Stream. L’interdesk recompose alors instantanément l’ensemble de ses données professionnelles : coordonnées, messages, agenda, tâches, projets mais aussi toutes ses interopdocs en cours (INTERactions OPératoires DOCumentées). Son bureau est juste au dessus de l’archithèque**  intégrée d’Amazoog France. Sept cent téra-octects transitent ici chaque jour. Ils sont une centaine comme lui à coordonner l’ensemble. Entre eux ils se baptisent les « aiguilleurs ». Grâce à l’infrastructure gigantesque dont dispose Amazoog, chaque information, chaque donnée, chaque échange, chaque interaction est stockée en permanence. Bob et ses collègues s’occupent spécifiquement de l’aiguillage des échanges et des interactions. Les anciens « documents » n’existent plus. Entièrement dissous dans la colossale mémoire de Networld2, ils ne sont plus qu’un flux de données en mouvement perpétuel. Mais grâce au travail de Bob ils peuvent être « instanciés », recomposés, reconfigurés à chaque instant, pour être basculés en affichage personnalisé dans l’interdesk du profil qui en fait la demande.
A 13h, Bob descend dans l’archithèque. Chaque succursale d’Amazoog en possède une, de taille variable (bien que toujours colossale). La température y est artificiellement maintenue à 7 degrés pour éviter toute surchauffe. Les murs de ce gigantesque local sont en effet constitués d’un seul et unique interdesk. L’archithèque d’Amazoog France est spécialisée dans la gestion des flux historiques et littéraires. L’ensemble du patrimoine écrit planétaire étant désormais numérisé, les supports physiques ont été dématérialisés. Networld2 les contient tous, et peut sur simple demande les traduire dans toutes les langues parlées sur la planète. Parmi l’ensemble des supports physiques, seuls les livres sont encore systématiquement conservés par enfouissement. A l’échelle de la planète, les réserves d’enfouissement représentent l’équivalent d’un continent comme l’Amérique du sud : à 100 mètres sous terre, d’immenses entrepôts de titanium affichant un degré d’hygrométrie adapté à la conservation du papier. Les anciennes bibliothèques ont été remplacées par des guichets individuels de visionnage répartis dans toutes les rues des grandes villes, pour les gens ne pouvant pas s’offrir d’interdesk personnel. Ces guichets permettent d’adresser une demande d’accès aux différentes archithèques : Bob et les aiguilleurs récupèrent la demande, l’apparient au Personal Stream du profil qui l’envoie et retournent un flux composite avec les éléments nécessaires. Une zone de l’archithèque est réservée aux versionneurs. A l’inverse des BuMPS ils n’ont pas la possibilité d’interférer sur la circulation des flux. Leur travail consiste à maintenir des flux stabilisés et en nombre suffisant pour satisfaire aux requêtes les plus courantes adressées à l’interdesk central.
Vers 18h en sortant du travail, Bob jette un œil distrait au fronton du bâtiment d’Amazoog où scintille la devise de la firme. « Your Lifes. Our Memory. »

Vos vies. Notre mémoire.

**Clin d'oeil et excuses à Jean-Michel Salaün à qui j'emprunte, pour le détourner, le concept d'archithèque.

 

================================
Texte "de commande", paru dans la revue Documentaliste, Sciences de l'information, vol. 45, n°3, Août 2008, p.82

"Less code. More Data."

J'ai retenu trois phrases-clé de la vidéo de la table-ronde réunissant Howard Bloom, auteur deThe Evolution of Mass Mind from the Big Bang to the 21st Century, Peter Norvig, Directeur de la recherche chez Google Jon Udell, "Evangeliste" chez Microsoft et Prabhakar Raghavan, Head of Research and Search Strategy chez Yahoo!.
Première phrase clé : "Moins de code, plus (+) de données".
L'idée notamment exprimée par Peter Norvig (mais faisant l'unanimité chez les autres), est que si nous avons suffisamment de données, nous n'avons plus besoin "d'intelligence". C'est pour lui l'avenir proche de l'intelligence artificielle. Non plus singer le fonctionnement de l'esprit humain et ses capacités de raisonnement, mais s'appuyer sur l'étendue des données, des données toujours plus "intelligentes" (intelligence étant probablement ici à entendre dans le sens de l'intelligence d'un organisme en croissance exponentielle, c'est à dire sa capacité à embrasser un nombre toujours plus grand de ramifications, de recoupements, dont émergent au final des motifs ("patterns"), des représentations directement interprétables ou signifiantes. Je n'ai pas le temps de vous les retrouver mais nombre d'observateurs francophones se sont déjà exprimés sur ce "Web of Data" et sur cette "intelligence des données" (jetez un oeil chez Got et ses petites cases, dans la maison "InternetActu" d'Hubert ou encore chez Christian Fauré)
Deuxième phrase clé : "We don't need taxonomy of knowledge. We need taxonomy of desire".
Cela renvoie à toutes les analyses dérivées de la "base de donnée des intentions" de John Battelle. P. Raghavan parle également de la création d'une "place de marché des intentions" (A marketplace of intent).
Troisième phrase clé : "From a world wide web to a web wide world".
C'est cette fois Nova Spivack (modérateur de la conférence) qui s'exprime et souligne la migration du web "dans" le monde réel (cf mes propres analyses sur la dérive des continents documentaires et le passage du World Wide Web au World Life Web).

Concernant le web sémantique, Peter Norvig rappelle qu'il y a troies voies pour atteindre le web sémantique : les bases de données structurées, les formats particuliers (rdf) et ... les contenus. Les textes. Les écrits. Pour lui, la vraie sémantique est là. Dans les textes. Et là encore, pour pouvoir extraire cette sémantique, il (leur) faut d'immeeeeeeenses gisements de données textuelles. GBS ?

Indexation : Google a l'écoute.

Non non. Il n'y a pas de faute d'orthographe dans le titre de ce billet. Google n'est pas "à" l'écoute (quoi que ... mais c'est une autre affaire), mais Google dispose désormais de la capacité d'écoute en termes d'indexation. Plus concrètement, il s'agit "simplement" d'indexer, dans des vidéos ou des fichiers audio, le contenu desdites vidéos ou fichiers, "mot à mot". Ce qui permet donc à l'utilisateur de faire une recherche "mot à mot" directement dans lesdits fichiers. Démonstration. Le dispositif pour l'instant expérimental (il est encore rattaché aux Google Labs) ne tourne que sur les discours et vidéos politiques des prétendants à la maison blanche. Cette nouvelle est d'importance car l'indexation vidéo est un enjeu primordial pour les acteurs de la recherche d'information. Primo car les contenus vidéo explosent littéralement sur le net (avec d'ailleurs un impact important sur la gestion de la bande passante). Deuxio parce qu'offrir un accès "profond" à ces contenus sans changer les habitudes et les modalités de requêtage des internautes constitue la promesse d'un nouvel eldorado publicitaire.

Technologies de l'artefact : rebonds ...

Ma petite analyse de l'autre jour à propos des technologies de l'artefact et de la nécessité de (re)bâtir une heuristique de la preuve, de développer les outils et d'enseigner les méthodes d'une rétro-ingénierie documentaire, ma petite analyse de l'autre jour disais-je, trouve un écho dans un article paru dans l'édition du Monde du 10 septembre. Elle est également relayée par Narvic (dont je recommande la lecture pour ceux qui ne connaissent pas encore son blog).

<Update de 5 minutes plus tard>à lire aussi - je ne l'ai pas encore fait - "Les bidouilleurs de la société de l'information" dans le dernier Monde Diplo </Update>

Culture informationnelle, fracture cognitive, redocumentarisation de soi et plus si affinités.

Quelques extraits de mon intervention de vendredi dernier à propos des technologies de l'artefact et de la capillarité :

  • à propos des réseaux sociaux et du processus de redocumentarisation : "Dans le monde réel, nous disposons tous de « documents d’identité », factuels, lesquels documents et identités peuvent être « documentés » de différentes manières, par exemple par des services de police ou par les services sociaux. Dans le monde « virtuel », les sites de réseaux sociaux comme Facebook permettent de redocumentariser notre identité connectée, qu’elle soit ou non en adéquation avec notre identité réelle : la description identitaire est ici fragmentée, enrichie et complétée par d’autres. « Je » me définis par la manière dont je me décris mais également par la nature de mes relations, des réseaux auxquels j’appartiens, des opinions des « groupes » ou des « communautés » que je fréquente. Cette redocumentarisation particulière est à la fois très frappante et très prégnante du fait de l’essor et de l‘engouement auprès des publics jeunes des sites de réseaux sociaux. Ce qui permet d’indiquer que pour la première fois à l’échelle de la culture informationnelle, le premier terrain documentaire, c’est celui de ma propre subjectivité. C’est « moi ». L’une des toutes premières explorations documentaires de ces publics n’est plus celle d’un document physique ou même numérique : c’est celle de leur subjectivité connectée. Ceci peut peut-être expliquer un certain nombre de changements, de dysfonctionnements, de naïvetés constatées dans l’approche qu’ont les étudiants et les publics « novices » du « fait » documentaire. Une autre manière de voir les choses est de se dire que c’est là un retour au « Je suis moi-même la matière de mon livre » de Michel de Montaigne. A cette différence qu’en s’inscrivant sur Facebook à 15 ans, on n’a que très peu souvent conscience d’entrer en documentation de soi."
  • à propos de l'éducation à l'information : "il faut arriver à structurer un enseignement, une « éducation à l’information » qui accepte de s’affranchir de ses habituels repères euclidiens pour réorganiser ses fondamentaux selon troix axes. Primo : les pratiques individuelles sont indissociables de leur inscription communautaire. Deuxio : les typologies des contenus documentaires sont pour partie à revoir (à l’aune des critères précédemment énoncés). Tertio : le double mouvement de massification des accès et de marchandisation des pratiques (et des accès) conditionne l’ensemble dans le contexte d’une « économie sociale des documents numériques »."
  • à propos d'une possible fracture cognitive : "la vocation des filtres technologiques (navigateurs, agrégateurs, moteurs de recherches ...) est de disparaître ou de s’intégrer : intégration dans des artefacts technologiques plus anciens ou mieux maîtrisés, ou intégration qui peut également passer par une externalisation du service produit. Mal analysé, cet affaiblissement constant des « barrières » technologiques peut avoir un effet de contamination problématique : si on ne pense pas la culture de l’information en s’inspirant des leçons précédentes, le risque est de voir la même culture de l’information transporter des pratiques « n-1 » dans des environnements technologiques « n+1 ». En d’autres termes, le risque est de créer au mieux un décalage (effet retard ou effet diligence selon Perriault) et au pire une fracture cognitive."

Le texte intégral de mon intervention est disponible Téléchargement oegrcdi.rtf . Soyez indulgent, il ne s'agit pas d'un "article scientifique" mais d'un simple texte d'accompagnement. Il a juste pour vocation de vous permettre de mieux cerner le contenu de chacune des diapos de ma présentation. Laquelle présentation est également téléchargeable : Téléchargement oegrcdi.ppt (et sera bientôt sur Slideshare dès que le service voudra bien fonctionner).

Technologies de la capillarité et de l'artefact.

Je suis en train de préparer une intervention que je ferai ce vendredi 12 Septembre lors d'un séminaire organisé à Rennes. Le thème est le suivant : "Contextes est enjeux de la culture informationnelle, approches et questions de la didactique de l'information."
Mon intervention "Redocumentatisation du monde et culture informationnelle", peut être ainsi résumée : "quelles grandes évolutions affectent les processus documentaires, les technologies et les usages informationnels ? Quelles leçons peuvent en être tirées pour la réflexion sur la culture informationnelle ?"
Vaste programme donc ... L'occasion d'aborder deux "notions" qui m'apparaissent aujourd'hui essentielles et que je vous livre "brutes de décoffrage".
La première c'est le passage des "technologies de l'intelligence" (pour reprendre l'expression de Pierre Lévy), aux "technologies de la capillarité". La capillarité, nous apprend Wikipédia, est "l'étude des interfaces entre deux liquides non miscibles, entre un liquide et l'air ou entre un liquide et une surface." Cette emprunt au vocabulaire de la physique me permet de décrire la logique actuelle d'enregistrement et de conservation par les moteurs de recherche, de toutes les traces, actions, documents et comportements qui caractérisent et marquent notre présence connectée. Captation, par capillarité donc, de tout ce que rend possible la confusion des pratiques que génère la redocumentarisation globale du net et la dérive des continents documentaires qui le composent. L'objectif est simple : la constitution d'une base de donnée des intentions. Dernier exemple en date, le lancement très controversé de Google Chrome qui, par capillarité, agrège, rassemble et mixe des informations en provenance de sphères informationnelles jadis distinctes et non-miscibles.
La seconde c'est le passage des artefacts technologiques (navigateurs et interfaces d'accès au sens large + programmes (algorithmes) et bases de données et d'index au sens large) aux technologies de l'artefact. Ces technologies de l'artefact sont celles qui rendent possible, pour l'amateur, la création de représentations volontairement altérées et artificielles de la réalité dans une recherche (une "mimesis") de la vraissemblance. Parmi ces technologies de l'artefact (de l'artefacture dirait probablement Bruno Bachimont), on pourra citer en exemple les "Photoshop Naked Contest", les "Fake Vidéos" (comme celle de l'étoile noire volant au dessus de San Francisco), cette application permettant à tout le monde de vieillir instantanément une photo, les guerres d'édition et les tentatives de redocumentarisation déviantes sur Wikipedia. Ces technologies de l'artefact réclament d'urgence la construction d'une heuristique de la preuve, de la traçabilité de la preuve, une heuristique qui tienne compte de ces phénomènes, qui les explicite, et qui permette (c’est le plus délicat) de les « monitorer » non pas tant en temps réel mais bien a posteriori, c'est à dire dans l'optique d'une rétro-ingénierie documentaire. Une approche enfin qui tienne compte de la babélisation des expertises et qui redonne à chacun, à chaque contenu, à chaque fragment de contenu, la part d’autoritativité** qui lui incombe, et celle-là seule.
Naturellement si cela vous inspire des commentaires, ils sont ouverts :-)

**Définition de l'autoritativité par Evelyne Broudoux : "attitude consistant à produire et à rendre public des textes, à s’auto-éditer ou à publier sur le web, sans passer par l’assentiment d’institutions de référence référées à l’ordre imprimé."

Google Books : un appétit de Lyon.

Impossible de faire l'impasse sur cette nouvelle d'importance. Et c'eût été dommage de la noyer dans le fatras des petits billets de rentrée ... donc ...
Cela fait déjà longtemps qu'on en parlait, c'est désormais chose faite. Le dernier petit village gaulois résistant encore et toujours au grand numérisateur d'outre-atlantique ... ne résiste plus. Google numérisera le fonds des 500 000 ouvrages de la BM de Lyon. Cela devrait lui prendre 10 ans. Voici quelques billets incontournables pour comprendre les enjeux de ce nouveau contrat : Alain Pierrot et BiblioFrance. Je rappelle simplement qu'avec le retrait de Microsoft du marché de la numérisation d'ouvrages libres de droits (arrêt du programme Live Book Search) confortant la situation de monopole de Google (exception faite de l'OCA qui n'a cependant pas les mêmes finances et donc le même rythme de croisière ni la même force de frappe), et avec les temps de disette culturelle qui se confirment chaque jour davantage, la question d'une alternative publique "crédible" ne méritera bientôt - hélas - même plus d'être posée. Faute de grives ... on pourra toujours s'occuper en relisant divers guides de bonnes pratiques pour une numérisation réussie ...

Sur ce sujet, prenez également le temps de lire la réaction en forme de coup de gueule de Jean-Claude Guédon, postée sur Biblio-fr, dont je reproduis ici un (large) extrait et que je partage entièrement (cf mes nombreuses alertes à propos du risque d'un eugénisme documentaire):

  • " (...) La numérisation à la Google est un piège. En effet, le document numérisé demeure la propriété de Google et la bibliothèque impliquée doit empêcher tout autre moteur de recherche autre que Google d'indexer sa collection numérisée. En d'autres mots, Lyon pourra consulter la version indexée en interne, et ne pourra exposer au reste du monde que du "papier numérique" (pages images). Il est vrai que nous aurons ainsi accès à des milliers de livres rares, mais ces ouvrages ne seront disponibles que sous la forme de pages-images que l'on ne pourra que lire. Toute recherche plein texte devra s'effectuer par le truchement du site de Google. Toute autre opération sur le texte sera impossible, sauf à refaire le travail de reconnaissance des caractères. Bref, le "cadeau" de Google, c'est un document numérique aussi proche du papier que possible. (...) Ce que Google recherche actuellement, c'est un monopole sur la capacité d'appliquer toute forme d'algorithmique à la documentation numérique mondiale. En bref, Google veut devenir le système d'exploitation de la documentation numérique et pourra ainsi contrôler toutes les opérations de récupération, identification, analyses sémantiques, etc. que l'on peut effectuer ou imaginer dans le monde numérique. Il y va de la mémoire collective de tous les peuples; il y va aussi de l'accès à l'information (et sa manipulation), etc. Bref, il y va de conséquences fondamentales pour la culture et la vie politique mondiale. Bravo, Lyon ! Vous voilà complice d'un magnifique holdup culturel !
    Une alternative beaucoup plus intéressante aurait été L'Open Content Alliance. C'est un peu moins efficace, un peu plus coûteux, et un peu plus lent, mais c'est entièrement libre. Malheureusement, le mirage d'une numérisation de masse rapide et gratuite conduit à ignorer ou négliger les côtés plus subtils du cadeau empoisonné de Google. Google a su produire une offre qui détient un réel pouvoir de fascination pour certains bibliothécaires. C'est regrettable, mais cela révèle aussi les limites de certains bibliothécaires, ceux qui jouent avec Google (comme l'on joue avec le feu) : ce sont de parfait spécialistes des incunables numériques et ils observent l'avenir dans leur rétroviseur (pour
    reprendre une formule bien connue de Marshall McLuhan).

    *Jean-Claude Guédon*
    *Université de Montréal*

Je ne croie pas en revanche (je n'ai jamais cru), comme l'analyse Jean-Michel, que le livre soit une danseuse pour Google, une maîtresse que l'on (qu'il) entretient à fonds perdus. Et ce pour plusieurs raisons que je vais brièvement résumer :

  • Primo, rien dans les pratiques de Google (corporate management) ne laisse place à la notion de "danseuse". Les fameux 20% de temps octroyés aux employés pour qu'ils travaillent sur des projets à eux n'ont de sens que dans la mesure où ils permettent de faire émerger des projets et des applications rentables pour la firme (Gmail, GoogleMaps ...).
  • Deuxio, en accord avec les arguments de Jean-Michel (mettre en place une barrière d'entrée suffisamment haute sur le marché de la numérisation de masse, s'attirer les faveurs d'une partie des intellectuels), le service GoogleBooks tient également une place de choix dans l'écosystème algorithmique de la firme : la base de connaissance ainsi constituée n'est probablement pas étrangère aux remarquables capacités de traduction automatique du même Google.
  • Tertio, même si, comme le note encore Jean-Michel, l'arrivée de Google sur ce marché "n'a pas modifié l'économie du livre, ni celle des bibliothèques", elle a en revanche considérablement fait bouger les lignes. Elle a contraint l'ensemble des acteurs de la chaîne du livre (des éditeurs aux auteurs en passant par les libraires et les bibliothèques) à se (re-)positionner. Davantage encore, elle a pris une place à l'horizon du débat sur la numérisation de masse au regard de laquelle chacun doit placer ses pions et redéfinir ses stratégies dans un mouvement de jeu initié là encore par le même Google et son service GoogleBooks. L'impact sur l'économie du livre et des bibliothèques pourrait dès lors être tout à fait retentissant lorsque le marché de la lecture électronique (liseuses notamment) prendra son véritable essor.

Je pourrai lister d'autres arguments mais ce serait un peu long pour un billet de rentrée, donc je résume : une danseuse qui s'inscrit dans une stratégie globale de management, un danseuse dont les effets d'optimisation sur des services tiers sont certainement importants (d'aussi loin en tout cas que l'on puisse en juger), une danseuse qui modifie les postures et les stratégies d'un ensemble d'autres acteurs, d'individus et de corporations ... ne me semble pas vraiment correspondre à la définition d'une danseuse ;-)

Dans un monde ou la circulation, le flux, prennent chaque jour davantage le pas sur l'inscrit, sur le fixe, le service GoogleBooks, plutôt qu'un danseuse, pourrait rapidement s'avérer être une pièce maîtresse dans le jeu du contrôle de l'accès aux contenus et du formattage des pratiques afférentes.

Et puis encore ... Repérés par Alain Pierrot, ces 3 articles du dernier congrès de l'IFLA dont celui consacré à l'accord de la bibliothèque de Bavière avec Google (.pdf) a retenu mon attention. Il n'offre aucun scoop mais livre une foule de détails intéressants, dont celui-ci :

  • "la coopération entre Google et la BSB implique que, pour la première fois dans l'histoire des bibliothèques allemandes, un projet de numérisation à l'échelle industrielle soit planifié techniquement et logistiquement. Une "sélection" d'ouvrages est faite uniquement en fonction de leur état - et donc la capacité de ceux-ci à être scannés dans une perspective de conservation, et selon certaines exigences de taille et de volumes dues à la technologie de numérisation propriété de Google. (...) Il faut souligner dans ce contexte que le critère "conservation", sous-jacent à la décision de déclarer un ouvrage en état satisfaisant pour être numérisé ou non, a été décidé conjointement par la BSB et Google. En cas de doute, le verdict final est toujours rendu par la bibliothèque. (...) Les normes de qualité fixées en accord avec Google comprennent également une marge de manoeuvre, comme il est d'usage dans ce genre de projets financés par des fonds privés. La BSB a eu la chance de ne pas appartenir aux membres fondateurs de ce projet, lancé par Google en 2004, mais aux membres "tardifs", qui profitent aujourd'hui des ajustements technologiques continuellement apportés par Google."

Navigateur Chromé et WebOS jantes alliage

Attention, ça va buzzer. Google vient d'annoncer (1er Septembre) sur son blog officiel le lancement de son navigateur open source maison. Nom de code : Google Chrome. Le pré-lancement s'est effectué de manière originale via la mise en ligne et la distribution ciblée d'une BD de 50 pages (réalisée par Scott McCloud, une référence dans le domaine) présentant les fonctionnalités dudit navigateur. Le lancement est prévu pour le 2 septembre (aujourd'hui) dans 100 pays. Aucun lien de téléchargement n'est à cette heure disponible.

Les arguments et fonctionnalités mis en avant dans ladite BD sont (seraient ...) :

  • la stabilité (pour éviter les plantages en différenciant et en "autonomisant" chaque onglet comme autant "d'applications"),
  • la rapidité (notamment pour le chargement de java), la sécurité (hum ... hum ...),
  • la perfectibilité (Chrome est Open Source et a bénéficié de la large communauté de développement autour de Mozilla/Firefox)
  • la synchronisation (installation native de GoogleGears) : élément clé, cette synchronisation étant en effet (comme je me plais à le répéter), une pierre angulaire déterminante pour déployer un webOS.
  • L'utilisation des ressources mémoires (point certes plus technique mais important ...) : l'idée est en gros la suivante : un onglet = un processus. Si je ferme l'onglet, j'arrête le processus (ce qui n'est pas nécessairement le cas dans les navigateurs actuels et ralentit très souvent les navigateurs tout en mobilisant beaucoup de ressources mémoire).
  • Simplicité et ergonomie : les onglets ne seront plus en dessous mais au-desus de la barre de recherche (comme dans le navigateur Opera). Google indique (c'est à mon sens un élément clé) que le browser et les "tab process" (processus tournant dans les onglets) seront séparés. Le navigateur est donc bien une fenêtre sur le monde (j'ai bien dit une "fenêtre", en anglais "windows", donc browser = OS) et les onglets ses applications. Chaque onglet est indépendant, avec l'affichage de sa propre barre d'adresse.
  • Captations mémorielles : et puis bien sûr, Google ne serait pas Google s'il n'y avait pas dans ce lancement une nouvelle OPA sur nos comportements et ressources mémorielles (externes et objectives : le web) et mnémoniques (internes et subjectives : nos comportements, nos habitus, nos historiques de recherche). Le truc s'appelle "omnibox" et s'inspire de la nouvelle barre de recherche Firefox (dont j'oublie le nom ...) en ce sens qu'il ne permet pas seulement de rechercher la présence d'un mot dans des URL, mais : propose aussi des suggestions de requêtes (comme Google Suggest), farfouille dans les pages que vous avez le plus visitées, vous propose des pages que vous n'avez pas encore visitées mais qui sont "populaires" (résurgence du PageRank ?), et last but not least, propose une recherche full-text dans votre historique de recherche. Cette dernière fonction est d'importance car elle marque, en quelque sorte, la fin des bookmarks. Je m'explique : j'avais déjà il y a longtemps eu l'occasion d'écrire que l'arrivée de Google comme moteur de recherche rendait quasiment caduque l'utilisation des signets. Plutôt que de "marquer" des pages (processus tout de même assez fastidieux même si le web 2.0 - del.icio.us - lui a redonné ses lettres de noblesse) il suffisait de saisir le nom du service dans Google (ou dans la barre de recherche de Firefox), pour retomber instantanément sur ledit service ou le voir apparaître en première place dans les résutlats de recherche. J'avais à l'époque indiqué que Google se constituait ainsi autour d'une double "identité" : moteur de recherche bien sûr, mais aussi moteur "de sources". L'omnibox du navigateur Chrome marque donc une nouvelle étape : plus besoin de "bookmarker" une page, il suffira de resaisir la requête qui avait permis d'y accéder ("photo numérique" par exemple) pour retomber sur la page du catalogue FNAC présentant un comparatif de prix (par exemple toujours). Une prothèse mémorielle supplémentaire donc (à condition d'activer l'historique de recherche et de naviguer "en session" google ... ce qui sera sûrement proposé par défaut). Nouvelle prothèse, et probablement nouvelle entrave.
  • Utilisabilité personnalisée : autre petit gadget : quand vous ouvrez un nouvel onglet, au lieu de vous proposer une page blanche ou un site paramétré par défaut, Chrome vous présentera "vos" neuf pages les plus visitées ainsi que les mots clés que vous utilisez le plus (cf copie d'écran plus bas ... laquelle copie d'écran fait étrangement penser à un univers Netvibes).
  • Privauté : il sera possible de créer un onglet en mode privé ("incognito mode") dans lequel vous naviguerez anonymement et qui effecera les différents cookies quand vous le fermerez. C'est bien, mais cela veut surtout dire que dans tous les autres onglets, et par défaut, vous ne serez pas anonymes ...
  • Sécurité : Chrome téléchargera "en permanence" une liste de sites pratiquant le phishing ou dotés de différents "malwares" et vous avertira lors d'une de vos visites sur ces sites. Soit Google = gendarme du net.

Googlechromess

Donc ?
Côté navigateurs : Google était jusqu'ici (et reste) le principal donateur de la fondation Mozilla. En termes de parts de marché, Internet Explorer est donc directement ciblé et convié à un enterrement de première classe (même s'il reste le navigateur par défaut du plus grand nombre d'OS dans le monde. Faudra donc attendre un peu avant de prononcer l'oraison funèbre). Quant à Mozilla/Firefox, même si officiellement on indique ne pas se faire trop de souci, on sait aussi qu'il n'y aura pas nécessairement de la place pour tout le monde, et on anticipe en réfléchissant au déploiement d'une suite de services en ligne. Bref on songe à se déversifier ...
Côté stratégie : limpide (d'aussi loin que je puisse en juger ...). Une confirmation en tout cas. Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. Evolution largement annoncée et analysée (dernière analyse en date signalée dans mon billet de rentrée : celle de Nova Spivack). Enfin, rappelons que le déploiement d'une interface open-source pour un webOS n'est viable que si l'on contrôle suffisamment la chaîne de production, de traitement et de monétisation de l'information circulant dans ledit WebOS. Et il ne paraît pas aujourd'hui aberrant de considérer que Google contrôle de facto une bonne part de cette chaîne, ce qui le place en dehors d'un risque concurrentiel immédiat et l'autorise à se parer des atours et des vertus de l'Open source

Ailleurs dans la blogosphère : nombre de chroniqueurs se sont déjà fait le relai de ce lancement. J'ai retenu Ecrans, le billet de Tristan Nitot (et ses commentaires) pour avoir le point de vue en français de la fondation Mozilla, celui de Sébastien Billard (qui complète certains aspects techniques que je n'ai pas pris le temps de développer dans mon billet), et Emmanuel Parody, ce dernier présentant à mon sens l'analyse la plus pertinente de cette annonce. A la lecture du billet d'Emmanuel on s'aperçoit que tout "l'argumentaire de vente" autour de ce navigateur était habituellement dévolu aux systèmes d'exploitation (fiabilité, sécurité, ressources mémoire, etc ...). Je conclue en vous redonnant la fin de son analyse :

  • " (...) si chaque onglet (”tab”) peut fonctionner en toute indépendance et se séparer du corps du navigateur et si dans chaque onglet nous ouvrons une application, alors nous avons reproduit via le navigateur l’exact fonctionnement d’une suite d’applications. (...) et il ne reste plus grand chose qui nous sépare de la suite de logiciels. C’est exactement ce que démontre la présentation de Google Chrome. Saut ultime. Plus besoin de PC complexe, place au terminal connecté au web."

Y va y'avoir du sport ... En tout cas une belle manière de fêter les 10 ans de la firme. Un anniversaire qui pousse à faire le rapprochement avec une autre grosse firme américaine :

(Temps de rédaction de ce billet : 2 heures // Sources : sous les liens)

Google et son pot de Knol.

Knol fait quoi ?

Six mois après les effets d'annonce, Google lance enfin Knol, son projet d'encyclopédie "marchande". A noter au travers des différents billets s'étant fait écho de ce lancement : la possibilité de piocher directement des illustrations dans l'archive des "cartoons" du New Yorker (source), la possibilité d'utiliser différentes licences creative commons (cf copie d'écran ci-dessous), la possibilité "de choisir qui peut éditer vos articles (Ouvert, avec modération ou fermé)" (source), la possibilité d'activer l'affichage de liens publicitaires (ou pas), et le fait que tous les liens sortants seront en NoFollow (source), tirant ainsi les enseignements de ce qui arriva à Wikipedia.

Knol pourquoi ?

Globalement, les différents observateurs s'accordent sur deux points : primo, à la date de lancement de
Knol, on compte essentiellement des articles médicaux (ce qui est tout sauf un signal faible ...), et deuxio, ce projet n'a pas grand chance de concurrencer Wikipedia (seul Christian semble y croire). En revanche, il a de grandes chances de reformater le sens du projet encyclopédique du XXIème siècle vers un alignement, une superposition de deux écritures : l'écriture du "savoir" (écrire pour comprendre) et l'écriture de la publicité (écrire pour être vu).  Pour le reste, j'ai déjà dit tout le mal que je pensais de ce projet ... <Mauvaise foi>Si vous ne me croyez pas, comparez deux entrées tout à fait triviales de l'un et l'autre projet encyclopédique. Pour l'entrée "Toilettes", Wikipedia nous entraîne de l'ancienne cité d'Harappa jusqu'aux derniers avatars défécatoires d'un post modernisme assumé quand Knol nous propose uniquement d'apprendre ... à les déboucher en affichant moult plombières publicités. C'est tout dire :-). </Mauvaise foi> Plus sérieusement, l'approche qui semble mise en avant par Knol est une approche "How To". Comment ... "déboucher ses toilettes ?", "dépister un cancer du sein ?", etc.

Bref, Knol ne me parait pour l'instant pas avoir grand chose à voir avec Wikipedia. Il est par contre tout à fait adapté à l'écosystème Google et devrait lui permettre rapidement de pouvoir "monétiser" une grosse partie du traffic encyclopédique habituellement dirigé (à fonds perdus puisque non publicisés) vers Wikipedia. Ce qui est bien l'objectif premier du projet :-) (un second objectif étant probablement de servir de base de connaissance à Google Health, mais j'y reviendrai dans un prochain billet)

Knol procédural VS Wikipedia déclarative ?

Un positionnement qu'il est intéressant de replacer dans un (très rapide) historique (subjectif) de la "tentation encyclopédique" sur le réseau. Ce genre d'approche - et de tentation - est effectivement consubstantielle au net depuis son origine.

  • Elle émergea très tôt au travers des célèbres FAQs (Foires Aux Questions) : un individu répond "es qualité" (webmaster, éditeur, auteur ou "spécialiste") à sa communauté d'usage, sur des points très ciblés. L'autorité est ici constamment maintenue, affichée, lisible. Le principe est celui d'un ordonnancement, d'une rationalisation pensée, en l'occurence celle des questions les plus susceptibles d'être posées.
  • Passé l'ère des FAQs sur les sites webs, vînt ensuite l'ère des projets "Bidule-Answers" (Yahoo!Answers et consorts) : le principe est ici différent : n'importe qui peut répondre (parfois n'importe quoi) à n'importe qui et sur n'importe quel sujet. La dissolution de  l'expertise est ici totale. Seule compte la temporalité (promptitude, instantanéité) de la réponse. Le principe est celui de l'agglutination (les différentes réponses s'empilent les unes sous les autres) sans autre discrimination que temporelle ou "élective" (il est possible de voter pour telle ou telle réponse).
  • Le troisième temps est celui de Wikipedia. Un palimpseste planétaire de connaissances. Je vous renvoie à la rubrique idoine d'Affordance ou à ma dernière "synthèse" sur cet inépuisable sujet.
  • Le quatrième temps sera celui de Knol, mais il n'enterrera pas pour cela Wikipedia. Car Knol me semble concourir sur un autre terrain. Là où la logique d'accumulation des connaissances dans Wikipedia est clairement déclarative, celle de Knol (même s'il est encore un peu tôt pour être affirmatif et s'il ne s'agit pour l'instant que de pistes d'analyses ...) apparaît plutôt procédurale (question du "comment faire...", "comment dépister ..." ...). Parallèlement à cette macro-approche procédurale (qui n'empêche pas d'avoir des micro-knols déclaratifs sur tel ou tel sujet, tel ou tel concept), l'autre caractéristique de ce quatrième temps est celui de la mise en concurrence des expertises par processus de labellisation de l'auteur (Knol vous "reconnaît" comme expert en s'assurant de la levée de votre anonymat, mais Knol ne vérifie en rien les titres et diplômes dont vous vous parez). Labellisation fantôche donc pour Knol, contre babélisation fantasque pour Wikipedia. L'alibi qualitatif pour Knol, le vertige quantitatif pour Wikipedia. 2 mondes.

Conflits d'intérets en vue ...

L'une des principales questions que Knol va poser dans un très proche avenir est celle du conflit d'intérêt suivant : la "mise en avant" du contenu de Knol au sein des résultats de recherche de Google (nonobstant une prudente mise en avant du NoFollow sur les liens sortants). Sur ce sujet, il faut lire d'urgence l'article de Jason Calacanis (pour qui Google est devenu un authentique fournisseur de contenu - voir aussi la synthèse qu'en fait Martin Lessard), ainsi que l'édito de Wired (ou pour les plus pressés, la synthèse en français de Jean-Marie Le Ray. De fait, il y a de mon point de vue longtemps que Google est devenu un fournisseur de contenus, notamment via ses innombrables rachats (Blogger, YouTube). De fait également, il est tout à fait évident que lesdits contenus des susmentionnés services bénéficient d'un référencement plus "aisé" que d'autres ne gravitant pas dans l'écosystème de services du moteur.

Mythologies.

Google en tant que mythologie contemporaine présente un nombre de plus en plus grand de similitudes avec le mythe de Cronos. Comme lui son histoire commence par une castration : celle de la bibliométrie de Garfield, "amputée" de son rattachement à un circuit de diffusion classique et contrôlé (modèle des revues et de l'évaluation par les pairs) au profit d'un chaos fécond (le web). Comme lui il dévore et ingère ses enfants (Youtube, Blogger, Picasa et tant d'autres furent des petites - ou moyennes - start-ups avant d'être happées par le monstre ...). Comme lui, cette dévoration peut être lue comme le symptome d'une crainte : celle de voir l'un de ses enfants se retourner contre lui une fois atteint son âge adulte. Comme lui, il envoie l'essentiel de ses frères moteurs dans les profondeurs du Tartare, le laissant seul à son hégémonie (parts de marché et de traffic). La fin de l'histoire de Cronos est connue, celle de Google reste à écrire, mais (et j'arrête là avec les analogies mythologiques), il est clair - et le lancement de Knol ne fait que le confirmer - qu'il ne peut y avoir que trois issues à une telle appétence : soit le contrôle total, en amont et en aval, de l'accès à l'information et à la connaissance ; soit un final façon la grande Bouffe, c'est à dire l'effondrement de l'ogre sous le propre poids de son appétence ; soit la naissance d'un fils échappant à cette appétence qui à son tour, pourra tuer le père. Et dans cette dernière option (je reprends là mon analogie mythologique), je verrai bien Wikipedia en mère nourricière, telle Gaïa soustrayant un certain Zeus à l'appétit de son père, et du ventre de laquelle naîtront les initiatives sur le terreau desquelles une nouvelle mythologie s'écrira, une nouvelle génération de moteurs naîtra (songez à Trueknowledge ou encore Powerset, moteurs "sémantisés" travaillant avec Wikipedia comme base). 

Knol encore ...

Pour approfondir et/ou mesurer rapidement les principaux tenants et aboutissants du bidule : voir le billet très complet de Danny Sullivan et celui d'Astrid Girardeau dans Ecrans. A lire également les impressions de FredCavazza pour qui "Knol pourrait bien officialiser la création d’une nouvelle catégorie d’outils de publication qui apportent une information différente des blogs et wikis : un résumé ou plutôt une aggrégation / synthèse réalisée par un auteur identifié." De mon point de vue ces outils existent déjà. La "nouveauté" ne me semble pas résider dans la capacité d'aggrégation et le rattachement à un auteur identifié, mais plutôt dans la cohabitation des deux écritures susmentionnées (écriture du savoir et de la publicité), cohabitation qui ne se fait plus en terrain "neutre" (comme dans certains blogs par exemple), mais au sein d'un projet "labellisé" encyclopédique, qui confère donc à cette cohabitation une légitimité a priori. Heureusement, tous les a priori sont discutables ... 

Ci-dessous une copie d'écran des fonctionnalités proposées lors de la création d'un Knol.

Knol

Et puis pour finir sur un clin d'oeil ... le meilleur moyen de découvrir Knol, c'est encore de consulter l'article de Wikipedia qui lui est consacré :-) (et tout particulièrement les liens figurant en référence de l'article). Une chose est sûre en tout cas, les dîner de knols vont se multiplier ;-)

Dinerdeknol

Un dernier Knol mot.

Une dernière chose encore. Knol n'est pas un projet encyclopédique. Il ne vise pas la connaissance. Parce que la connaissance ne peut pas être la seule mise en concurrence des savoirs (le principe de Knol est que plusieurs "knols" concurrents peuvent être rédigés sur un même sujet, la prime allant au plus accédé, comme c'est l'usage dans l'écosystème Google). La connaissance est avant tout la définition et l'acceptation d'un concensus.  « Le savoir affecte forcément une forme circulaire : c’est en effet la seule manière de se représenter un ensemble de données diverses tel que chacune renvoie à toutes les autres et ait perspective sur toutes les autres. (...) Ce savoir n’est pas simplement cumulatif (...) mais circulaire parce qu’il y a une circulation du savoir d’un point quelconque à tout autre point possible. Sans doute cette circulation se fait elle le long de certains axes perspectifs qui seront par habitude plus fréquentés que d’autres à l’intérieur du tout, mais dont la commodité ne tient jamais finalement qu’à un état momentané du savoir, à un équilibre météorologique métastable. » Varet G., Histoire et savoir - Introduction théorique à la bibliographie : les champs articulés de la bibliographie philosophique. Paris, Les Belles Lettres, 1956.

Le pot de Knol est d'abord et avant tout un pot de miel publicitaire. Et on n'attire pas les mouches nouveaux encyclopédistes avec du vinaigre.

C'est la rentrée ...

Allez, hop hop hop, au boulot. Fini de lézarder. D'autant qu'il s'est passé plein de choses en deux mois ...

Côté encyclopédies :

  • la série rafraîchissante d'Ecrans sur "Inside Wikipedia". Episode 1 : Wikilove. Episode 2 : Wikipompiers. L'intégralité de la série à lire ici.
  • A ne pas manquer, le regard d'Hervé (Le Crosnier) sur l'édition papier de la Wikipedia par Bertelsman et la rémunération de ses ... 90 000 auteurs ...
  • Et puis bien sûr, lancement par Google de son projet encyclopédique baptisé Knol. Gardez patience, le prochain billet y sera entièrement consacré ;-)

Côté Moteurs (enfin ... surtout côté Google ...) :

  • A ne pas manquer : un article de Chris Anderson dans Wired sur l'âge du Petabyte et son héraut (Google). Article court, brillant et relativement impossible à résumer puisqu'il montre en une seule page quels sont les liens entre les théories scientifiques, la fin des théories scientifiques, le moteur de recherche Google, la puissance calculatoire, les avancées de la génomique, l'informatique distribuée, la nouvelle "science des données" et quelques autres trucs encore. Allez, filez le lire et vous comprendrez certainement un peu mieux la manière dont chacun d'entre nous est relié à la machine. 
  • un débat chez Google France sur l'économie numérique avec une conclusion d'Eric Besson. A écouter notamment vers la 67ème minute le point de vue des intervenants (entreprise) sur un aspect du débat autour de la net neutrality (taxation des recettes publicitaires sur internet). J'ai simplement retenu que pour Eric Besson, le fait d'envisager de "prioriser par exemple des données relatives à la télésanté" n'est pas nécessairement une atteinte au principe de neutralité du net. Pour les autres aspects - cruciaux - de la Net Neutrality, voir par exemple ce billet de Martin Lessard : "étrangler le Net".
  • Alors que Google croyait en avoir définitivement fini avec le Google Bombing, voilà-t-y-pas que le Google Bombing ressurgit dans l'outil Google Trends.
  • Pour ceux qui s'en inquiéteraient, Google se porte - toujours - financièrement très bien : chiffres complets ici et résumé sur Zorgloob. Côté "part de trafic", ça va aussi.
  • Un très bon dossier documentaire réalisé par 3 étudiants du cycle supérieur de l'INTD : "Les rapports de Google avec la justice" (.pdf). La première partie du dossier est une recension des procès et actions en justice contre Google, la seconde se focalise davantage sur l'exploitation des données personnelles. Très utile pour avoir une vision "fine" d'un justiciable pas comme les autres.
  • Dans la série "publicisons, publicisons, il en restera toujours quelques chose", LiveSearch (Microsoft) s'installe dans la motorisation de Facebook. (Rappelons pour mémoire que Google motorise - et constitue la régie publicitaire de - MySpace). Voir aussi pourquoi Jérôme Charron s'en félicite.
  • Pour les Googlophiles anglophobes, découverte de Goopilation, un blog qui traduit en français les billets de l'ensemble des blogs officiels de Google.
  • Et puis, et puis ... en septembre 2005, Google faisait disparaître de sa page d'accueil la mention du nombre de pages indexées, laissant les compteurs de notre imaginaire collectif baguenauder librement. Dans un billet en date du 25 Juillet, sur son blog officiel, Google annonce que son crawler a franchi une étape ("a milestone") : 1000 milliards d'adresses uniques détectées, ce qui, comme le rappelle Jean Véronis n'est pas la même chose que le nombre de pages indexées, mais qui est "déjà très impressionnant". Au-delà de son effet subliminal dans l'inconscient collectif (= "c'est Google qui a la plus grosse" ... base d'index), cette annonce révèle ce qui est l'un des tournants marquants dans l'histoire des moteurs de recherche : la principale difficulté, le principal objectif, n'est plus la capacité à atteindre un grand nombre de données (et à les réactualiser en temps réel), mais bel et bien la capacité à faire le tri entre le bon grain et l'ivraie, entre ce qui doit être indexé et ce qui ne doit pas l'être. Soit un retour à la raison d'être et aux fondements de leur algorithmie.
  • En parlant d'algorithmie justement, du côté de Yahoo! on semble s'intéresser de près à la mode des moteurs à la carte. Mais si souvenez-vous, ces moteurs "construits par l'internaute" et faisant de chacun de nous un autarcithécaire en puissance. Yahoo! a donc lancé le service BOSS (Build Your Own Search Service). Pour ne pas répéter ce que d'autres ont très bien décrit, allez lire le billet de Jérôme Charron sur le sujet. La stratégie de Yahoo! paraît claire : étant donné que le monde compte nombre d'excellents développeurs plein de bonnes idées, et étant donné qu'actuellement aucun d'entre eux ne peut bénéficier d'un équivalent de la base d'index de l'un des grands moteurs majeurs, il s'agit donc de leur offrir un accès à cette base, de les laisser bidouiller en postulant qu'il y aura probablement dans le lot une bonne ou une très bonne idée dont on pourra alors librement s'inspirer. Et dans le cas contraire, pendant qu'ils font joujou chez Yahoo!, ils ne vont pas monter de projet concurrent ;-).
  • La dérive des continents documentaires (voir ici) se poursuit, avec cette dernière étape clé de la synchronisation de nos moments connectés / non-connectés : après GoogleDocs et GoogleReader, c'est GMail et GoogleCalendar qui devraient être accessibles via GoogleGears. Rappelons, pour tenter de clarifier la "stratégie" de Google en la matière, que la synchronisation de ces applications est l'un de piliers incontournables du "webtop" ou du "WebOS", webtop dont on reparlera plus bas dans ce billet de rentrée.
  • L'une des dernières études du PewInternet nous apprend que si en 2002 seulement un tiers des internautes utilisaient un moteur de recherche pendant leur journée connectée, ils sont maintenant la moitié à le faire (49%). Les autres "habitudes" sont (de la plus à la moins fréquente) : l'e-mail, la recherche en ligne, la consultation d'actualités ("checking news"), et la consultation de la météo.

Côté Moteurs, outils ET bibliothèques :

  • Je vous l'avais annoncé avant les vacances, la bibliothèque municipale de Toulouse est désormais sur FlickR. Pour les détails et les motivations de cette (remarquable) opération, voir le message posté sur biblio-fr. Une Flickerisation des bibliothèques qui fait flores (6 à ce jour) comme en témoigne cette nouvelle initiative lue chez André Gunthert : "la George Eastman House est le premier grand musée de photographie à mettre en ligne en libre accès dans la section des Commons de Flickr plusieurs extraits de ses collections." Sans oublier, comme le rappelle Patrick Peccatte en commentaire du billet d'André, "les institutions présentes sur Flickr qui présentent des fonds intéressants mais pas sous le régime des Commons, comme la Biblioteca de Arte-Fundação Calouste Gulbenkian." Je croie qu'il y a là l'amorce d'un mouvement de fond (et de fonds ;-), dont l'impact à moyen terme pourrait être assez semblable à celui des projets de numérisation (Google Books).
  • et puis bien sûr, l'annonce de la numérisation de la BM de Lyon par ... Google. Là encore, un peu de patience, c'est le sujet d'un prochain billet.

Côté bibliothèques ...

  • Le discours de Barak Obama : sources, références et larges extraits à lire chez Jean-Michel Salaun.
  • Côté bibliothèques ET revues : Valérie Pécresse (ministre enseignement supérieur) et son copain Bruno Racine (BnF) avaient bien caché leur jeu. Le ministère de l'enseignement supérieur vient d'annoncer le déblocage de 10 millions d'euros pur la création d'une archive pour les revues de recherche françaises. L’objectif de cette archive est de conserver sur le long terme les revues scientifiques qui ont un faible usage. Cette archive sera sous la responsabilité de la BnF qui assurera également l’accès aux articles, sur support papier ou électronique, par son service de fourniture de documents. Ah ben non désolé. Fausse alerte. C'est pas en France. C'est au Royaume-Uni. A mettre en balance avec l'approche et l'existant hexagonal.
  • Et puis les diaporamas du dernier congrès de l'ABF (blog du congrès) sont regroupés en ligne sur le site de l'ABF.

Côté livre/document/lecture numérique :

  • André Gunthert nous livre une belle analyse d'un beau concept : la lecture exportable (ou les affres d'un copyright en bout de course). De mon côté je prolongerai bien l'analyse d'André en indiquant que ce qu'il décrit à juste titre comme une lecture exportable est en fait la réalisation concrète la plus proche de l'idée originale de transclusion (chez Ted Nelson - père fondateur de l'hypertexte - la transclusion désigne des contenus non plus "inclus" mais situés simultanément à divers endroits, sans altérer pour autant leur localisation originale ... pour plus d'infos voir sous le lien précédent).
  • L'iPhone devient liseuse : Virginie Clayssen rappelle à quel point la nouvelle pourrait être d'importance pour le décollage et la structuration d'un marché du livre électronique.
  • A lire : les enjeux du livre au format de poche, une étude de 8 pages de la DEPS, qui ne se termine pas par hasard sur "la perspective numérique", au moment où l'on parle de plus en plus d'une date limite de consommation des livres sous forme papier.
  • Et pendant que l'on réfléchit de plus en plus activement ici ou là sur l'avenir de la chaîne du livre à l'heure du numérique, le rouleau compresseur continue d'avancer : Amazon met la main sur AbeBooks (via Hervé Bienvault)

Côté biblio-scientométrie

  • la face cachée de la bibliométrie existe, et plus simplement au sens figuré. Pour organiser - selon des critères bibliométriques (taux de citation / date de parution de l'article / ... )  - les résultats issus d'une interrogation de la base Medine, imaginez que la liste desdits résultats soit ... une liste de visages dont le froncement des sourcils ou le sourire (ou l'absence de sourire) seont autant d'indicateurs vous permettant d'anayser lesdits résutlats et de mieux vous y orienter. Pas clair ? OK, une image :
    Facebib
  • le site reprend en fait la théorie des visages de Chernoff (voir ici ou pour une définition de ladite théorie) en l'adaptant aux usages scientométriques et en la faisant "tourner" sur une base d'articles scientifiques (PubMed). Gadget diront certains. Sûrement. Sûrement. Aussi sûrement que cela ouvre autant de pistes du côté d'une "humanisation" littérale des résultats de recherche. La source : ici. Pour jouer avec : .

Côté Science 2.0

Côté Web 2.0 ...

  • une petite bibliographie autour du web 2.0 mêlant articles scientifiques, thèses, ouvrages et études diverses, le tout accessible gratuitement.
  • Une jolie mise en image des différents services sociaux autour du web 2.0.
  • Je vous ai souvent parlé (en conclusion de ce billet par exemple) de l'inexorable avançée d'un mouvement d'externalisation de nos mémoires (intimes ET documentaires), lequel, conjugué à une informatique ambiante (everyware) et à une redocumentarisation du monde (internet des objets) et de l'homme (l'homme est un document comme les autres), donne littéralement corps à un hypercortex planétaire. Le résultat à court terme - 2040 -, et en termes beaucoup plus clairs (:-) est expliqué dans un édito du 16 Juillet de Wired, édito chroniqué, résumé et traduit sur InternetActu : "La machine unique pour les relier tous".
  • Prenez la plus grosse base de donnée iconographique gratuite de la planète (FlickR). Prenez ensuite l'une des toutes premières agences commerciales de diffusion de photo (Getty Images). Imaginez un accord entre les deux permettant à la seconde (Getty) de piocher à volonté dans la première (FlickR) pour en revendre le contenu en reversant 20 à 40% de la somme récoltée au photographe amateur. Et vous aurez un système gagnant-gagnant et un exemple très parlant de la manière dont les pro-am deviennent un incontournable levier de l'économie de la longue traîne.

Côté Web 2.0 et après ...

  • Après le Web 2.0, il y a naturellement le cloud computing. Hervé Le Crosnier signe un papier lumineux sur le sujet dans le Monde Diplo. Didier Durand signale un intéressant white paper d'évangélisation (technique) en provenance de chez Amazon : Cloud Architectures (.pdf)
  • Après le web 2.0, il y a aussi le webOS, soit la migration du Desktop (bureau comme interface du disque dur) vers le webtop (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack rédige sur le sujet un article de référence qui récapitule les enjeux et les ambitions de cette nouvelle migratio numérique des contenus et des comportements associés : "The future of the Desktop".
  • Après le web 2.0, il y a l'explosion des contenus gourmands (en bande passante) : voir les chiffres de la dernière étude Cisco, rapportés par Eric Baillargeon. Et de manière corrélée, il y a un phénomène de "dés-appropriation" de plus en plus systématique des contenus demandés par les internautes : voir le billet de Techcrunch rapportant le régne annoncé du "tout streaming". Là encore une nouvelle étape de la dérive des continents documentaires, dans laquelle après avoir confié nos contenus à des sites externes (tout en gardant une possibilité d'archivage en-ligne), nous prenons de plus en plus l'habitude de consommer des contenus comme de simples services, sans appropriation réelle ni possibilité de conservation ou de stockage. Bref, nous faisons avec Internet ce que nous faisions hier avec la télé, avant que l'on invente les magnétoscopes. Sauf que sur Internet, c'est pas très facile de réinventer le magnétoscope, comme en témoigne les mésaventures du service (excelletissime) Wizzgo. Espérons avec Jean-Michel que "S'il y a beaucoup de mythes dans le Web 2.0, il y a aussi beaucoup de préjugés chez les médias traditionnels, à commencer par croire que l'on peut retarder l'expression d'une demande explosive."

Côté énervements récurrents :

  • la fausse bonne idée de l'université entreprise, à lire sur le site de SLR ... pendant ce temps, Valérie Pécresse distribue les médailles en chocolat comme autant de labels vides de sens (et de financements ...)
  • les vraies-fausses promesses de maître Darcos. (= Episode 1 : on va supprimer plein de postes, mais en échange on va revaloriser la grille des salaires. Episode 2 : on va supprimer plein de postes. Euh ... oui oui, on va aussi revaloriser la grille des salaires. Mais pas tout de suite hein ? Episode 3 : relire l'épisode 2)
  • "L'autonomie" (financière) souhaitée des université est vraiment - mais alors vraiment - une notion à géométrie variable.
  • et dans la série "faisons fonctionner de nouveaux trucs avec tous les défauts des anciens machins", je vous recommande la lecture de "l'ANR pour les nuls" sur le site de Sauvons la Recherche.
  • Tout cela nous rappelle que la loi LRU a 1 an. A lire sur EducPros, un rapide bilan des opérations. A remarquer : seulement 9 universités (sur 85) ont décidé de mettre en place les fameux comités de sélection en lieu et place des anciennes commissions de spécialistes. Ce manque d'engouement n'est pas nécessairement la preuve d'un désaveu du système proposé (par les comités de sélection). Simplement le résultat d'un calendrier de mise en place à la hussarde et le symptôme d'un très grand flou dans le "comment concrètement" faire tourner ces nouveaux comités de sélection. Le résultats c'est que la plupart des université, déjà très occupées à mettre leur CA aux nouvelles normes, n'ont pour le moment pas eu vraiment le temps de s'occuper de la mise en place de ces comités. C'est à la fin de cette année universitaire que l'on pourra réellement juger sur pièces, même si de mon côté, mon opinion est faite ... Et par souci d'impartialité, le bilan de la loi LRU, côté communiqué officiel :-)
  • Sans archive(s) pas de mémoire, sans mémoire pas d'Histoire. Le petit monde de l'archivistique est depuis peu en butte à de sévères bouleversements qui engagent tout un pan de notre mémoire collective. Voir ici et là.
  • Edvige et Cristina. La France en (très) bonne place pour les prochain BigBrother Awards. Voir (parmi d'autres) : Politis, Le Monde, le point de vue de Jean-Marc Manach, l'article d'EDRI avec les liens vers les parutions du JO et d'autres couvertures presse. Ils en parlent aussi : l'ADBS. Au moins, cette affaire aura donné lieu, sur France Inter, à un téléphone sonne d'anthologie :-(
  • Et toujours à l'affiche, "les cages de la république".

Côté People et Blogosphere :

  • ce dont tout le monde a parlé cet été c'est la guerre entre blogueurs et journalistes. Rappel des faits.
  • Le départ de Versac tout comme la sortie de route classement de FredCavazza sont d'ailleurs peut-être assez symptômatique d'un changement d'époque. Car outre-atlantique aussi, Francis Pisani nous apprend que Jason Calacanis himself annonce son retrait blogosphérique. Je suis de mon côté depuis longtemps convaincu que les blogs auront permis l'émergence de nouvelles formes de parole (et de prise de parole), côté scientifique notamment, et qu'ils se dirigent lentement mais surement vers une hybridation de plus en plus marquée (voir les exemples très éclairants choisis par Narvic).
  • Et puis le choc de l'été sur les blogs sciences de Wikio : André Gunthert dégringole à la troisième place et Jean Véronis fait une entrée fracassante directement à la seconde (place). De mémoire d'homme, seule Samantha Fox avait, à l'époque du Top 50, réussi une telle entrée. M'est avis qu'avec de tels challengeurs qui ne respectent même pas la pause estivale, ma première place va rapidement être remise en question. Assez bizarremement, ni Closer, ni Gala ni Voici n'ont fait leur "une" de cet événement pourtant incountournable.

Côté identité numérique :

  • A l'heure où la gestion de la réputation numérique est chaque jour plus centrale pour le simple quidam, elle revêt, pour le futur potentiel président des Etats-Unis une importance plus que vitale. On lira donc avec intérêt sur le blog VerbalKint, la stratégie mise en place par l'équipe de campagne de Barak Obama pour contrer les rumeurs en temps réel. Intéressant de noter également l'évolution qui, depuis la dernière élection présidentielle américaine, avait marqué l'avènement des blogs comme outils de lobbying, et qui se décline aujourd'hui sur le mode de la gestion de la réputation. Comme dans la "vraie vie" des "vrais gens" pour qui les blogs, après être devenu un outil d'expression central, sont aujourd'hui l'un des principaux axes de leur visibilité numérique et de ce qui s'y rattache.

Côté "ça peut toujours servir" :

Côté Agenda :

Côté lectures :

Côté visionnage :


Ce qui me frappe dans tout ça ...

Comme dans la nouvelle de Borges, "Funes ou la mémoire", le mouvement d'externalisation de nos mémoires, documentaires et intimes, nous mène droit vers une société à l'hypermnésie latente, activable. Avec Google dans le rôle de Funes, et de son côté, pas la moindre aspiration à s'enfermer dans une pièce vide pour ne plus rien "enregistrer".

Bonne rentrée à tou(te)s :-)

(Sources : sous les liens // Temps de rédaction de ce billet : 2 mois ;-)

Europa Film Treasures

Attention ... C-A-D-E-A-U !!! Vous vous souvenez de mon enthousiasme lors de la découverte de l'incroyable Ubu ? Et bien dans un genre certes différent mais tout aussi enthousiasmant, voici un nouveau petit réservoir à pépites : Europa Film Treasures (découvert via l'indispensable BienBienBien)
La recette est simple : prenez une vingtaine de cinémathèques européennes, et mettez en commun leurs trésors. Vous obtenez un site sur lequel il est très fortement déconseillé d'aller naviguer en soirée, sous peine de passer une nuit blanche. Chacun y trouvera son bonheur, du fan d'images d'archives danoises de l'empereur Guillaume II, à l'amateur de vieilleries érotiques en passant par les vacanciers cherchant un dessin animé à visionner pour leur turbulante progéniture. C-A-D-E-A-U je vous dis. Bon visionnages donc et ... bonnes vacances :-))

Les cahiers au feu ... et les fils RSS au milieu

Comme promis, un petit billet "revue de liens" pour expurger mon agrégateur avant de partir en vacances.

Côté Moteurs (et un peu au-delà) :

  • Difficile de passer à côté du "big deal" passé entre Yahoo! et Google suite à la tentative avortée de rachat de Yahoo! par Microsoft. Pour une synthèse, voir notamment ce qu'en disent Adscriptor, Techcrunch, Média & Tech, Francis Pisani, Techcrunch France, ReadWriteWeb et (plus synthétique) Le Monde. Quelques analystes avaient, dès le départ de l'affaire, souligné que l'offensive de Microsoft avait de forte chances d'échouer au profit de Google. Ce dernier tire effectivement une nouvelle fois son épingle du jeu en renforçant une position déjà outrageusement hégémonique sur le marché de la publicité en ligne. De son côté, Yahoo! sauve (provisoirement ?) les meubles en renflouant ses caisses, mais le "coup" porté par cette affaire est en train de bousculer grandement (et durabement ?) la structure (et l'autorité) de son exécutif ...
  • Microsoft (pour se remettre du fiasco Yahoo ?) vient donc officiellement de s'offrir Powerset, moteur plus sémantisé que réellement sémantique (comme je tente de l'expliquer dans les 75 000 signes rédigés pour le séminaire INRIA IST'2008). L'argumentaire mis en avant dans le billet du blog de Microsoft est celui du renforcement du moteur Live.com (qui est clairement à la ramasse par rapport à Google et Yahoo) grâce à la mise en avant de la compréhension du contexte et de l'implicite. Bref, Microsoft entre officiellement dans la course au web sémantique. 
  • On pouvait déjà faire plein de choses avec Google et ses services (ou ceux qu'il a rachetés). On peut désormais en faire encore plus. Celui-ci a en effet annoncé qu'il allait se lancer dans le marché (juteux et stratégique) de la mesure d'audience et du "média-planning". Un créneau jusqu'ici propriété quasi-exclusive de Nielsen Online et ComScore (qui en tremblent déjà ...) ou Médiamétrie dans l'héxagone. Inutile je pense d'en rajouter une couche sur le fait qu'en gagnant (ce n'est pas encore fait et comme le souligne Emmanuel Parody c'est le marché de masse qui est d'abord visé ...) le marché de la mesure d'audience, Google devient un peu plus l'alpha et l'oméga d'une certaine représentation du web. Cette nouvelle corde à son arc est cependant parfaitement "logique" pour au moins deux raisons : primo l'infrastructure dudit Google, son nombre colossal de serveurs, et l'ampleur des données qu'il recueille et dont il peut librement disposer, deuxio, l'atout stratégique et l'effet de levier que représente un outil planétaire de mesure d'audience pour (mieux) vendre (encore plus) de la publicité aux annonceurs. Le service porte le doux nom de Google Ad Planner.
  • Google (ben oui, encore ...) se lance dans une opération de communication de maintien de la neutralité du Net. A l'heure où l'on constate partout (y compris en France - loi Hadopi - et au Canada mais aussi aux Etats-Unis avec la très récente annonce d'une purge du réseau Usenet) la transformation des FAI en auxiliaires de police, Google à donc annoncé (sans fournir de date ni de nom de service, ni de détails ...) : "le développement d’outils qui permettront aux internautes de vérifier par eux-même si leur fournisseur d’accès à Internet (FAI) intervient d’une manière ou d’une autre sur leur connexion." (via Ecrans) L'alpha et l'oméga disais-je ... A propos, plus largement, de la loi Hadopi (parenthèse ci-dessus), il existe heureusement encore quelques dangereux anarchistes pour tenir un discours vivifiant et cohérent sur la question du copyright et du logiciel libre.
  • Le web invisible connaît un deuxième recul très significatif. Après l'annonce (par Google) d'une indexation possible des données contenues derrière certains formulaires de recherche, c'est désormais Adobe qui annonce que le format Flash sera indexable par les moteurs. Comprenez : Adobe va mettre à disposition de Google et Yahoo! (pourquoi pas de Microsoft ? Parce que Microsoft développe sa propre technologie concurrente à Flash : Silverlight) un player spécifique qui permettra de naviguer "dans" les sites en flash et d'en indexer certains éléments au passage. Pour le reste, voir le billet de Techcrunch d'où je tiens l'info, les Questions/Réponses de Google WebmasterCentral et la FAQ d'Adobe. La question de l'indexation (et du référencement) des sites en Flash est un vieux serpent de mer pour les référenceurs. Avec ce nouveau système, c'est un pan entier du web qui va à son tour émerger dans les pages de résultats des moteurs. Les avis des analystes sont par ailleurs assez partagés sur l'intérêt et la nouveauté relative de cette indexation.

Côté Réseaux sociaux :

  • Marc Andreessen (fondateur de Netscape et actuel gourou de Ning) rejoint l'exécutif de Facebook. Bonne pioche dans tous les cas et rapprochements probables ou nouvelle concentration à venir de ce côté là.
  • Une bibliographie sur la question des réseaux sociaux par l'une des meilleurs spécialistes de la question, Danah Boyd.
  • Un entretien avec Pierre Bellanger (PDG Skyrock) à propos du "premier réseau social d'Europe" (Skyblogs) dans lequel tombe une (de mes) idées reçues : "La totalité (des blogs) est active. Tout blog qui n'a pas été modifié ou consulté dans les derniers 90 jours est automatiquement supprimé. Près de 10 000 blogs sont ainsi fermés chaque jour, tandis qu'il s'en crée plus de 30 000. La plate-forme est un réseau vivant. Pas de cimetière de blogs ou de profils chez nous !"

Côté web 2.0 :

Côté bibliothèques :

Côté Wikis et Wikipédia :

Côté "livre et numérique" et livres numériques :

Côté Web sémantique :

Côté bibliométrie et indicateurs scientifiques :

  • un rapport sur l'usage statistique des citations (.pdf) et son résumé en français sur le site de Sauvons la recherche. Le rapport plaide clairement en faveur d'une théorie de la relativité générale des indicateurs statistiques scientifiques là où la plupart des "décideurs" y voient l'alpha et l'oméga de toute politique d'évaluation digne de ce nom. Pour les autres, il est toujours possible de faire joujou avec ce genre d'outils.

Côté lectures :

  • le dernier Livre Blanc de Christophe Asselin/Digimind sur la "Réputation Internet". Avec notamment quelques buzz digitaux disséqués et l'indication de "stratégies" pour les anticiper, les démonter, les relancer, les contrôler. Du simple veilleur au consultant en communication de crise, ce Livre Blanc devrait amplement satisfaire son lectorat.
  • LA bible du documentaliste et du bibliothécaire : le Traité de Documentation de Paul Otlet, sous-titré "Le livre sur le livre". C'était en 1934. Et on n'a guère fait mieux depuis.
  • Pour se faire plaisir (et se faire un peu peur dans la veine du 1984 d'Orwell), la dernière nouvelle de Cory Doctorrow : Little Brother. Librement téléchargeable.

Côté ressources pédagogiques :

  • Un vrai cours en ligne de Laurent Jenny sur l'Histoire de la lecture (avec bibliographie, exercices et tout et tout)
  • Prenez des textes scientifiques "fondateurs" et faîtes-les analyser par des scientifiques d'aujourd'hui pour mieux comprendre leur impact et leur inaltérable actualité : c'est la très bonne idée du projet Bibnum, pour l'instant encore à l'état de maquette, mais dont on souhaite qu'elle prenne très rapidement son essor (et qu'elle s'ouvre au-delà des 4 domaines qu'elle entend pour l'instant couvrir - math, physique, chimie, biologie -  les SHS constituant un formidable terrain de jeu pour ce genre de mise en perspective).

Et pour finir, un petit lien du Week-End :-)

Tectonique du livre

Ca bouge. Ca bouge même beaucoup dans le monde des livres, de l'édition, du numérique et des bibliothèques. Petite revue d'effectif (en vrac ... pas le temps d'un billet d'analyse ...) :

  • l'un des bastions de la loi Lang est en train de tomber : les livres pourraient être soldés après 6 mois et non deux ans (délai actuellement de rigueur). Tout le monde est - à juste titre - en émoi comme en atteste le communiqué conjoint du SNE, du SLF et de la SGDL (communiqué de presse du 22/05/2008)
  • j'Hachette Numilog : Hachette s'offre Numilog. Hachette se distingue déjà par une politique numérique très "offensive" et très en avance, notamment du côté des manuels scolaires, et notamment outre-atlantique. Cet achat s'inscrit donc dans une continuité qui creuse l'écart avec le reste du peloton. Voir l'interview du PDG d'Hachette Livre sur le Figaro. (repéré chez Aldus et Kotkot)
  • le SNE crée une commission numérique (communiqué de presse du 21/05/2008). Il était temps diront les mauvaises langues. Le communiqué indique : "Alors que d’autres industries culturelles ont déjà été touchées par l’arrivée du numérique, le livre fait face aux mêmes enjeux tout en ayant encore le temps de réfléchir (...)" J'aimerais en être convaincu mais ce n'est hélas pas le cas (cf les points suivants de ce billet). A noter : il s'agit - notamment - pour cette commission, de pérenniser l'offre légale d'ouvrages sous droits dans le cadre de Gallica 2. A noter aussi : "La commission Numérique est présidée par Stéphanie van Duin, directrice du développement du groupe Hachette". Lequel groupe Hachette (filiale du groupe Lagardère), vient - je vous le rappelle - de racheter Numilog, principal fournisseur de la même offre légale d'ouvrages sous droits. Je vous fais un dessin ?
  • (repéré via Alain Pierrot) Microsoft arrête le service Live Book Search (recherche d'ouvrages numérisés libres de droits, le concurrent de Google Book Search) ainsi que le service Live Academic Search (le concurrent de Google Scholar) : Communiqué de presse. Il y a en fait deux niveaux de lecture dans ce communiqué : Microsoft continuera d'indexer les ouvrages et les articles de recherche, mais dans son index standard, et non plus de manière séparée. En revanche, Microsoft arrête les frais de la numérisation. C'est très clairement le côté financier qui est mis en avant. Le communiqué indique encore : "Nous prévoyons que la meilleure manière pour un moteur de recherche de rendre accessible des ouvrages numérisés est d'indexer les entrepôts créés par les éditeurs et les bibliothèques. Grâce à nos investissements (sic), la technologie pour créer ces entrepôts est désormais disponible à moindre coût pour tous ceux qui ont un intérêt commercial ou une mission de service public dans la numérisation d'ouvrages." Mon analyse (rapide ...) est que Microsoft est coincé : d'une part par l'urgence de se positionner clairement sur le secteur du "search" en particulier et du Web en général (cf le récent feuilleton à propos du rachat de Yahoo!), ce positionnement risquant d'engager dans un avenir proche de très importants frais de trésorerie, et d'autre part, le retard du projet Live Book Search par rapport à l'offre Google Book Search est trop important pour pouvoir être comblé (avec là également quelques considérations de trésorerie à prendre en compte). Donc Microsoft arrête. Pour le reste des enjeux, voir le billet d'Alain Pierrot.
  • De son côté, non seulement Google continue de déployer son arme de numérisation massive tout en piochant avec délectation, sans retenue et avec notre consentement bénédiction éclairée dans les entrepôts numérisés existants, mais en sus, il ne manque aujourd'hui plus grand chose au tableau pour pouvoir filer jusqu'à son terme la métaphore de l'ogre dévorant ses enfants. Je m'explique : pour fonctionner en "vase-clos", c'est à dire pour centraliser au maximum les accès (lock-in syndrom) tout en externalisant au minimum ses services**, il ne manque à Google qu'une seule chose, les données catalographiques (métadonnées donc) des ouvrages déjà numérisés (par lui ou par d'autres), ou en voie de l'être (par lui ou par d'autres). Or l'OCLC (organisme derrière l'outil Worldcat) vient de passer (10 Mai 2008) un accord avec Google pour partager avec lui leurs données bibliographiques, lesquelles données sont elles-mêmes gracieusement fournies par la masse des catalogueurs anonymes (en fait c'est même un peu plus compliqué que ça puisqu'il faut parfois payer pour faire "remonter" ses notices dans l'interface de l'OCLC, mais passons ...). En échange, Google continuera de faire ce qu'il fait déjà (c'est à dire renvoyer vers les sites des bibliothèques possédant les ouvrages), mais il le fera "mieux" ... Et dans l'intervalle il jouira sans entrave du petit bijou qu'il vient ainsi de s'offrir à moindre frais : c'est à dire, ne tournons pas autour du pot, l'ensemble d'une certaine idée de la chaîne du livre, depuis la numérisation des ouvrages jusqu'à leur prescription et leur délivrance aux utilisateurs, en passant par la richesse et la souplesse que confère à cet ensemble la maîtrise de la chaîne de catalogage (= notices bibliographiques). La morale de l'histoire ne dit pas ce qu'en pensent les catalogueurs qui se trouvent ainsi "employés sans être payés" (sinon de reconnaissance symbolique) par la firme de Mountain View. Mais n'est-ce pas là in fine notre lot à tous ? (Via le Chronicle of Higher Ed)
  • Et puis aussi, on a appris la disparition de la DLL (Direction du livre et de la lecture). Et alors ? Et ben alors ... allez lire Olivier Tacheau, Dominique Lahary  et l'onctueuse extrême onction de François Bon sur le sujet).

Bon, on résume ?

  • En France, les bibliothèques s'éloignent inexorablement de l'Etat (DLL requiescat in pace), alors que dans le même temps les éditeurs multipolaires (Lagardère) s'en rapprochent (dangereusement ?).
  • Ailleurs dans le monde, l'insolente réussite de Google condamne les meilleures volontés - OCLC - (et les projets alternatifs pourtant les plus crédibles) à se féliciter d'être - pardonnez le raccourci - corvéables à merci, alors même que les rivaux les plus solides (financièrement) préfèrent botter en touche (Live Book Search).
  • En ligne de fond, la loi Lang sur le prix unique du livre est patiemment mais sûrement détricotée au seul profit des éditeurs et des grandes centrales.
  • Et au final, et ben au final je ne serai pas très prompt à me réjouir de voir ainsi les destinées du livre (numérique ou non) laissées entre les mains de deux régies publicitaires : Lagardère et Google. Tout cela "me fait penser au prestige du rince-doigts ou du baise-main. Ce n’est pas le rince-doigts qui fait les mains propres, ni le baise-main qui fait la tendresse."

** à l'inverse de toutes (ou presque) les autres organisations qui, elles, externalisent leur activité documentaire vers Google ou les grands firmes proposant une offre Saas (cf le dernier billet de Jean-Michel Salaun à propos de Cloud Computing)

Bataille encyclopédique

L'actualité encyclopédique est relativement chargée ...

  • Afin de rivaliser avec Wikipedia, la Britannica lance une opération de communication visant à offrir un an d'accès gratuit à la totalité de l'encyclopédie : il suffit pour cela de s'inscrire ici. Pour obtenir votre abonnement cadeau, il vous faudra cependant justifier d'une activité de "web publisher", c'est à dire disposer d'un site/blog tenu régulièrement. L'idée est donc de profiter de la blogosphère (et assimilée) comme chambre d'écho, afin de ramener du traffic vers la Britannica. Je m'y suis moi-même inscrit et je teste depuis une semaine les ressources de cette grande dame. Et j'avoue rester un peu sur ma faim. Il est vrai que je n'entre pas tout à fait dans le profil de l'usager lambda d'encyclopédies, mais sur des requêtes assez spécialisées, les contenus de la Britannica apparaissent assez maigres au regard de ceux de Wikipedia. In fine, il n'est pas sur que l'opération de communication porte ses fruits étant donné qu'il est par exemple impossible d'offrir aux autres (ceux qui n'ont pas gagné un an d'abonnement gratuit) un lien vers les contenus de ladite Britannica. Bref, le contre-buzz est déjà en marche est il semble évident que la Britannica n'a pas compris la logique de sérendipité qui sous-tend l'économie de l'attention. (voir aussi l'article d'Ecrans)
  • beaucoup plus pertinente (à mon avis) est l'initiative de Larousse qui vient de lancer son encyclopédie contributive. L'article d'Ecrans sur le sujet est limpide et j'en reprends donc les grandes lignes pour ce qui concerne le "modèle" de cette riposte à la Wikipédia : "accès libre à son dictionnaire encyclopédique validé (150 000 articles et 10 000  objets multimédias). Pour consulter l’encyclopédie, il faut s’inscrire et il est possible de fournir ensuite des textes ou des images, tout en restant propriétaire de son œuvre. (...) Chaque volontaire est invité à créer son espace personnel, qui dispose d’une messagerie. Contrairement à Wikipedia, les anonymes sont bannis et les contributions sont sanctuarisées une fois écrites. Pas question d’aller mettre son grain de sel sur un article d’internaute déjà publié." L'interface est en sus beaucoup plus agréable de celle de la Britannica et les futurs contributeurs sont bien guidés, avec par exemple la possibilité d'indiquer un niveau de lecture de leur article (expert, grand public ou junior). Côté contenus en revanche, c'est la même déception (subjective) que pour la Britannica. Une déception certainement biaisée par mon habitude de consultation de Wikipédia, mais les possibilités de navigation me semblent bien en-deça d'une logique d'écriture de contenus multimédia.

Moralités :

  • Dans l'absolu, il est heureux que les marchands d'encyclopédie tentent de devancer les initiatives des marchands/moteurs de recherche. On avait en la matière plutôt été habitué à constater une habitude de suiveurs. Or ces initiatives interviennent alors que, parmi d'autres, le projet Knol de Google en est encore à l'état d'annonce. Quant à savoir si l'amorçage collaboratif prendra ...
  • Dans l'absolu toujours, et alors même que les encyclopédies "classiques" se mettent au numérique - elles y étaient déjà timidement entrées - et surtout au numérique collaboratif, on observe que le leadership du collaboratif numérique (Wikipédia donc) va tenter l'expérience du papier (essentiellement pour renflouer sa trésorerie) une expérience dont on mesurera les enjeux en lisant le billet de Jean-Michel Salaun.

De profundis.

Web de surface. Web profond. Web invisible. Ces trois expressions sont issues d'un article "culte" qui remonte à Juillet 2001 et qui est une étude de la société "Brightplanet", laquelle étude avait à l'époque permis de prouver que les ressources du web "invisible" (non-indexable et/ou non-indexé) étaient considérables au regard  de celles du web habituellement visibles. Rappelons-le, à cette époque là, les moteurs de recherche n'étaient par exemple pas capable d'indexer autre chose que du HTML, et ainsi l'ensemble des documents désormais habituels (fichiers word, acrobat, excel, powerpoint ...) passaient à la trappe. Depuis ce temps, la dérive des continents documentaires s'est mise en place (voir le petit schéma dans ce billet), les moteurs se sont rendus capables de grouper un nombre gigantesque de ressources et de documents dans la même sphère d'indexabilité, ces mêmes moteurs vont de plus en plus "racler" les fonds de tiroir à la recherche de données que l'on croyait jusqu'à lors inindexables.
Pour autant, le web "invisible" aux moteurs demeure, et reste un gisement de données et d'informations très attractif pour ces mêmes moteurs. Et c'est encore une fois Google (qui fut le premier moteur à indexer des formats de fichiers bureautiques) qui fait en la matière une percée singulièrement significative : ce dernier vient en effet d'annoncer qu'il allait être capable d'indexer (crawling) les données situées "derrière" les formulaires web. Exemple : une base de donnée immobilière vous permettant de trouver la location de vos rêves pour vos prochaines vacances. Les informations de cette base sont pour l'instant inaccessibles car elle relèvent de ce qu'on appelle le web "dynamique" (par opposition au web "statique"). Ces pages sont générées à la demande de l'internaute, suite au remplissage du formulaire idoine.
Comme rappelé dans le billet de Google annonçant la chose, les limites de ce genre d'approche sont encore considérables et relèvent aussi bien d'aspects techniques (procédure GET des formulaires ou sécurisation par mot de passe ou captcha par exemple) que d'aspects éthiques (la plupart des sociétés n'ayant pas envie que leur "base de donnée" - d'annonces immobilières par exemple - se retrouve du jour au lendemain intégralement "visible"). Google annonce donc qu'il n'indexera finalement que très peu de ces formulaires, et continuera naturellement de respecter les instructions du fichier robots.txt (qui autorise ou interdit tout ou partie de l'indexation d'un site aux moteurs de recherche).
Attendons de voir quels types d'informations remonteront ainsi dans la page de résultats de Google pour juger sur pièces, mais il n'en reste pas moins que cette nouvelle avancée dans la dérive des continents documentaires indexables et le recul qu'elle marque pour la définition (et la préservation ?) d'un web invisible est importante.

(Sources : JournalDuNet, Abondance // Temps de rédaction de ce billet : 45 minutes)

Web-média, cloud-computing, vectorialisme et modernité calculatoire

Je reproduis ci-dessous un commentaire d'Hervé Le Crosnier, en réponse à ce billet, mais qui me semble très intéressant (et pertinent) pour comprendre quels sont aujourd'hui les grand axes d'analyse qu'il faut mobiliser pour approcher au plus près les logiques à l'oeuvre dans les manoeuvres économiques auxquelles se livrent les géants du web.
=============
"Ce qui est en jeu est la recomposition des "vecteurs" (les vecteurs sont les entités web "dont le métier principal est d’organiser de grandes banques de données des "intentions" de leurs usagers"), qui sont autre chose que des "web-médias". Certes, l'aspect "web-média", suivant l'expression de Jean-Michel Salaün, est important. C'est la source actuelle des revenus de ces conglomérats. Mais trois autres aspects doivent êtres pris en compte simultanément :

  • le "cloud computing" : disposer d'une force de frappe informatique (réseau + serveurs + mémoire + logiciels "as a service") pour offrir des services aux particuliers (dépôts photo, logiciels de productivité,...) et les capter dans l'univers d'un des vecteurs. Attention, on n'est plus dans l'époque des "mainframes", le nombre d'usagers ne se limite pas à des "grappes de terminaux", mais se compte en millions...
  • la "modernité calculatoire" : tenter de résoudre tous les problèmes par de calcul. L'exemple achevé est évidemment 23andme et la folie eugéniste que ce projet recouvre, mais on trouve des applications de ce "modèle calculatoire" à bien d'autres activités... dont le calcul de l'appariement (des personnes entre elles - réseau social, des personnes et des publicités, des publicités et des articles, des malades et des traitements)
  • le positionnement comme futur "appareil idéologique et administratif" visant à remplacer les divers pouvoirs publics défaillants (pour des raisons qu'il serait trop long de prendre en compte ici). Cela va de la gestion du compte de santé des individus, jusqu'au capacités de créer des banques virtuelles mondialisées (PayPal qui trouve sa niche dans le paradis fiscal du Luxembourg,...). La délivrance des identifiants (openId ayant actuellement le vent en poupe), un rôle régalien auparavant, est maintenant dans la ligne de mire des vecteurs... avec les conséquences sur l'organisation de la vie sociale et politique que l'on peut imaginer (pour les craindre, si l'on est dans la logique européenne, ou les souhaiter si on a biberonné dans la logique anti-fédérale des libertariens étatsuniens).

Ce sont donc quatre axes d'analyse qu'il faut mobiliser simultanément pour comprendre l'évolution du vectorialisme. Avec cet angle de vue, la tectonique ne se limite plus au partage de la manne publicitaire. Et de nouveaux acteurs sont dans la danse, qui ne sont pas (ou pas encore) des "web-médias", mais qui sont déjà des "vecteurs" : géants du service et du logiciel tels adobe ou IBM, compagnies de télécoms qui s'étendent sur toute la chaîne de valeur tels orange, SKT ou NTT, gestionnaires de services en réseau comme Amazon, dont la boutique en ligne est devenue minoritaire dans l'usage de ses serveurs et réseaux (pas encore de ses revenus, mais c'est la perspective de Jeff Bezos).
Il faut préciser cette portée du vectorialisme, lancer des études sur les stratégies des conglomérats (sachant que ces stratégies sont souvent élaborées a posteriori par les béhémots eux-mêmes : le capital n'est pas une "cinquième colonne" avec un plan secret, mais un organisme vivant qui s'adapte et anticipe pour mieux s'adapter...).

Petit père castrateur : pas si sûr.

Fin Novembre 2007, Denis Olivennes (alors encore PDG de la FNAC) remet à Nicolas Sarkozy son rapport sur la prévention du téléchargement illégal, recommandant notamment la mise en place de mesures d'interruption de l'accès à Internet.
Le Jeudi 10 Avril 2008, le parlement européen a adopté l'amendement suivant :

  • "Amendement 22 bis. engage la Commission et les États membres à reconnaître qu’Internet est une vaste plate-forme pour l’expression culturelle, l’accès à la connaissance et la participation démocratique à la créativité européenne, créant des ponts entre générations dans la société de l’information, et, par conséquent, à éviter l’adoption de mesures allant à l’encontre des droits de l’homme, des droits civiques et des principes de proportionnalité, d’efficacité et d’effet dissuasif, telles que l’interruption de l’accès à Internet."

La suite de l'analyse est à lire chez Philippe Aigrain.

(Voir aussi sur 01.net, et sur Ecrans les confidences d'un autre castrateur en puissance en plein déni)

La fracture amicale.

"La nouvelle fracture numérique opposera les gens disposant d'un réseau d'amis et ceux sans amis. L'ancienne fracture numérique entre les riches (ceux disposant d'une connexion internet) et les pauvres continuera d'exister." La citation (repérée par TechCrunch) est de Robert Scoble. Si cette "formule" m'intéresse c'est parce qu'elle traduit assez bien la manière dont, in fine, les logiciels sociaux (qui, rappelons-le, sont bien plus que les simples "réseaux sociaux") ont durablement transformé la nature de notre rapport au web.
<Parenthèse> Dire que les logiciels sociaux ont transformé la nature de notre rapport au web, n'est pas du tout la même chose (et est à mon avis beaucoup plus juste) que d'affirmer - comme on le lit un peu trop souvent - que les réseaux sociaux ont changé la nature du web </Parenthèse>
Il me semble qu'aujourd'hui, dans l'essentiel de nos pratiques, la socialisation dans sa dimension expérientielle première, est devenue au moins aussi importante que les trois activités qui firent la spécificité du primo-web, c'est à dire la navigation-lecture (browsing), la navigation-recherche (searching) et naturellement l'écriture (au sens large de "production de contenus"). Ce qu'ont permis les logiciels sociaux c'est le transfert de logiques de socialisation grégaires depuis des espaces clos et dédiés (les forums ou groupes Usenet) vers des espaces réellement réticulés, c'est à dire largement distribués au travers du moindre espace d'écriture ou de navigation.
Cette réflexion en appelle une autre. Il n'est pas aujourd'hui sur le web d'espace de production de contenus numériques qui n'échappe à l'angle d'une analyse "conversationnelle", "socialisante". On n'écrit plus, on ne publie ou ne produit plus aujourd'hui de contenu simplement pour être présent, pour occuper un espace, ou pour être bien "positionné" mais tout au contraire pour confronter ou pour souscrire. On écrit, on publie, on produit pour engager un débat. Pour "se" confronter aux autres. Pour maintenir et établit un contact. De toutes les fonctions du langage théorisées par Jakobson, c'est la fonction phatique qui est au coeur de l'ensemble des socialisations numériques, y compris (et surtout ?) de l'écriture-socialisante qui couvre  (par exemple) l'immense majorité des productions de la blogosphère.
Comme nouveaux totems de cette dominance du phatique, citons les trackbacks ou rétroliens (qui en inversant la polarité des liens pour la première fois dans l'histoire de l'hypertexte, contribuèrent largement à disséminer ladite fonction phatique et à en faire l'un des tout premiers horizons d'attente de l'écriture numérique courante). Citons également l'incontournable et parfaitement totémique "poke" de Facebook
Pour autant, et dès que cette confrontation se trouve inscrite dans un processus collaboratif assez large impliquant un nombre significatif de personnes, on retombe très largement dans les anciens et classiques shémas auctoriaux et éditoriaux. Des shémas "étagés" dans lesquels les fonctions de représentativité et de leadership sont réaffirmées comme essentielles. La présumée "sagesse des foules" n'est que l'exercice d'une démocratie numérique rigoureusement équivalente au système politique dans lequel nous évoluons. La seule différence (de taille) vient de son amorçage : les "leaders", les "gourous", les "éditeurs", les "auteurs" ne sont pas élus dans une logique de représentativité en assumant une charge "par délégation", mais ils sont les promoteurs ... à l'origine de leur propre promotion. Une promotion dans le meilleur des cas au service d'un projet ou d'une parole, et dans le pire des cas au seul et unique service d'un égotisme forcené. Les autres, tous les autres y souscrivent au sens littéral du terme. Ils écrivent, publient, discutent, débattent "en dessous", dans les limbes palimpsestiques de ces nouveaux espaces de socialisation numérique. La fonction phatique ne prime plus. Le "poke" redevient "private joke".
Le web, quelle que soit sa dénomination ("world wide web, world live web, world life web"), sa numérotation (1.0, 2.0 ...) demeure un espace rhizomatique mais devient de plus en plus organique ; son organisation confine à l'organique. Les liens unissant des contenus y côtoient désormais les relations unissant des personnes. Cette corporéité nouvellement incarnée n'est pas simplement métaphorique. Elle traduit un changement de nature radical. L'erreur serait de croire que ce changement de nature est également un changement d'objet. Le web est et demeure une artefacture technique. L'erreur serait de ne chercher qu'à questionner cette artefacture. Le web n'est qu'un vecteur. Le changement concerne tout au contraire notre rapport individuel et intime à la socialisation. Notre rapport à l'autre.
Il y a quinze ans de cela, des scientifiques, des universitaires, se posaient la question de savoir quels documents/contenus pouvaient être numérisés. La réponse est aujourd'hui connue : il n'est aucun contenu qui ne résiste à la numérisation, rien qui ne puisse être numérisé ou numérique. Rien qui ne puisse être re-présenté "sous forme" et "au format" numérique. Pro forma. Ce qui est vrai des documents/contenus le sera-t-il également pour les individus et les relations interpersonnelles ?
Ce n'aura pas été le moindre mérite de Facebook et consorts que de permettre que ces questions soient posées. Les réponses seront là aussi évidentes. Dans 15 ans. Ou peut être moins. D'ici là nous aurons grand besoin de sociologues pour nous aider à bâtir la science du web.

(Temps de rédaction de ce billet : 2h30)

Le plug-in de la redocumentarisation.

La redocumentarisation** vient de s'offrir son premier plug-in (si c'est pas le premier, vous me le signalerez en commentaires :<Edit> merci Hubert, effectivement ... </Edit>). L'idée est simple : il s'agit pour une plateforme de blog (Wordpress) de permettre d'aller piocher directement dans les photos déposés sous licence idoine (creative commons) dans une base de donnée adéquate (FlickR), et d'insérer ladite photo pour illustrer votre billet. Le billet de ReadWriteWeb explique tout cela en détail (et avec des images). Ce dispositif déjà très puissant laisse raisonnablement espérer que demain (web sémantisé + micro-formats + progrès significatifs dans la recherche d'images) il sera possible d'obtenir le même résultat non plus en tapant un terme à la recherche d'une illustration, mais en "appelant" simplement l'illustration la plus adéquate sur la base d'une analyse (indexation) à la volée du texte en regard.

<Incise pour secte pédauquienne, les autres peuvent sauter ce passage>Il s'agit donc davantage et stricto sensu (cf définition ci-après) de documentarisation que de "re"-documentarisation, mais comme l'objet supportant cette documentarisation (blog Wordpress) est sui generis un objet redocumentarisé et redocumentarisable, je considère qu'il s'agit davantage de redocumentarisation.</fin de l'incise>

On aurait à mon avis tort de voir là un simple petit gadget de plus pour bloggueurs-geeks. Ce phénomène de redocumentarisation systématique et possiblement automatisée (ou en tout cas grandement facilitée) de toute trace (texte, vidéo, audio, photo), s'applique aujourd'hui à des entrepôts gigantesques de données, mais avec une granularité remarquable. Une granularité des contenus et des micros-contenus qui, via ces macro-agrégateurs que sont les sites-entrepôts (FlickR, YouTube, Del.icio.us pour n'en citer que quelques-uns), va permettre de rendre le processus de redocumentarisation totalement transparent et parfaitement intuitif. D'ailleurs, en y repensant, la recherche universelle, dernière trouvaille en date de nos chers moteurs, n'annonçait-elle pas déjà cette redocumentarisation universelle à la portée de tous ?

Pour conclure et le dire autrement, ce premier plug-in de la redocumentarisation ouvre la voie à une petite révolution documentaire : celle du passage à un âge où nous produirons simultanément et "nativement" un contenu (texte, image, vidéo), la documentation associée, et quelques-unes des redocumentarisations possibles s'y rattachant. Ce qui ne sera rien d'autre que la suite logique de la vidéo de M. Wesh ... "We'll need to rethink a few things ..." We'll need to rethink documents.

**Pour ceux qui lisent ce blog en diagonale (et pour quelques-uns de mes étudiants), définition de la redocumentarisation par Jean-Michel Salaün :

  • "Pour définir la re-documentatisation, il faut commencer par s'entendre sur le terme «documentarisation». Documentariser, c'est ni plus ni moins traiter un document comme le font (...) les professionnels de la documentation (...) : le cataloguer, l'indexer, le résumer, le découper, éventuellement le renforcer, etc. (...) L'objectif de la documentarisation est d'optimiser l'usage du document en permettant un meilleur accès à son contenu et une meilleure mise en contexte.
    Le numérique, par nature, implique une re-documentarisation. Dans un premier temps, il s'agit de traiter à nouveau des documents traditionnels qui ont été transposés sur un support numérique en utilisant les fonctionnalités de ce dernier. Mais le processus ne se réduit pas à cette simple transposition. En effet, bien des unités documentaires du Web ne ressemblent plus que de très loin aux documents traditionnels. Dans le Web 2.0 (...) la stabilité du document classique s'estompe et la redocumentarisation prend une tout autre dimension. Il s'agit alors d'apporter toutes les métadonnées indispensables à la reconstruction à la volée de documents et toute la tracabilité de son cycle. Les documents traditionnels eux-mêmes, dans leur transposition numérique, acquièrent la plasticité des documents nativement numérique et peuvent profiter des possibilités de cette nouvelle dimension.
    " in La redocumentarisation : un défi pour les sciences de l'information.

(Temps de rédaction de ce billet : 45 minutes)

L'éditeur est-il soluble dans le crowdsourcing ?

Voilà à n'en pas douter de quoi rajouter de l'eau au moulin du dernier billet de Jean-Michel dont je ne reprends ici qu'une phrase hors-contexte mais significative tout de même : "Quelle étrange dynamique qui conduit à rechercher la vérité, sans pouvoir en assumer la responsabilité !". De mon côté j'avais attiré votre attention sur la problématique de la responsabilité éditoriale dans Wikipédia. Et j'en viens donc au vif du sujet et au coeur de ce billet : quel est le point commun entre Eric Dupin (Presse-citron.net), Olivier Martinez (acteur procédurier) et Florence Devouard (Wikimedia fondation) ? Et bien tous ont un problème d'éditeur.
L'affaire est donc celle qui oppose Olivier Martinez à Eric Dupin. La génèse de l'affaire et son dernier rebondissement sont lisibles et parfaitement résumés sur le site d'Ecrans. Donc Hop vous partez le lire et quand ça y est, Hop, vous revenez ici. Ca y est ? Bon.
Donc le titre de ce billet : Fuzz (le site d'Eric Dupin) est en effet un Digg-like, un de ces sites dans lequel les utilisateurs font remonter le contenu et, par leurs votes, construisent la hiérarchie des news ainsi collectées. Donc Eric Dupin n'est effectivement pas responsable de la "Une" de Fuzz, pas plus que de la hiérarchisation de toute news y figurant. Mais Eric Dupin est éditeur du site Fuzz. Et à ce titre aujourd'hui condamné.
Toute cette affaire est à la fois troublante et éclairante.
Eclairante parce qu'elle souligne que tout acte de publication implique une responsabilité éditoriale, et ce indépendamment de la longueur et de la profondeur de la chaîne des médiations qui interviennent dans le processus. L'éclairage en question porte donc dans le cas qui nous occupe, sur la désagrégation (désintermédiation) de la boucle publication-édition, une désagrégation, un délitement qui n'en ôte pas la spécificité, et qui en aucune manière ne peut aboutir à un escamotage. L'une (la publication) ne peut effacer l'autre (l'édition) et réciproquement. Toute publication doit être éditée pour "exister", et tout acte éditorial ne peut porter que sur la trace inscrite d'une publication première, originelle.
Troublante parce qu'au vu de la LEN (loi sur l'économie numérique) et des modèles actuellement dominants de nano-publication (un billet de blog, un fil twitter) versus macro-agrégation (les Digg-like et dans une moindre mesure les moteurs-remixeurs de recherche), la définition de la responsabilité éditoriale est pour le moins fluctuante (comme le souligne l'article d'Ecrans, le choix du tribunal dans l'affaire Martinez/Dupin aurait reposé sur la présence d'une rubrique baptisée "Les people", rubrique mise en place par Fuzz/Eric Dupin, et attestant donc - toujours selon les juges - de la responsabilité éditoriale d'Eric Dupin).
Le dernier point d'éclairage qu'apporte cette affaire, c'est le décalage du coup porté à Fuzz. Olivier Martinez aurait mieux fait de choisir d'attaquer l'individu à l'origine du dévoilement de sa vie privée, au lieu de s'en prendre au site ayant agrégé et relayé l'information, même si cette agrégation contribua grandement à donner une visibilité à cette information. C'est donc là encore de désintermédiation qu'il s'agit. Mais d'une désintermédiation auctoriale et non plus éditoriale. Personne ne semble se soucier en effet de l'individu à l'origine de l'information. Conclusion (temporaire) : la visibilité éditoriale devient l'autorité factuelle et engage la responsabilité civile du vecteur de visibilité (le site Fuzz).

<Update de 5 minutes plus tard>Etonnant ... le site Libération semble être affecté par le verdict de l'affaire puisqu'après avoir publié aujourd'hui même une page relayant la rumeur du mariage entre Olivier Martinez et Kylie Minogue (preuve en image n°1), il a promptement ôté ladite page de son site à l'heure (21h40) où j'écris ce billet.

Kyliemartinez_2

Ayepu

Ou comment Libération invente le mouvement perpétuel en balladant son lecteur, puisqu'en utilisant "le moteur de recherche de notre base archive" on tombe sur la copie d'écran n°1 avec l'adresse de l'article, laquelle adresse nous amène à la copie d'écran n°2 qui nous ramène ... etc ... etc ...
</Update>

<Update de 5 jours plus tard> Explication du revirement de libé sur @si.</Update>

(Temps de rédaction de ce billet : 1h30)