Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Faites briller les Chromes : Google OS est officialisé.

Le 2 Septembre 2008, à propos du lancement du navigateur Google Chrome, j'écrivais ceci :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. (...) En Avril 1975, deux étudiants américains fondent leur société. Ils l'appellent Microsoft. 10 ans plus tard, en 1985, la première version de Windows débarque sur le marché ... En Septembre 1998, deux étudiants déposent le nom de domaine Google.com. 10 ans plus tard ..."

Presque 2 ans plus tard, le 7 Juillet 2009, Google officialise la sortie programmée de "son" OS, basé sur "son" navigateur Google Chrome :

  • "the operating systems that browsers run on were designed in an era where there was no web. So today, we're announcing a new project that's a natural extension of Google Chrome — the Google Chrome Operating System. Google Chrome OS is an open source, lightweight operating system that will initially be targeted at netbooks."

Le WebOS c'est quoi ??
Le webOS c'est la migration du "Desktop" (bureau comme interface du disque dur) vers le "Webtop" (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack avait rédigé sur le sujet un article de référence qu'il n'est jamais trop tard pour relire : "The future of the Desktop".

Le WebOS c'est quand ??
Pas d'affolement. Ce sera pour la seconde moitié de 2010 selon le billet d'annonce de Google. A  moins ... à moins que Microsoft ne lui grille la priorité lors de la prochaine annonce de son prochain système d'exploitation. Laquelle annonce doit intervenir prochainement. Ce qui conduit à se poser la question de l'opportunité d'une telle annonce de la part de Google, à quelques jours de l'annonce du prochain OS de Microsoft (annonce prévue pour Lundi prochain). Car entre ces deux-là c'est naturellement une éternelle course à l'innovation. Et les effets d'annonce ... s'ils sont opportunément ciblés ...
D'ailleurs, finalement, pas besoin d'attendre 2010 pour expérimenter le WebOS : vous l'utilisez tous les jours : chaque fois que vous consultez vos mails en ligne, chaque fois que vous alimentez un compte FLickR ou DailyMotion, chaque fois que vous travaillez sur un Wiki ou échangez et partagez des documents, chaque fois que vous faîtes une recherche sur Google, chaque fois que vous activez un historique de recherche, chaque fois que vous vous identifiez en ligne pour bénéficier d'un service. Le WebOS, vous y êtes déjà !

Le WebOS de Google ressemblera à quoi ??
D'après le billet de Google, il sera Open Source (ce qui permet à la firme de bénéficier des meilleurs développements et de la meilleure diffusion possible à moindre coût), "légér" (c'est à dire qu'à la différence de ses glorieux aînés dont la longue série des Windows, il ne devrait pas nécessiter des kilo-tonnes de ressource mémoire pour lancer une application de traitement de texte). Il sera "rapide", "simple", et "sécurisé", les éternels 3S ("Speed, Simple & Secure").
L'interface sera "minimale" et l'utilisateur, comme dans Google Chrome, n'aura pas à se soucier de problèmes de virus et autres malwares, c'est Google qui se chargera de tout (en maintenant, par exemple, une liste de malwares). Voilà pour la couche de base.
Les applications seront multi-plateformes : "apps will run not only on Google Chrome OS, but on any standards-based browser on Windows, Mac and Linux thereby giving developers the largest user base of any platform."
Et je l'installe où mon webOS ? Premiers visés, les Netbooks (mini-pcs). Et naturellement l'ensemble de la gamme des cellulaires, sur laquelle Google est déjà positionné avec Android. Deux développements qui ne sont pas indiqués comme concurrents, mais qui bénéficieront nécessairement de passerelles ou de couches communes de développement. Mais pas seulement. Les ordinateurs du bureau "classiques" sont également visés.

Que retenir de tout ça ??

Ce qui est frappant à la lecture du billet de Google, c'est l'insistance mise sur les comportements et les attentes "full-web" des utilisateurs (avoir un ordinateur qui "démarre vite", consulter ses mails, partager des documents, etc ...). Frappant mais loin d'être étonnant : tout cela est la suite logique :

  • de la dérive des continents documentaires,
  • de l'essor (et de l'optimisation) des terminaux de téléphonie mobile (dont naturellement l'I-Phone),
  • de la migration "dans les nuages" de l'ensemble des nos comportements informationnels
  • et, in fine, des programmes et outils les sous-tendant.

D'ailleurs, c'est pas pour faire le malin, mais le 21 Avril 2005, Le Monde reprenait à sa une un billet intitulé : "Le jour où notre disque dur aura disparu." Notre disque dur n'a finalement pas disparu mais (c'était la thèse défendue dans l'article), il s'est entièrement déplacé. Il est aujourd'hui "dans les nuages" (cloud computing). Un peu comme dans la métaphore de l'oignon (déjà utilisée par d'illustres aînés), de couches en couches (d'abord les mails, puis les photos, puis les applications permettant de retoucher les photos, puis les "suites bureautiques", puis le stockage massif de fichiers en tous genres, puis les protocoles de travaux collaboratifs en tous genres, etc ...), de couches en couches, ne reste aujourd'hui de feu notre "environnement de travail de bureau" que l'essentiel : un bouton marche-arrêt, une interface, une clé - celle du moteur-monde -, et une porte - celle navigateur planétaire. C'est précisément cet essentiel auquel Google propose aujourd'hui de s'attaquer.

Par le petit bout de la lorgnette.
L'officialisation du lancement d'un OS Google 100% full-web bâti autour de son navigateur ne surprendra donc pas les analystes, même si certains feindront l'étonnement ou affirmeront ne pas y croire en indiquant qu'il s'agit là pour l'instant d'un simple effet d'annonce. Ce que nous raconte l'annonce de ce prochain webOS, c'est l'inversion totale de la stratégie d'équipement d'une grande firme industrielle. Les deux approches (Microsoft et Google) sont des symétries parfaitement opposées. Microsoft à toujours joué la carte de la périhérie : il s'agissait de fournir le pack complet, de négocier avec les fabriquants pour l'installation par défaut de Windows, bref de faire en sorte d'encercler totalement l'utilisateur pour pouvoir ensuite se recentrer sur les services (mises à jour, nouvelles versions, patchs, anti-virus, etc ...). La stratégie de Google est d'une immuable centralité : Le moteur de recherche était là au départ, et c'est, encore 10 ans plus tard le même moteur qui conditionne l'existence même du navigateur (grâce par exemple à la base de donnée constituée en temps réel sur les différents sites de malwares), comme c'est le même moteur de recherche qui conditionne le futur WebOS. Ce que nous raconte l'annonce de Google Chrome au-delà de l'informatique dans les nuages, c'est que cet OS sera développé pour des utilisateurs qui l'ont (déjà) choisi et resteront libres d'en choisir un autre (liberté illusoire tant ils sont déjà prisonniers consentants de l'écosystème Google). Ce qui là encore est l'exact opposé - et le principal souci - de Microsoft.
Ce qui est fascinant dans tout cela c'est que la stratégie de Google apparaît limpide, à l'unisson de l'évolution actuelle du web. Comme une métonymie assumée autant que programmatique. Comme une boucle qui s'achève. Où comme un étau qui se resserre encore davantage. Sur chacun de nous. Inexorablement.

<Update de 5 minutes plus tard> A noter également comme une magnifique et prometteuse illustration du WebOS, cette annonce d'un système d'exploitation complet et open source tenant, avec l'ensemble de ses applications (un 40aine de logiciels également open source), sur une clé USB à 5$ ... le tout dans le cadre du programme OLPC (One Laptop Per Child) ... On en reparle à la rentrée ... </Update>

Z'en parlent aussi :

Moteur de recherche de signaux

Les moteurs de recherche sont les premiers auxiliaires de notre accès au net. Ceux-ci comptent déjà nombre de profondes mutations, tant en terme de technologie qu'en terme de modèle économique et de poids sur des pans entiers de l'activité du "monde réel". Ils ont successivement joué le rôle : 

  • de moteurs d'accès à des contenus,
  • d'indicateurs de popularité des mêmes contenus (algorithme PageRank),
  • de moteurs de recommandation et de suggestion (fonction "refine search", auto-complétion, etc ...)
  • d'outils d'indexation en temps réel (World Live Web)
  • pour dernièrement intégrer progressivement un part de plus en plus importante de sémantique dans l'affichage (microformats) et dans la recherche des contenus (web sémantisé),
  • tout en restant focalisés sur le carré magique des usages du web (Shopping. Health. Travel. Local), en valorisant et monétisant au maximum les requêtes transactionnelles.

Les mêmes moteurs subissent aujourd'hui une double mutation : celle de l'indexation des profils (la jonction entre moteurs de recherche et réseau sociaux se fera sans aucun doute très prochainement, posant le double problème d'un pan-catalogue des individualités humaines et de la pertinence des profils), et celle de l'indexation du micro-net et de ses micro-contenus (Twitter notamment). Là encore, et indépendamment de la sauce économique à laquelle elle s'accomodera (rachat, intégration), l'intégration de ces micro-contenus ne laisse aucun doute. Elle a d'ailleurs déjà commencée :

L'intégration se fera donc. La question est de savoir comment et pourquoi.
Sur le comment, globalement deux stratégies sont possibles : soit en "isolant" les tweets dans une partie dédiée du moteur de recherche (ce que fit Google avec les blogs en leur réservant un moteur dédié : blogsearch.google.com), soit en les intégrant et en les mixant à l'ensemble des autres résultats. La tendance étant massivement à la recherche universelle et à la fusion de l'ensemble des résultats de recherche, on peut légitimement supposer que c'est la première voie qui sera retenue.
Oui mais à vouloir tout mixer (contenus web, micro-messages, vidéos, news, images ...) on risque la confusion et cela nécessite un art avéré de l'interfaçage (la fameuse "User Experience"). Il est donc également probable que la seconde stratégie soit finalement retenue (= isoler ces contenus dans un onglet et/ou un espace dédié). Bref, on n'en sait rien et on attendra de voir.
Sur le comment toujours, mais dans son versant technique, là encore on notera deux possibilités : soit intégrer progressivement les tweets de quelques comptes (personnes, entreprises ou institutions) "labellisés" comme influents (l'approche qu'à visiblement choisi Microsoft). Soit (ce que fera certainement Google), appliquer la mécanique bien rôdée du PageRank aux Tweets de la même manière qu'aux autres contenus mais avec des niveaux de pondération légèrement différents : les backlinks (liens entrants) pouvant être "remplacés" par les RT, la popularité d'un compte Twitter étant aisément repérable au seul nombre de ses "followers" ou à la mention de son nom (précédé de l'arobase) dans l'ensemble des Tweets.
Des moteurs de recherche aux moteurs de signaux.
Ce qui est aujourd'hui en train de changer dans les notre expérience quotidienne des moteurs de recherche c'est la nature même de la relation qui nous lie à eux. Ils ne sont plus les seuls intermédiaires du début, entre "nous" et "des" contenus. Ils sont devenus des auxiliaires, des adjuvants, des assistants personnels à l'omniscience de plus en plus pregnante (via la personnalisation et la dérive des continents documentaires). Demain, quand l'intégration du micro-net sera passée dans les usages courants (comme l'est l'intégration des news, des vidéos ou des images), demain nous les utiliserons non plus comme moteurs de recherche mais comme moteurs de signaux. Nous n'y chercherons plus des contenus (c'était hier), nous n'y attendrons plus simplement une recommandation et une logique de prescription (c'est aujourd'hui), mais nous voudrons y trouver une qualification de ces contenus. Une qualification qui se voudra la symbiose entre des métriques sociales et comptables.
Un petit Tweet pour un grand bouleversement ?
C'est aux moteurs capables de nous livrer la meilleure qualification que nous souscrirons. Pour y parvenir, la prochaine mue des moteurs de recherche en fera des moteurs de signaux (un Tweet, une modification d'un profil, d'un statut ...). Et particulièrement de signaux "faibles". Ce n'est d'ailleurs pas un hasard si en évoquant les projets de Google en la matière (lancement d'un service de Microblogging search), Marissa Mayer parle de "Clues" (indices) et rapproche cela du Google Trends (tendances). Indices, tendances, signaux. Le meilleur moteur sera celui capable de repérer ces signaux faibles. Ce qui  - si mon analyse est avérée ... - serait à l'échelle de l'histoire des moteurs, un gigantesque bouleversement. L'ensemble des moteurs fonctionnent en effet aujourd'hui sur leur capacité à entériner des signaux forts. Toute leur algorithmie est ainsi pensée : afficher dans les premiers résultats les sites/articles/contenus les plus visibles, les plus cités, les plus commentés, les plus débattus, les plus liés. Depuis l'invention de la bibliométrie dont les fondements ont été implémentés dans l'algorithme du Pagerank, toute l'histoire des moteurs de recherche (et du succès de Google) se tient dans leur capacité à isoler le plus pregnant, le plus visible, le plus "émergé". Une visibilité que nous ne pouvons bien sûr pas "oculairement" percevoir, mais qui est (relativement) simple, limpide, perceptible et "révélable" pour les crawlers du web, comme les phéromones sont naturellement perceptibles aux fourmis. Demain, il leur faudra très probablement être capables de faire l'inverse avec les mêmes critères d'excellence : c'est à dire continuer de jouer leur rôle de localisation de sources (plus personne ne retient aujourd'hui l'adresse d'un site, on tape son nom dans Google et Google, "bookmark" universel, nous livre aussitôt l'adresse du site) ET être également capables de remonter des signaux faibles, c'est à dire des occurences documentaires à faible pertinence absolue mais à forte pertinence relative.

La réalité est pourtant plus compliquée que cela. S'il est vrai que les moteurs de recherche, dans l'héritage de la bibliométrie, ont pour but d'isoler les figures et les contenus les plus "marquants", la bibliométrie (et les moteurs de recherche) a également pour fonction de révéler les réseaux de citation et de collaboration, à savoir ces auteurs, ces contenus nettement moins cités ou liés mais qui, parce qu'ils sont à un moment ou à un autre "associés" aux plus cités, acquièrent une pertinence nouvelle. Il en ira de même pour la collecte de ces signaux faibles. La révélation et l'analyse de leur pertinence aura partie liée avec les contenus et les autorités déjà constitué(e)s, déjà repéré(e)s. En cela, les réseaux sociaux et les sites de micro-blogging constituent de précieux outils de repérage.

Alors quoi ? Alors il est très probable que la prochaine bataille de la pertinence, intégrant le micro-net et ses propriétés spécifiques (fragmentation accrue de ses contenus + "autorités" de plus en plus diluées), se jouera juste en dessous de l'habituelle ligne de flottaison des navigateurs, ligne en dessous de laquelle l'essentiel des internautes ne descend presque jamais consulter les résultats, mais ligne en dessous de laquelle se niche et se nichera toujours davantage la réelle pertinence des résultats, c'est à dire l'adéquation existant entre les signaux faibles détectés et leur corrélation aux contenus et aux autorités les plus saillantes assignées à la requête. Une pertinence qui instrumentalise une apparente sérendipité comme premier auxiliaire de la recherche

Industries des données ou écritures industrielles ?

En écoutant Bernard Stiegler hier sur France Culture dans l'émission "du grain à moudre", je me disais que dans la gradation technologique qui mène du Fordisme à Google, on pourrait établir le genre de hiérarchie suivante :

  • Première pèriode industrielle (1950-1980) : les technologies du "faire" (ère industrielle). La valeur, ce sont les matières premières utilisées dans les chaînes de production.
  • Seconde période industrielle (1980-1997) : les technologies de l'intelligence (l'ouvrage éponyme de Pierre Lévy est publié en 1993). C'est l'avènement du web, des réseaux comme nouvelle infrastructure industrielle. La valeur se tient cette fois dans la perpétuelle dispersion / ré-agrégation des contenus disponibles. La valeur, c'est le lien hypertexte pour le dire plus simplement.
  • Troisième période industrielle (1998-2003) : les technologies de l'accès. Dont on pourrait poser la naissance en même temps que celle de Google. La valeur est alors celle de la mémoire. Mémoire informatique externalisée. Externalisation de nos mémoires documentaires. Google c'est "La" base de donnée (pour reprendre l'expression utilisée par Stiegler dans l'émission en question)
  • Et (il me semble en tout cas), nous basculons lentement mais sûrement dans une quatrième période industrielle (2003-200?), celle des technologies de la capillarité et de l'artefact, bâties autour de mémoires informatiques industrialisées mais autour également d'une "industrialisation de l'intime" (pour reprendre l'expression d'Alain Giffard) qui se donnent - notamment - à lire dans les réseaux sociaux (en 2003, nombre de réseaux sociaux "majeurs" ont atteint un large public). Le système de valeur que se choisira cette quatrième période industrielle pourrait être directement "indexé" sur la porosité choisie, induite ou subie entre notre identité documentaire (les traces que nous laissons sur le réseau) et notre présence retournée (= la collecte et l'agrégation de ces traces telles qu'elles se donnent à lire une fois remixées par les industries des données - moteurs de recherche et réseaux sociaux en tête). Soit le passage d'une externalisation de nos mémoires documentaires à une externalisation de nos intimités mémorielles documentées. Une autre dimension essentielle de cette monnaie sera très probablement celle du synchronisme, défini comme la capacité à faire correspondre les traces de nos activités et les indices de notre présence en ligne. Les questions qui se posent sont naturellement innombrables. L'une des plus saillantes me semble être celle de l'industrialisation possible du décalage qui existe entre ce que nous sommes, ce que nous voudrions être, et ce que nous donnons à lire de nous dans nos systèmes d'écriture sur les réseaux, dans les traces documentaires et documentées que nous y laissons. C'est probablement là un nouveau "temps" pour nos systèmes d'engrammation. Davantage peut-être que des lectures industrielles (Alain Giffard encore), la préemption de l'ensemble de nos traces connectées et déconnectées par les industriels de l'accès et des données, me semble relever de stratégies d'écritures industrielles.

Et demain ? Avec l'internet des objets ("everyware"), avec le web des données, avec la sémantisation des protocoles de recherche et d'interactions en ligne, avec la frontière abolie entre l'intime, le privé et le public, avec le réagencement permanent et la rémanence sans cesse accrue des synchronismes entre le monde réel et le monde numérique ... l'ère qui s'ouvre devant nous verra probablement la fusion des "anciens" agencements machiniques supportant nos lectures industrielles (moteurs de recherche et réseaux sociaux) en un seul nouvel agencement symbolique, une seule entité, une seule monade calculatoire - qui restera diversement instanciée. Le risque est d'y voir se dissoudre, autour de logiques de souscription quasi-incantatoires, ces agencements collectifs d'énonciation qui bâtirent le web. Une dissolution au profit (et nécessairement "for-profit") de la génération auto-entretenue d'écritures industrielles singularisées.
Economie des écritures industrielles.
Je note par ailleurs en même temps que je l'écris, que la "génération auto-entretenue d'écritures industrielles singularisées" est une définition qui semble parfaitement circonscrire le périmètre et l'enjeu de l'affichage des publicités contextuelles et ciblées (Adwords et Adsense). Depuis déjà 10 ans, l'industrie des données met toutes ses forces dans la bataille pour ne jamais tarir la source des ces écritures industrielles. Elle peut ajourd'hui y déverser en temps réel l'intimité de nos mémoires documentaires et documentées. C'est peut-être la clé d'un web à venir, un web implicite mais dont l'implicite ne s'analysera plus seulement à l'aune des artefact techniques proposés.

Le web (implicite ?) de demain est celui que construisent aujourd'hui les agencements algorithmiques qui permettent la génération auto-entretenue d'écritures industrielles singularisées.

L'évidence même.

L'index de Google est - ou devrait être - un bien commun de l'humanité. Et à ce titre nous appartenir collectivement. Merci à Pierre Mounier d'avoir souligné cette évidence. Preuves à l'appui.

Du "cloud computing" au "home computing" : comment le web devînt fractal.

Cloud computing.
On connaissait déjà depuis quelques temps l'âge d'or, les promesses (et les dangers) du "cloud computing", de l'informatique dans les nuages. Le réseau internet repose depuis son invention sur une architecture "client-serveur". Le cloud computing permet à chacun de nous d'être les innombrables "clients" (au double sens du terme) d'une gigantomachie dans laquelle Google, Amazon et quelques autres s'affrontent à grands coups de datacenters et autres "fermes de serveurs". C'est là le climax d'une polarisation extrême de l'architecture client-serveur.
Home computing.

Imaginons maintenant que la polarisation s'inverse et qu'au lieu de disposer de quelques giga-serveurs centralisant l'offre de contenus et de données de la planète internet toute entière, nous retrouvions une architecture dans laquelle chacun d'entre nous demeurerait client mais disposerait à part égale de la possibilité de devenir un serveur. Une sorte de forme réinventée et légèrement décalée de l'architecture peer-to-peer (ou le passage par un point nodal externe aux clients connectés reste obligatoire). Imaginons donc que chacun de nos ordinateurs personnels, via son navigateur, puisse devenir son propre serveur et ainsi proposer à des tiers d'accéder librement à son contenu (téléchargement d'images, de films, de musique) voir même auto-héberger des pages web. C'est la prouesse (?) que vient de réaliser le navigateur Opera avec le lancement d'une nouvelle version de son navigateur baptisée "Opera Unite".

Le WebOS enfin réalisé ?

Il y a belle lurette que la guerre des navigateurs fait rage. Il n'est donc pas impossible que cette sortie soit d'abord un coup marketing pour permettre à Opera de sortir de la zone de confidentialité dans laquelle Internet Explorer, Chrome et Firefox le relèguent. Mais. Mais je viens de tester et d'installer Opera Unite avec un camarade de jeux qui a bien voulu en faire de même. Et le fait est que c'est totalement bluffant.
L'avènement de l'informatique dans les nuages a fait du webOS un enjeu central pour les grands acteurs de l'internet. Comme je l'écrivais dans ce billet :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur."

Fractale_1 Le web fractal. Le webOS était donc réalisé, incarné, sur la scène et sous les auspices des quelques géants du cloud computing, de l'informatique distribuée, "dans les nuages", mais tout aussi massivement distribuée que commercialement vérouillée.
Si la poursuite des essais d'Opera Unite demeure concluante, si celui-ci tient toutes ses promesses, c'est à un nouvel avatar du web qu'il va falloir nous habituer. Un web parfaitement et rigoureusement fractal. Chaque navigateur de chaque ordinateur connecté au réseau devenant son propre client, son propre serveur, son propre client-serveur, son propre internet. C'est là tout l'enjeu du Home Computing.

Quelques réflexions à chaud : vers une nouvelle partition des flux numériques.

  • Tout comme le cloud computing adressait - au sens strict - d'énormes problèmes de confidentialité, ses principaux acteurs disposant de tous les moyens et de toutes les ressources pour constituer une base de donnée des intentions à l'échelle planétaire.
  • Si Opera Unite s'installe dans les pratiques, les marchés des industries culturelles et les projets ubuesques "Hadopi-like" risquent fort de n'avoir pas 6 mois mais bien 10 ans de retard. R.I.P. Hadopi. R.I.P. Christine Albanel. R.I.P. Pascal Nègre. Ce pourrait être un électrochoc comparable à celui que représenta l'avènement de peer-to-peer il y a de cela quelques - courtes - années.
  • Dans une telle configuration, impossible - sauf pour Opera ... - de contrôler quelque flux que ce soit, sauf à imposer des fichiers mouchards à tous les ordinateurs individuels de la planète, ou sauf à transformer tous les FAI (fournisseurs d'accès à Internet) en zélés délateurs doublés de Vidocqs des réseaux.
  • Cette nouvelles architecture fractale du Home Computing va également poser, non plus aux autorités politiques, commerciales ou judiciaires, mais bien aux utilisateurs eux-mêmes, d'énormes problèmes de confidentialité et de sécurisation de leurs données personnelles. En poussant à peine un peu les scénarios imaginables, on pourrait même se retrouver dans une situation diamétralement inverse à celle que nous connaissons actuellement, situation dans laquelle les particuliers confieront (pour des raisons de sécurité) leurs données importantes aux des acteurs majeurs du cloud computing, pour laisser le home computing transformer leurs ordinateurs personnels en simples terminaux d'échanges. Une virtualisation totale de l'échage et du stockage numérique, mais avec une nouvelle "partition" (au sens informatique du terme) des espaces et des termes mêmes de l'échange. 

Quelques liens pour une découverte plus approfondie de l'outil et des enjeux :

(Sources : sous les liens // Temps de rédaction de ce billet : 2 heures, tests du navigateur non-inclus :-)


Is it a bird ? Is it a plane ? No. It's a monopolistic library-bookseller.

La dernière fois que je vous avais entretenu de l'un de mes sujets de prédilection, Google Books, c'était pour me faire l'écho (et tenter l'analyse) de la dernière bombe lancée par Google sur les pauvres casques bleus du commerce du livre :

Nous étions alors en Novembre 2008, et le désormais célèbre Google Book Settlement venait de paraître. Que s'est-il passé depuis ?

Planète Opt-Out.

Le grand numérisateur a tout pris. Livres libres de droits, livres sous droits, livres dans la zone grise et oeuvres orphelines. Tout y est, ou presque. Et même s'il est toujours quasi-impossible d'estimer réellement le nombre d'ouvrage réellement numérisés et disponibles dans Google Books, la fourchette raisonnable se situe entre 7 et 10 millions d'ouvrages numérisés, pas mal pour un projet lancé en 2005.
Et l'heure est désormais aux ultimatums. Soit vous souhaitez jouer le jeu de Google et entrer dans le modèle qu'il propose et qui vous permettra d'être indemnisé pour vos oeuvres (vous avez alors jusqu'au 5 janvier 2010 pour vous déclarer), soit vous décidez de bouder, vous vous réservez le droit d'attaquer Google en justice, et là vous avez le droit de continuer à ne pas toucher d'argent ou si peu, d'entrer en résistance, et là vous avez jusqu'au 4 septembre 2009 pour le faire (la date était initialement celle du 5 mai, mais elle a été prolongée à la demande des associations d'auteurs). Comme le rappelait ActuaLitté le 21 Avril 2009, "éditeurs allemands, autrichiens et Suisses germanophones ont choisi d'accepter le contrat proposé par Google plutôt que d'entrer dans un conflit juridique". D'autres suivront. A n'en pas douter. Il n'y a guère qu'en France (et aussi un peu au Québec), que le SNE et La Martinière décident de se payer le luxe d'un affrontement juridique qui pour en être très noble n'en est pas moins voué à l'échec. Mais au pays de Cyrano, on mise beaucoup sur le panache. La prise de position du SNE est d'ailleurs assez largement ambigüe (pour ne pas dire illisible) dans la mesure ou il recommande tout à la fois aux éditeurs de participer au réglement (settlement) tout en dénonçant le fait que celui-ci est contraire aux principes du droit d'auteur en France (mais cette territorialisation du débat est-elle réellement viable, y compris juridiquement ...) et en maintenant donc une ligne d'affrontement juridique déclaré (tribune détaillée du SNE à lire en .pdf chez Légipresse).

Masse critique.
Alors que les usages de E-books émergent massivement et rencontrent un marché qui dépasse largement les seules "niches" ou certains experts voulaient le cantonner, la question de l'offre, et plus précisément du volume de l'offre s'affirme chaque jour davantage comme absolument cruciale. Et là encore, quand Google décide de faire feu, ce n'est pas quelques dizaines, ce ne sont pas 1000, quelques milliers ou quelques dizaines de milliers d'ouvrages qu'il verse au pot commun, mais bien 500 000 ouvrages libres de droits, lisibles au format E-pub pour la liseuse Sony. Et oui. Car on parle aussi désormais de plateforme technologique. A ma gauche, Amazon, son Kindle et son format. A ma droite, Google, son thesaurus (qui est aussi un trésor) de guerre, et ses partenariats avec la liseuse Sony dans un format (E-pub) non supporté nativement par le Kindle. Le combat des chefs.
Mi-mars 2009, l'e-Book Store de Sony affichait plus de 600 000 livres suite au dernier "versement" de Google. Amazon affiche de son côté plus de 230 000 titres. Il va sans dire que la granularité des deux offres est sans commune mesure, les 500 000 ouvrages de Google étant pour l'essentiel (la totalité ?) libres de droit quand ceux d'Amazon sont pour l'essentiel des ouvrages sous droits. Ceci étant dit, c'est là un bien beau produit d'appel dont on Lionel Maurel ne sait quoi penser :

  • "D’un côté, on peut y voir pour l’instant un progrès dans l’accessibilité aux œuvres du domaine public, qui vont trouver une nouvelle vie par le biais du Reader. Mais plusieurs commentaires envisagent déjà le risques qu’à moyen terme l’accès à ces e-books ne devienne payant, une fois que les liseuses auront trouvé leur public. Et dans ce cas, il y aurait une forme de “privatisation” du domaine public, préjudiciable et d‘autant plus contestable que les originaux papier de ces livres ont été fournis par les bibliothèques partenaires de Google.Notons par ailleurs que visiblement, lesdites bibliothèques partenaires n’ont absolument pas eu leur mot à dire lors de cette transaction avec Sony … une des conséquences directes de l’exclusivité exigée par Google en contrepartie de ses largesses …"

(Voir aussi le mode d'emploi pour la récupération desdits titres, mode d'emploi qui rappelle très justement l'occasion ainsi donnée à Sony d'étoffer un peu son fichier client ...)

Google'Zon & Amaz'oog : l'infanterie et l'artillerie.
L'erreur serait de penser l'opposition frontale entre Google et Amazon comme un affrontement se jouant à armes égales. Cet apparent duopole n'en est pas un. Amazon est dans une logique d'artillerie : il est à la fois son alpha et son oméga, fixant les prix d'une offre qu'il maîtrise de bout en bout pour une tablette qu'il fabrique. Soit une artillerie pensée comme une architecture en vase clôt mais à la puissance de tir phénoménale. Google est dans une logique d'infanterie. Même s'il dispose d'autant de verrous que nécessaire, il laisse les éditeurs monter au créneau et défendre ses positions en leur permettant d'établir une liste indicative de prix de vente dont il déterminera seul lequel doit être in fine retenu. Amazon contrôle son stock, son flux de marché, et fait du prosélytisme autour de sa tablette et de ses formats. Google contrôle "un" stock (qui n'est pas encore "le" stock mais pourrait bientôt le devenir), et avec le Google Book Settlement se met en position de contrôler le marché et ses flux. Sur ce terrain, c'est Google qui a l'avantage sur le long terme, car il dispose des moyens de piloter (au sens cybernétique du terme) l'ensemble de l'offre d'ouvrages sous droits en laissant l'infanterie (auteurs, libraires et éditeurs) essuyer le feu nourri et les pertes qui ne manqueront pas de subvenir dans cette période d'engagement.

Un flux de marché multi-canaux. Autre avantage de poids pour Google, son flux de marché ne se limite pas aux seules tablettes électroniques, c'est toute la chaîne des périphériques (informatiques) et des services (numériques) dont il est en capacité de se servir pour déployer son offre. Google annonce (à l'occasion de la Book Expo America) qu'il se positionnera sur ce marché (celui de la lecture et non du "livre" numérique) d'ici à la fin de l'année 2009. Mais il ne parle pas d'e-books mais bien plutôt de terminaux orientés Web ("web-enabled devices"). Plus d'un million et demi d'ouvrages libres de droits sont ainsi dès maintenant lisibles sur votre téléphone portable (et si vous n'avez pas d'IPhone, vous pouvez quand même "faire comme si" ... ici) Quand Amazon pense "structuration du marché et de l'offre", Google, selon un gimmick bien ancré dans la culture de la firme, raisonne en termes d'offre de service. Ce qui, jusqu'ici, ne lui a pas trop mal réussi ...

Éditeur dans les nuages. Quand Amazon conditionne (une partie de) son marché à l'adoption des Ebooks, Google se moque de savoir si lesdits ebooks constitueront un jour ou non un marché de masse (ou de niche suffisamment rentable). Google s'en moque parce que ce que vise Google ce n'est pas un marché, c'est un écosystème, celui du Cloud Publishing, de l'édition dans les nuages. Et faut-il rappeler qu'il est déjà leader dans le domaine du "cloud computing" ...

BVL. Bureau de vérification de la littérature. Le commandement général de cette infanterie sera assuré par l'algorithmie et l'écosystème de services de la planète Google, mais plus précisément incarné par Michael Healy, récemment nommé à la tête du BRR (Book Rights Registry), cet organisme créé de toutes pièces par Google (et financé par Google ... tant qu'à faire hein ...), et chargé de créer et d’administrer LA base de données des ayants-droits de la totalité des livres concernés par le Google Settlement. 

Le monde se réveille. Avec la gueule de bois.
Ce qui depuis 3 ans paraît évident et nécessaire aux yeux des analystes (dont très modestement votre serviteur) à savoir l'affrontement entre les deux géants Amazon et Google autour d'une offre marchande d'ouvrages n'existant qu'en leur flux numérique, apparaît aujourd'hui subitement dévoilé. Et c'est le New-York Times qui ouvre le bal dans un article daté de son édition du 31 Mai : "Preparing to Sell E-Books, Google Takes on Amazon."

J'ai mal à ma poldoc. ("poldoc" : en jargon bibliothéconomique, désigne la "politique documentaire", c'est à dire le choix des fonds accessibles) Il est un point qui est moins discuté - parce que moins "vendeur" - dans le cadre du Google Book Settlement, c'est la manière dont les ouvrages pourront être mis à disposition des bibliothèques. Et là aussi, fort heureusement, mais peut-être un peu tardivement, on commence à appeler un chat un chat. Il y eut bien sûr le lumineux papier de Robert Darnton (version originale ici) qui dit avec une profondeur d'analyse séduisante, tout le danger potentiel que représente la main mise de Google sur la prescription documentaire :

  • "Après avoir lu l'accord passé entre Google, les auteurs et les éditeurs, et s'être imprégné de sa philosophie - ce qui n'est pas une tâche facile puisque le document s'étire sur 134 pages et 15 appendices-, on en reste bouche bée : voici posées les fondations de qui pourrait devenir la plus grande bibliothèque du monde. Une bibliothèque numérique, certes, mais qui battrait à plate couture les établissements les plus prestigieux d'Europe et des Etats-Unis. De surcroît, Google se hisserait au rand de plus grand libraire commercial de la planète - son empire numérique relèguerait Amazon au rang de boutique de quartier. (...) Google Book Search est sur le point d'inaugurer la plus grande bibliothèque et le plus important magasin de livres de l'histoire. Quelle que soit la manière d'interpréter cet accord, ses dispositions s'imbriquent de manière si inextricable qu'elles s'imposent en bloc. Aujourd'hui, ni Google, ni les auteurs, ni les éditeurs, ni la cour de district de New York ne sont en mesure d'y apporter des changements notables. C'est un tournant majeur dans le développement de ce que nous appelons la société de l'information. Si nous ne rééquilibrons pas la balance, les intérêts privés pourraient bientôt l'emporter pour de bon sur l'intérêt public. Le rêve des Lumières serait alors plus inaccessible que jamais".

Il y a désormais le débat posé en termes clairs, celui de savoir si la partie "bibliothèque" du Google Book Settlement représente ou non une privatisation des "ressources" tout autant que des "fonctions" de la bibliothèque. De mon côté j'avais déjà largement insisté (et je maintiens) sur le risque réel d'un eugénisme documentaire, qui dépasse - à mon avis toujours - et de loin, le seul risque d'une privatisation (au sens anglo-saxon du terme) des fonds documentaires planétaires.

Le plus rageant dans cette affaire c'est qu'en en restant au sein de notre hexagone, on compte, ces 10 dernières années, au moins 3 ou 4 rapports pointant la nécessité stratégique de régler le problème des oeuvres orphelines (via une gestion centralisée), cette fameuse "zone grise" de la littérature, qui constitue le coeur de nombre de collections bibliothéconomiques, zone grise sur laquelle Google a irrémédiablement fait main-basse et dont nous ne commençons qu'à peine à entrevoir les potentialités économiques. C'est ce que rappelle (entre autres choses) cet article du New York Times daté du 4 Avril :

  • "While the registry’s agreement with Google is not exclusive, the registry will be allowed to license to others only the books whose authors and publishers have explicitly authorized it. Since no such authorization is possible for orphan works, only Google would have access to them, so only Google could assemble a truly comprehensive book database.
    “No other company can realistically get an equivalent license,” said Pamela Samuelson, a professor at the University of California, Berkeley, and co-director of the Berkeley Center for Law and Technology.
    "

Le lobbying comme dernière arme ? Nul ne semble aujourd'hui réellement en mesure de rivaliser avec Google sur le marché de la capitalisation (au sens propre) des savoirs et des connaissances. Et ce n'est pas, loin s'en faut une question d'argent. La meilleure preuve est le simple abandon par Microsoft de son outil de recherche de livres. Le même Microsoft qui trouve actuellement bien plus stratégique de financer une chaire de recherche "sur" le Google Book Settlement à la New York Law School institute.

Google Books, volet bibliothèques. Comme je l'écrivais plus haut, si l'actualité se concentre sur le réglement Google, lequel concerne les oeuvres orphelines et les oeuvres sous droit, cela ne doit pas faire oublier que le troisième - et historiquement premier - volet de l'entreprise de numérisation continue d'avancer à grands pas. Ainsi, le 26 Mars, Google a annoncé sur son blog être arrivé au terme du contrat de numérisation "historique" l'unissant à la bibliothèque d'Harvard. Il aura mis 5 ans. Je bloguais alors sur Urfist Infos et j'avais relayé ce qui s'annonçait déjà comme un projet "historique". 5 ans plus tard, sur les 15,8 millions de volumes libres de droit de la bibliothèque, on ne sait toujours pas, ni sur la FAQ d'Harvard, ni dans le billet du blog de Google, combien de volumes sont aujourd'hui rendus disponibles. Il nous faudra nous contenter de ceci "we have digitized and made available (...) many hundreds of thousands of public domain books". Plusieurs centaines de milliers ... On ignore combien mais on mesure l'échelle. On connaît aussi la loi de Moore et l'on observe les mutations en cours de l'objet autant que du marché-livre. Et l'on est comme groggy devant l'enjeu.

Nous y voilà. En novembre 2006, dans un article paru dans la revue Les cahiers du SLF, j'écrivais :

  • "les « moteurs de recherche » ne le sont plus qu’à la marge. Leur véritable activité, la seule génératrice de chiffre d’affaire, est celle de la monétisation publicitaire de l’ensemble du bouquet de services qu’ils offrent : de la découverte ou de la création du besoin jusqu’à sa transformation en acte d’achat, l’ensemble du circuit de consommation est ainsi réalisé en cercle fermé.  La bataille de l’information étant gagnée à leur entier bénéfice – la crise de la presse en ligne en témoigne – les moteurs entrent dans une autre guerre commerciale dont le livre n’est que l’un des premiers retranchements (...)."

Et plus loin dans le même article :

  • "la « monétisation » de l’ensemble des services offerts est inéluctable. Le lancement du tout récent Google Checkout , équivalent du site de paiement sécurisé PayPal, confirme qu’un droit d’entrée sera tôt ou tard prélevé par Google sur l'ensemble de sa panoplie de service, livres y compris. Le seule question est : à quelle hauteur ?"

De colloques en conférences, de grands cénacles en petits comités d'initiés, j'ai répété (avec d'autres ...) depuis plus de 3 ans révolus que Google serait nécessairement libraire, bibliothécaire et éditeur. Et que, nécessairement, cela se ferait beaucoup plus vite qu'on ne pouvait le penser (avant l'obtention de leur diplôme de DUT ai-je encore pris le pari avec mes étudiants de l'IUT de la Roche sur Yon ... pari gagné ;-). Avec d'autres j'ai essayé de convaincre de la nécessité absolue d'une contre-offensive "de poids", sur trois axes :

  1. un portail de recherche fédérée regroupant l'essentiel de l'offre des libraires dits "indépendants",
  2. une réflexion de fond sur les usages, avec la mise en place d'expérimentations à couverture ou à portée nationale.
  3. une bibliothèque numérique qui ne soit pas seulement interface mais d'abord et avant tout contenus, contenus moissonnés pour être d'abord rassemblés, et pour être, ensuite seulement, distribués dans le cadre d'un bouquet de services et d'applications.

3 ans plus tard :

  • le portail de la librairie française "indépendante" n'a jamais vu le jour, et ne le verra probablement jamais. Ou alors - ce qui est pire à mon sens - il finira par voir le jour mais ne sera plus piloté par les acteurs (libraires et idéalement auteurs) mais par les fournisseurs (Hachette et d'autres ...)
  • les études de terrain portant sur les usages s'exhibent dans quelques cénacles et dîners mondains sans qu'aucune dimension stratégique réelle ne leur soit dévolue
  • Gallica intègre depuis quelques mois à peine une offre légale d'ouvrages sous droits dont l'indigence du fonds le dispute à l'inadéquation au public
  • les différents projets de bibliothèque mondiale, universelle ou interplanétaire hésitent toujours entre interface et contenus (et font hélas le plus souvent le choix de la seule interface "à rebond", laquelle vous renvoie vers les contenus ... via d'autres interfaces ...)

La proie et l'ombre. Pendant ce temps, Google avance. Pendant ce temps les dispositifs de lecture électronique, Kindle en tête, s'étendent bien au-delà de leur seul supposé "marché de niche", pendant ce temps, l'ombre tutellaire d'un omnipotent GoogleZon a remplacé la proie que constitua pour lui (et pour d'autres) une politique publique du livre et de la lecture. La récente démission de Benoît Yvert et la nomination d'un remplaçant "par interim" à la tête de la DLL et du CNL atteste du niveau de sanctuarisation à rebours de la réflexion et de l'action culturelle de ce gouvernement.

A l'horizon ...

Reste à Google au moins un épineux problème : celui de la valeur juridique de son "accord" au regard de la législation anti-trust d'une part et au regard de la législation européenne d'autre part. La commission européenne va d'ailleurs bientôt se pencher sur la chose. <Message subliminal> une bonne raison de plus pour aller voter dimanche :-) </message subliminal>

Google libraire. Google bibliothécaire. Amazon éditeur. Amis admirateurs de l'ancienne (antienne ?) chaîne-du-livre-en-un-seul-mot, vous voilà désormais affranchis. La messe est pourtant loin d'être dite. L'avenir donnera lieu a de bien beaux débats, a de bien belles analyses délicieusement partisanes, soulèvera de nouvelles questions essentielles pour ce que l'on appelle - par le tout petit bout de la lorgnette - l'avenir de la prescription documentaire, et qui n'est rien moins - sans lyrisme déplacé - que le simple avenir de la transmission des savoirs et de la culture à l'échelle de la planète. 

Compléments ...

A lire également :

(Temps de maturation de ce billet : 2 mois // Temps de rédaction de ce billet : 8 heures ... soit deux - grosses - soirées ...  // Sources : sous les liens avec une mention et un merci particulier à Virginie et Hervé pour leur veille attentive)

Bing. Je fais confiance à Microsoft ...

Je fais confiance à Microsoft ... non pas pour construire de bons produits, mais pour sa parfaite maîtrise du marketing, c'est à dire, littéralement, pour son sens du "marché". Et donc en ce moment, côté Microsoft, ce dont tout le monde parle, ce qui buzze, c'est le prochain lancement du prochain moteur de recherche microsoft, baptisé "Bing" (mais qui devait initialement s'appeler Kumo, "araignée" en japonais)
Rappel des faits
Bing vient remplacer "LiveSearch" (dont les parts de marché sont en chute régulière, à l'image de la pertinence de ses résultats). Pour "se refaire" sur le marché de la recherche d'information, Microsoft a misé gros sur le rachat de la technologie alimentant le moteur (sémantique) Powerset : c'était il y a un peu moins d'un an, le premier Juillet 2008.
Le Buzz de Bing.
Dans cette affaire de buzz savamment orchestré, la presse et la blogosphère jouent à plein leur rôle de chambre d'écho sur l'air de la ritournelle du choc des titans : Microsoft Corp. contre Google Inc., Bing contre Google.
Pour le reste, il faudra attendre ... le 3 Juin, date officielle de lancement du produit. Sans attendre, j'ai donc fait le tour des principaux articles sur le sujet, disséqué les copies d'écran circulant sur le net, consulté le "product guide", et surtout, j'ai regardé la vidéo officielle de lancement (le teaser). Qu'y ai-je vu ?

Première minute.

Bing-o sur la catégorisation "light"
Un truc qui - c'est d'actualité - mise sur la sémantique. Pas sur le "web sémantique" comme idéal mais sur la "sémantique prosaïque" pour l'usager lambda, c'est à dire une forme de catégorisation légère et autant que possible transparente.
Bing-o sur les requêtes transactionnelles.
Ce que cherchent majoritairement les gens sur Internet, ce sont des billets de train, d'avion, des ustensiles de cuisine, des fringues, le tout à moindre coût et avec un maximum de "critiques" (reviews) pour pouvoir finaliser leur acte d'achat dans les meilleures conditions possibles. Et de fait, le teaser de Bing laisse une TRES large place à la mise en avant de ces requêtes transactionnelles, dans le résultat desquelles s'affichent à foison différentes visualisations (par ailleurs intéressantes) des avis et autres opinions des "autres clients ayant aussi acheté/testé ce produit".
En fait, après avoir visionné une bonne dizaine de fois ce trailer, j'ai surtout eu l'impression que Microsoft venait d'inventer ... le guide FNAC. Une requête = un produit = des avis (structurés en différentes catégories, fonctionnalités du produit, etc ...)
Deuxième minute

Bing
SHOPPING. HEALTH. TRAVEL. LOCAL. Voilà les 4 "angles", les 4 accroches choisies dans la seconde partie du teaser de microsoft. Ce n'est certes pas un scoop, mais c'est une confirmation et une illustration. Confirmation que massivement, à l'échelle planétaire, les 4 usages les plus répandus des moteurs de recherche sont, dans l'ordre : 

  • les achats en ligne via des comparateurs,
  • les requêtes portant sur le domaine médical (médecine personnelle)
  • les voyages
  • les recherches locales (un restaurant ouvert ce soir près de chez moi, la pharmacie de garde, les spectacles sympas à voir dans ma ville, etc. ..)

SHOPPING. HEALTH. TRAVEL. LOCAL. Si j'étais un marketer dans l'âme, et si j'étais à la recherce d'un nom qui buzze pour le prochain Google-killer, je tenterai bien un truc sur la base de ces 4 initiales. SHTL. Euuh ... SHUTTLE ? Ah ben non déjà pris :-(

Le carré magique des usages du web.

Bon redevenons sérieux. Ce carré parfait des usages du web peut d'ailleurs être affiné, toujours grâce au talent marketing de Microsoft. Pour chacun de ces 4 approches, Microsoft met en avant une requête :

  • SHOPPING (digital cameras).
  • HEALTH (Diabetes).
  • TRAVEL (United 875).
  • LOCAL (French Restaurant).

On dispose là d'une segmentation parfaite du coeur de cible de Microsoft, c'est à dire ... de la planète (américaine).

  • Ce que les gens (à tout le moins les américains, premier marché visé par ce trailer), ce que les gens achètent le plus sur Internet, ce sont des appareils photo numériques.
  • La majorité des requêtes dans le domaine de la santé/médecine personnelle portent sur le diabète (là encore, pas étonnant au regard des habitudes nutritionnelles de nos amis du nouveau monde).
  • Les voyages plébiscités sont ceux des lignes intérieures (aux états-unis, les gens voyagent beaucoup et souvent en avion, géographie territoriale oblige).
  • L'essentiel des recherches locales ou de proximité ont pour objectif de trouver un petit restaurant sympa à New-York, donc un petit restaurant français :-)

SHOPPING. HEALTH. TRAVEL. LOCAL. Et plus précisément donc : Appareil photo, Diabète, Vol intérieur, Restaurant. Second carré parfait des usages du web.

Et à part ça ?

A part çà, en deux minutes trente de trailer, j'ai vu un truc qui quand il ne réinventait pas (intelligemment) les guides FNAC, ressemblait beaucoup à ce que propose déjà ... Google.
Alors ... combat de titans annoncé ou soufflé marketing vite effondré ?
Pour le savoir il faudra attendre de tester réellement Bing (le 3 Juin donc). En attendant, tout ce que je peux en dire c'est que Bing, reposant sur la technologie Powerset n'est en lui-même porteur d'aucune innovation réelle. La plupart des fonctionnalités proposés sont déjà mises en place par Google ou par Exalead (pour ne citer qu'eux deux). En revanche, elles sont proposées (par les autres moteurs) d'une manière pour l'instant plus "éclatée" et moins homogène, moins "intégrée", moins transparente. A la vue de ce court trailer l'une des plus belles promesses de Bing semble être la mise en cohérence et en transparence de fonctionnalités collant au plus près des usages mainstream du web. De la même manière que Windows avait installé les usages mainstream de la micro-informatique. 

Mainstream Microsoft ? Nihil novi sub sole ;-)

(Temps de rédaction de ce billet : 2 heures)

L'envahissement par contamination : quand Google escamote son propre contenu

Alors qu'elle occupait déjà parfois plus des 2/3 des résultats affichés au-dessus de la ligne de flottaison du navigateur, la publicité fait désormais son entrée au sein même de l'espace de requêtage, via la fonction Google Suggest :
Googleadsearch

Plusieurs remarques :

  • primo, la pertinence de cette nouvelle fonctionnalité dans l'environnement et le modèle économique de la firme. Les requêtes transactionnelles occupent - chez Google comme chez les autres moteurs - une très large place, et c'est là l'occasion d'augmenter significativement leur taux de clic (et donc les revenus publicitaires liés)
  • deuxio, cela atteste d'un envahissement, par contamination, de tous les espaces sémiotiques disponibles dans ce qui représente aujourd'hui, tant par le nombre d'accès que de consultations, le parangon de l'interface technologique.
  • tertio, cet envahissement est révélateur d'un trouble : il opère une substitution. En plaçant l'affichage et "l'induction" publicitaire dès avant le déroulement même de la requête, il "escamote" littéralement la possibilité de visualiser côte à côte les résultats organiques et les les résultats commerciaux du moteur. 
  • quarto : il est révélateur d'une certaine idée du web implicite dans sa déclinaison marchande. Dans un ancien billet j'écrivais à ce sujet : "Demain probablement, ces mêmes applications, ces mêmes moteurs, sauront et ce sans même avoir besoin d'une requête initiale, d'un "amorçage", sauront ce que nous sommes le plus susceptibles de chercher ou de saisir comme requête selon l'heure de la journée, le lieu de notre connexion ou encore notre environnement." Monétiser l'intentionnalité au moment même où celle-ci est entrain d'être formulée.

Conclusion : Cette fonctionnalité est profondément signifiante. Elle marque le passage à une nouvelle étape.

  • Avant-hier, la publicité était proposée par les moteurs dans une logique de complémentarité aux résultats organiques.
  • Hier, grâce à sa contextualisation, la publicité fut proposée par les moteurs (Google en tête) comme le strict équivalent des résultats organiques. "Ads are content" : "les publicités sont du contenu" ou "les publicités sont le contenu" ?
  • Désormais, la publicité escamote la possibilité même de consulter les résultats organiques. Ce faisant, Google indique clairement que la recherche, le "search" n'est nullement une fin, seulement un moyen.

Une question ... Quand on connaît l'importance (pour une société, une entreprise ...) de figurer en bonne place dans les résultats sponsorisés du moteur, on peut légitimement supposer que le fait de figurer en lien sponsorisé dans l'espace de requêtage via la fonction Google Suggest, et donc de se libérer du risque d'être affiché parmi d'autres liens commerciaux concurrents, va faire exploser les enchères.

(Source : Media&Tech // Temps de rédaction de ce billet : 20 minutes)

Searchology.

Searchology. Tel est le nom de l'événement au cours duquel Google a présenté de nouvelles options de recherche. La dernière "searchology" s'était tenue il y a deux ans de cela et elle avait vu l'annonce de la recherche universelle. Petite revue de détail de cette dernière Searchology ...

Nota-Bene :

Acte I. You're my Wonder Wheel : une oasis de recherche dans le désert de la catégorisation (clustering). Il s'agit là d'une représentation cartographique de l'outil de catégorisation tournant déjà dans Google (affichage tout en haut ou en bas de la première page de résultats). Ici, Google marque deux points. Le premier parce que la catégorisation est incontestablement une clé importante pour le guidage (affinage) des recherches. Or sur ce terrain Google avait un temps de retard. Le second parce que cette catégorisation est représentée de manière cartographique. Mais si les moteurs cartographiques sont bien installés (Kartoo en tête), leur interface graphique chargée est très souvent déroutante pour l'utilisateur lambda. Avec sa Wonder Wheel, Google allie la puissance de la catégorisation et celle de la cartographie mais de manière non-déroutante pour l'usager, sans que celui-ci ait besoin de faire appel à une acculturation particulière. Comme le rappele Danny Sullivan dans son billet la catégorisation avait été "inventée" (dans le monde des moteurs de recherche) par AltaVista avec son algorithme "Live Topics", notamment développé par un certain François Bourdoncle, actuel PDG d'Exalead.

Acte II. A la recherche du temps perdu : Google Timeline. Dans toute activité de recherche d'information, la capacité de replacer une information en contexte sur une ligne du temps est un énorme avantage qualitatif qui permet de trancher dans le quantitatif des résultats délivrés. Le passage des moteurs à l'indexation temps réel ("world live web") ne doit pas faire oublier l'aspect fondamentalement discriminant qui permet de disposer d'une archéologie (même sommaire) de l'inscription numérique des informations diffusées en ligne. C'est précisément pour répondre à ce besoin que Google propose une fonctionnalité de type Timeline. Laquelle fonctionnalité est remarquablement intuitive : l'affichage se fait d'abord par clusters de "dizaines d'années" pour, en deux clics, permettre de descendre au niveau du cluster mensuel. Le gros défaut de cette Timeline est qu'elle ne permet pas réellement de "dater" une information. Elle se contente de récupérer les "années" figurant dans le corps du texte. Ainsi, je n'ai pas écrit d'articles en Juin 1944, mais l'un de mes articles (et mon nom) se retrouve dans un recueil qui comprend également une analyse du discours du 6 Juin 1944. C'est là tout le problème de l'information "non-structurée" avec laquelle doivent se débrouiller les moteurs de recherche. Et c'est ce qui m'amène au troisième point, le moins souligné par les différents analystes, le moins visible également, mais à mon avis pourtant de loin le plus important.

Acte III. "Rich snippets" : Google embarque sur le web de données et s'empare des microformats. Ce n'est là rien moins que l'entrée officielle de Google dans la course au web sémantique. Dans un article produit à l'occasion du dernier séminaire INRIA j'écrivais ceci :

  • "A l’inverse d’une approche descendante impliquant que soient déjà franchis les différents obstacles techniques permettant la mise en œuvre d’un web totalement sémantique, l’évolution des fonctionnalités sémantiques des moteurs de recherche suivra plus probablement une approche ascendante, émergente. Il s’agit cette fois de prendre progressivement en compte les différentes avancées des protocoles, langages et formalismes liés au web sémantique, non pas de manière globale mais sur des contenus très ciblés, ou dans le cadre de contextes de recherche là encore très spécialisés. En Mars 2008, Yahoo ! a ainsi annoncé qu’il prendrait en compte le standard RDF ainsi que les microformats. Pour ne prendre que ce dernier exemple, de nombreux développements existent actuellement. La dernière course de fond engagée par les moteurs consistera donc à en prendre le maximum en compte (sans nécessairement attendre une harmonisation globale ou une standardisation univoque de l’ensemble des développements  applicatifs en cours), tout en trouvant le moyen de s’en servir pour « enrichir » l’expérience utilisateur lors d’une recherche d’information, par exemple en présentant des résultats de recherche davantage structurés ou permettant davantage d’interactions synchrones avec d’autres recherches, d’autres services, d’autres terminaux d’accès. Dit autrement, les moteurs sémantiques pourraient fournir une solution aux limitations de la recherche par mot-clé."

Sur son blog, Google écrit ainsi :

  • "today we are announcing that some of our snippets are going to get richer. These "rich snippets" extract and show more useful information from web pages than the preview text that you are used to seeing. For example, if you are thinking of trying out a new restaurant and are searching for reviews, rich snippets could include things like the average review score, the number of reviews, and the restaurant's price range (...) In this example, you can quickly see that the Drooling Dog Bar B Q has gotten lots of positive reviews, and if you want to see what other people have said about the restaurant, clicking this result is a good choice. We can't provide these snippets on our own, so we hope that web publishers will help us by adopting microformats or RDFa standards to mark up their HTML and bring this structured data to the surface."

L'enrichissement sémantique des résultats (rendu possible par l'ajout de microformat du côté des utilisateurs qui créent les contenus) est la face la plus avancée - et peut-être la plus pragmatique - de la quête du web sémantique. Une autre approche est l'enrichissement sémantique des requêtes elles-mêmes (en s'appuyant par exemples sur des bases de questions). Quand ces deux approches là seront effectives, c'est à dire probablement dans quelques - très - courtes années, l'expérience de la recherche d'information n'aura alors plus rien à voir avec celle que l'on exerce aujourd'hui. Et de la même manière qu'il est impossible de faire mesurer à une jeune internaute à quel point la recherche sur Gopher ou Véronica étaient à des années lumières de ce qu'il connaît aujourd'hui, la recherche sémantique de demain (après-demain ?) renverra à l'âge de pierre notre pratique actuelle de la recherche d'information.

Moteur sous ordonnance.

Octobre 2007. Avant-hier, les moteurs vous offraient de rassembler en un même espace de type "portail" l'ensemble de vos données médicales.
Mars 2008. Hier ils inventaient la médecine 2.0 et en profitaient pour mettre la main sur la gestion de votre dossier médical.
13 Mai 2009. Aujourd'hui, quand vous tapez ibuprofène (ou aspirine), les moteurs médecins vous demandent le motif de votre requête. Ils se renseignent en menant, à l'échelle mondiale, une enquête statistique sur les requêtes ayant trait à la santé

Ibuprofen
Demain ... Quand vous taperez migraine, ils vous délivreront directement une ordonnance ... Vous n'aurez à vous occuper de rien. Votre assurance médicale en sera immédiatement alertée, votre compte bancaire tout aussitôt débité, le dossier laissé dans le dernier hôpital que vous avez fréquenté sera aussitôt mis à jour, et avant même de vous délivrer et de vous permettre d'imprimer votre ordonnance, ils auront au préalable vérifié dans votre dossier médical qu'il n'y a pas de contre-indications à ce traitement.

L'entonnoir : Google sous la loupe des sciences de l'information

Je vous en parlais déjà ici, c'est désormais chose (presque) faite.

L'entonnoir est en ce moment même sur les presses de l'imprimerie Caen et paraîtra le 6 Juin. Ce sera un beau livre de 250 pages, avec couverture en couleur et un dos cousu-collé, vendu au prix de 24 euros.
Dès maintenant, le meilleur endroit pour commander et se procurer l'ouvrage : http://cfeditions.com

Entonnoir

 


Bon de commande et présentation des auteurs : Téléchargement L_entonnoir-flyer.pdf

Buzz + : toute commande reçue avant la parution du 2 juin recevra en plus un cadeau C&F.

L'entonnoir : Google sous la loupe des sciences de l'information

L'ouvrage "L'entonnoir : Google sous la loupe des sciences de l'information" sera bientôt dans les bacs ! Merci à l'équipe de CFéditions pour :

  • l'énorme boulot éditorial fourni
  • les tombereaux de patience déroulés sous les pieds des auteurs
  • le contrat de diffusion conforme à ce que doit être aujourd'hui le tempo de propagation des idées (particulièrement sur des sujets aussi mouvants)


Wikiopole n'est pas que du pipole.

(le titre de ce billet ne veut rien dire, c'était juste pour la sonorité :-)

Avec l'aide du RTGI (qui est aujourd'hui ce qui se fait de mieux dans le domaine de la visualisation dynamique de larges corpus de données), et à l'occasion de la sortie de son classement mensuel, Wikio et ses très actifs WikioLabs, lancent Wikiopole, une interface de visualisation de la blogosphère et de ses liens. J'aime particulièrement la possibilité d'isoler par un code couleur les liens entrants, sortants et/ou réciproques.
Galaxyaffordance

Nota-Bene : le TouchgraphBrowser permet également de visualiser de semblable manière les liens qui "font réseau" autour d'un site ou blog donné, mais celui-ci ne bénéficie pas du corpus structuré (catégories Wikio) sur lequel tourne le Wikiopole, laquelle structuration permet une vision plus "fine" de certaines relations.

Le petit lien du Week-End : briser Google

Qui n'a jamais rêvé de briser Google, de réduire en charpie l'espace entier de la page d'accueil la plus célèbre du monde, de contribuer à l'effondrement littéral de ce moteur-mastodonte ? C'est désormais possible. Car contre la loi de la gravité, même le dieu Google ne peut rien.
(Via : Sébastien Billard)

Net Recherche 2009

J'avais déjà, dans ces mêmes colonnes, eu l'occasion de vous dire tout le bien que je pensais de l'ouvrage "Net Recherche" d'Armelle Thomas et Véronique Mesguich (éditions de l'ADBS). Lequel ouvrage vient de reparaître dans une 3ème édition mise à jour. La trame, l'orientation et l'angle du premier ouvrage étaient déjà si solidement ficelés et efficaces que cette nouvelle édition augmentée et complétée a tout d'une bible pour l'amateur comme pour le professionnel. Dans une louable complémentarité éditoriale, l'ADBS donne sur son site, accès à la typologie complète des outils de recherche recensés et disséqués dans l'ouvrage Net Recherche 2009.

Ne vous reste plus qu'à commander l'ouvrage en question pour la somme de 30 euros. C'est par là.

Cataloguing error

Voilà l'exemple parfait que je cherchais pour mon cours de catalogage. C'est l'erreur de catalogage à l'ère industrielle. 57 000 titres sont portés disparus.
(Merci à Virginie pour le lien)

Google (presque) Fatal Error.

Google fait une erreur et la totalité du web devient "indésirable".
Le 31 Janvier la totalité des sites internet accessibles depuis le moteur se voient affublés de la mention "ce site risque d'endommager votre ordinateur", mention assortie d'une page d'avertissement supplémentaire avant de pouvoir accéder à n'importe quel site. L'erreur n'aura duré qu'une heure. 55 minutes exactement. L'explication vint dans la foulée de la bouche de Marissa Mayer, sur le blog officiel de Google : pour filtrer les sites présentant des malwares (logiciels "espions"), Google travaille avec le consortium StopBadware. C'est ce consortium qui envoie à Google des listes actualisées avec les sites "dangereux", listes que Google fait ensuite remonter dans son index. Et là vint le bug ou plus exactement l'erreur humaine : quelqu'un mit le signe "/" dans le champ prévu pour lister les sites indésirables. Du coup, la totalité du web indexé par Google ... devînt indésirable.
Comme toute mésaventure touchant le géant, tout le mode s'est fait l'écho de cet événement, du blogueur anonyme jusqu'au New-York Times en passant par le gazouillis planétaire.
Il y a plusieurs manières de regarder ce "bug".
Le regarder comme ce qu'il est. C'est à dire une avarie d'un moteur, avarie d'origine humaine, promptement réparée, sans réel préjudice (les sites internet restaient accessibles depuis les autres moteurs même si la majorité des réactions dont j'ai été le témoin numérique cherchaient plutôt à comprendre "pourquoi" Google se mettait à planter plutôt que d'utiliser spontanément un autre moteur pour leur recherche ...).
Le regarder pour ce qu'il donne à voir. Un internet soudainement "effacé", subitement "inaccessible", soudainement "malveillant", subitement "filtré". Internet, somme d'un nombre considérable d'informations et de connaissances, Internet, silo informationnel aux dimensions à peine inimaginables. Internet inaccessible par une seule petite erreur humaine. Tous les sites du Net subitement devenus "indésirables" ou dangereux. Imaginez un seul instant que du jour au lendemain, tous les livres accessibles dans toutes les bibliothèques deviennent, par l'erreur ou la volonté d'un seul, subitement "indésirables" ... Fantasme ?
Le regarder comme la préfiguration d'un fantasme. Celui que nombre d'auteurs de S-F ont usé jusqu'à la corde. Le fantasme du crash mondial. Du Bug de l'en 2000. De la mémoire du monde (numérique) aussi subitement qu'irrémédiablement effacée, ôtée de "nos" mémoires. Machines hypermnésiques instrumentant ou occasionnant l'amnésie planétaire. Ce n'est probablement pas au hasard que ReadWriteWeb parle à propos de ce bug d'un "Epic fail".
L'erreur de Google doit nous interpeller.
Elle doit nous amener à reconsidérer nos usages. A sortir de la métonymie si pregnante qui a fait de cette partie (Google) la représentation du tout (le web).
Elle doit nous amener à nous pencher sur la double dimension du moteur. Un outil d'accès à l'information qui n'est pas l'information. Mais également de plus en plus, une infrastructure qui contient l'information : data centers, fibre optique, centres de données offshore, informatique distribuée. Le géant aujourd'hui ne se contente plus d'embrasser "la" toile, il fait exister "sa" toile, son réseau, son Internet, Le Googlenet.
Et le risque est là.
Le risque que "ceci tue cela". Que l'Internet aux contenus et aux accès préemptés par quelques grands acteurs de l'internet marchand ne se superpose à l'internet public avant que de le l'absorber et de le supplanter. Le risque pour l'usager de perdre toute lisibilité dans les tentatives, accidentelles ou organisées, de filtrage des accès ou des contenus.
Et l'on reparle de la neutralité du net et de la tendance actuelle au filtrage arbitraire.

Ce débat sur la neutralité nécessaire du Net est déjà ancien. Mais il n'a jamais été autant d'actualité. Piotrr sur Homo-Numericus nous livre une revue de presse parfaitement éclairante et accessoirement assez déprimante ... Revue de presse qu'il vous faudra compléter par la lecture du billet rebond d'André Gunthert, lequel renvoie vers le rapport "Enhancing Child Safety & Online Technologies", rapport final du Internet Safety Technical Task Force (également commenté ici), décembre 2008. Extrait du billet d'André :

  • "Les conclusions du rapport sont éclairantes. Les problèmes rencontrés en ligne par les mineurs ne sont pas différents de ceux auxquels ils sont confrontés en dehors du web, mais en sont plutôt le miroir. Internet augmente la proportion de contenus illégaux disponibles, mais n'accentue pas nécessairement l'exposition des jeunes à ces contenus. Ceux qui sont le plus susceptibles de les retrouver en ligne sont ceux qui ont déjà des comportements à risques ou des difficultés dans leur vie. Les dynamiques familiales et l'environnement social sont de meilleurs facteurs prédictifs de comportements à risques que l'usage des technologies numériques. Les réseaux sociaux ne sont pas les endroits qui exposent le plus aux déviances. Selon le commentaire qu'en propose Danah Boyd, qui a participé aux travaux de la commission, la question n'est pas «de savoir si internet est sûr ou pas, mais si les enfants vont bien ou pas. Et beaucoup d'entre eux ne vont pas bien.» «Après avoir pris en considération les données, explique-t-elle, je crois fermement qu'il faut arrêter de prendre internet pour la cause, mais au contraire commencer à le voir comme le mégaphone.»"


Les 3 Internets.
Le choix se pose aujourd'hui en ces termes :

  • il existe un internet (infrastructure) et un web (contenus) public. C'est celui des origines.
  • il existe aujourd'hui un risque de lui voir accolé un Internet et un Web filtré par les états.  
  • il existe aujourd'hui le risque de voir se développer, à côté, en parallèle ou en collaboration avec le fitlrage des états, un "Internet privé" dont, progressivement, l'essentiel des contenus et des infrastructures appartiendront aux quelques grandes sociétés marchandes se partageant le gâteau de la toute puissante algorythmie calculatoire qui règle et enregistre inexorablement l'ensemble de nos vies numériques.

Moralité : prenons garde aux coupures. D'où qu'elles viennent ...

(Voir aussi l'article d'Ecrans sur le sujet. // Temps de rédaction de ce billet : 45 minutes)


Google private Life : The Wall.

Quelques infos et commentaires un peu en vrac autour de l'ogre préféré ...

Des photos et des hommes ...
Google a mis depuis quelques temps en ligne l'intégrale des photos du magazine Life, y compris les clichés non publiés par le célèbre magazine. Un appétit insatiable, un fonds documentaire qui semble inépuisable et ... un mur de fortification du "GoogleNet" qui se construit pierre après pierre. Lesdites photos par exemple ne sont pas indexables par d'autres moteurs de recherche comme le signale Philip Lenssen. On pourra m'objecter que puisque les frais incombent à Google et que l'initiative de la mise en ligne lui revient, il n'est pas aberrant que celui-ci s'arroge certains droits. Sauf que. Sauf que ces photos relèvent d'une dimension clairement patrimoniale. Elles sont un bien commun. Et à ne pas y prendre garde, en ce domaine documentaire comme en d'autres, on risque de se retrouver avec un acteur privé en situation de diffusion et d'exploitation exclusive de tout un tas de biens communs de l'humanité. On constatera que c'est dommage. Mais il sera déjà trop tard. Il existe pourtant bien d'autres approches ... Mais encore faut-il que les bibliothèques pourvoyeuses aient les moyens d'en être à l'initiative ...

"Rendre l'information universellement accessible" ... et après ?
Ce mur infranchissable aux autres (moteurs) que Google est progressivement en train de bâtir autour de son corpus, de "son" web, est symptomatique d'un renversement dans la philosophie l'idéologie de la marque, ou à tout le moins d'un retour à un principe de réalité comptable. Renversement déjà remarqué par plusieurs analystes. Je crois que le temps du "tout service, tout gratuit" chez Google sera bientôt révolu. Plus globalement, je crois également que le gimmick "rendre l'information universellement accessible" sera prochainement remplacé par un autre. Jusqu'ici Google ne nous avait pas habitué à préserver un pré carré de manière aussi ostentatoire. Attitude d'autant plus étrange que l'on ne peut pas dire que la concurrence motorisée soit à son apogée. Alors quoi me direz-vous ? La faute à la crise ? Je ne pense pas. Je pense que Google à atteint (ou n'est pas loin d'atteindre) "son" objectif : rassembler en une même sphère d'indexabilité des documents, des informations, des biens communs et patrimoniaux de l'humanité, mais également des comportements, des intentions de navigation, de l'intime (cf ma presque mondialement célèbre "théorie de la dérive des continents documentaires"). "Organiser l'information et la rendre universellement accessible". L'information EST organisée. Les dépêches de l'AFP sont estampillées "Hosted by Google", les photos de Life ne sont consultable QUE dans Google, nos emails personnels sont scannés mot après mot par Google pour pouvoir nous afficher des publicités contextuelles, dans les fables d'Esope on peut désormais lire "Le filigrane Google contenu dans chaque fichier est indispensable pour informer les internautes de notre projet et leur permettre d’accéder à davantage de documents par l’intermédiaire du Programme Google Recherche de Livres. Ne le supprimez en aucun cas." L'information EST organisée. Elle est effectivement universellement accessible. Universellement accessible par chacun d'entre nous SUR les serveurs de Google. SUR le GoogleNet.

La recherche est le centre et les services la périphérie. Mais faut se recentrer.
Maigre rayon de soleil dans cet horizon sombrement Googlien, le même Google annonce l'abandon de son projet Palimpsest (voir ici, ou ) dont l'ambition était tout simplement de permettre aux scientifiques du monde entier de stocker gratuitement leurs données volumineuses sur les serveurs de Google, en les rendant du même coup partageables et accessibles pour les autres scientifiques du monde entier ... et accessoirement pour Google. Vous avez dit "bien commun" ?
L'abandon de ce projet n'est d'ailleurs pas isolé. Le moteur "dont le centre est partout et la circonférence nulle part", une formule qui fut à l'époque l'une des clés pour comprendre la stratégie d'entrisme de Google, semble avoir besoin de se repossitionner "autour de" ses services centraux au prix d'un nettoyage des services périphériques. Après Lively et Palimpsest, ce sont Google Video, Google Mashup Editor, Google Notebook, Google Catalogs (service qui eut son importance pour le développement de Google Book Search), Dodgeball et Jaiku qui sont abandonnés ou arrêtés par Google (voir à ce sujet les billets de Zorgloob, Francis Pisani, Philipp Lenssen ...). Google se recentre donc autour de la recherche, et en particulier de la recherche "universelle" (voir le White Paper signalé par Steven Arnold), nouvelle clé de voûte de son écosystème de services.

A quelque crise malheur est bon ...
La crise économique boursière n'est certainement pas étrangère au recentrage de l'ogre de Mountain View. Mais je crois qu'elle n'en est pas la cause profonde, elle n'en est que le déclencheur structurel. "L'occasion" de passer, en 2009, à une nouvelle étape de déploiement, peut-être à une nouvelle stratégie. Il n'est d'ailleurs pas innocent que l'on voir récemment refleurir la rumeur du Google Drive (souvenez-vous), un espace de stockage "personnel", en ligne. L'information EST organisée. L'information est universellement accessible SUR les serveurs de Google. Particuliers, entreprises mais aussi institutions et demain peut-être états s'y retrouvent. En 10 ans, les habitudes sont acquises. Pour la plupart d'entre elles irrémédiablement. Devant l'omniprésence du moteur, devant la qualité des services offerts, devant l'ancienneté des usages individuels et collectifs que l'on en fait aujourd'hui, qui, oui, qui serait prêt à lâcher Google au profit d'autres services si ce dernier proposait un accès payant à certains de ses services ? Peu de gens à mon avis. Alors bien sûr nous n'en sommes pas encore là, mais s'il fallait cette année encore jouer au jeu des prédictions, je dirai que du côté de Google, l'année 2009 sera celle de l'établissement de sa suite bureautique en ligne comme principal sideman du moteur de recherche. Et que pour s'installer définitivement dans les habitudes, il ne manque plus à la suite bureautique en ligne qu'un espace de stockage personnalisé en ligne. Je crois donc qu'on verra bientôt apparaître le fameux GDrive, dont la rumeur court depuis déjà deux ans ... GoogleNet pour l'infrastructure, GoogleWeb pour le guichet unique d'accès à l'information avec son moteur (Google) et son navigateur (Chrome qui vient de sortir de son statut "béta"), GoogleOS pour les usages, usages eux-mêmes archivés dans la ruche mondiale du GoogleDrive.

"... dont le centre est partout, et la circonférence nulle part." comme disait l'autre ...

=====================
Et puis aussi ...
=====================

  • Sur le sujet des photos de Life - mais sous un tout autre angle, voir la tribune d'Augustin Besnier dans Le Monde, lointain écho de préoccupations déjà abordées ici et là ...
  • De manière plus anecdotique, Google offre également la possibilité de télécharger le dictionnaire Littré développé en version open source. Il n'est certes pas le premier à le proposer mais la concentration de services offerts et l'effet de marque jouant à plein, qui se souviendra demain qu'il ne fut pas le premier à le proposer et que l'initiative ne lui en revient pas ? Qui d'ailleurs ira télécharger le Littré ailleurs que depuis Google ?
  • Et puis malgré tous les risques qu'il fait peser sur nous, il y a ces éclairs de génie, ces outils dont la puissance nous émerveille au sens propre, et qui nous laissent entrevoir toutes les potentialités des mises en abyme que permet le web : je parle ici des 14 toiles du musée du Prado qui sont visibles en très haute résolution via Google Earth. Vagabondages vous explique tout, ainsi que Le Monde (et son portfolio dédié). Je ne vais donc pas en rajouter une couche, juste un petit cadeau bonus pour d'autres approches de la perspective muséale : le mur d'images d'ArtScope, avec, (deuxième petit cadeau bonus), en toile de fond, une empreinte de plus en plus forte de ces technologies y compris pour le grand public et sur des corpus non nécessairement patrimoniaux ou artistiques, tel le site "Zoomorama", qui permet de mettre en ligne des photo en haute définition avec là encore des effets de zoom proprement vertigineux. De la larme de Saint-Jean à l'infinie navigation du monde telle qu'elle se déploie dans Google Earth, de 1435 à 2009, derrière cette technologie, derrière ces 14 toiles c'est toute la dimension et toute la puissance dilatoire du web qui se donne à lire, toute la courbure si particulière de l'espace-temps internet, de notre espace-temps numérique, de notre macroscope.

(Temps de rédaction de ce billet : 2h45)

Micro, méso et macro-net : les médiasphères et le moteur.

(billet inspiré par quelques rapides tests sur Whostalkin, découvert chez Steve Rubel)

En ce temps-là ...
En ce temps là
, la vie était plus belle simple : on avait les annuaires, les moteurs et les méta-moteurs.
En ce temps-là l'unité de publication était la page (web).
En ce temps-là, ceux qui publiaient sur le net ne publiaient (généralement) QUE sur le net, pas dans les grands médias. Et ceux qui écrivaient dans les grands médias ne publiaient pas sur le net.
En ce temps là, ce qui était écrit, restait écrit, restait fixé.
Et puis ...
Et puis les annuaires disparurent. Ne restèrent que (quelques) méta-moteurs et surtout les moteurs et surtout LE moteur.
Et puis les unités de publication se réduisirent, se fragmentèrent. L'unité ne fut plus seulement la page mais également le billet (de blog), voire le fil (de discussion sur un forum ou de commentaires sur un blog) ou le micro-fil (twitter limite l'unité de publication à 140 caractères). Une unité de publication parfois simplement confinée à une unité de présence en ligne, laquelle unité de présence est elle-même composée des traces éparses (profilaires ?) de notre social stream tel qu'il se constitue par exemple au travers de nos différents profils sur différents réseaux sociaux,
Et puis les instances d'énonciation éditoriales se floutèrent. Publier ici n'empêcherait plus de publier là. Les journalistes écrivent "dans" le web, les blogueurs écrivent "dans" les journaux, passent à la télé. Certains journaux ne sont faits que de reprises d'écrits de blogs (vendredi.info), certains blogs (maître Eolas) jouissent d'une crédibilité supérieure à certains journaux.
Et puis ce qui était écrit par l'un devînt modifiable par l'autre, par tous les autres (Wikipédia). L'auteur, l'autre. Figure gemellaire de l'hypertextualité. Agencements collectifs d'énonciation. La trace céda la place à sa propre traque.
Voilà ce qui changea. Ce qui ne change pas en revanche, pour vous, pour moi, c'est le besoin de s'y retrouver (au sens propre mais également et de plus en plus souvent au sens figuré également ...), d'y trouver parfois simplement "quelque chose", plus rarement "ce que l'on cherche".

Editorialement parlant, on dispose donc désormais de trois "médiasphères" :

  • le micro-net de type twitter mais également composé de nos traces profilaires,
  • le meso-net de type "blogs" individuels et non-institutionnels, ainsi que de la longue cohorte des pages personnelles
  • et le macro-net de type journaux ou chaînes de télé implantés sur le web (libération, le figaro, l'Obs ...)

Machiniquement parlant, pour rendre compte de ce nouveaux paysage éditorial du net, on ne dispose pourtant plus que des seuls moteurs qui, de plus en plus souvent, mal étreignent à force de trop embrasser.
Idéalement, il faudrait pouvoir disposer d'un moteur pour chacune de nos trois médiasphères. Car il va sans dire que la spécificité éditoriale de chacune d'entre elles conditionne à la fois la nature des recherches qui y sont effectuées mais également la nature, la granularité documentaire des résultats qui y figurent. Et l'on se prend à rêver d'un retour des moteurs à curseurs avec un même moteur permettant de régler le "grain" de la recherche depuis les macro-médias du macro-net jusqu'aux micro-médias du micro-net. 

Aujourd'hui, on dispose de :

  • Nano-moteur : pour chercher dans le micro-net. Exemple : WhosTalkin?
  • Meso-moteur : pour chercher dans le meso-net. Exemples : Blogsearch, Technorati, Wikio.
  • Macro-moteur : pour chercher dans le macro-net. Exemple : Google et Google News.

Cette granularité est inédite à cette échelle, et il y a fort à parier que 2009 lui donnera ses lettres de noblesse, l'enracinant comme une composante à part entière du Giant Global Graph. Alors que l'étage supérieur, le macro-net, apparaît aujourd'hui stabilisé, ayant atteint un rythme de croissance optimal, le micro-net et le meso-net continuent d'exploser, sur le même type d'échelle logarithmique que le web à ses débuts. Après la croissance des blogs, c'est aujourd'hui la croissance des réseaux sociaux et des sites de micro-blogging. La valeur de ces deux espaces, du dernier particulièrement, réside dans leur nature conversationnelle. Une conversation certes souvent tenue par des idiots et pleine de bruit et de fureur, mais également une conversation qui aiguille, qui stimule, qui signale, et qui est en tout état de cause le complément aujourd'hui indispensable de la plénitude du net comme médiasphère. Bref une conversation qui mérite d'être indexée et suivie pour pouvoir être ensuite accédée de manière asynchrone, dans la verticalité qu'impose le couperet d'une recherche et non plus simplement dans la linéarité d'un échange.

Signalons pour finir que cette granularité se superpose à une autre granularité préexistante et depuis déjà longtemps consubstantielle au net : la granularité des médias (vidéos, images, audio, texte) qui le composent. C'est à la croisée de ces chemins, à la croisée de cette granularité bipolaire que devront se positionner les acteurs de la recherche d'information pour répondre aux besoins de l'usager du web de 2009 et d'au-delà.

(Temps de rédaction de ce billet : 2h00)

Google anathème : moi non plus.

C'est suffisamment rare pour être signalé, quelques analystes et observateurs nous annoncent simultanément la fin prochaine de Google. Après que ce scénario catastrophe (fin de Google) ait été envisagé par l'Hathi Trust pour sauvegarder la base de connaissance que constitue Google Books, c'est d'abord Franck Poisson (fondateur du bureau Google France en 2002) qui s'y colle en annonçant le départ de tout ou partie du trio de tête avant la fin de l'anné 2009. L'argumentaire reposant essentiellement sur la "soif d'entreprendre" et le besoin de voir de nouveaux horizons me semble personnellement un peu court mais bon ... Le second à s'y coller c'est Stephen Abram, qui relaie un édito de PCMag sobrement intitulé : "Why Google must Die", lequel édito s'en prend directement au nerf de la guerre. Extrait :

  • "Too much commerce, not enough information. There seems to be an underlying belief, especially at Google, that the only reason you go online is to buy something. People merely looking for information are a nuisance. This is made apparent anytime you look for information about a popular product. All you find are sites trying to sell you the product. Hey, here's a challenge: Ask Google to find you a site that honestly compares cell-phone plans and tells you which is best. Try it! All you get are thousands of sites with fake comparisons promoting something they are selling."

Dans sa reprise de l'édito en question, Stephen utilise une figure rhétorique intéressante en se posant les questions qui fâchent, mais du point de vue de la gestion d'un OPAC dans une bibliothèque. Ce qui donne au final un truc assez rigolo mais qui illustre bien les "travers" des moteurs de recherche actuels et l'intérêt de développer des alternatives publiques et non-marchandes (en plus d'éduquer les utilisateurs aux travers en question)

Bref, le problème avec Google, c'est que c'est toujours du "je t'anathème, moi non plus." :-)

Europeana : 3 petits tours, et puis ...

La bibliothèque européenne, Europeana a donc été lancée le 20 Novembre (communiqué de presse.pdf). Europeana se compose actuellement de "2 millions de documents, dont des livres, des cartes, des peintures et des photographies, provenant des bibliothèques nationales et de plus de 1 000 institutions culturelles des 27 pays de l’Union européenne." Et Viviane Redding, dans le sus-mentionné communiqué de presse, lui fixe un objectif de 10 millions de documents en 2010.
Pour bien comprendre le contexte et les enjeux, un artcle de Bruno Texier fait le point dans Archimag :

  • "2,5 milliards de livres constituent le patrimoine des bibliothèques européennes. Seul 1 % de ce corpus est actuellement disponible en format numérique…"
  • Europeana restera en version "béta" (prototype donc) pendant encore deux ans.
  • "La Commission européenne a annoncé qu’elle allouera, en 2009-2010, un budget de 120 millions d’euros afin d’améliorer l’accessibilité en ligne de ce patrimoine."

Le New-York Times nous retourne aussi habilement qu'insidieusement la vieille antienne de l'hégémonie culturelle, en retenant que plus de la moitié des 2 millions de documents ont été fournis par la France, contre seulement "1 % par l'Allemagne, 1.4% par l'Espagne et seulement 10% par le Royaume-Uni."
Le BBF de son côté nous indique le communiqué de presse de l'INA (.pdf) indiquant que la totalité des documents numérisés par l'INA seront également disponibles dans Europeana. D
Dominique Lahary a par ailleurs entièrement raison de souligner l'enjeu d'Europeana pour "le web public, qui est aussi un web de service public."
Europeana c'est donc un petit peu Hourra et Hosanna. Oui mais voilà, Europeana n'a fait sur le web que trois petits tours ... et puis s'en va. Parce que figurez-vous que sitôt le site ouvert, celui-ci a été assailli par des millions d'utilisateurs. 10 millions de curieux, de bibliophiles, d'étudiants, de quidams, de citoyens se sont donnés rendez-vous pour l'inauguration. Et là, c'est le drame. Bousculade à l'entrée, serveurs en rideau. Crac boum hue. A pu Europeana. Europeana.eu aujourd'hui, c'est un temps de chargement d'une minute trente (j'ai compté ...) pour tomber sur le message suivant : "The Europeana site is temporarily not accessible due to overwhelming interest after its launch (10 million hits per hour). We are doing our utmost to reopen Europeana in a more robust version as soon as possible. We will be back by mid-December." Des sites pris d'assaut lors de leur ouverture, cela arrive. Des serveurs qui flanchent, c'est courant. Même le Grand Google a connu ce genre d'affres pour le lancement de Gmail ou d'Analytics. Mais visiblement, l'équipe de conception d'Europeana n'avait pas prévu un tel enthousiasme, une telle curiosité, une telle appétence, une telle bibliophilie planétaire. Faut dire aussi que l'annonce de l'ouverture avait largement dépassé l'étroitesse des frontières de l'union pour atteindre au communiqué de presse planétaire. Même Google s'était pour l'occasion fendu d'un billet relayant, annonçant et se félicitant de ladite ouverture de la bibliothèque numérique européenne, et en profitant pour lancer un appel du pied appuyé (à moins qu'il ne s'agisse d'un tacle sournois) :

  • "As we move ahead with Google Book Search, we look forward to finding new ways to collaborate on initiatives such as Europeana -- and taking part in what could become the biggest technological leap in disseminating knowledge since Gutenberg invented the printing press."

Dans ces conditions, difficile de faire un billet un peu fouillé sur un service inaccessible. Heureusement, quelques chanceux curieux de la première heure ont eu le temps d'apercevoir le site. L'intérieur d'Europeana ressemble donc à ça. Heureusement, on sait aussi que Gallica 2 a servi de prototypage pour le lancement d'Europeana. Et Gallica 2 est encore accessible en ligne, ce qui permet donc de se faire une petite idée de ce que sera l'intérieur d'Europeana en termes d'interface.
Europeana Europeanasearchresults
En attendant la réouverture :

  • on pourra toujours relire la génèse du projet sur La République des Lettres.
  • gloser sur le choix du logotype, avec une stylisation du "E" suivi de deux "O" (évoquant un engrenage ...), qui, si l'on applique un effet miroir au même "E" et aux deux "O" le suivant, nous donne étrangement les initiales d'une autre bibliothèque numérique mondiale : "GOO ..."
  • moquer l'incapacité à anticiper le volume de connexions à l'ouverture ou le délai envisagé pour la réouverture (3 semaines tout de même ...) ... d'aucuns ont envisagé l'hypothèse (naturellement hautement fantaisiste) que Google prête quelques-uns de ses serveurs à Europeana, ou lui propose même d'héberger son contenu ... ce qui, tout à fait sérieusement cette fois, nous renvoie à la question essentielle de l'informatique dans les nuages pour les institutions et services publics (voir par exemple ici et ).
  • prendre des nouvelles de la santé des serveurs d'Europeana sur la page dev.europeana.eu
  • se languir de la mise en ligne de cette collection exceptionnelle...

De tout cela je retiens qu'il faut prendre l'épisode du lancement raté de ce grand projet pour ce qu'il est : une fable moderne pleine d'enseignements sur la mesure et le périmètre d'un service public numérique à l'heure et à l'ère de l'accès comme clé de voûte bibliothéconomique renouvellée.

<Update> Voir aussi le débat nourri - et légèrement "trollé" - sous le billet de Jean Quatremer. Ainsi que les chiffres détaillés de Telerama.fr </Update>

Collusion ?

En France, le magnat des médias (Arnaud Lagardère) est aussi "l'ami" du président de la république (Nicolas Sarkozy) et le témoin de son (premier) mariage. Collusion ? Collusion.
Aux Etats-Unis, le PDG du premier moteur de recherche de la planète vient d'entrer au "conseil des sages" du président Obama (Interview vidéo d'Eric Schmidt). Goobama donc. Les accointances démocrates de l'équipe dirigeante du moteur Google ne sont plus un secret. Pas davantage que n'est secrète la position démocrate sur les enjeux de la neutralité de l'Internet. Pas davantage que n'est anodin le rôle joué par le média Internet dans la campagne présidentielle américaine. Collusion ? Difficile d'en juger pour le moment. Seule certitude : la question hier posée ("qu'arriverait-il si nous répondions mal au mot 'socialisme' ?") se reposera demain avec une acuité nouvelle.

"Les cons ça ose tout."

" ... c'est même à ça qu'on les reconnaît " disait le maître. Diego Maradona et Lutz Heilman osent tout. Le premier, nous apprend Zorgloob, a demandé (et obtenu !!!) des versions locales de Google et de Yahoo!, qu'elles ne fassent plus apparaître de résultats sur la requête "Diego Maradona." La page suivante est donc collector : à vos copies d'écran, car c'est à ma connaissance la première fois dans l'histoire de l'Internet qu'une telle disparition est opérée.
Le second (via le toujours excellent Ecrans et de ReadWriteWeb), Lutz Heilman, 42 ans, aujourd’hui député au parlement fédéral du parti die Linke (La Gauche), et ex-agent de la fameuse police secrète est-allemande (Stasi), a demandé et obtenu la fermeture immédiate et ce deux jours durant, de la version allemande de Wikipedia (enfin pas tout à fait mais presque).

Deux réflexions croisées :

  • c'est la première fois qu'un particulier obtient l'application aussi radicale et disproportionnée d'un tel "effacement".
  • seuls des états avaient jusqu'ici réussi à faire plier de tels mastodontes, et la négociation n'avait pas porté sur le terrain judiciaire mais uniquement sur le plan ... financier.
  • cela laisse songeur sur plein de plans ...

Et une morale façon "vieux con des neiges d'antan" : on n'effacera jamais les livres. On peut les censurer, les brûler, les détruire, les pilonner mais les effacer ... jamais. Et si vous voulez lire une belle histoire à ce sujet, vous pouvez vous précipiter sur Globalia.

Nous sommes tous des américains (fauchés) et notre ministère est un Ponce Pilate numérique

============================================================================
Billet d'humeur publié un lundi mais rédigé un vendredi soir (très tard) sur un (non?) événement qui a presque un an mais qui me semble assez fidèlement traduire une certaine logique ...
============================================================================

Préambule. Aux Etats-Unis, les grandes firmes de l'informatique ont pignon sur rue dans les universités et dans les écoles. Elles les financent pour partie, elles les fournissent en ordinateurs et autres équipements, elles recrutent et payent des étudiants pour évangéliser sur tel ou tel produit leurs petits camarades, elles recrutent et payent des professeurs, elles leurs offrent des licences logicielles gratuites. Bref, elles "font le job" de la formation aux technologies de l'information.

Google et les 140 classes de collégiens.

En France, l'éducation à la culture informationnelle est, suite à la volonté acharnée de quelques-uns, de plus en plus l'objet de discussions, de colloques, de publications. En France, on a (péniblement) mis en place des dispositifs aux noms abscons mais à l'efficacité qui commence à être prouvée : B2i, C2i, et tutti quanti. En France, le Sénat, dans sa session ordinaire du 22 Octobre 2008, a diffusé un rapport d'information sur l'impact des nouveaux medias sur la jeunesse (Téléchargement r08-0461.pdf). A la page 123 dudit rapport, on peut lire le compte-rendu de l'audition de Mr Olivier Esper et Mme Myriam Boublil, respectivement "chargé des relations institutionnelles" et "directrice de la communication", chez ... Google Inc. L'audition se conclut comme suit :

  • "M. Olivier Esper a enfin souhaité faire la présentation des initiatives de Google France en matière d'éducation aux médias : le tour de France des collèges, qui consiste en des actions d'apprentissage de l'utilisation d'Internet à des élèves, le soutien des actions d'e-Enfance (hébergement de leurs vidéos sur Youtube et campagne publicitaire gratuite sur Internet) et ChercheNet, jeu concours monté en partenariat avec la Délégation aux usages de l'Internet, qui vise à éduquer à la création de contenus et au respect de la propriété intellectuelle.

Intrigué par ce "Cherche Net", et quelques clics plus tard, je tombe sur le communiqué de presse de Google France, dans lequel j'apprends qu'il ne s'agit pas vraiment d'un tout petit projet puisqu'il concerne tout de même "140 classes de collégiens de 6ème et 5ème des départements du Finistère, de l’Ille-et-Vilaine, du Morbihan, des Côtes-d’Armor, de la Sarthe, du Maine-et-Loire, de la Loire-Atlantique, de la Mayenne et de la Vendée." Le titre du communiqué de presse est le suivant : "Calysto lance Cherche Net avec Google et la DUI". Pour information, Calysto est une société de conseil, la DUI est une excroissance du pouvoir politique (ministère de l'enseignement supérieur principalement), et Google est ... Google.

Et maintenant les faits : le fond du projet Cherche Net.

Sur la page du communiqué de presse, je retiens les informations suivantes :   

  • "A l'initiative de Google France, et avec le soutien de la Délégation aux Usages de l'Internet, Calysto mènera dans les collèges de Bretagne et des pays de Loire, une opération inédite et ludique d'éducation à Internet et ses usages pour les enfants : le jeu concours Cherche Net. (...) Cherche Net a pour vocation de (...) mettre en pratique les informations enseignées aux enfants sur l'Internet, (...) :
  • comment rechercher efficacement sur Internet ?  Comment éviter de tomber sur des contenus choquants ? Comment utiliser des outils de retouche d'image ? Comment créer un blog ?
  • les sensibiliser et  les éduquer aux règles à respecter sur Internet (sécurité, droit d'auteur, droit à l'image…)
  • valider leurs compétences du B2i (Brevet informatique et internet)
  • favoriser une démarche collaborative et une prise de conscience collective
  • développer leur curiosité et leur créativité."

Et maintenant, reprenons ...

  • Qui ? "A l'initiative de Google France" : c'est assez troublant. Ce genre d'initiative est normalement attendu de la DUI, dont la mission est - sauf erreur de ma part - "la formation et l'accompagnement au TIC" (sic). C'est d'autant plus troublant que derrière la mention "à l'initiative de", il faut naturellement comprendre et lire "avec le financement de". Donc si on résume : Google est à l'initiative du projet, le finance, le fait réaliser par une société de service (Calysto) et demande sa bénédiction à la DUI (à moins que la bénédiction de la DUI ne lui soit acquises dès avant)
  • Quoi ? On va donc apprendre aux collégiens "comment rechercher efficacement sur Internet". Il serait à la fois plus honnête et plus exact d'indiquer qu'on va leur apprendre "comment chercher efficacement sur Internet avec Google." Ce qui est déjà une bonne chose. Mais ce qui n'est pas tout à fait la même chose. On va également apprendre aux collégiens "Comment utiliser des outils de retouche d'image ?" Alors là j'avoue que j'en reste baba. Dans le même temps, je mesure la force de mes prophéties auto-réalisatrices concernant les technologies de l'artefact. Et je m'en désole.
  • Pourquoi ? Pour "valider leurs compétences du B2i (Brevet informatique et internet)" Et ben voilà. C'est Google qui va valider le B2i. OK. Et demain, on l'envoie valider quoi ?? Le bac ? La licence ? La première étoile de ski ? Et puis aussi on va faire ça pour "favoriser une démarche collaborative et une prise de conscience collective et développer leur curiosité et leur créativité." Et pour en faire de bons clients. Bien souples. Bien captifs. Bien formés formattés.  

Moralité courte.

A l'initiative de Google et sur les fonds de Google, Google forme les futurs utilisateurs et clients de Google là où ils sont, c'est à dire dans les collèges. Il les forme à l'utilisation de Google et des outils de Google. Il le fait avec l'aval du Ministère de l'enseignement supérieur et de la recherche (dont la DUI est l'émanation directe), ce dernier se vautrant dans le confort de la figure d'un Ponce-Pilate numérique (dont on connaît la propension à "s'en laver les mains").

Moralité longue

C'est parfois dans les "petites" opérations de communication que se donnent le mieux à lire les grands desseins ministériels ... Car soyons clair, ce n'est en l'occurence pas Google (ni Calysto) que je blâme (quoi que pour Calysto ...). A tout prendre, j'aime autant que ce soit eux qui se chargent du boulot plutôt que la DUI et ses experts nommés. Ce qui est particulièrement irritant me fout dans une rogne noire c'est de constater l'incurie des "pouvoirs publics" à l'échelon national à capitaliser sur les réseaux de compétence e-x-i-s-t-a-n-t-s, leur refus castrateur de leur octroyer quelques maigres subsides pour permettre à ces mêmes réseaux de compétence d'opérer un passage à l'échelle, pour leur permettre de démultiplier leur offre de formation, bref pour leur permettre de faire ce que s'apprête à faire Google, mais en le faisant mieux (et probablement pour moins cher).

Pour être plus clair, il existe en France dans les universités, les lycées et les collèges toutes les structures nécessaires à la réflexion (déjà bien avancée) et à l'action (chroniquement en manque de moyens). Nous disposons :

Alors pour passer ma rogne, je fais un rêve. Celui de voir un jour l'auto-complaisance ministérielle et ses effets d'annonce à la consistance d'étouffe-chrétien se resaisir, décrocher son téléphone, convoquer non pas des blogueurs influents mais des gens capables, leur demander où ils en sont de leur réflexion, leur demander quelles sont leurs préconisations, leur demander quels sont leurs besoins ... et leur donner les moyens de gagner un pari. Un pari formidable. Celui de l'entrée réussie d'une classe d'âge dans la société de l'information. Et puis je me réveille. Et je vois le temps qui passe. Et je voie le temps perdu. Et le Cheval à Phynances qui galope, et la Machine à Décerveler qui fait son office (et réciproquement). 

Conclusion : nous sommes tous des américains.
Le projet Cherche Net date de Décembre 2007. J'en ignore les résultats. Je ne les ai pas trouvés sur le site de la DUI. Le site Cherchenet.fr n'est de toute façon plus en ligne. La seule trace qui en subsiste est celle-ci. Le nom de domaine est par ailleurs disponible si vous êtes tentés par une spéculation hasardeuse (plénonasme ?). J'ignore s'il sera reconduit cette année. Mais le projet Cherche Net n'était que la partie émergée de l'iceberg. Aujourd'hui, les mêmes perpétuent le tour de France des collèges et des écoles. Avec les mêmes partenaires, plus quelques autres. C'est du Cherche Net  mais à l'échelle industrielle. Du biberonnage dès le berceau. Voilà pour l'existant. Voilà pour hier et aujourd'hui. Et demain ? Demain aux Etats-Unis en France, les grandes firmes de l'informatique auront pignon sur rue dans les universités et dans les écoles. Elles les financeront pour partie, elles les fourniront en ordinateurs et autres équipements, elles recruteront et paieront des étudiants pour évangéliser sur tel ou tel produit leurs petits camarades, elles recruteront et paieront des professeurs, leurs offriront des licences logicielles gratuites. Bref, elles "feront le job" de la formation aux technologies de l'information.
Demain ce sera Ubu Roi. UBU : Université des Baudruches Unanimes. ROI : retour sur investissement à la hauteur du désinvestissement constaté. Ubu roi vous dis-je. 

(Temps de rédaction de ce billet : 3h30 - oui je sais c'est long, non je n'avais rien de mieux à faire vendredi soir)

Quoi de nouveau sous les moteurs ?

Revue de liens éparpillés "façon puzzle" comme dirait l'autre.

  • Google indexe désormais les documents scannés. 2 conclusions : le web invisible recule encore, la puissance de frappe "made in Google" sur toutes les étapes de la numérisation (institutionnelle, personnelle, en amont, en aval ...) augmente (encore) d'un cran. L'info est disponible sur le blog officiel de Google et commentée (notamment) chez Christophe Asselin.
  • Google dispose de plus de 2 millions de serveurs répartis sur une trentaine de centres de calcul (datacenters). Information et commentaires chez Didier Durand. Informatique dans les nuages donc, mais façon cumulonimbus.
  • Google hébergerait 10,5 millions de sites web sur les 182 millions que compte le Net. Info et commentaires chez Olivier Andrieu.

Nota bene : de ces deux dernières infos, je retiens que l'hypothèse d'un GoogleNet comme "second réseau" est de moins en moins invraisemblable.

  • L'informatique distribuée (ou "dans les nuages") est décidémment à la mode puisqu'Exalead vient de lancer CloudView, "sa" solution Cloud Computing permettant à une entreprise d'accéder et d'agréger l'ensemble de ses données internes et externes.
  • Microsoft de son côté a lancé Microsoft Azure, une nouvelle version instance de sa plateforme Windows, avec un credo : des services indépendants de l'infrastructure. Finalement, le cloud computing n'est que la déclinaison "système" d'un état de fait depuis longtemps avéré dans la gestion des "contenus" : différencier la gestion du fond (= les contenus) de la gestion de la forme (= gabarits, templates). Je vais peut-être avoir l'air d'enfoncer une porte ouverte, mais il est amusant de constater que cette petite micro-évolution dans la gestion des documents (gestion différenciée des contenus et des gabarits) était largement annonciatrice d'une macro-transformation dans la gestion des données (= gestion différenciée des services et de l'infrastructure = cloud computing). Moralité : en observant finement l'évolution des "documents" on peut arriver à inférer ce que seront les grandes orientations prises dans la gestion des données et des services.
  • Google (encore) : une vidéo qui en 4 minutes, met en scène l'évolution de la page d'accueil la plus célèbre du monde.
  • Google (toujours) offre désormais la possibilité de s'abonner par RSS aux résultats de son moteur de recherche à l'aide de la fonction Google Alerts (qui ne tourne pour l'instant que sur Google News).Nota bene : il faut d'abord créer une "alerte" puis aller la modifier ("manage alert") et demander la création du fil rss correspondant ("Feed").
  • Microsoft motorise désormais Facebook pour la recherche web. Cela ne marche pour l'instant qu'aux Etats-Unis, mais cela est un signal fort de l'effet vortex recherché par les stratèges du site de réseau social. Stratégie identique (et cependant concurrente) à celle des moteurs de recherche qui eux aussi s'efforcent de maintenir le plus longtemps possible l'utilisateur dans leur périmètre de services. Sur le même sujet, voir aussi le commentaire de Techcrunch.
  • Et puis parce qu'il n'y a pas que Google, Microsoft et Exalead dans la vie, voici un petit nouveau baptisé "SearchCube" qui est en fait une application de présentation des résultats de recherche sous forme de rubiks cube animé (sur la base des résultats de Google et de Thumbshots.org). Sympa. Sans plus mais sympa.

(Sources : sous les liens // Temps de rédaction de ce billet : 1 heure)

Politburo motorisé : Goobama ou MicroCain ?

Dans la série "le politique et son reflet motorisé", et dans une quête éperdue de notoriété mise à mal, je vais donc sacrifier à la tradition médiatique. <Teasing> A la fin du billet que vous êtes en train de lire, vous connaîtrez, en avant-première mondiale, le résultat de l'élection présidentielle américaine. </Teasing>

Préambule.
Les rapports entre le politique et la représentation du monde que donnent à voir les moteurs sont de plus en plus étroits, de plus en plus complexes, de plus en plus décisifs. C'est un poncif que de souligner le rôle que joue le net dans les élections américaines aujourd'hui, et qu'il jouera sans nul doute demain à l'échelle de la vie démocratique planétaire, pour le meilleur ou pour le pire. Dans un billet d'Octobre 2006 j'écrivais déjà :

  • "il serait alarmant que Google puisse ne serait-ce qu'envisager de prendre le contrôle d'une centralisation du vote, par la biais des machines électroniques à voter. Ce scénario n'a aujourd'hui rien plus rien de fantaisiste. Google dispose des financements, des appuis politiques et de l'architecture informatique qui lui permettraient d'organiser le vote planétaire à l'échelle de chaque pays le désirant. (...) Nos sociétés occidentales n'hésitent par ailleurs plus (...) à confier à des sociétés privées la gestion d'intérêts et d'énergies fondamentales, qui sont le bien commun des 6 milliards d'êtres qui peuplent la planète. Hésiteront-elles longtemps avant de lui confier la démocratie ?"

A l'heure ou les médias du monde entier ont tous leurs sens numériques entièrement braqués sur l'élection en train de se jouer aux USA, regardons ce que la chose numérique apporte comme éclairage et comme décryptage à la chose politique.

Realnumerik et/ou Realpolitik.
Le billet de ReadWriteWeb, "Your election Day Web Toolkit",  nous offre une vue exhaustive de cette boîte à outils numérique : informations en temps réel sur le vote en cours, vote participatif sitôt filmé et sitôt posté sur YouTube, groupes de microblogging décryptant les résultats là encore en temps réel, sondages divers et variés, et bien sûr, marketing et merchandising citoyen avec de grandes enseignes vous offrant un café tiède ou un nuggets moisi si vous entrez chez eux en hurlant "j'ai voté".

Moteurs et politiques : une affaire de résultats.

Mais au-delà du gadget et de l'insondable sondage, les moteurs savent également offrir de très beaux outils de décryptage et de suivi des résultats. Dans cette catégorie, la palme revient probablement au "Political Dashboard" de Yahoo!. A l'heure où j'écris ce billet, seules les projections de vote sont naturellement accessibles, mais vous avez la possibilité de créer votre propre scénario en cliquant sur les différents états pour en faire changer la couleur politique et disposer donc d'autant de scénarios et de résultats que possible. 
Google n'est naturellement pas en reste et se fend d'un billet sur son blog officiel pour détailler l'ensemble de "son" dispositif : une GoogleMaps qui permettra de visualiser les résultats, une page Google News dédiée avec un affichage en colonne des résultats état par état, etc.

Là où cela se complique ...
Jusque là, au final, pas grand chose de nouveau, sauf que chacun peut se rejouer en solo et dans son salon la grand messe télévisuelle des soirées électorales, avec des joujous capables de déclencher une soudaine moiteur intime chez le chroniqueur politique d'astreinte ou la directeur d'institut de sondage sur le pont. Là où cela se complique c'est quand on en arrive aux authentiques stratégies motorisée d'un vote (prétendûment ?) à valeur ajoutée.

De nouveaux espaces synoptiques
L'exemple le plus frappant est celui du canal vidéo créé sur YouTube pour l'occasion et baptisé : Video Your Vote. 596 vidéos sont pour l'instant (4 Novembre, 22h, heure française) répertoriées. Là encore, une carte GoogleMaps sert de support, d'accrochage, aux vidéos envoyées par des citoyens (ou des personnalités), lesquelles vidéos sont répertoriées et visualisables selon un certain nombre de thèmes : les "Notable voter" par exemple, personnalités diverses (mais essentiellement politiques) qui se fendent de leur propre reportage sur eux-mêmes et leur vote ; plus intéressantes, les vidéos des "First Time Voter" (sous la catégorie "voting perspectives") qui font part de leur état d'esprit. Beaucoup plus étonnante, la catégorie "Voter Intimidation". Et oui. "Voter Intimidation" On y découvre des vidéos qui dénoncent des tentatives d'intimidation plus ou moins graves, dont l'essentiel provient de groupes de pression ou de lobbys politico-industrialo-religieux. Mais on trouve également dans la même catégorie une "interview" (?) de Sally Morgan, étudiante à l'université de Virginia Tech (?) qui raconte comment on (?) a tenté de l'intimider dans sa faculté. On a donc d'un côté des vidéos amateur dont la valeur sociologique est avérée, mais pour lesquelles on ne peut disposer d'aucune valeur de vérité propre (cf mes points d'interrogation dans la phrase précédente), et de l'autre côté, mises sur le même plan dans le même dispositif, des reportages "classiques" de médias "traditionnels", dé-portés sur YouTube. Là encore me direz-vous, rien de nouveau : toute soirée électorale combine les micro-trottoirs anecdotiques avec les analyses politiques plus "sourcées". Mais ce qui change ici c'est l'industrialisation du processus. Alain Giffard (parmi d'autres, dont B. Stiegler) a parfaitement décrit cette industrialisation de l'intime. Ce même intime qui est à l'oeuvre dans l'isoloir, dans cet acte politique fondateur. Tout cela est pour le moins troublant et mériterait à lui seul une analyse complète. Dernière catégorie sur laquelle je vous invite à jeter un oeil dans la chaîne Video Your Vote, c'est la catégorie "Polling Place Problems" et la sous-catégorie "Machine Problems". Aux USA, les machines à voter sont en place dans un très grand nombre d'états. On y découvre de courtes vidéos aussi hallucinantes qu'effrayantes qui, après les ambiguités de la mal-bouffe et du fast-food, nous font découvrir les immenses dangers de demain : ceux du fast-vote, du mal-vote. L'industrialisation du processus de vote se surajoute à celle de l'intime pour lui ôter, à terme, sa valeur propre.

Du passé ne faisons plus table rase.
Les candidats sont naturellement les plus exposés à l'éléphantesque mémoire des moteurs. L'outil Google Citation (tournant - pour l'instant - sur Google News) est capable d'extraire les phrases qu'ils ont prononcé pendant les 5 dernières années sur une thématique donnée et de les resituer en contexte (exemple ici). Autre exemple, l'indexation "textuelle" des vidéos des candidats. Même si peut-être moins que d'autres ils ont, dans l'exercice de leur fonction, le droit à l'oubli numérique, il va falloir réfléchir à l'impact que cet accès direct, permanent et traçable à leurs mémoires aura sur leurs ... discours. La mémoire et la mer l'amer comme disait l'autre

Vers une logique de panoptique.

L'ensemble de ces dispositifs, de ces artefacts, de ces cartes synoptiques s'enrichissent rapidement et nécessairement d'une dimension supplémentaire à la problématique bien plus lourde : celle d'une dérive panoptique inévitable. C'est la logique du genre. Nous filmons, ils enregistrent. Pour en revenir à l'analogie avec les soirées électorales d'antan, dans les dispositifs offerts par les moteurs, toute l'éditorialisation est camouflée. Elle semble avoir disparue (aucun chroniqueur, analyste ou journaliste n'est là pour "faire des choix" de reportage ou de questions à poser ou à ne pas poser), mais elle est plus que jamais présente. Saut qu'il ne s'agit plus d'une éditorialisation à priori mais a posteriori. Ce que changent les moteurs, c'est la temporalité du "moment" politique. La valeur ajoutée maximale de ce moment est, pour les usagers, le temps des sondages qui le précèdent et naturellement celui du temps présent de l'élection. Mais la valeur ajoutée maximale pour les moteurs est tout autre. Elle est dans l'éditorialisation rendue a posteriori possible de ces milliers de données, de comportements et de requêtes collectés de manière cadrée, de manière expérimentale et quasi-scientifique.

"Qu'arrivera-t-il si nous répondons mal à des requêtes comme 'socialism' ?"

Car avant et parfois même pendant le vote, les gens cherchent. Et l'on sait ce qu'ils cherchent. Là encore le blog officiel de Google nous livre les requêtes les plus courantes. Je m'attarde 5 minutes sur les 10 sujets politiques les plus recherchés ("Top Political Topics") :

  1. debate
  2. Social Security
  3. presidential debate
  4. polls
  5. voter registration
  6. gas prices
  7. oil prices
  8. FDIC
  9. electoral college
  10. Socialism

Le "socialisme" est donc le 10ème mot-clé le plus recherché en ce moment par les américains. Outre que cela ferait probablement plaisir à la cellule communication du PS français, cela nous en dit déjà beaucoup sur "l'angoisse" et "l'incompréhension" de l'amérique républicaine face à ce fléau. Mais ce qui m'intéresse ici, ce n'est pas tant la requête que le résultat de cette requête dans Google. Première étape : la fonction Google Suggest est là encore riche d'enseignements.

Socialism     

C'est bien le socialisme d'Obama qui inquiète, qui intrique, qui est la chose recherchée. Deuxième étape : les résultats. Wikipédia, Dictionary.com, la Britannica, un site de bibliothèque numérique en économie. Les 4 premiers résultats donnent donc dans une "neutralité" de bon aloi. Le cinquième résultat est déjà plus surprenant : une page personnelle d'un "socialiste indépendant". Le premier site offrant un rapport direct entre la requête ("socialism") et le contexte de la requête (élection américaine) arrive en 9ème position et il s'agit d'un site clairement républicain. A tout cela il faut ajouter que ladite page de résultat n'est pas nécessairement celle qui sera affichée en réponse à toutes les requêtes déposées sur ce seul mot-clé. En effet, nombre d'internautes utilisent le moteur Google en étant identifiés sur leur compte Google (gmail par exemple). A partir de là (principe de la personnalisation persistante : diapos 29 et 39 à 42), les "préférences" et l'historique de recherche de l'internaute sont convoqués pour proposer un remix personnalisé de résultats. Autant dire que les républicains qui cherchent des infos sur "Obama le socialiste" trouveront dans lesdits résultats de quoi largement alimenter leur socialophobie. Tout cela nous ramène donc aux préoccupations du précédent billet sur le sujet : "qu'arrivera-t-il si nous répondons mal à des requêtes comme 'socialism' ?" Ou comment passer du nez de Cléopâtre au socialisme d'Obama : la face du monde en sera peut-être changée. Pour le meilleur ... ou pour le pire.

Et maintenant chose promise chose dûe : le résultat du vote en avant première mondiale.

(Sources : sous les liens // Temps de rédaction de ce billet : 2h15)

Le web en son reflet motorisé : Google invente le monopolien.

Le 11 Avril 2008 sur son blog Webmaster Central, Google annonçait qu'il allait désormais se donner les moyens d'indexer certaines données disponibles "derrière" un formulaire, faisant ainsi reculer encore un peu le périmètre du web invisible. Comme je l'avais souligné au moment de cette annonce, un certain nombre de paramètres restaient encore dans le flou (quels formulaires ? sur quels sites ? comment ?). Six mois plus tard, sur le même blog, Google vient d'annoncer sa solution partielle au problème : cela s'appelle le First Click Free. Et comme souvent avec Google, c'est une très bonne idée, une idée par ailleurs très simple ... mais une idée que lui seul est en mesure de proposer et d'implémenter de manière significative du fait de sa situation quasi-monopolistique, une idée qui met également en péril une certaine conception du Net. Mais revenons au First Click Free.
De quoi s'agit-il ?
Les webmasters proposant du contenu protégé (par exemple sur le modèle payant par abonnement, comme les grands quotidiens de presse), auront la possibilité d'ouvrir leurs pages "privées" au crawler du moteur. Résultat ? Ce contenu sera indexé par Google, et l'internaute qui arrivera sur cette page depuis Google, y aura accès. Et oui. L'internaute qui arrivera sur cette page depuis Google. Pas "depuis un autre moteur". Google offre comme garantie que l'internaute qui souhaitera consulter les pages liées au contenu ainsi "dé-protégé" ne pourra pas le faire. C'est donc la technique bien connue des marchands d'aspirateurs du siècle dernier qui est retenue : celle du pied dans la porte. Le problème, c'est que ladite fonctionnalité instaure de facto un web à deux vitesses, qui semble contraire au principe que Google se fait par ailleurs fort de défendre, celui de la neutralité du Net en tant que réseau, en tant qu'infrastructure. Pour bien comprendre et sans faire trop long sur le sujet, rappelons que derrière la problématique de la neutralité du Net, la question est de savoir si les fournisseurs d'accès ont ou non la possibilité d'élargir ou de restreindre "sur mesure" la bande passante dédiée à certains sites. Naturellement, dans le cas des First Click Free, Google ne se positionne pas sur le créneau de l'infrastructure (ce qui lui permet de continuer à "militer" pour le maintien d'une neutralité du net), mais sur celui (c'est son métier) des contenus.
Alors en quoi est-ce contraire au principe de neutralité du Net ?
Et bien jusqu'ici, les moteurs se différenciaient par deux points : leur algorithmie, et leur infrastructure technologique leur permettant d'indexer le plus grand volume possible d'informations disponibles et de mettre à jour leur base d'index. Pour le dire différemment, si certains contenus étaient disponibles sur certains moteurs et pas sur d'autres, ce n'était en rien dû au fait que les éditeurs de ces contenus avaient ou non passé un "contrat d'indexation" avec tel ou tel moteur, mais simplement au fait que les routines d'indexation de tel moteur étaient plus efficaces que celles de tel autre. Avec First Click Free, la donne est radicalement changée. Pour la première fois à l'échelle du Net, des éditeurs vont pouvoir contractualiser l'accès à des parties payantes de leur site, avec un seul acteur au détriment des autres.
Tempête dans un verre d'eau ?
Pas vraiment. On savait déjà que les moteurs aimaient bien tisser des liens d'affection, soit avec des services dépendant directement de leur propre écosystème (ex : les vidéos de YouTube et les blogs de Blogger sont légèrement surpondérés dans les résultats de Google), soit avec des services tiers desservant prioritairement leur propre modèle économique (Ebay, Amazon ...). On savait également que les mêmes moteurs prospéraient sur des liens d'affiliation (offre Google Adsense).
Après les liens d'affiliation et d'affection, voici venue le temps des monopoliens.
Ce qui est explicitement proposé aux webmasters (pardon d'insister un peu lourdement), c'est l'indexation exclusive de certains contenus. Jusqu'ici, l'ouverture d'un contenu à un moteur, signifiait également l'ouverture de ce même contenu à tous les autres acteurs de la recherche d'information.
Quelle est la cible ?
Poser la question des (monopo)liens, c'est nécessairement poser la question de la cible d'un tel service. Pas besoin en l'occurence d'aller chercher bien loin. Si certains sites de particuliers ou certains portails d'entreprises peuvent être intéressés par cette visibilité accrue sur des contenus jusqu'ici inaccessibles, c'est (à mon avis) très clairement la presse en ligne qui est visée. Souvenez-vous en la matière de la complexité de l'indexation des contenus de la presse par Google (service Google News). Après les procès intentés par les sites de presse dans différents pays, après les accords passés avec certaines agences, Google ne se contente plus de son pourtant déjà très remarquable coup du chapeau. Prenons la question du côté d'un site de presse généraliste national ; les données sont les suivantes : je veux que mon contenu (y compris une partie de mon contenu payant) soit indexé et visible sur les moteurs de recherche. Je veux cela parce que je n'ai pas le choix et que je ne peux pas me passer du traffic généré par les moteurs. J'avais donc jusqu'ici le choix entre "garder mes contenus fermés à l'indexation" (et donc me priver du traffic qu'ils auraient pu générer), ou "donner mes contenus ouverts" (et là aussi me priver du traffic généré puisque les internautes consulteront lesdits contenus sur Google News plutôt que sur mon propre site). Avec les monopoliens, j'aurai désormais la possibilité d'amener du traffic vers mon site, en contrôlant la visibilité de mes contenus, sans risquer de voir mon audience sur lesdits contenus "déportée" vers les moteurs de recherche et leurs services d'agrégation d'actualités. Cette proposition de Google va donc probablement ravir ou à tout le moins donner du grain à moudre à ceux qui planchent en ce moment sur l'avenir de la presse.
Monopoliens sous conditions.
Si vous n'êtes pas encore convaincus que c'est bien la presse en ligne qui est directement visée, les conditions (Guidelines) fixées par Google (bé oui, en plus il fixe des conditions) devraient achever de vous convaincre. Pour ceux qui choisiront de mettre en oeuvre ces monopoliens, il faudra : (1) "que les internautes qui arriveront sur ces pages puissent voir le texte intégral du contenu", (2) "que le contenu affiché soit identique à celui offert à l'indexation du GoogleBot", (3) "que si la source liée est un article affiché sur plusieurs pages" (ce que font fréquemment tous les sites de presse) "il soit possible de consulter l'intégralité de l'article en une seule page sans qu'on lui demande (à l'usager) de s'enregistrer ou de payer".
Un nouveau contrat de dupe ?
Concrètement, en autorisant ainsi Google à indexer certaines données "privées / payantes" de leurs sites, et même si Google donne comme garantie que les usagers ne pourront pas aller au-delà du contenu ainsi autorisé, rien n'est en revanche garanti sur le comportement du GoogleBot ... à partir du moment où celui-ci disposera du mode d'accès à l'ensemble des contenus payants du site, il y a de fortes chances pour qu'il ne se prive pas de les indexer à des fins que pour l'instant lui seul connaît (même s'il est naturellement toujours possible de "re"-sécuriser des contenus mais vu le volume et l'architecture des grands sites de presse, il y a de grandes chances pour qu'un certain nombre de pages "fuitent" ainsi vers le moteur, et étant entendu que ce qui intéresse Google ce sont précisément ces contenus d'actualité qui lui restaient partiellement fermés).
Et donc ?
Et donc là encore, comme il le fit déjà avec GoogleBooks pour la partie concernant les ouvrages encore sous droits, Google avance, Google fait sans cesse reculer les frontières de l'indexation, Google alimente son coeur de métier sur des logiques tenant à proprement parler de la dévoration. Ceci doit d'autant plus nous interpeller qu'à mon avis (côté obscur de la force) nous n'avons jamais été aussi près de voir émerger demain un authentique GoogleNet se substituant au réseau Internet tel que nous le connaissons aujourd'hui, et que (côté optimiste de la force) d'autres sont en passe de montrer qu'il est possible d'être à la fois visionnaire et tout aussi "malin" que le Cronos du Net.

(Via Google Blogoscoped // Temps de rédaction de ce billet :1h30)

Le politique et son reflet motorisé : jusqu'ici ... tout va bien.

Vous souvenez-vous du débat télévisé entre Ségolène Royal et Nicolas Sarkozy ? Vous souvenez-vous, dans ce débat, de l'épisode sur l'EPR de 3ème génération ? Vous souvenez-vous de la TRD (tentative de redocumentarisation déviante) occasionnée ? Oui ? (sinon, allez vous rafraîchir la mémoire ici, puis revenez).
L'autre soir, dans un autre pays, un autre débat opposait Sarah Palin à Joe Biden. Et que font aujourd'hui les gens (enfin certains) pendant les débats politiques ? Et bien ils cherchent. Ils cherchent à comprendre. En France ils avaient donc cherché sur Wikipédia la vérité sur l'EPR, et comme les partisans de l'un y trouvèrent la vérité, mais que cette vérité était celle de l'autre, ils se mirent à chacun écrire leurs vérités. Sans dommage heureusement. Aux Etats-Unis, les gens ont cherché ... mais sur Google. Et Google s'est "amusé" avec son outil Google Trends, pour "voir" littéralement ce que les gens tapaient ... dans Google, au fur et à mesure de l'avancée du débat et des arguments. Le compte-rendu que fait Google de cette expérience, est - au-delà du bourrage de mou habituel de la firme - très intéressant. On y apprend d'abord que les gens utilisent énormément la fonction "define:" proposée par le moteur dès qu'ils butent sur un mot (en l'occurence "Maverick" ou "theocracy").
<Digression>M'appuyant sur un panel à peine moins représentatif que celui de Google (mes étudiants), il faut reconnaître que cette fonction (parfois assez indélicate et malgré l'existence d'une remarquable concurrence) remporte effectivement un énorme succès : c'est en effet le seul opérateur qu'ils retiennent sans que j'aie besoin de le leur répéter 17 fois. </Digression>
Donc les gens cherchent. Mais à relire le billet de Google, on s'aperçoit surtout de la fantastique opportunité que représentent pour lui ces grand-messe télévisuelles. Car pendant que les gens cherchent pour comprendre le discours, Google dispose du discours. Google est dans la situation du scientifique qui monte une "manip", une expérimentation, et qui s'efforce d'en contrôler la totalité des paramètres, des variables.  Quand un candidat prononce le nom "d'Ahmadinejad" les gens cherchent [Achmadinijad], [Akmadinijad], [Akmadinajad], [president Iran], [Iran leader]. Et alors ?
Alors avec ce genre de focale (un évènement dont on sait qu'il va - pendant une période de temps donnée -  occuper l'attention d'une majorité de l'opinion), alors à cette échelle (des millions d'américains ont regardé ce débat), c'est l'occasion pour le moteur de faire ce que tous les puissants de ce monde (et aussi quelques scientifiques ...) ont un jour rêvé de faire : sentir le pouls réel de la planète, de l'opinion, disposer de données très peu "bruitées" parce que centrées sur un événement donné, dans une fenêtre de temps fixe, mesurable. Difficile en effet, si l'on ne dispose pas du cadre, du contexte fourni par le temps du débat télévisé, d'apparier les requêtes déposées ([Akmadinajad], [president Iran] ...) à une même entité référente ("Ahmadinejad"). Avec la grand-messe politique, Google tient sa source.
OK mais euh ... et alors ?
Alors vous vous souvenez de ce que racontait l'autre jour Peter Norvig (Google Chief Scientist) à propos de l'intelligence des données ? Avec ce genre d'expérimentation politique à l'échelle d'un pays, Google peut se permettre d'avancer considérablement plus vite que les outils du web sémantique. Il peut littéralement "zapper" le recours à des logiques sémantiques au profit d'un apprentissage via des logiques d'auto-renforcement. Le volume des données traitées, "l'intelligence" que leur confère ce genre d'expérimentation sont, dans l'instant et à ce volume, beaucoup plus prometteuses et plus efficientes que ne peut prétendre l'être un web sémantique (ou sémantisé) toujours en manque d'un volume de données (et de métadonnées) suffisamment vaste ou suffisamment homogène.
Oui mais ...
Oui mais le problème c'est que les données, même interprétées, même compilées à cette échelle, ne sont jamais exemptes de variables, d'imprévisibles, d'impondérables variables. Le fameux "grain de sable" capable de détraquer un immense engrenage. Tout ceci pose donc deux questions : l'architecture de Google, autant que son approche, autant que son quasi-monopole, le mettent aujourd'hui clairement en situation (délibérée ou non) de pouvoir fausser les représentations communes, et ce à l'échelle d'un pays, d'une nation. "Je me dis parfois que je peux sentir les sentiments du monde, ce qui peut aussi être un fardeau. Qu'arrivera-t-il si nous répondons mal à des requêtes comme "amour" ou "ouragan" ?" disait déjà Apostolos Gerasoulis (le papa d'Ask Jeeves, 4ème moteur de recherche au monde tout de même). Dans sa situation actuelle, Google peut légitimement se poser la question de savoir : "Qu'arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?"
Quand les gens tapent [Akmadinajad], [president Iran] au moment d'un débat électoral majeur, qu'arrivera-t-il, que pourrait-il arriver si "je" les renvoyais vers des résultats même légèrement, même infinitésimalement partisans ?
Vous êtes perdus, vous ne voyez toujours pas où je veux en venir ?
Quand les gens ont cherché des informations sur l'EPR lors du débat télévisé français, que serait-il arrivé si on leur avait majoritairement affiché des sites renvoyant davantage à la version d'un candidat au détriment de l'autre ?
Ca y est ? Vous voyez où je veux en venir ?
Avec Wikipédia, nous avons encore la possibilité de contrôler, "d'éditer". Et être capable d'éditer, c'est encore être capable d'éditorialiser, et donc de contextualiser, de diversifier, de distancier. Avec Google nous sommes le nez dans le guidon, le nez dans le miroir, nous n'avons plus que la seule liberté de souscrire à l'ordre de la liste affichée de résultats. Alors bien sûr Google n'oriente pas les résultats en fonction de tel ou tel candidat. Bien sûr la question n'est pas là. La question est de savoir s'il est ou non aujourd'hui déraisonnable de poser de telles questions. Je pense que non. La question est de savoir combien de temps encore la neutralité des données, la neutralité de Google pourra résister aux sirènes de la puissance du politique. A mon avis plus pendant très longtemps. Une question annexe est de se demander s'il ne devrait pas être obligatoire de mettre l'ensemble de ces données à disposition de scientifiques confirmés et ("si possible" aujourd'hui ou "s'il en reste" demain) non salariés de Google (ou d'une autre holding de l'infotainment) ? Ou au moins de permettre auxdits scientifiques d'y mettre un peu plus que le bout de leur nez, ne serait-ce que pour avoir la certitude que Google ne sera pas tenté, un jour, de se poser la question  "Qu'arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?".

(Source : ReadWriteWeb, qui souligne et titre "Google has change political debate for ever" // Temps de rédaction de ce billet : 2 heures et 15 minutes)

<Update de plusieurs jours plus tard> Google s'intéresse également aux prochaines élections au parlement européen </Update>

"Political Streams" ou du classement comme représentation.

Microsoft via ses "labs" lance son interface de visualisation en temps (quasi)réel des tendances, politiques en l'occurence. Cela s'appelle Political Streams et vous propose de voir quels sont les "gens", les "articles" (presse), les billets (blogs), et les pays qui sont au centre de "l'attention" planétaire. L'ensemble s'appuie sur les contenus de Freebase. Tout laisse penser que l'actuel Political Streams se déclinera bientôt sous d'autres formes : Society Streams, Sports Streams, etc ... C'est en tout cas ce que l'on se dit en parcourant la page du projet. On note enfin pour ceux qui n'en seraient pas encore convaincus, que la visualisation, que le rendu visuel en un espace étroit (mais dynamique) d'un ensemble gigantesque de données, est sinon l'avenir, à tout le moins une piste très très très explorée par les différents moteurs de recherche. Les autres projets qui occupent la une des LiveLabs - Seadragon, Photosynth - sont pour l'essentiel dédiés à la représentation de larges corpus en temps réel pour en dégager des motifs, des patterns, des tendances. Voilà pourquoi les classements, tous les classements (de celui de Shangaï à celui de Wikio), passionneront toujours les scientifiques, tous les scientifiques. Parce que toutes les visualisations, toutes les représentations, débutent toujours par un classement. Parce qu'un classement, c'est le début, c'est le niveau 1 de la représentation (le degré zéro de la représentation étant celui de la liste - cf Goody). Un classement est déjà plus, beaucoup plus que la simple liste dont il conserve pourtant l'apparence. Un classement c'est la mise en place de principes dynamiques d'organisation qui révèlent du sens (quand les classement sont bien faits) plutôt que de nous le laisser le construire seuls avec nos listes, ou qui ne révèlent qu'eux-mêmes (quand les classements sont mal faits).

(Info initiale repérée sur DataMining)

God Save the Cloud (computing)

Quelques ressources et réflexions en vrac à propos d'informatique dans les nuages (Cloud Computing).

  • ReadWriteWeb nous offre un billet sur les 5 tendances (trends) du Cloud Computing : (1) des serveurs "blades", en français "lames" (c'est à dire des serveurs dont a été viré tout ce qui est "inutile", afin d'optimiser leur puissance ... si vous avez une traduction française du terme ... je prends :-), (2) une fonctionnement plus écologique (le cloud computing et ses immenses "fermes "de serveurs et autres Data Centers sont très gourmands en énergie ... premier concerné et premier à réagir : Google), (3) Virtualisation (au sens informatique du terme), (4) passage à l'échelle (pour gérer l'inflation des données portées en ligne ... ils 'agit de pouvoir gérer plusieurs péta-octets de données), (5) équipement Linux comme couche de base (aujourd'hui et d'après l'étude citée, un serveur sur 5 tournerait sous Linux)
  • Le Guardian rappelle le point de vue de Richard Stallman sur le sujet, qui est pour le moins sans ambiguité. "C'est pire que de la stupidité", pointant le risque énorme qu'il y a à confier systématiquement nos données à des systèmes qui - même s'ils sont "ouverts" en consultation et en dépôt - restent, par nature, propriétaires. Stupide donc, ET dangereux. A croiser avec le billet "Démocratisation des données" d'Hal Varian (économiste en chef chez Google), qui est un plaidoyer pour que les entreprises (spécialement les petites et moyennes), usent et abusent de la délagation de services que rend possible Google. A terme, c'est un vrai risque de dépendance informationnelle qui se profile.
  • Le prochain OS de Microsoft pourrait s'appeler "Windows Cloud". C'est en tout cas ce que confie Steve Ballmer au Register : "We’re not driving an agenda towards being service providers but we’ve gotta build a service that is Windows in the cloud". Une manière désormais stratégiquement incontournable pour Microsoft d'achever sa mue vers un OS au moins autant en ligne que sur des machines locales. Plus précisément, ce sont deux logiques convergentes parce que diamétralement opposées qui se dessinent chez les deux géants Google et Microsoft. Google offre "naturellement" la totalité de sa gamme applicative en ligne, avec la possibilité d'une synchronisation (Gears) laissant encore possible la survivance de comportements et de consultations dé-connectées. Microsoft offre tout aussi "naturellement" une gamme logicielle "locale" avec la possibilité d'une équivalence partielle en ligne afin de cannibaliser les comportements et les consultations connectées. C'est l'idée d'un "light editing" permettant d'éditer dans des applications en ligne tout ou partie d'un document, l'essentiel (ou le reste) du document, restant édité localement. Conclusion ? Ca vaudrait peut-être le coup que la bande à Roger se remette au travail sur ces sujets, pour nous aider à penser la granularité documentaire dans une globalité réticulée d'instanciations et de comportements dont elle est désormais indissociable.
  • Précipitez-vous sur la dernière conférence d'Hervé Le Crosnier à l'EBSI. Vous en sortirez plus intelligent et surtout vous contribuerez à faire exploser les serveurs de l'EBSI, ce qui permettra à un passionnant débat de rebondir, débat que l'on peut résumer comme suit : les institutions doivent-elles céder à l'extraordinaire facilité du "Cloud Computing par délégation", si non, de quels autres choix disposent-elles, et si oui, quel est le risque ? Cette question apparaît effectivement centrale : l'informatique distribuée permet aujourd'hui (et ça ne va pas s'arranger demain), d'institutionnaliser la notion de "délégation de services (informatiques)". Rappelons que nombre d'institutions publiques (mais on pourrait faire la même analyse pour le secteur privé) se sont déjà engagées sur une pente glissante en confiant leurs contenus à des prestataires externes, et en se coupant - in fine - d'une grande partie de leur public (l'exemple le plus frappant me semble être celui de Google Books). Si en plus des contenus, elles externalisent durablement (l'externalisation durable et persistante étant le principe au coeur de la délégation de service qu'autorise l'informatique distribuée), si, disais-je, elles externalisent également leurs services ... elles ne devront pas s'étonner de se trouver un beau jour sans public, et donc sans légitimité, sans raison d'être. Une question qui est d'autant plus d'actualité que les grands acteurs du cloud computing (Google et Microsoft) entrent chaque jour un peu plus dans l'université, dans l'institution (la preuve sous les deux liens précédents).
  • Voir également sur le sujet du Cloud Computing en général, un (déjà ancien) billet de Louis Naugès, qui fixe bien le problème et les enjeux du Cloud Computing. Sans oublier, bien sûr, l'article "fondateur" d'Hervé Le Crosnier.

Je mesure donc je publie ...

Publish or perish. On parle beaucoup ces derniers temps de scientométrie et d'évaluation de la recherche.
Concernant la réforme des universités tout d'abord. Le dernier rapport de l'AERES met les labos de recherche des universités en ébullition : chacun compte ses publis et les publis de ses collègues et autant vous dire que si l'effet recherché par cette grille de lecture était de déclencher une saine émulation, c'est parfaitement raté ...
Même au CNRS (où les gens ont le temps de publier ... ce qui est hélas de moins en moins le cas à l'université, tâches administratives et d'enseignement obligent), l'heure est à la fronde. Voilà pour l'agitation "politique" autour de l'évaluation. Côté scientifique, plusieurs articles et rapports permettent d'avoir une vue plus claire de la situation :

  • "The first mover advantage in scientific publication", publié au début du mois sur ArXiv, montre que quel que soit le champ scientifique concerné, les modèles mathématiques sous-jacents à l'évaluation du facteur d'impact offrent une très nette prime au premier entrant. Un article publié au début d'une thématique scientifique recevra, de toute façon, un nombre significativement plus élevé de citations que les autres. Prime à l'antériorité donc, qui n'est pas nécessairement synonyme de qualité.
  • "Characteristics of Open Access Web Citation Network: A Multidisciplinary Study, presented at COLLNET 2008 (Berlin, July 28-August 1, 2008)"(.pdf) s'intéresse à la manière dont sont cités les publications des journaux en Open Access. Voir le compte rendu de Gabriel sur Urfist Info.
  • La VRS (Vie de la recherche scientifique) publie un numéro dont le dossier central est consacré aux questions d'évaluation : n⁰374 (.pdf). Voir aussi le compte-rendu qu'en fait l'un des auteurs sur son blog.
  • Un numéro entier de la revue Ethics in Science and Environmental Politics est là encore consacré à l'évaluation et aux indicateurs. L'ensemble des articles de ce numéro sont disponibles en accès libre. J'en retiens principalement 3. Primo : "Challenges for scientometric indicators: data demining, knowledge flows measurements and diversity issues" (.pdf) qui plaide pour un "déminage" des données bibliométriques (jolie référence au "data mining") et une ouverture à de nouveaux indicateurs rendant compte de la dynamique actuelle et des nouveaux modes de publications. Deuxio : "Google Scholar as a new source for citation analysis" (.pdf) qui montre la relative priximité des métriques issues de l'ISI (facteur d'impact) et le service offert par Google Scholar (en écho, on pourra relire mes propres considérations sur le sujet). Tertio : "Validating research performance metrics against peer rankings" (.pdf), de Stevan Harnad. Il y revient sur les "promising new online
    metrics such as download counts, hub/authority scores and growth/decay chronometrics" et revient sur l'opportunité offerte par le "UK Research Assessment Exercise 2008" (évaluation nationale de la recherche au Royaume-Uni), programme dans lequel "a full spectrum of metrics can be jointly tested, field by field, against peer rankings."

Et puis si vous n'avez pas le temps pour toutes ces lectures, alors n'en faites qu'une seule : "Du mauvais usage de faux-indicateurs" (.pdf) : une note de recherche passionnante de Yves Gingras dont je vous livre quelques extraits de la conclusion :
Biblio
Et plus loin :
Biblio2

(Temps de rédaction de ce billet : 1h15)

Recherche vers le futur ...

A l'occasion de ses 10 ans, Google met en place un petit outil qui vous permet de fouiller le web ... d'il y a dix ans. L'occasion d'un petit exercice d'ego-surfing toujours instructif.
==> 6 résultat en 2001 (dont certains assez croustillants ...)
Egosurf
==> 11 500 résultats en 2008 (dont certains toujours aussi croustillants mais très très très loin dans les pages de résultats)
Egosurf1

Au final un petit gadget sympathique mais qui est également la meilleure preuve que "Tout ce vous avez dit ou écrit sur Internet durant les 35 dernières années pourra être utilisé contre vous."

(Via Zorgloob)

Séminaire Inria : IST 2008

De retour de Dijon ... Mon diaporama est visible et téléchargeable sur SlideShare.

Le chapitre paru dans l'ouvrage "Métadonnées : mutations et perspectives" est disponible dans ArchiveSic.

  • Ertzscheid Olivier, "Moteurs de recherche : des enjeux d'aujourd'hui aux moteurs de demain", in Métadonnées : mutations et perspectives, Collection : Sciences et techniques de l'information, pp.59-89, 2008. <en ligne> http://archivesic.ccsd.cnrs.fr/sic_00325690/fr/

30 pages, 3 heures d'intervention lundi après-midi.
L'ouvrage complet est une mine, et je dis pas ça parce que j'étais invité ;-) La preuve ? Il m'a tenu éveillé durant les 7 heures de mon retour en train, ce qui est un signe incontestable d'intérêt.
Juste un petit regret pour ce séminaire : son tarif est prohibitif pour que les universités y soient représentées. Seuls les grands organismes de recherche français peuvent payer ce truc-là à leurs chercheurs et responsables de documentation. Et de fait, à de trop rares exceptions près, il n'y avait là que des gens (forts sympathiques par ailleurs) de l'INRIA (organisateur), du CNRS, de l'INSERM, de l'INRA ...  Ce serait pourtant important que vu la richesse et la qualité des intervenantes (enfin celles que j'ai entendues), les cours puissent être diffusés en vidéo sur Internet.
Merci en tout cas à Lisette Calderan de l'INRIA pour l'invitation et pour l'organisation.

Timeline Google. 10 ans. 10 Dates.

A l'occasion de son dixième anniversaire (je vous passe les débats sur l'âge réel du moteur selon que l'on prend en compte la publication de l'article originel sur le Pagerank, la date d'enregistrement du nom de domaine Google.com, le lancement du moteur mais hébergé sur le site de Stanford, etc ...), à l'occasion de son dixième anniversaire donc, Google met en place une Timeline très bien faite qui va réjouir à la fois les fans (qui sont de toute façon naturellement réjouis), mais aussi et surtout les analystes et observateurs du moteurs, tant il était pour ces derniers devenu délicat de disposer d'une grille de lecture fiable, aisément consultable et à jour des différentes acquisitions, innovations, et services du même moteur, bon sang que cette phrase est longue. On y retrouve notamment (spéciale dédicace à Jean-Michel) les étapes importantes de l'évolution de la Home Page la plus visitée du monde.
Voici mon petit relevé à moi des 10 dates qui m'ont le plus marqué (ou me semblent les plus importantes) depuis ces 10 ans :

  1. 3 Mai 1999 : Google embauche son 11ème employé. Le premier à n'être pas un ingénieur. Il s'agit d'Omid Kordestani. Monsieur "ads are content". Il a fait (pas tout seul, certes) du modèle économique de Google ce qu'il est aujourd'hui.
  2. 26 Juin 2000 : Google est le premier à franchir la barre du milliard de pages indexées. La "taille" de l'index de Google est indissociable de son succès.
  3. 12 Février 2001 : Google acquiert Usenet. En d'autres termes, il est la première société marchande à pouvoir se payer tout un pan d'une mémoire et d'une histoire collective, en l'occurence celle des forums de discussion qui furent à la fois les laboratoires, les incubateurs et les prémisses de l'Internet. A l'époque la nouvelle ne semble pas choquer grand monde. Moi si.
  4. 17 Décembre 2003 : lancement de Google Print, qui deviendra Google Books. Autre pièce essentielle du puzzle dont on mesure encore assez mal - à mon avis - la place centrale qu'elle sera amenée à occuper dans l'écosystème global du moteur.
  5. 18 Août 2004 : entrée en bourse. L'action est mise à prix 85 $. Elle côte aujourd'hui 429 $.
  6. 8 février 2005 : lancement de Google Maps. Le terreau le plus fertile de l'ensemble des mashups existant aujourd'hui. Et, au sens propre, une nouvelle manière de voir le monde.
  7. 30 Août 2006 : Google Books autorise le téléchargement des oeuvres du domaine public. Il était au départ garanti "sans impression ni téléchargement", .
  8. 9 Octobre 2006 : acquisition de YouTube. A mettre en balance avec les acquisitions phares de l'autre géant (Yahoo! ingère Del.icio.us). Derrière ces "coups de banque", le signe que désormais, quand une bonne idée ou une innovation rencontre massivement les usagers, elle n'a plus les moyens de résister aux Big Three. Exception confirmant la règle : Facebook ne s'est pas encore fait croquer.
  9. 30 Mai 2007 : lancement de Google Gears. La synchronisation est la prochaine (dernière ?) étape de la dérive des continents documentaires. Le passage obligé pour un WebOS.
  10. 1 Septembre 2008 : lancement de Google Chrome. A l'instar de Microsoft, Google aura donc mis 10 ans pour se doter de sa fenêtre Windows. Dix ans pendant lesquels il a patiemment bâti son OS.

Et vous, quelle est votre petite chronologie subjective des 10 dates clés du moteur ?

(Source : Eric Baillargeon // Temps de rédaction de ce billet : 1 Heure)

Sergei Brin souffre de la maladie de Parkinson.

======================================================================
Billet d'humeur où il est question de Sergei Brin, du financement de la recherche médicale, des maladies orphelines, de l'appel de Sauvons la Recherche et de quelques autres choses encore.
========================================================================

Donc Serguei Brin souffre de la maladie d'Alzheimer.

Bon ben en fait non. Derrière cette intox se cachent en fait trois infos.
1 : Sergei Brin a ouvert son blog***. (il a naturellement choisi la plateforme Blogger)
2. Sur son nouveau blog, Sergei Brin nous annonce être client dans fait de la pub pour la société de sa femme (société 23andMe dont Google est largement actionnaire). Et comme tous les clients il a fait faire son séquençage de génôme en bavant sur un morceau de papier buvard (ou un coton-tige, je sais plus) et en l'envoyant par la poste à 23andMe pour 200 euros 399 $ (enfin on peut supposer qu'ils lui ont fait un prix).
3. Et donc résultat des courses : Sergei Brin sur son blog nous annonce qu'il risquerait d'être atteint de la maladie de Parkinson parce qu'il est porteur d'un gêne LRRK2 (vous et moi aussi) et d'une mutation particulière de ce gêne (G2019S) qui est liée à la symptomatologie parkinsonnienne, même si - ça c'est moi qui le précise - il est par ailleurs établi que l'étiologie exacte de la maladie de Parkinson est inconnue (.pdf). Bref, Sergei a le gêne et la mutation du gêne, sa mère avait le gêne et la mutation du gène et la maladie de Parkinson, donc Serguei serait plus que d'autres exposé à cette même maladie. Et là, comme le dit Sergei, merci Anne (sa femme), merci la société de sa femme (23andMe) parce que grâce à elle(s), il a les 20 prochaines années pour se "préparer" à l'arrivée (supposée ...) de ladite maladie de Parkinson. Il va pouvoir faire du sport pour retarder l'arrivée (supposée) de la maladie, filer plein d'argent à des fondations pour la recherche médicale sur la maladie de Parkinson (dommage que 23andMe ne lui ait pas également détecté le gêne du cancer, de la mucoviscidose, de l'amyotrophie spinale, de la leucémie, et de toutes les maladies orphelines existantes ... il paraît que dans ces domaines aussi, la recherche a besoin de pognon), et vivre chacun des jours restant avec l'idée qu'il est plus que d'autres exposé à la maladie de Parkinson. C'est la fête. Youpi.
D'un strict point de vue scientifique (si des généticiens me lisent, qu'ils n'hésitent pas à me corriger), les arguments avancés par Sergei dans son billet, et la manière dont ils le sont, peuvent effectivement l'amener à penser qu'il a peut-être plus de chances que quelqu'un d'autre d'être un jour atteint de la maladie de Parkinson, mais les mêmes arguments pourraient également l'amener à penser qu'il a plus de chances que quelqu'un d'autre de développer un ulcère du foie, un kyste à l'orteil gauche, un annuaire de recherche francophone ou une appendicite <Update>(effectivement, ça se confirme ...).</Update>
Car voilà bien tout le danger que représentent des sociétés comme 23andMe pour des clients lambda. Elles sont l'exact pendant technologique des voyantes et mediums du moyen-âge. En travaillant sur la peur, en instrumentalisant l'ignorance, en habillant "l'a peu près" des atours de la vérité scientifique, en présentant comme des faits scientifiques avérés des suppositions dont aucune n'est à ce jour prouvée, on crée, au pire, les conditions d'émergence de ladite pathologie, et au mieux, une jolie psychose maniaco-dépressive. Il faut ici rappeler que des sociétés comme 23andMe n'ont que faire de la recherche médicale. Seul compte le dogme génétique : une maladie = un gêène ; Vous voulez savoir si vous allez être malade ? Demandez-nous si vous avez le gêène. Seule les intéresse le potentiel marchand de la génomique personnalisée. Leur pouvoir de nuisance n'est (pour l'instant) que "psychologique" ou "psycho-somatique". Mais leur discours, leur fonds de commerce est le même que celui d'un monde dans lequel l'état ou les cigarettiers vous expliqueraient qu'en achetant votre paquet de cigarette, vous aidez la recherche contre le cancer en permettant d'augmenter le nombre de cas existants, donc le nombre de cas cliniques, donc les possibilités de disposer d'un plus grand spectre d'analyse, donc au final les possibilités de trouver un remède.

Le billet de Sergei Brin, sa position à la tête de l'une des plus grandes holdings de l'information et de la conaissance que le monde ait jamais connu, les relations maritales et financières unissant le même Sergei Brin aux sociétés actuellement leader sur le (super)marché du séquençage génomique personnalisé (Google détient des parts substantielles dans 23andMe mais également dans son concurrent direct, Navigenics), tout cela pose par ailleurs une question lancinante : voulons-nous d'un monde dans lequel les progrès et les principaux financements de la médecine devront parier sur le niveau d'hypocondrie de leurs grands dirigeants ou financiers ? Voulons-nous d'un monde dans lequel il nous faudra guetter le cancer de Bill Gates, la maladie de Parkinson de Mickael J. Fox ou Sergei Brin, l'Alzheimer de Ruppert Murdoch pour espérer voir la recherche sur ces maladies bénéficier d'un effort de recherche suffisamment financé ?

Voilà pourquoi les notions si peu sexy et souvent galvaudées d'un "pilotage de la science" et d'une "politique scientifique" sont si importantes, si nécessaires. Voilà pourquoi la question du financement et des orientations de la recherche publique sont si cruciales, si vitales. Voilà pourquoi le politique, les chercheurs et les citoyens doivent s'emparer de ce débat, sans qu'aucun ne vienne déposséder l'autre de ses prérogatives. Voilà pourquoi les chercheurs et les citoyens ne peuvent pas laisser le politique faire n'importe quoi. Voilà aussi pourquoi certains engagements pour la recherche et l'enseignement supérieur m'apparaissent, bien au-delà des intérêts corporatistes qui les meuvent, plus que d'autres légitimes.

***au moment où je publie ce billet, rien n'indique que le blog de Sergei Brin ne soit pas un faux. Mais rien n'indique non plus le contraire :-).

Le poids des mots marchands.

J'aborde souvent, avec mes étudiants ou lors de formations, la question de la marchandisation de l'indexation (liens sponsorisés). J'en profite (quand j'ai le temps ...) pour pointer les dérives malheureusement consubstantielles à ce processus. Je cite souvent en exemple les achats électoraux de l'UMP au moment de la crise des banlieues ou bien encore à l'époque de l'affaire des caricatures du prophète Mahomet. L'actualité vient de me fournir un nouvel exemple pour mes prochains cours. Le mot en question est cette fois : Avortement (abortion). Et la question posée la suivante : les militants anti-avortement ou les lobbys et groupes de pression religieux peuvent-ils acheter ce mot à des fins publicitaires ? Jusqu'ici la réponse était non. Comme le rappelle le NYTimes qui relate l'affaire, l'achat de mots-clés sur Google est relativement encadré et soumis à certaines règles : il est ainsi impossible d'acheter des mots-clés pour des produits dérivés d'espèces animales protégées (par exemple : fourrure en poil d'ours des pyrénées) ou d'afficher dans le texte des publicités des incitations à la violence. Bref, une déontologie a minima et condamnée à un perpétuel ajustement. Mais il est des mots-clés tendanciellement neutres pour lesquels le traitement publicitaire peut être lourd de conséquences. Et c'est le cas du mot clé "abortion". Donc suite à un procès engagé contre Google par le Christian Institute, un accord amiable a été trouvé entre les deux. Il sera désormais possible (pour le Christian Institute mais également pour tous les groupes religieux ou sectaires anti-avortement) d'acheter ce mot-clé "comme les autres". La condition fixée par Google et figurant dans les termes de l'accord amiable est la suivante : "le texte des publicités doit être factuel, et non pas graphique ou émotionnel." Naturellement, rien n'est dit en revanche sur le contenu des pages liées ... et inutile de vous dire que dans lesdites pages liées, le Christian Institute  ne se prive pas de jouer sur le registre émotionnel. Ne reste plus qu'à espérer que le planning familial dispose d'un compte Adwords :-(
Moralité ? Tout change. Jusqu'au XXème siècle, les mots avaient un sens, ils ont désormais un prix. Le risque est que dans bien des cas, leur prix ne fixe leur sens commun.

"Less code. More Data."

J'ai retenu trois phrases-clé de la vidéo de la table-ronde réunissant Howard Bloom, auteur deThe Evolution of Mass Mind from the Big Bang to the 21st Century, Peter Norvig, Directeur de la recherche chez Google Jon Udell, "Evangeliste" chez Microsoft et Prabhakar Raghavan, Head of Research and Search Strategy chez Yahoo!.
Première phrase clé : "Moins de code, plus (+) de données".
L'idée notamment exprimée par Peter Norvig (mais faisant l'unanimité chez les autres), est que si nous avons suffisamment de données, nous n'avons plus besoin "d'intelligence". C'est pour lui l'avenir proche de l'intelligence artificielle. Non plus singer le fonctionnement de l'esprit humain et ses capacités de raisonnement, mais s'appuyer sur l'étendue des données, des données toujours plus "intelligentes" (intelligence étant probablement ici à entendre dans le sens de l'intelligence d'un organisme en croissance exponentielle, c'est à dire sa capacité à embrasser un nombre toujours plus grand de ramifications, de recoupements, dont émergent au final des motifs ("patterns"), des représentations directement interprétables ou signifiantes. Je n'ai pas le temps de vous les retrouver mais nombre d'observateurs francophones se sont déjà exprimés sur ce "Web of Data" et sur cette "intelligence des données" (jetez un oeil chez Got et ses petites cases, dans la maison "InternetActu" d'Hubert ou encore chez Christian Fauré)
Deuxième phrase clé : "We don't need taxonomy of knowledge. We need taxonomy of desire".
Cela renvoie à toutes les analyses dérivées de la "base de donnée des intentions" de John Battelle. P. Raghavan parle également de la création d'une "place de marché des intentions" (A marketplace of intent).
Troisième phrase clé : "From a world wide web to a web wide world".
C'est cette fois Nova Spivack (modérateur de la conférence) qui s'exprime et souligne la migration du web "dans" le monde réel (cf mes propres analyses sur la dérive des continents documentaires et le passage du World Wide Web au World Life Web).

Concernant le web sémantique, Peter Norvig rappelle qu'il y a troies voies pour atteindre le web sémantique : les bases de données structurées, les formats particuliers (rdf) et ... les contenus. Les textes. Les écrits. Pour lui, la vraie sémantique est là. Dans les textes. Et là encore, pour pouvoir extraire cette sémantique, il (leur) faut d'immeeeeeeenses gisements de données textuelles. GBS ?

Indexation : Google a l'écoute.

Non non. Il n'y a pas de faute d'orthographe dans le titre de ce billet. Google n'est pas "à" l'écoute (quoi que ... mais c'est une autre affaire), mais Google dispose désormais de la capacité d'écoute en termes d'indexation. Plus concrètement, il s'agit "simplement" d'indexer, dans des vidéos ou des fichiers audio, le contenu desdites vidéos ou fichiers, "mot à mot". Ce qui permet donc à l'utilisateur de faire une recherche "mot à mot" directement dans lesdits fichiers. Démonstration. Le dispositif pour l'instant expérimental (il est encore rattaché aux Google Labs) ne tourne que sur les discours et vidéos politiques des prétendants à la maison blanche. Cette nouvelle est d'importance car l'indexation vidéo est un enjeu primordial pour les acteurs de la recherche d'information. Primo car les contenus vidéo explosent littéralement sur le net (avec d'ailleurs un impact important sur la gestion de la bande passante). Deuxio parce qu'offrir un accès "profond" à ces contenus sans changer les habitudes et les modalités de requêtage des internautes constitue la promesse d'un nouvel eldorado publicitaire.

La recherche de blogs : pistes pour demain.

Compte-rendu de lecture de l'article : Hearst M., Hurst M., Dumais S., "What shoulg blog search look like ?" (.pdf)

Si cet article a attiré mon attention, c'est pour plusieurs raisons, et tout d'abord le "profil" de ses trois auteurs. L'article est en effet rédigé par Marti Hearst, professeur à Berkeley et spécialiste de la navigation et des interfaces "à facette", Susan Dumais (Microsoft), inventeur de l'indexation sémantique latente et spécialiste des interactions homme-machine, et Matthew Hurst (Microsoft), blogueur et inventeur du remarquable outil BlogPulse.

L'article part d'un constat : les outils actuels de recherche de blogs n'exploitent pas les fonctionnalités structurelles spécifiques de ces plateformes. Ce constat peut - de mon point de vue - être discuté dans la mesure ou les usagers (sauf certains geeks et professionnels de l'info) ne feraient probablement pas trop usage de fonctionnalités de recherche avancées.
Deuxième constat plus intéressant et qui nous en apprend beaucoup sur la manière dont les gens "cherchent" de l'information : l'article mentionne une étude portant sur 500 requêtes prises au hasard et qui les décompose comme suit : 52% contiennent des noms "d'entités nommées" (des personnes, des produits, des entreprises). Sur les 48% restant, 25% expriment des requêtes de "haut-niveau" (les exemples donnés sont "stock trading" "gay rights"). Les derniers 23% sont des requêtes navigationnelles et des requêtes "adultes", auxquelles s'ajoutent un petit lot d'inclassables. L'étude citée comprend une autre info intéressante : ses auteurs ont établi que concernant les requêtes sur des entités nommées, le "besoin" des requêtants était en général de voir ce qui se disait (sur le web, dans la presse) de l'entité en question, au moment de la requête. Bref, du requêtage dans une logique de "recherche d'actualité". Par ailleurs, 20% des requêtes les plus populaires étaient corrélées à une actualité récente. Bref encore, les usagers vont sur le Net pour les même raisons qu'ils se rendent dans des maisons de la presse : l'actualité, l'actualité, l'actualité.

L'article revient ensuite sur les caractéristiques propres de l'information publiée sur les blogs : l'unité n'est plus la page HTML mais le billet, le ton est souvent plus personnel, les opinions dominent l'information, etc. Les auteurs proposent alors de se focaliser autour de 3 scénarios :

  • "Find out what are people thinking or feeling about X over time.
  • Find good blogs/authors to read.
  • Find useful information that was published in blogs sometime in the past."

Je serai tenté de résumer ces trois scénarios par 3 mots-clés :

  • Hubs (vue la plus large possible de points de vue sur un sujet, approche synchronique),
  • Authorities (repérage de blogs "de confiance")
  • et Trends (vue diachronique d'un sujet).

Tout le monde aura reconnu derrière les deux premiers scénarios la patte de Kleinberg, rien de très nouveau donc, mais une bonne grille d'analyse.Voici les pistes proposées par les auteurs pour chacun des trois scénarios :

  • Scénario 1 : l'objectif est d'aider les "market researchers" à utiliser "the results of sentiment mining (...) to help get a timely understanding of reactions to products and policy proposals alike." La solution proposée est la suivante : "It should organize and aggregate the results better, and by having a focus on author information, including who has commented on the post, and who
    has blogged about the post.
    "
  • Scénario 2 : l'idée est ici clairement d'instrumentaliser le processus de sérendipité qui joue à plein pour l'identification de blogs de référence (par l'exploration des blogrolls notamment). Les annuaires de blogs ne semblant pas (plus ...) être capable de proposer des pistes fiables et étant délaissés par les utilisateurs. Les pistes proposées sont au nombre de trois. Primo : une caractérisation de la qualité des blogs sur la base d'une analyse quantitative et d'une identification des contenus "originaux" et des contenus "repris". Deuxio : "Subtopics within topics. A reader may want to find blogs that provide high-quality commentary on one topic specically within a general subject area, for example, commentary on a particular television show or on a particular model of motorcycle. Often these are interspersed with high-quality commentary on other related topics, such as other TV shows or other vehicles. A blog selection interface should allow for the automatic creation of a feed reader on only the subtopics of interest across several high-quality blogs simultaneously, with little or no additional work needed on the part of the user." Ce qui est ici décrit ressemble furieusement à ce que Wikio met en place depuis déjà pas mal de temps dans sa page "catégories" avec autant de fils RSS que de sous-catégories. Tertio : la caractérisation fine des auteurs et des lecteurs du blog, caractérisation construite autour des questions suivantes (je souligne celles qui me paraissent les plus prometteuses mais aussi les plus délicates à "mesurer") : "Who are the people who do the interacting on the blog, including in comments ? Whom does the blog link to, and which others are linked to it ? What forms of media link to it ? How many people write for this blog? What are
    their reputations
    ? How many people post comments for the authors of the blog? What is the quality of the comments ? Does this blog link to others with similar or different viewpoints ?
    " A noter que sur ce dernier point, une approche façon "controverse" telle qu'elle est mise en place (manuellement) par SmallBrother.info me semble très intéressante.

Avant d'aborder le dernier scénario, les auteurs proposent la mise en place d'une interface "à facettes" pour résoudre les problèmes à multiples dimensions posés par la recherche de blogs. On aurait notamment une facette "sociale" pour en savoir plus sur les auteurs et les commentateurs de blogs, et une autre facette davantage orientée "typologie des blogs" (tiens, tiens ...), une typologie qui là encore est le centre névralgique de l'approche (et du succès) de Wikio, via son célèbre classement. L'article relève la difficulté de faire entrer un blog dans une catégorie et une seule en fonction de son contenu (beaucoup de blogs traitant de beaucoup plus d'une seule thématique), difficulté augmentée par d'autres catégorisations possibles (en fonction de l'audience, du rattachement institutionnel, etc ...) et il propose 4 pistes pour affiner et produire des typologies pertientes et adaptées :

  • "standard text classification" : avec des trucs du genre "sérieux", "ironique", "artistique" ... De fait, les outils de l'ingénierie linguistique permettent aujourd'hui de "parser" des contenus pour en extraire des "tendances stylistiques". Il serait intéressant de les faire tourner sur un corpus large de blogs (par exemple ceux du classement wikio) pour voir le résultat et affiner les appartenances actuelles de tel ou tel blog.
  • "filtrage collaboratif" : un grand classique. Permettre aux gens de soumettre leurs blogs préférés en les rattachant à des blogs existants et déjà "catégorisés" ou "typologisés".
  • "sélection implicite" : plus osé (mais bien dans la ligne d'un web implicite de plus en plus présent ...). Il s'agirait en fait de "pister" les comportements de navigation pour ensuite implémenter un système de recommandation plus ou moins personnalisé.
  • "requêtes descriptives" : l'idée serait ici d'analyser les requêtes pour proposer, par exemple, des blogs "humoristiques" à quelqu'un qui tape "faites-moi rire avec mon divorce", ou des blogs plus sérieux et à dominante juridique à quelqu'un qui tape "comment choisir un avocat pour mon divorce".

Au final, même si l'article ne dit rien du "comment faire" (du fait des enjeux commerciaux et des brevets probablement déjà en cours de dépôt sur ces questions), il fourmille de pistes intéressantes.
M'est avis que Pierre Chappaz ainsi que le nouveau conseiller scientifique de Wikio et l'équipe prometteuse des Wikio Labs devraient y trouver quelques idées à creuser. Disons que ce sera là ma première contribution au dîner parisien de demain ;-)

// Temps de rédaction de ce billet : 2h30 //

Technologies de la capillarité et de l'artefact.

Je suis en train de préparer une intervention que je ferai ce vendredi 12 Septembre lors d'un séminaire organisé à Rennes. Le thème est le suivant : "Contextes est enjeux de la culture informationnelle, approches et questions de la didactique de l'information."
Mon intervention "Redocumentatisation du monde et culture informationnelle", peut être ainsi résumée : "quelles grandes évolutions affectent les processus documentaires, les technologies et les usages informationnels ? Quelles leçons peuvent en être tirées pour la réflexion sur la culture informationnelle ?"
Vaste programme donc ... L'occasion d'aborder deux "notions" qui m'apparaissent aujourd'hui essentielles et que je vous livre "brutes de décoffrage".
La première c'est le passage des "technologies de l'intelligence" (pour reprendre l'expression de Pierre Lévy), aux "technologies de la capillarité". La capillarité, nous apprend Wikipédia, est "l'étude des interfaces entre deux liquides non miscibles, entre un liquide et l'air ou entre un liquide et une surface." Cette emprunt au vocabulaire de la physique me permet de décrire la logique actuelle d'enregistrement et de conservation par les moteurs de recherche, de toutes les traces, actions, documents et comportements qui caractérisent et marquent notre présence connectée. Captation, par capillarité donc, de tout ce que rend possible la confusion des pratiques que génère la redocumentarisation globale du net et la dérive des continents documentaires qui le composent. L'objectif est simple : la constitution d'une base de donnée des intentions. Dernier exemple en date, le lancement très controversé de Google Chrome qui, par capillarité, agrège, rassemble et mixe des informations en provenance de sphères informationnelles jadis distinctes et non-miscibles.
La seconde c'est le passage des artefacts technologiques (navigateurs et interfaces d'accès au sens large + programmes (algorithmes) et bases de données et d'index au sens large) aux technologies de l'artefact. Ces technologies de l'artefact sont celles qui rendent possible, pour l'amateur, la création de représentations volontairement altérées et artificielles de la réalité dans une recherche (une "mimesis") de la vraissemblance. Parmi ces technologies de l'artefact (de l'artefacture dirait probablement Bruno Bachimont), on pourra citer en exemple les "Photoshop Naked Contest", les "Fake Vidéos" (comme celle de l'étoile noire volant au dessus de San Francisco), cette application permettant à tout le monde de vieillir instantanément une photo, les guerres d'édition et les tentatives de redocumentarisation déviantes sur Wikipedia. Ces technologies de l'artefact réclament d'urgence la construction d'une heuristique de la preuve, de la traçabilité de la preuve, une heuristique qui tienne compte de ces phénomènes, qui les explicite, et qui permette (c’est le plus délicat) de les « monitorer » non pas tant en temps réel mais bien a posteriori, c'est à dire dans l'optique d'une rétro-ingénierie documentaire. Une approche enfin qui tienne compte de la babélisation des expertises et qui redonne à chacun, à chaque contenu, à chaque fragment de contenu, la part d’autoritativité** qui lui incombe, et celle-là seule.
Naturellement si cela vous inspire des commentaires, ils sont ouverts :-)

**Définition de l'autoritativité par Evelyne Broudoux : "attitude consistant à produire et à rendre public des textes, à s’auto-éditer ou à publier sur le web, sans passer par l’assentiment d’institutions de référence référées à l’ordre imprimé."

Navigateur Chromé et WebOS jantes alliage

Attention, ça va buzzer. Google vient d'annoncer (1er Septembre) sur son blog officiel le lancement de son navigateur open source maison. Nom de code : Google Chrome. Le pré-lancement s'est effectué de manière originale via la mise en ligne et la distribution ciblée d'une BD de 50 pages (réalisée par Scott McCloud, une référence dans le domaine) présentant les fonctionnalités dudit navigateur. Le lancement est prévu pour le 2 septembre (aujourd'hui) dans 100 pays. Aucun lien de téléchargement n'est à cette heure disponible.

Les arguments et fonctionnalités mis en avant dans ladite BD sont (seraient ...) :

  • la stabilité (pour éviter les plantages en différenciant et en "autonomisant" chaque onglet comme autant "d'applications"),
  • la rapidité (notamment pour le chargement de java), la sécurité (hum ... hum ...),
  • la perfectibilité (Chrome est Open Source et a bénéficié de la large communauté de développement autour de Mozilla/Firefox)
  • la synchronisation (installation native de GoogleGears) : élément clé, cette synchronisation étant en effet (comme je me plais à le répéter), une pierre angulaire déterminante pour déployer un webOS.
  • L'utilisation des ressources mémoires (point certes plus technique mais important ...) : l'idée est en gros la suivante : un onglet = un processus. Si je ferme l'onglet, j'arrête le processus (ce qui n'est pas nécessairement le cas dans les navigateurs actuels et ralentit très souvent les navigateurs tout en mobilisant beaucoup de ressources mémoire).
  • Simplicité et ergonomie : les onglets ne seront plus en dessous mais au-desus de la barre de recherche (comme dans le navigateur Opera). Google indique (c'est à mon sens un élément clé) que le browser et les "tab process" (processus tournant dans les onglets) seront séparés. Le navigateur est donc bien une fenêtre sur le monde (j'ai bien dit une "fenêtre", en anglais "windows", donc browser = OS) et les onglets ses applications. Chaque onglet est indépendant, avec l'affichage de sa propre barre d'adresse.
  • Captations mémorielles : et puis bien sûr, Google ne serait pas Google s'il n'y avait pas dans ce lancement une nouvelle OPA sur nos comportements et ressources mémorielles (externes et objectives : le web) et mnémoniques (internes et subjectives : nos comportements, nos habitus, nos historiques de recherche). Le truc s'appelle "omnibox" et s'inspire de la nouvelle barre de recherche Firefox (dont j'oublie le nom ...) en ce sens qu'il ne permet pas seulement de rechercher la présence d'un mot dans des URL, mais : propose aussi des suggestions de requêtes (comme Google Suggest), farfouille dans les pages que vous avez le plus visitées, vous propose des pages que vous n'avez pas encore visitées mais qui sont "populaires" (résurgence du PageRank ?), et last but not least, propose une recherche full-text dans votre historique de recherche. Cette dernière fonction est d'importance car elle marque, en quelque sorte, la fin des bookmarks. Je m'explique : j'avais déjà il y a longtemps eu l'occasion d'écrire que l'arrivée de Google comme moteur de recherche rendait quasiment caduque l'utilisation des signets. Plutôt que de "marquer" des pages (processus tout de même assez fastidieux même si le web 2.0 - del.icio.us - lui a redonné ses lettres de noblesse) il suffisait de saisir le nom du service dans Google (ou dans la barre de recherche de Firefox), pour retomber instantanément sur ledit service ou le voir apparaître en première place dans les résutlats de recherche. J'avais à l'époque indiqué que Google se constituait ainsi autour d'une double "identité" : moteur de recherche bien sûr, mais aussi moteur "de sources". L'omnibox du navigateur Chrome marque donc une nouvelle étape : plus besoin de "bookmarker" une page, il suffira de resaisir la requête qui avait permis d'y accéder ("photo numérique" par exemple) pour retomber sur la page du catalogue FNAC présentant un comparatif de prix (par exemple toujours). Une prothèse mémorielle supplémentaire donc (à condition d'activer l'historique de recherche et de naviguer "en session" google ... ce qui sera sûrement proposé par défaut). Nouvelle prothèse, et probablement nouvelle entrave.
  • Utilisabilité personnalisée : autre petit gadget : quand vous ouvrez un nouvel onglet, au lieu de vous proposer une page blanche ou un site paramétré par défaut, Chrome vous présentera "vos" neuf pages les plus visitées ainsi que les mots clés que vous utilisez le plus (cf copie d'écran plus bas ... laquelle copie d'écran fait étrangement penser à un univers Netvibes).
  • Privauté : il sera possible de créer un onglet en mode privé ("incognito mode") dans lequel vous naviguerez anonymement et qui effecera les différents cookies quand vous le fermerez. C'est bien, mais cela veut surtout dire que dans tous les autres onglets, et par défaut, vous ne serez pas anonymes ...
  • Sécurité : Chrome téléchargera "en permanence" une liste de sites pratiquant le phishing ou dotés de différents "malwares" et vous avertira lors d'une de vos visites sur ces sites. Soit Google = gendarme du net.

Googlechromess

Donc ?
Côté navigateurs : Google était jusqu'ici (et reste) le principal donateur de la fondation Mozilla. En termes de parts de marché, Internet Explorer est donc directement ciblé et convié à un enterrement de première classe (même s'il reste le navigateur par défaut du plus grand nombre d'OS dans le monde. Faudra donc attendre un peu avant de prononcer l'oraison funèbre). Quant à Mozilla/Firefox, même si officiellement on indique ne pas se faire trop de souci, on sait aussi qu'il n'y aura pas nécessairement de la place pour tout le monde, et on anticipe en réfléchissant au déploiement d'une suite de services en ligne. Bref on songe à se déversifier ...
Côté stratégie : limpide (d'aussi loin que je puisse en juger ...). Une confirmation en tout cas. Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. Evolution largement annoncée et analysée (dernière analyse en date signalée dans mon billet de rentrée : celle de Nova Spivack). Enfin, rappelons que le déploiement d'une interface open-source pour un webOS n'est viable que si l'on contrôle suffisamment la chaîne de production, de traitement et de monétisation de l'information circulant dans ledit WebOS. Et il ne paraît pas aujourd'hui aberrant de considérer que Google contrôle de facto une bonne part de cette chaîne, ce qui le place en dehors d'un risque concurrentiel immédiat et l'autorise à se parer des atours et des vertus de l'Open source

Ailleurs dans la blogosphère : nombre de chroniqueurs se sont déjà fait le relai de ce lancement. J'ai retenu Ecrans, le billet de Tristan Nitot (et ses commentaires) pour avoir le point de vue en français de la fondation Mozilla, celui de Sébastien Billard (qui complète certains aspects techniques que je n'ai pas pris le temps de développer dans mon billet), et Emmanuel Parody, ce dernier présentant à mon sens l'analyse la plus pertinente de cette annonce. A la lecture du billet d'Emmanuel on s'aperçoit que tout "l'argumentaire de vente" autour de ce navigateur était habituellement dévolu aux systèmes d'exploitation (fiabilité, sécurité, ressources mémoire, etc ...). Je conclue en vous redonnant la fin de son analyse :

  • " (...) si chaque onglet (”tab”) peut fonctionner en toute indépendance et se séparer du corps du navigateur et si dans chaque onglet nous ouvrons une application, alors nous avons reproduit via le navigateur l’exact fonctionnement d’une suite d’applications. (...) et il ne reste plus grand chose qui nous sépare de la suite de logiciels. C’est exactement ce que démontre la présentation de Google Chrome. Saut ultime. Plus besoin de PC complexe, place au terminal connecté au web."

Y va y'avoir du sport ... En tout cas une belle manière de fêter les 10 ans de la firme. Un anniversaire qui pousse à faire le rapprochement avec une autre grosse firme américaine :

(Temps de rédaction de ce billet : 2 heures // Sources : sous les liens)

Google et son pot de Knol.

Knol fait quoi ?

Six mois après les effets d'annonce, Google lance enfin Knol, son projet d'encyclopédie "marchande". A noter au travers des différents billets s'étant fait écho de ce lancement : la possibilité de piocher directement des illustrations dans l'archive des "cartoons" du New Yorker (source), la possibilité d'utiliser différentes licences creative commons (cf copie d'écran ci-dessous), la possibilité "de choisir qui peut éditer vos articles (Ouvert, avec modération ou fermé)" (source), la possibilité d'activer l'affichage de liens publicitaires (ou pas), et le fait que tous les liens sortants seront en NoFollow (source), tirant ainsi les enseignements de ce qui arriva à Wikipedia.

Knol pourquoi ?

Globalement, les différents observateurs s'accordent sur deux points : primo, à la date de lancement de
Knol, on compte essentiellement des articles médicaux (ce qui est tout sauf un signal faible ...), et deuxio, ce projet n'a pas grand chance de concurrencer Wikipedia (seul Christian semble y croire). En revanche, il a de grandes chances de reformater le sens du projet encyclopédique du XXIème siècle vers un alignement, une superposition de deux écritures : l'écriture du "savoir" (écrire pour comprendre) et l'écriture de la publicité (écrire pour être vu).  Pour le reste, j'ai déjà dit tout le mal que je pensais de ce projet ... <Mauvaise foi>Si vous ne me croyez pas, comparez deux entrées tout à fait triviales de l'un et l'autre projet encyclopédique. Pour l'entrée "Toilettes", Wikipedia nous entraîne de l'ancienne cité d'Harappa jusqu'aux derniers avatars défécatoires d'un post modernisme assumé quand Knol nous propose uniquement d'apprendre ... à les déboucher en affichant moult plombières publicités. C'est tout dire :-). </Mauvaise foi> Plus sérieusement, l'approche qui semble mise en avant par Knol est une approche "How To". Comment ... "déboucher ses toilettes ?", "dépister un cancer du sein ?", etc.

Bref, Knol ne me parait pour l'instant pas avoir grand chose à voir avec Wikipedia. Il est par contre tout à fait adapté à l'écosystème Google et devrait lui permettre rapidement de pouvoir "monétiser" une grosse partie du traffic encyclopédique habituellement dirigé (à fonds perdus puisque non publicisés) vers Wikipedia. Ce qui est bien l'objectif premier du projet :-) (un second objectif étant probablement de servir de base de connaissance à Google Health, mais j'y reviendrai dans un prochain billet)

Knol procédural VS Wikipedia déclarative ?

Un positionnement qu'il est intéressant de replacer dans un (très rapide) historique (subjectif) de la "tentation encyclopédique" sur le réseau. Ce genre d'approche - et de tentation - est effectivement consubstantielle au net depuis son origine.

  • Elle émergea très tôt au travers des célèbres FAQs (Foires Aux Questions) : un individu répond "es qualité" (webmaster, éditeur, auteur ou "spécialiste") à sa communauté d'usage, sur des points très ciblés. L'autorité est ici constamment maintenue, affichée, lisible. Le principe est celui d'un ordonnancement, d'une rationalisation pensée, en l'occurence celle des questions les plus susceptibles d'être posées.
  • Passé l'ère des FAQs sur les sites webs, vînt ensuite l'ère des projets "Bidule-Answers" (Yahoo!Answers et consorts) : le principe est ici différent : n'importe qui peut répondre (parfois n'importe quoi) à n'importe qui et sur n'importe quel sujet. La dissolution de  l'expertise est ici totale. Seule compte la temporalité (promptitude, instantanéité) de la réponse. Le principe est celui de l'agglutination (les différentes réponses s'empilent les unes sous les autres) sans autre discrimination que temporelle ou "élective" (il est possible de voter pour telle ou telle réponse).
  • Le troisième temps est celui de Wikipedia. Un palimpseste planétaire de connaissances. Je vous renvoie à la rubrique idoine d'Affordance ou à ma dernière "synthèse" sur cet inépuisable sujet.
  • Le quatrième temps sera celui de Knol, mais il n'enterrera pas pour cela Wikipedia. Car Knol me semble concourir sur un autre terrain. Là où la logique d'accumulation des connaissances dans Wikipedia est clairement déclarative, celle de Knol (même s'il est encore un peu tôt pour être affirmatif et s'il ne s'agit pour l'instant que de pistes d'analyses ...) apparaît plutôt procédurale (question du "comment faire...", "comment dépister ..." ...). Parallèlement à cette macro-approche procédurale (qui n'empêche pas d'avoir des micro-knols déclaratifs sur tel ou tel sujet, tel ou tel concept), l'autre caractéristique de ce quatrième temps est celui de la mise en concurrence des expertises par processus de labellisation de l'auteur (Knol vous "reconnaît" comme expert en s'assurant de la levée de votre anonymat, mais Knol ne vérifie en rien les titres et diplômes dont vous vous parez). Labellisation fantôche donc pour Knol, contre babélisation fantasque pour Wikipedia. L'alibi qualitatif pour Knol, le vertige quantitatif pour Wikipedia. 2 mondes.

Conflits d'intérets en vue ...

L'une des principales questions que Knol va poser dans un très proche avenir est celle du conflit d'intérêt suivant : la "mise en avant" du contenu de Knol au sein des résultats de recherche de Google (nonobstant une prudente mise en avant du NoFollow sur les liens sortants). Sur ce sujet, il faut lire d'urgence l'article de Jason Calacanis (pour qui Google est devenu un authentique fournisseur de contenu - voir aussi la synthèse qu'en fait Martin Lessard), ainsi que l'édito de Wired (ou pour les plus pressés, la synthèse en français de Jean-Marie Le Ray. De fait, il y a de mon point de vue longtemps que Google est devenu un fournisseur de contenus, notamment via ses innombrables rachats (Blogger, YouTube). De fait également, il est tout à fait évident que lesdits contenus des susmentionnés services bénéficient d'un référencement plus "aisé" que d'autres ne gravitant pas dans l'écosystème de services du moteur.

Mythologies.

Google en tant que mythologie contemporaine présente un nombre de plus en plus grand de similitudes avec le mythe de Cronos. Comme lui son histoire commence par une castration : celle de la bibliométrie de Garfield, "amputée" de son rattachement à un circuit de diffusion classique et contrôlé (modèle des revues et de l'évaluation par les pairs) au profit d'un chaos fécond (le web). Comme lui il dévore et ingère ses enfants (Youtube, Blogger, Picasa et tant d'autres furent des petites - ou moyennes - start-ups avant d'être happées par le monstre ...). Comme lui, cette dévoration peut être lue comme le symptome d'une crainte : celle de voir l'un de ses enfants se retourner contre lui une fois atteint son âge adulte. Comme lui, il envoie l'essentiel de ses frères moteurs dans les profondeurs du Tartare, le laissant seul à son hégémonie (parts de marché et de traffic). La fin de l'histoire de Cronos est connue, celle de Google reste à écrire, mais (et j'arrête là avec les analogies mythologiques), il est clair - et le lancement de Knol ne fait que le confirmer - qu'il ne peut y avoir que trois issues à une telle appétence : soit le contrôle total, en amont et en aval, de l'accès à l'information et à la connaissance ; soit un final façon la grande Bouffe, c'est à dire l'effondrement de l'ogre sous le propre poids de son appétence ; soit la naissance d'un fils échappant à cette appétence qui à son tour, pourra tuer le père. Et dans cette dernière option (je reprends là mon analogie mythologique), je verrai bien Wikipedia en mère nourricière, telle Gaïa soustrayant un certain Zeus à l'appétit de son père, et du ventre de laquelle naîtront les initiatives sur le terreau desquelles une nouvelle mythologie s'écrira, une nouvelle génération de moteurs naîtra (songez à Trueknowledge ou encore Powerset, moteurs "sémantisés" travaillant avec Wikipedia comme base). 

Knol encore ...

Pour approfondir et/ou mesurer rapidement les principaux tenants et aboutissants du bidule : voir le billet très complet de Danny Sullivan et celui d'Astrid Girardeau dans Ecrans. A lire également les impressions de FredCavazza pour qui "Knol pourrait bien officialiser la création d’une nouvelle catégorie d’outils de publication qui apportent une information différente des blogs et wikis : un résumé ou plutôt une aggrégation / synthèse réalisée par un auteur identifié." De mon point de vue ces outils existent déjà. La "nouveauté" ne me semble pas résider dans la capacité d'aggrégation et le rattachement à un auteur identifié, mais plutôt dans la cohabitation des deux écritures susmentionnées (écriture du savoir et de la publicité), cohabitation qui ne se fait plus en terrain "neutre" (comme dans certains blogs par exemple), mais au sein d'un projet "labellisé" encyclopédique, qui confère donc à cette cohabitation une légitimité a priori. Heureusement, tous les a priori sont discutables ... 

Ci-dessous une copie d'écran des fonctionnalités proposées lors de la création d'un Knol.

Knol

Et puis pour finir sur un clin d'oeil ... le meilleur moyen de découvrir Knol, c'est encore de consulter l'article de Wikipedia qui lui est consacré :-) (et tout particulièrement les liens figurant en référence de l'article). Une chose est sûre en tout cas, les dîner de knols vont se multiplier ;-)

Dinerdeknol

Un dernier Knol mot.

Une dernière chose encore. Knol n'est pas un projet encyclopédique. Il ne vise pas la connaissance. Parce que la connaissance ne peut pas être la seule mise en concurrence des savoirs (le principe de Knol est que plusieurs "knols" concurrents peuvent être rédigés sur un même sujet, la prime allant au plus accédé, comme c'est l'usage dans l'écosystème Google). La connaissance est avant tout la définition et l'acceptation d'un concensus.  « Le savoir affecte forcément une forme circulaire : c’est en effet la seule manière de se représenter un ensemble de données diverses tel que chacune renvoie à toutes les autres et ait perspective sur toutes les autres. (...) Ce savoir n’est pas simplement cumulatif (...) mais circulaire parce qu’il y a une circulation du savoir d’un point quelconque à tout autre point possible. Sans doute cette circulation se fait elle le long de certains axes perspectifs qui seront par habitude plus fréquentés que d’autres à l’intérieur du tout, mais dont la commodité ne tient jamais finalement qu’à un état momentané du savoir, à un équilibre météorologique métastable. » Varet G., Histoire et savoir - Introduction théorique à la bibliographie : les champs articulés de la bibliographie philosophique. Paris, Les Belles Lettres, 1956.

Le pot de Knol est d'abord et avant tout un pot de miel publicitaire. Et on n'attire pas les mouches nouveaux encyclopédistes avec du vinaigre.

C'est la rentrée ...

Allez, hop hop hop, au boulot. Fini de lézarder. D'autant qu'il s'est passé plein de choses en deux mois ...

Côté encyclopédies :

  • la série rafraîchissante d'Ecrans sur "Inside Wikipedia". Episode 1 : Wikilove. Episode 2 : Wikipompiers. L'intégralité de la série à lire ici.
  • A ne pas manquer, le regard d'Hervé (Le Crosnier) sur l'édition papier de la Wikipedia par Bertelsman et la rémunération de ses ... 90 000 auteurs ...
  • Et puis bien sûr, lancement par Google de son projet encyclopédique baptisé Knol. Gardez patience, le prochain billet y sera entièrement consacré ;-)

Côté Moteurs (enfin ... surtout côté Google ...) :

  • A ne pas manquer : un article de Chris Anderson dans Wired sur l'âge du Petabyte et son héraut (Google). Article court, brillant et relativement impossible à résumer puisqu'il montre en une seule page quels sont les liens entre les théories scientifiques, la fin des théories scientifiques, le moteur de recherche Google, la puissance calculatoire, les avancées de la génomique, l'informatique distribuée, la nouvelle "science des données" et quelques autres trucs encore. Allez, filez le lire et vous comprendrez certainement un peu mieux la manière dont chacun d'entre nous est relié à la machine. 
  • un débat chez Google France sur l'économie numérique avec une conclusion d'Eric Besson. A écouter notamment vers la 67ème minute le point de vue des intervenants (entreprise) sur un aspect du débat autour de la net neutrality (taxation des recettes publicitaires sur internet). J'ai simplement retenu que pour Eric Besson, le fait d'envisager de "prioriser par exemple des données relatives à la télésanté" n'est pas nécessairement une atteinte au principe de neutralité du net. Pour les autres aspects - cruciaux - de la Net Neutrality, voir par exemple ce billet de Martin Lessard : "étrangler le Net".
  • Alors que Google croyait en avoir définitivement fini avec le Google Bombing, voilà-t-y-pas que le Google Bombing ressurgit dans l'outil Google Trends.
  • Pour ceux qui s'en inquiéteraient, Google se porte - toujours - financièrement très bien : chiffres complets ici et résumé sur Zorgloob. Côté "part de trafic", ça va aussi.
  • Un très bon dossier documentaire réalisé par 3 étudiants du cycle supérieur de l'INTD : "Les rapports de Google avec la justice" (.pdf). La première partie du dossier est une recension des procès et actions en justice contre Google, la seconde se focalise davantage sur l'exploitation des données personnelles. Très utile pour avoir une vision "fine" d'un justiciable pas comme les autres.
  • Dans la série "publicisons, publicisons, il en restera toujours quelques chose", LiveSearch (Microsoft) s'installe dans la motorisation de Facebook. (Rappelons pour mémoire que Google motorise - et constitue la régie publicitaire de - MySpace). Voir aussi pourquoi Jérôme Charron s'en félicite.
  • Pour les Googlophiles anglophobes, découverte de Goopilation, un blog qui traduit en français les billets de l'ensemble des blogs officiels de Google.
  • Et puis, et puis ... en septembre 2005, Google faisait disparaître de sa page d'accueil la mention du nombre de pages indexées, laissant les compteurs de notre imaginaire collectif baguenauder librement. Dans un billet en date du 25 Juillet, sur son blog officiel, Google annonce que son crawler a franchi une étape ("a milestone") : 1000 milliards d'adresses uniques détectées, ce qui, comme le rappelle Jean Véronis n'est pas la même chose que le nombre de pages indexées, mais qui est "déjà très impressionnant". Au-delà de son effet subliminal dans l'inconscient collectif (= "c'est Google qui a la plus grosse" ... base d'index), cette annonce révèle ce qui est l'un des tournants marquants dans l'histoire des moteurs de recherche : la principale difficulté, le principal objectif, n'est plus la capacité à atteindre un grand nombre de données (et à les réactualiser en temps réel), mais bel et bien la capacité à faire le tri entre le bon grain et l'ivraie, entre ce qui doit être indexé et ce qui ne doit pas l'être. Soit un retour à la raison d'être et aux fondements de leur algorithmie.
  • En parlant d'algorithmie justement, du côté de Yahoo! on semble s'intéresser de près à la mode des moteurs à la carte. Mais si souvenez-vous, ces moteurs "construits par l'internaute" et faisant de chacun de nous un autarcithécaire en puissance. Yahoo! a donc lancé le service BOSS (Build Your Own Search Service). Pour ne pas répéter ce que d'autres ont très bien décrit, allez lire le billet de Jérôme Charron sur le sujet. La stratégie de Yahoo! paraît claire : étant donné que le monde compte nombre d'excellents développeurs plein de bonnes idées, et étant donné qu'actuellement aucun d'entre eux ne peut bénéficier d'un équivalent de la base d'index de l'un des grands moteurs majeurs, il s'agit donc de leur offrir un accès à cette base, de les laisser bidouiller en postulant qu'il y aura probablement dans le lot une bonne ou une très bonne idée dont on pourra alors librement s'inspirer. Et dans le cas contraire, pendant qu'ils font joujou chez Yahoo!, ils ne vont pas monter de projet concurrent ;-).
  • La dérive des continents documentaires (voir ici) se poursuit, avec cette dernière étape clé de la synchronisation de nos moments connectés / non-connectés : après GoogleDocs et GoogleReader, c'est GMail et GoogleCalendar qui devraient être accessibles via GoogleGears. Rappelons, pour tenter de clarifier la "stratégie" de Google en la matière, que la synchronisation de ces applications est l'un de piliers incontournables du "webtop" ou du "WebOS", webtop dont on reparlera plus bas dans ce billet de rentrée.
  • L'une des dernières études du PewInternet nous apprend que si en 2002 seulement un tiers des internautes utilisaient un moteur de recherche pendant leur journée connectée, ils sont maintenant la moitié à le faire (49%). Les autres "habitudes" sont (de la plus à la moins fréquente) : l'e-mail, la recherche en ligne, la consultation d'actualités ("checking news"), et la consultation de la météo.

Côté Moteurs, outils ET bibliothèques :

  • Je vous l'avais annoncé avant les vacances, la bibliothèque municipale de Toulouse est désormais sur FlickR. Pour les détails et les motivations de cette (remarquable) opération, voir le message posté sur biblio-fr. Une Flickerisation des bibliothèques qui fait flores (6 à ce jour) comme en témoigne cette nouvelle initiative lue chez André Gunthert : "la George Eastman House est le premier grand musée de photographie à mettre en ligne en libre accès dans la section des Commons de Flickr plusieurs extraits de ses collections." Sans oublier, comme le rappelle Patrick Peccatte en commentaire du billet d'André, "les institutions présentes sur Flickr qui présentent des fonds intéressants mais pas sous le régime des Commons, comme la Biblioteca de Arte-Fundação Calouste Gulbenkian." Je croie qu'il y a là l'amorce d'un mouvement de fond (et de fonds ;-), dont l'impact à moyen terme pourrait être assez semblable à celui des projets de numérisation (Google Books).
  • et puis bien sûr, l'annonce de la numérisation de la BM de Lyon par ... Google. Là encore, un peu de patience, c'est le sujet d'un prochain billet.

Côté bibliothèques ...

  • Le discours de Barak Obama : sources, références et larges extraits à lire chez Jean-Michel Salaun.
  • Côté bibliothèques ET revues : Valérie Pécresse (ministre enseignement supérieur) et son copain Bruno Racine (BnF) avaient bien caché leur jeu. Le ministère de l'enseignement supérieur vient d'annoncer le déblocage de 10 millions d'euros pur la création d'une archive pour les revues de recherche françaises. L’objectif de cette archive est de conserver sur le long terme les revues scientifiques qui ont un faible usage. Cette archive sera sous la responsabilité de la BnF qui assurera également l’accès aux articles, sur support papier ou électronique, par son service de fourniture de documents. Ah ben non désolé. Fausse alerte. C'est pas en France. C'est au Royaume-Uni. A mettre en balance avec l'approche et l'existant hexagonal.
  • Et puis les diaporamas du dernier congrès de l'ABF (blog du congrès) sont regroupés en ligne sur le site de l'ABF.

Côté livre/document/lecture numérique :

  • André Gunthert nous livre une belle analyse d'un beau concept : la lecture exportable (ou les affres d'un copyright en bout de course). De mon côté je prolongerai bien l'analyse d'André en indiquant que ce qu'il décrit à juste titre comme une lecture exportable est en fait la réalisation concrète la plus proche de l'idée originale de transclusion (chez Ted Nelson - père fondateur de l'hypertexte - la transclusion désigne des contenus non plus "inclus" mais situés simultanément à divers endroits, sans altérer pour autant leur localisation originale ... pour plus d'infos voir sous le lien précédent).
  • L'iPhone devient liseuse : Virginie Clayssen rappelle à quel point la nouvelle pourrait être d'importance pour le décollage et la structuration d'un marché du livre électronique.
  • A lire : les enjeux du livre au format de poche, une étude de 8 pages de la DEPS, qui ne se termine pas par hasard sur "la perspective numérique", au moment où l'on parle de plus en plus d'une date limite de consommation des livres sous forme papier.
  • Et pendant que l'on réfléchit de plus en plus activement ici ou là sur l'avenir de la chaîne du livre à l'heure du numérique, le rouleau compresseur continue d'avancer : Amazon met la main sur AbeBooks (via Hervé Bienvault)

Côté biblio-scientométrie

  • la face cachée de la bibliométrie existe, et plus simplement au sens figuré. Pour organiser - selon des critères bibliométriques (taux de citation / date de parution de l'article / ... )  - les résultats issus d'une interrogation de la base Medine, imaginez que la liste desdits résultats soit ... une liste de visages dont le froncement des sourcils ou le sourire (ou l'absence de sourire) seont autant d'indicateurs vous permettant d'anayser lesdits résutlats et de mieux vous y orienter. Pas clair ? OK, une image :
    Facebib
  • le site reprend en fait la théorie des visages de Chernoff (voir ici ou pour une définition de ladite théorie) en l'adaptant aux usages scientométriques et en la faisant "tourner" sur une base d'articles scientifiques (PubMed). Gadget diront certains. Sûrement. Sûrement. Aussi sûrement que cela ouvre autant de pistes du côté d'une "humanisation" littérale des résultats de recherche. La source : ici. Pour jouer avec : .

Côté Science 2.0

Côté Web 2.0 ...

  • une petite bibliographie autour du web 2.0 mêlant articles scientifiques, thèses, ouvrages et études diverses, le tout accessible gratuitement.
  • Une jolie mise en image des différents services sociaux autour du web 2.0.
  • Je vous ai souvent parlé (en conclusion de ce billet par exemple) de l'inexorable avançée d'un mouvement d'externalisation de nos mémoires (intimes ET documentaires), lequel, conjugué à une informatique ambiante (everyware) et à une redocumentarisation du monde (internet des objets) et de l'homme (l'homme est un document comme les autres), donne littéralement corps à un hypercortex planétaire. Le résultat à court terme - 2040 -, et en termes beaucoup plus clairs (:-) est expliqué dans un édito du 16 Juillet de Wired, édito chroniqué, résumé et traduit sur InternetActu : "La machine unique pour les relier tous".
  • Prenez la plus grosse base de donnée iconographique gratuite de la planète (FlickR). Prenez ensuite l'une des toutes premières agences commerciales de diffusion de photo (Getty Images). Imaginez un accord entre les deux permettant à la seconde (Getty) de piocher à volonté dans la première (FlickR) pour en revendre le contenu en reversant 20 à 40% de la somme récoltée au photographe amateur. Et vous aurez un système gagnant-gagnant et un exemple très parlant de la manière dont les pro-am deviennent un incontournable levier de l'économie de la longue traîne.

Côté Web 2.0 et après ...

  • Après le Web 2.0, il y a naturellement le cloud computing. Hervé Le Crosnier signe un papier lumineux sur le sujet dans le Monde Diplo. Didier Durand signale un intéressant white paper d'évangélisation (technique) en provenance de chez Amazon : Cloud Architectures (.pdf)
  • Après le web 2.0, il y a aussi le webOS, soit la migration du Desktop (bureau comme interface du disque dur) vers le webtop (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack rédige sur le sujet un article de référence qui récapitule les enjeux et les ambitions de cette nouvelle migratio numérique des contenus et des comportements associés : "The future of the Desktop".
  • Après le web 2.0, il y a l'explosion des contenus gourmands (en bande passante) : voir les chiffres de la dernière étude Cisco, rapportés par Eric Baillargeon. Et de manière corrélée, il y a un phénomène de "dés-appropriation" de plus en plus systématique des contenus demandés par les internautes : voir le billet de Techcrunch rapportant le régne annoncé du "tout streaming". Là encore une nouvelle étape de la dérive des continents documentaires, dans laquelle après avoir confié nos contenus à des sites externes (tout en gardant une possibilité d'archivage en-ligne), nous prenons de plus en plus l'habitude de consommer des contenus comme de simples services, sans appropriation réelle ni possibilité de conservation ou de stockage. Bref, nous faisons avec Internet ce que nous faisions hier avec la télé, avant que l'on invente les magnétoscopes. Sauf que sur Internet, c'est pas très facile de réinventer le magnétoscope, comme en témoigne les mésaventures du service (excelletissime) Wizzgo. Espérons avec Jean-Michel que "S'il y a beaucoup de mythes dans le Web 2.0, il y a aussi beaucoup de préjugés chez les médias traditionnels, à commencer par croire que l'on peut retarder l'expression d'une demande explosive."

Côté énervements récurrents :

  • la fausse bonne idée de l'université entreprise, à lire sur le site de SLR ... pendant ce temps, Valérie Pécresse distribue les médailles en chocolat comme autant de labels vides de sens (et de financements ...)
  • les vraies-fausses promesses de maître Darcos. (= Episode 1 : on va supprimer plein de postes, mais en échange on va revaloriser la grille des salaires. Episode 2 : on va supprimer plein de postes. Euh ... oui oui, on va aussi revaloriser la grille des salaires. Mais pas tout de suite hein ? Episode 3 : relire l'épisode 2)
  • "L'autonomie" (financière) souhaitée des université est vraiment - mais alors vraiment - une notion à géométrie variable.
  • et dans la série "faisons fonctionner de nouveaux trucs avec tous les défauts des anciens machins", je vous recommande la lecture de "l'ANR pour les nuls" sur le site de Sauvons la Recherche.
  • Tout cela nous rappelle que la loi LRU a 1 an. A lire sur EducPros, un rapide bilan des opérations. A remarquer : seulement 9 universités (sur 85) ont décidé de mettre en place les fameux comités de sélection en lieu et place des anciennes commissions de spécialistes. Ce manque d'engouement n'est pas nécessairement la preuve d'un désaveu du système proposé (par les comités de sélection). Simplement le résultat d'un calendrier de mise en place à la hussarde et le symptôme d'un très grand flou dans le "comment concrètement" faire tourner ces nouveaux comités de sélection. Le résultats c'est que la plupart des université, déjà très occupées à mettre leur CA aux nouvelles normes, n'ont pour le moment pas eu vraiment le temps de s'occuper de la mise en place de ces comités. C'est à la fin de cette année universitaire que l'on pourra réellement juger sur pièces, même si de mon côté, mon opinion est faite ... Et par souci d'impartialité, le bilan de la loi LRU, côté communiqué officiel :-)
  • Sans archive(s) pas de mémoire, sans mémoire pas d'Histoire. Le petit monde de l'archivistique est depuis peu en butte à de sévères bouleversements qui engagent tout un pan de notre mémoire collective. Voir ici et là.
  • Edvige et Cristina. La France en (très) bonne place pour les prochain BigBrother Awards. Voir (parmi d'autres) : Politis, Le Monde, le point de vue de Jean-Marc Manach, l'article d'EDRI avec les liens vers les parutions du JO et d'autres couvertures presse. Ils en parlent aussi : l'ADBS. Au moins, cette affaire aura donné lieu, sur France Inter, à un téléphone sonne d'anthologie :-(
  • Et toujours à l'affiche, "les cages de la république".

Côté People et Blogosphere :

  • ce dont tout le monde a parlé cet été c'est la guerre entre blogueurs et journalistes. Rappel des faits.
  • Le départ de Versac tout comme la sortie de route classement de FredCavazza sont d'ailleurs peut-être assez symptômatique d'un changement d'époque. Car outre-atlantique aussi, Francis Pisani nous apprend que Jason Calacanis himself annonce son retrait blogosphérique. Je suis de mon côté depuis longtemps convaincu que les blogs auront permis l'émergence de nouvelles formes de parole (et de prise de parole), côté scientifique notamment, et qu'ils se dirigent lentement mais surement vers une hybridation de plus en plus marquée (voir les exemples très éclairants choisis par Narvic).
  • Et puis le choc de l'été sur les blogs sciences de Wikio : André Gunthert dégringole à la troisième place et Jean Véronis fait une entrée fracassante directement à la seconde (place). De mémoire d'homme, seule Samantha Fox avait, à l'époque du Top 50, réussi une telle entrée. M'est avis qu'avec de tels challengeurs qui ne respectent même pas la pause estivale, ma première place va rapidement être remise en question. Assez bizarremement, ni Closer, ni Gala ni Voici n'ont fait leur "une" de cet événement pourtant incountournable.

Côté identité numérique :

  • A l'heure où la gestion de la réputation numérique est chaque jour plus centrale pour le simple quidam, elle revêt, pour le futur potentiel président des Etats-Unis une importance plus que vitale. On lira donc avec intérêt sur le blog VerbalKint, la stratégie mise en place par l'équipe de campagne de Barak Obama pour contrer les rumeurs en temps réel. Intéressant de noter également l'évolution qui, depuis la dernière élection présidentielle américaine, avait marqué l'avènement des blogs comme outils de lobbying, et qui se décline aujourd'hui sur le mode de la gestion de la réputation. Comme dans la "vraie vie" des "vrais gens" pour qui les blogs, après être devenu un outil d'expression central, sont aujourd'hui l'un des principaux axes de leur visibilité numérique et de ce qui s'y rattache.

Côté "ça peut toujours servir" :

Côté Agenda :

Côté lectures :

Côté visionnage :


Ce qui me frappe dans tout ça ...

Comme dans la nouvelle de Borges, "Funes ou la mémoire", le mouvement d'externalisation de nos mémoires, documentaires et intimes, nous mène droit vers une société à l'hypermnésie latente, activable. Avec Google dans le rôle de Funes, et de son côté, pas la moindre aspiration à s'enfermer dans une pièce vide pour ne plus rien "enregistrer".

Bonne rentrée à tou(te)s :-)

(Sources : sous les liens // Temps de rédaction de ce billet : 2 mois ;-)

Les cahiers au feu ... et les fils RSS au milieu

Comme promis, un petit billet "revue de liens" pour expurger mon agrégateur avant de partir en vacances.

Côté Moteurs (et un peu au-delà) :

  • Difficile de passer à côté du "big deal" passé entre Yahoo! et Google suite à la tentative avortée de rachat de Yahoo! par Microsoft. Pour une synthèse, voir notamment ce qu'en disent Adscriptor, Techcrunch, Média & Tech, Francis Pisani, Techcrunch France, ReadWriteWeb et (plus synthétique) Le Monde. Quelques analystes avaient, dès le départ de l'affaire, souligné que l'offensive de Microsoft avait de forte chances d'échouer au profit de Google. Ce dernier tire effectivement une nouvelle fois son épingle du jeu en renforçant une position déjà outrageusement hégémonique sur le marché de la publicité en ligne. De son côté, Yahoo! sauve (provisoirement ?) les meubles en renflouant ses caisses, mais le "coup" porté par cette affaire est en train de bousculer grandement (et durabement ?) la structure (et l'autorité) de son exécutif ...
  • Microsoft (pour se remettre du fiasco Yahoo ?) vient donc officiellement de s'offrir Powerset, moteur plus sémantisé que réellement sémantique (comme je tente de l'expliquer dans les 75 000 signes rédigés pour le séminaire INRIA IST'2008). L'argumentaire mis en avant dans le billet du blog de Microsoft est celui du renforcement du moteur Live.com (qui est clairement à la ramasse par rapport à Google et Yahoo) grâce à la mise en avant de la compréhension du contexte et de l'implicite. Bref, Microsoft entre officiellement dans la course au web sémantique. 
  • On pouvait déjà faire plein de choses avec Google et ses services (ou ceux qu'il a rachetés). On peut désormais en faire encore plus. Celui-ci a en effet annoncé qu'il allait se lancer dans le marché (juteux et stratégique) de la mesure d'audience et du "média-planning". Un créneau jusqu'ici propriété quasi-exclusive de Nielsen Online et ComScore (qui en tremblent déjà ...) ou Médiamétrie dans l'héxagone. Inutile je pense d'en rajouter une couche sur le fait qu'en gagnant (ce n'est pas encore fait et comme le souligne Emmanuel Parody c'est le marché de masse qui est d'abord visé ...) le marché de la mesure d'audience, Google devient un peu plus l'alpha et l'oméga d'une certaine représentation du web. Cette nouvelle corde à son arc est cependant parfaitement "logique" pour au moins deux raisons : primo l'infrastructure dudit Google, son nombre colossal de serveurs, et l'ampleur des données qu'il recueille et dont il peut librement disposer, deuxio, l'atout stratégique et l'effet de levier que représente un outil planétaire de mesure d'audience pour (mieux) vendre (encore plus) de la publicité aux annonceurs. Le service porte le doux nom de Google Ad Planner.
  • Google (ben oui, encore ...) se lance dans une opération de communication de maintien de la neutralité du Net. A l'heure où l'on constate partout (y compris en France - loi Hadopi - et au Canada mais aussi aux Etats-Unis avec la très récente annonce d'une purge du réseau Usenet) la transformation des FAI en auxiliaires de police, Google à donc annoncé (sans fournir de date ni de nom de service, ni de détails ...) : "le développement d’outils qui permettront aux internautes de vérifier par eux-même si leur fournisseur d’accès à Internet (FAI) intervient d’une manière ou d’une autre sur leur connexion." (via Ecrans) L'alpha et l'oméga disais-je ... A propos, plus largement, de la loi Hadopi (parenthèse ci-dessus), il existe heureusement encore quelques dangereux anarchistes pour tenir un discours vivifiant et cohérent sur la question du copyright et du logiciel libre.
  • Le web invisible connaît un deuxième recul très significatif. Après l'annonce (par Google) d'une indexation possible des données contenues derrière certains formulaires de recherche, c'est désormais Adobe qui annonce que le format Flash sera indexable par les moteurs. Comprenez : Adobe va mettre à disposition de Google et Yahoo! (pourquoi pas de Microsoft ? Parce que Microsoft développe sa propre technologie concurrente à Flash : Silverlight) un player spécifique qui permettra de naviguer "dans" les sites en flash et d'en indexer certains éléments au passage. Pour le reste, voir le billet de Techcrunch d'où je tiens l'info, les Questions/Réponses de Google WebmasterCentral et la FAQ d'Adobe. La question de l'indexation (et du référencement) des sites en Flash est un vieux serpent de mer pour les référenceurs. Avec ce nouveau système, c'est un pan entier du web qui va à son tour émerger dans les pages de résultats des moteurs. Les avis des analystes sont par ailleurs assez partagés sur l'intérêt et la nouveauté relative de cette indexation.

Côté Réseaux sociaux :

  • Marc Andreessen (fondateur de Netscape et actuel gourou de Ning) rejoint l'exécutif de Facebook. Bonne pioche dans tous les cas et rapprochements probables ou nouvelle concentration à venir de ce côté là.
  • Une bibliographie sur la question des réseaux sociaux par l'une des meilleurs spécialistes de la question, Danah Boyd.
  • Un entretien avec Pierre Bellanger (PDG Skyrock) à propos du "premier réseau social d'Europe" (Skyblogs) dans lequel tombe une (de mes) idées reçues : "La totalité (des blogs) est active. Tout blog qui n'a pas été modifié ou consulté dans les derniers 90 jours est automatiquement supprimé. Près de 10 000 blogs sont ainsi fermés chaque jour, tandis qu'il s'en crée plus de 30 000. La plate-forme est un réseau vivant. Pas de cimetière de blogs ou de profils chez nous !"

Côté web 2.0 :

Côté bibliothèques :

Côté Wikis et Wikipédia :

Côté "livre et numérique" et livres numériques :

Côté Web sémantique :

Côté bibliométrie et indicateurs scientifiques :

  • un rapport sur l'usage statistique des citations (.pdf) et son résumé en français sur le site de Sauvons la recherche. Le rapport plaide clairement en faveur d'une théorie de la relativité générale des indicateurs statistiques scientifiques là où la plupart des "décideurs" y voient l'alpha et l'oméga de toute politique d'évaluation digne de ce nom. Pour les autres, il est toujours possible de faire joujou avec ce genre d'outils.

Côté lectures :

  • le dernier Livre Blanc de Christophe Asselin/Digimind sur la "Réputation Internet". Avec notamment quelques buzz digitaux disséqués et l'indication de "stratégies" pour les anticiper, les démonter, les relancer, les contrôler. Du simple veilleur au consultant en communication de crise, ce Livre Blanc devrait amplement satisfaire son lectorat.
  • LA bible du documentaliste et du bibliothécaire : le Traité de Documentation de Paul Otlet, sous-titré "Le livre sur le livre". C'était en 1934. Et on n'a guère fait mieux depuis.
  • Pour se faire plaisir (et se faire un peu peur dans la veine du 1984 d'Orwell), la dernière nouvelle de Cory Doctorrow : Little Brother. Librement téléchargeable.

Côté ressources pédagogiques :

  • Un vrai cours en ligne de Laurent Jenny sur l'Histoire de la lecture (avec bibliographie, exercices et tout et tout)
  • Prenez des textes scientifiques "fondateurs" et faîtes-les analyser par des scientifiques d'aujourd'hui pour mieux comprendre leur impact et leur inaltérable actualité : c'est la très bonne idée du projet Bibnum, pour l'instant encore à l'état de maquette, mais dont on souhaite qu'elle prenne très rapidement son essor (et qu'elle s'ouvre au-delà des 4 domaines qu'elle entend pour l'instant couvrir - math, physique, chimie, biologie -  les SHS constituant un formidable terrain de jeu pour ce genre de mise en perspective).

Et pour finir, un petit lien du Week-End :-)

Allô Google bobo

Ou quand et comment les moteurs seront médecins ...
Rappel des faits :

Et maintenant, cinquième épisode.

Moteurs bipolaires : après Microsoft Healthvault, voici venue Google Health.
Après divers atermoiements, Google Health est désormais opérationnel, et en ligne (uniquement réservé aux résidents américains pour l'instant). L'annonce officielle sur le blog de Google date du 19 Mai, et c'est Marissa Mayer (en charge du projet depuis le départ d'Adam Bosworth) qui rédige le billet de lancement (lequel billet ne nous apprend rien, à part que Google fait cela pour notre bien).
Quand on regarde la "privacy policy" du service, on tombe sur une page "a minima", parfaitement semblable à celle des autres services Google. Bien plus intéressante et la page concernant les sites tiers associés à Google Health ou souhaitant développer des services via l'API mise à disposition par Google Health (c'est à dire par exemple les compagnies d'assurance, les pharmacies, les médecins exerçant en libéral, les hopitaux et cliniques, sans oublier naturellement ... les laboratoires pharmaceutiques). A titre d'exemple, la page présentant les partenaires (sites tiers) actuels de Google Health en compte 8 dont : 4 super-pharmacies en ligne, 1 supermarché du diagnostic, et 3 cliniques - dont celle de Cleveland qui servit à la phase de test du service Google Health (cf épisode 4). Mais revenons à la page "privacy policy" des sites tiers. La première chose qui frappe est le nombre d'occurences de "l'explicit opt-in" demandé à l'usager. L'usager doit donc explicitement et en conscience mettre en ligne ses données médicales. Rappelons que pour Google et les services qu'il développe, la règle de l'Opt-in est loin d'être le socle de la culture de l'entreprise. L'essentiel des autres services tient grâce à l'opt-out (Opt-out = je prends, collecte et indexe tout, et si ovus ne voulez pas y être, vous nous le signalez).

Opt-in explicite donc pour les services des sites tiers associés à Google Health. Faut-il s'en satisfaire ? Oui. Est-ce une garantie suffisante ? Non. Le secret réside dans la manière dont sera présenté l'interfaçage de cet opt-in explicite aux usagers desdits services. En effet, quand vous installez un logiciel, on vous demande habituellement aussi votre opt-in explicite : il s'agit de lire à l'écran les 1227 pages défilantes de la licence dudit logiciel. En règle générale, on fait défiler sans lire et on coche la case "OK j'ai bien lu et je suis d'accord". Fin de l'opt-in explicite. Je prends les paris que les usagers de sites à vocation médicale ne liront pas plus attentivement les conditions d'utilisation du service qu'ils ne le font pour les autres sites ou logiciels qu'ils installent et utilisent. L'opt-in explicite est une chose, le consentement éclairé en est une autre ...
Quelles sont les autres obligations pour les sites tiers ?

  • "Autoriser les utilisateurs à détruire de manière permanent leurs données stockées sur votre service ; une sauvegarde peut être effectuée pendant une courte période ("backup copies may exist for a short time"). Vous apprécierez l'exactitude temporelle de la "courte période" ...
  • "obtenir le consentement ("opt-in consent") de l'utilisateur si des données personnelles de santé sont utilisées pour de la publicitée ciblée". Petit exemple (c'est moi qui parle) : vous êtes atteint d'un cancer, vous êtes inscrits sur Google Health, votre pharmacien et les laboratoires avec lesquels il travaille sont eux aussi inscrits comme sites tiers. Ils vous proposent de donner votre consentement pour être tenu au courant des dernières avancées dans le traitement du cancer dont vous souffrez (et vous balancer au passage de la publicité ciblée pour traiter - par exemple - la dépression) : allez-vous refuser cette offre ? Non. Clairement non. Là encore donc, dans le contexte de la collecte de données médicales privées, et compte-tenu des affects entrant en compte, la règle de l'opt-in ne constitue en rien une sécurité suffisante.

Et puis comme Google est gentil, il interdit formellement aux sites tiers "d'employer des stratégies publicitaires agressives telles que les pop-up". Nous voilà rassurés. Autre obligation (conforme aux pratiques de la firme), toute "offre promotionnelle" (promotional notices) devra être labellisée comme telle (c'est à dire être indiquée comme un "lien sponsorisé").

Push & pull Medicine.

L'intérêt (et le danger potentiel) de ces services (Google Health et MS Healthvault) c'est qu'ils ont vocation à fonctionner aussi bien en mode pull (je fais remonter mes données) qu'en mode push (je les renvoie vers d'autres services). Un point sur lequel revient en détail le journal Health Management Technology : "users can pull their medication prescription records from large retail pharmacies, as well as structured medical data from EMRs, store it in their Google Health profiles and, when needed, push the data to new pharmacies or hospitals." Si l'on raisonne, comme le fait l'article cité, en termes "d'utilisabilité", l'utilisateur est effectivement gagnant. Mais si l'on se place du point de vue de l'écosystème ainsi constitué, une même société "mère", est à la fois le régulateur, l'hébergeur, et le provider (fournisseur) de ces enregistrements médicaux personnels. Pour prendre une analogie facile, l'équivalent est notre actuel système bancaire : votre salaire est directement perçu par votre banque, qui l'héberge (en prospérant dessus), qui le redistribue à des sites tiers quand vous le dépensez, et qui vous "facture" toute une série de services sur la base de cet hébergement et de cette régulation-redistribution. En filant la métaphore, la publicité ciblée sur des contenus médicaux, c'est un peu l'équivalent des "aggios" et autres "autorisations de découvert" : on vous la présente comme un service, comme une "facilité" sans vous dire que c'est naturellement là où les marges de rentabilité sont les plus importantes pour l'organisme régulateur. Bref, si vous aimez votre banquier, vous adorerez Google Health. D'autant que de la même manière que votre banquier est capable de vous localiser et de vous laisser un message personnalisé dès que vous dépassez votre découvert autorisé, Google Health prévoit aussi de vous alerter par SMS pour vous rappeler de prendre votre pilule bleue (ou rouge).

Le meilleur ami de l'hypocondriaque compulsif.

Plus basique (en apparence) et dépouillé que son rival Healthvault, Google Health vous propose par défaut 4 possibilités :

  • la quatrième : trouver un docteur (classé par ville, par spécialité ...). Notez pour l'instant que cette possibilité vient en dernier ... nous y reviendrons plus tard ...
  • la troisième : trouver des services de santé (ami hypocondriaque bienvenue : les services en question te permettront de tester ton rythme cardiaque - et de te découvrir une légère arythmie - de tester ta résistance à l'effort - et de commencer à t'inquiéter pour ta retraite - , de calculer ton risque d'infarctus - et de contacter dans la foulée une société d'assurance-vie -, de te créer un pillulier électronique - un "e-pillulier" - et autres indispensables joyeusetés ...)
  • la seconde : importer ses données médicales. Le centre névralgique du système
  • la première : permet d'ajouter instantanément à son profil l'ensemble des maladies, symptômes et allergies connues de la planète, ainsi que l'ensemble des examens, médicaments et vaccins répertoriés. Il ne m'a pas fallu plus de 17 secondes pour ajouter à mon profil des "crampes abdominales" que je traite avec de l'Actigall (par voie orale), une allergie au beurre, et pour envisager une échographie pelvienne ainsi qu'une biopsie nerveuse et un bon vieil électrocardiogramme des familles, et comme il me restait encore un peu de temps j'en ai profité pour demander une sérologie aux IG-E positifs allô docteur Carter, il fibrille.

Bref vous l'aurez compris, étant donné que nous sommes tous (et certains plus que d'autres) des hypocondriaques en puissance, ce nouveau pan-catalogue de la chaîne médicale s'avérera aussi jouissif que dangereux. D'autant que ledit pan-catalogue est "drôlement bien fait" diront les optimistes, "drôlement incitatif" serais-je tenté de rajouter ... Prenons un exemple parmi d'autres : les crampes abdominales. Quand vous les ajoutez à votre profil, vous pouvez accéder à une page décrivant :

  • les symptômes
  • le traitement
  • les causes
  • les examens et tests permettant d'établir un diagnostic (lesquels tests et examens vous pouvez directement ajouter à votre profil pour les demander à votre médecin ... ou changer de médecin si le vôtre ne veut pas vous les prescrire ... ou changer de médecin ET de compagnie d'assurance si la vôtre ne les prend pas en charge ... etc, etc ...)
  • les moyens de prévention
  • les complications à prévoir (sic)
  • et, dernier de la liste ..."quand contacter un docteur". Ben oui, cela vient en dernier, vu que c'est pas précisément l'objectif du système, vous l'aurez compris (cf supra). On n'est jamais aussi bien soigné que par soi-même. En revanche, sur la base de la liste des examens, pathologies et autres symptômes et traitements que vous aurez ajoutés à votre profil, nombreux sont les docteurs (travaillant pour des compagnies d'assurance ou des laboratoires pharmaceutiques) qui vous contacteront. Push & Pull vous disais-je.

Dans le même temps, pour les mêmes crampes abdominales mais cette fois sur la partie droite de la page, vous accéderez à une sélection des actualités (Google News) sur le sujet, ainsi qu'à des articles et ouvrages (Google Scholar) sur la question. Et pour en débattre avec d'autres patients, on vous ajoute gratia pro deo, quelques liens vers des groupes de discussion sur le sujet (Google Groups).
Si j'abandonne pour un temps l'ironie, j'avoue que, malheureusement, ce genre d'écosystème médical sera perçu par beaucoup comme parfaitement bienvenu au regard de la manière catastrophique dont est de plus en plus souvent effectuée la prise en charge des patients en matière d'information et de suivi médical "éclairé".
Le risque de tout cela (sans même parler des dérives marchandes et consuméristes), c'est de s'enfermer das une logique de la médecine personnalisée risquant à terme de se substituer à l'autorité de la médecine "générale" et/ou "spécialisée. Permettez-moi une rapide caricature à vocation illustrative : la médecine personnalisée c'est exactement comme la justice personnalisée. Se faire médecine soi-même ou se faire justice soi-même. Si on touche à un cheveu de mes enfants, je sors mon lance-flamme pour ensuite éplucher les restes de l'agresseur à l'opinel. S'il y a une justice, c'est précisément pour éviter au pathos et à l'affect de rendre "leur" justice. Fin de la caricature. S'il y a une médecine "générale", c'est pour éviter que l'administration de soins et de traitements ne soit soumise qu'à la seule appréciation de celui qui les réclame.
Car oui, le plus gros problème que posent ces sites est bien celui de la crise de la notion d'autorité au profit de la notion de crédibilité. Si je suis médecin, j'ai l'autorité pour délivrer tel médicament ou pour établir tel diagnostic. Si je suis patient dans Google Health, je dispose d'une masse d'éléments crédibles (et faisant parfois autorité comme les articles de Medline se retrouvant "encapsulés" via le service Google Scholar) m'incitant à revêtir les habits d'une autorité médicale que je ne serai pourtant jamais, et ce indépendamment de ma bonne foi, de ma bonne volonté, et de l'objectivité voulue de ma lecture (de cette masse d'éléments crédibles). Si cette question de l'autorité est si essentielle, c'est parce qu'elle est elle-même l'horizon d'une autre question essentielle : celle de l'arbitrage. Ici comme ailleurs, en médecine comme en justice ou en éducation, il faut rendre des arbitrages, c'est à dire faire le choix d'investir (ou pas) dans telle (ou telle) direction pour telle (ou telle) raison. L'essence même de ces arbitrages est qu'ils se doivent d'être rendus de manière (supposément) impartiale ou à tout le moins désintéressée en n'ayant pour seul objectif que le bien commun de l'humanité (ou du groupe de population directement concerné par lesdits arbitrages).

Autorité, Arbitrage, Ecosystème.

Le graphique donnant à voir l'écosystème du site Healthvault de Microsoft est très révélateur, et ce bien au-delà du côté "l'île aux enfants" de la représentation graphique elle-même (tout le monde sourit : les patients, les médecins, les hélicoptères, les boîtes de médicaments, et le coeur du système est dessiné sous les traits d'un coffre-fort ... on peut effectivement être rassuré par l'image du coffre-fort, à condition que nous soyons les seuls à en posséder le clé et la combinaison, ce qui n'est clairement pas le cas ici ...). Bref, graphique très révélateur disais-je. Tout y est relié, tout est relié au centre du système, c'est à dire les données possédées par Healthvault : donnés médicales personnelles, dossiers médicaux publics (ceux détenus par les hôpitaux), pharmacies, compagnies d'assurance, laboratoires d'analyse. Un bien bel écosystème en vérité.

D'autorités en arbitrages se construisent donc les écosystèmes économiques, financiers, informationnels, médicaux. L'écosystème qui nous est promis par Google et Microsoft est - dans le discours tout au moins - de nature profondément schizophrénique. D'un côté ces sociétés affirment leur volonté de ne rendre aucun arbitrage : "elles" n'interviennent pas, "elles" ne font que collecter et centraliser les informations, que permettre à d'autres de déployer des services applicatifs. Mais dans le même temps, "elles" sont les seules à disposer d'une vue d'ensemble du système qu'elle administrent "malgré elles", qu'elles administrent en creux, qu'elles administrent parce qu'elles sont seules à posséder et à (re)distribuer la seule pièce de l'écosystème qui ait une valeur d'échange, la seule pièce qui puisse donc faire office de "monnaie" : les données médicales. Lesquelles données sont elles-mêmes doubles : à la fois objectivées (résultats d'examens antérieurs par exemple) et parfaitement subjectivables (la liste des "maladies que l'on pense avoir" par exemple). Ce qui ne fait que doubler leur valeur symbolique d'échange. Ainsi, dès à présent pour le gouvernement de l'ensemble (gouvernement au sens de "gouvernail", "direction" dans la pensée cybernétique), tout est mis en place dans cet écosystème pour que se trouve systématiquement renforcées la valeur d'autorité des moteurs (qui fournissent le service et capitalisent la "monnaie") et leur valeur d'arbitrage. Avec le consentement libre et éclairé l'opt-in explicite du patient de l'utilisateur.

(Sources : sous les liens ... mais aussi CisMEF, Zorgloob, Hervé Le Crosnier par mail ... // Temps approximatif de rédaction de ce billet : 4 heures)

Dmoz a 10 ans.

Joyeux anniversaire (c'était officiellement le 5 Juin) au dernier dinosaure des annuaires web. Dmoz, alias l'Open Directory Project, est - d'une certaine manière - le pionnier du Web 2.0 actuel dans sa dimension collaborative : ce fut en effet le premier projet Internet d'envergure à reposer entièrement sur l'implication d'une équipe de bénévoles construisant ensemble de la valeur (Dmoz est encore aujourd'hui l'annuaire choisi par Google pour sa partie "annuaire"), pour le simple plaisir ... de construire ensemble de la valeur utile à tous.

C'est wikipédie qui l'est : vers une guerre de position.

La phase 5 de la bataille encyclopédique est engagée. Rappel des faits.

  • Round 1 : phase d'observation. Les grandes Dames encyclopédiques observent d'un oeil distant (et parfois sarcastique) l'essor de la toute petite Wikipédia.
  • Round 2 : l'offensive. Devant l'engouement suscité et le succès (ou la renommée) avérée de la petite encyclopédie qui monte qui monte ... les grandes Dames fourbissent leurs armes. Les arguments de bonne foi et - plus fréquemment - de mauvaise foi sur la ligne éditoriale, la fiabilité, la nature même du projet pleuvent.
  • Round 3 : la contre-offensive. C'est la fameuse querelle des anciens et des modernes avec la très sérieuse revue Nature dans le rôle d'arbitre et un opposition point à point entre la fiabilité des informations publiées dans Wikipedia et dans Britannica. Le résultat de cet arbitrage n'en a toujours pas fini d'être commenté mais il démontre que d'un strict point de vue qualitatif, les reproches adressés à Wikipedia ne tiennent pas.
  • Round 4 : l'alignement. Puisque le modèle contributif-collaboratif-ouvert mène la danse, puisque les usagers en redemandent, puisque l'encyclopédisme d'usage est entré dans les moeurs, les grandes Dames se décident à s'y mettre. De son côté, Wikipedia tire également les enseignements d'un encyclopédisme plus "traditionnel" et réfléchit sérieusement à des stabilisations ponctuelles de certains de ses articles en même temps qu'elle fait le choix du papier comme support de cette fixation (pour plus de détails, voir mon dernier billet sur le sujet).

Voilà où nous en sommes (à peu près ...) aujourd'hui. Mais il ne vous a pas échappé qu'un match ne se joue pas en 4 rounds (sauf par KO), et le cinquième s'annonce également épique. Alors que les critiques commencent à leur tour à pleuvoir sur les virage collaboratif de l'encyclopédie Larousse ( et notamment), Hubert nous apprend que Britannica se lance dans le tryptique collaboratif. Je copie-colle un extrait du billet d'Hubert :

  • "une version totalement ouverte dans sa consultation pour que les journalistes ne citent plus seulement Wikipédia, et une version qui intégrera 3 niveaux de contenus : ceux créés par les utilisateurs, par un pool d’experts et le contenu de la dernière édition de la Britannica elle-même."

Ne serait-ce ma mauvaise foi galopante, je me hasarderais à écrire que vouloir satisfaire tout le monde est parfois le plus sûr moyen de ne contenter personne. A lire l'intégralité du billet d'annonce de Britannica ainsi que l'article s'en faisant écho sur Wired, ce qui me saute aux yeux, c'est que l'argumentaire principal derrière ces mutations encyclopédiques n'est pas - ou alors à la marge - une réflexion sur la nature même du projet encyclopédique au XXIème siècle. Ce qui motive cet habillage collaboratif, le "nerf de la guerre" c'est - du côté des grandes Dames - la course à l'audimat, la course à l'attention. Derrière cette course il y a une évidence contingente : la meilleur encyclopédie du monde ne vaut rien si elle n'est pas lue. Mais à la manière des charades à tiroirs, cette contingence en cache une autre : être lu est une chose, être lu par des prescripteurs en est une autre. Or les principaux prescripteurs de l'économie de l'attention, ses principaux relais, sont aujourd'hui les journalistes et les bloggeurs. Ainsi donc derrière l'accès gratuit de Brittanica pour les "web publishers", derrière le lancement très médiatique du Larousse collaboratif, la  cible visée est transparente, évidente. Le virage collaboratif n'est au mieux qu'un habillage marketing destiné à gagner la seule vraie bataille : celle du positionnement dans les moteurs de recherche. Car derrière ce positionnement se trouve le graal : argent, renommée, notoriété et cercles vertueux - ou vicieux - associés.
Or en ce domaine, on connaît depuis longtemps les liens affinitaires qui lient la première Encyclopédie mondiale (Wikipedia) au premier moteur de recherche (Google). Je m'en suis ici même fait l'écho à de nombreuses reprises. Et cette "guerre de positions" au sens littéral du terme n'en finit pas d'affoler. Dernière polémique en date, celle des entreprises du CAC 40 ou plus exactement des agences de relations publiques qui vivent sur leurs dos, lesquelles s'émeuvent de la place prise aujourd'hui par Wikipedia dans ... les relations publiques. Le dernier article d'Ecrans est là-dessus aussi remarquable qu'édifiant : "Wikipedia terrorise le CAC 40."
Alors ? Alors Wikipedia a - à mon sens - permis d'instaurer un virage radical dans la définition du projet encyclopédique (encyclopédisme d'usage). Les autres grandes Dames ont - d'aussi loin que les articles mentionnés dans ce billet permettent d'en juger - fait l'économie de cette réflexion de fond au profit ... d'une recherche du profit.  Fait l'économie d'une réflexion sur le Projet Encyclopédique dont elles sont porteuses, pour la quête d'une viabilité économique concernant la diffusion de leur encyclopédie. Autre chose qui me frappe dans tout cela, c'est une inversion des "literacies." Jusqu'ici, les "références encyclopédiques" étaient un exercice et un passage obligé pour l'étudiant, le chercheur, l'amateur. Elles étaient "devant être recherchées". On "se" devait de les rechercher. Elles n'avaient donc pas à se soucier de marketing, faire autorité suffisait. Pour des raisons sur lesquelles je ne vais pas m'étendre (faudrait une thèse là dessus) mais que les habitués de ce blog ont l'habitude de croiser, notre approche de la connaissance a changée en même temps que changeaient les modes de constitution et de transmission de cette connaissance. Le résultat c'est que les encyclopédies sont engagées aujourd'hui dans des péripéties dignes des grandes guerres d'éditeurs au moment de l'attribution d'un prix littéraire. Il faut "aller chercher" le chercheur, l'étudiant pour qu'à son tour il soit tenté de renouer avec la tradition de "la-référence-encyclopédique-mais-pas-Wikipedia." Inversion des literacies donc. Parce qu'on ne peut pas éternellement ménager la chèvre et le chou, l'autorité et la notoriété, "être à la fois Jean Dutour et Jean Moulin" comme disait l'autre. Or ce combat est perdu d'avance. Non pas que les encyclopédies n'aient pas les moyens de le mener (toute l'actualité prouve au contraire qu'elles sont toutes disposées à s'offrir ces moyens, si peu nobles soient-ils), mais ce combat n'est pas le leur. Elles n'en maîtrisent ni l'alpha, ni l'oméga. Ce combat, c'est celui des moteurs de recherche qui sont les seuls à disposer de la force de frappe nécessaire pour faire significativement bouger les choses, dans un sens ou dans un autre. Aucune agence de RP, aucun habillage collaboratif n'y changera quoi que ce soit. Quand une encyclopédie (qu'elle qu'elle soit) fait de sa quête de notoriété une ambition première, elle sacrifie nécessairement sa valeur d'autorité. Les encyclopédies qui font aujourd'hui ce pari là oublient une chose simple : la notoriété de Wikipédia est un épiphénomène. La notoriété de Wikipedia n'est qu'un épiphénomène. Cette notoriété ne s'est pas exclusivement construite sur la place manquante des autres encyclopédies dans la sphère numérique. Elle s'est construite sur une propagation massivement partagée de l'indice d'autorité accordé à l'essentiel des articles de La Wikipedia. Rendre accessible est une chose. Etre accessible (au sens propre comme au sens figuré) en est une autre.

<Update du lendemain> Sur le même sujet, voir le billet de Didier Durand qui revient sur l'article d'Ecrans et la - pathétique - "stratégie" de l'agence EuroRSCG. </Update>

Symptome ou maladie ?

Message récupéré sur une liste de diffusion professionnelle de bibliothécaires (pas biblio-fr, une autre, à l'étranger). Le message est un peu long mais il mérite une lecture attentive tant il exemplifie le malaise et/ou le décalage d'une (partie) de la profession des bibliothécaires. Mes commentaires (à chaud, donc un peu sarcastiques et navrés ...) sont insérés en gras et en rouge.

  • "J'ai constaté depuis quelques mois que je recevais de plus en plus de mails voire d'appels téléphoniques de gens qui avaient trouvé la référence de documents figurant dans le catalogue de notre bibliothèque. Serait-ce une mauvaise chose ?? Certains souhaitaient pouvoir emprunter ces documents, d'autres étaient des auteurs demandant qui une correction dans la notice, qui proposant l'acquisition de leur dernière publication... D'autres encore étaient des journalistes, des formateurs, etc. Bigre ! Horreur ! Du public ! Des usagers !!!
    Une collègue m'a informé - d'où l'urgence absolue de la formation des bibliothécaires pour éviter le syndrôme de la formation par "on-dit" - qu'on pouvait très facilement chercher un ouvrage directement sur Google, en "recherche simple", et que les réponses incluaient des catalogues de bibliothèques possédant l'ouvrage (affichage de la notice). J'ai testé l'opération avec qques ouvrages que nous avons au catalogue, et j'ai effectivement eu des réponses incluant la notice de mon catalogue, ce qui je trouve fâcheux... - vous noterez le possessif "mon" devant catalogue ... plus sérieusement, l'ouverture des catalogues (ne parle-t-on pas d'"OPAC", open PUBLIC access catalogue") est une problématique clé sont trop peu de bibliothèques se sont saisies avant que les grands indexeurs ne la rendent opératoire, emportant avec eux l'adhésion du public, tant cette ouverture des données correspond à un besoin et à une attente.
    Quelques dangers de cette situation (et il y en a sûrement d'autres auxquels je n'ai pas pensé) la paranoïa est une composante élémentaire de la psychologie du bibliothécaire :
    - Être submergé de requêtes ben oui, déjà qu'on va voir arriver de nouveaux usagers, si en plus ils ont des questions ...
    - Être harcelé par divers demandeurs inistants (sic) car c'est bien connu l'usager-demandeur est insistant, et en bibliothèque, insister, c'est du harcèlement
    - Le catalogue étant "transparent", les auteurs de vols tels que celui dont nous avions été victimes il y a quelques années trouveront d'autant plus facilement ce qu'ils cherchent, si les ouvrages sont en
    libre-accès, s'ils sont empruntés. Autre genre de vol pouvant se dérouler: les ouvrages en libre-accès qui sont épuisés en librairie et chez l'éditeur, difficiles à trouver, même sur Internet: on viendra nous les voler en biblilothèque, surtout dans celles non équipées de systèmes anti-vol
    comme la nôtre. Ne pourrait-on pas imaginer que l'usager-harceleur ne vienne simplement les lire ??
    Vous pouvez faire le test suivant: vous tappez sur Google (en recherche simple) "site:" immédiatement suivi par l'adresse de votre catalogue, sans le "http://www", et sans saisir d'espaces. De cette manière, Google fera une recherche sur ce qu'il possède de votre base
    de données dans sa propre base de données. Il affichera ce qu'il a trouvé comme nombre de notices dans votre catalogue. Ce chiffre sera faux, mais en général supérieur à très supérieur au nombre réel de notices que vous avez. Cela indique toutes les personnes qui ont obtenu des réponses à leur recherche incluant une notice de votre catalogue, les notices ayant été enregistrées à plusieurs reprises dans la "base de données planétaire" de Google.
    Est-ce que vous avez déjà été confrontés à cette situation ? Comment y répondez-vous, comment y faites-vous face ? Avez-vous eu des problèmes ? Prêtez-vous des documents à des lecteurs venant "d'ailleurs" et qui vous demandent par mail un prêt ? Ami lecteur qui vien d'ailleurs, retournes-y.
    Vos institutions qui le souhaitent ont-t-elles trouvé des mesures pour "protéger" leur catalogue de l'indexation que Google en fait, même si l'on n'a pas passé d'accord avec le moteur de recherche ? Où l'on retrouve exemplifiée la maxime : "leur thésaurus (aux moteurs de recherche) est un thesaurus" (plus d'info par ici). De fait, il suffit aux robots de Google d'accéder à une notice, pour, par le biais des fichiers liés et des hyperliens, arriver à "pomper", à récupérer et indexer une bonne partie d'un catalogue.
    "

Alors ? Symptome d'une profession qui ne maîtrise plus la logique d'accès et de service qui fait pourtant son coeur de métier ? Simple angoisse crispée et paranoïaque due à une méconnaissance profonde des enjeux ? Le message d'un seul ne saurait avoir valeur d'exemple pour l'ensemble d'une profession, mais comme je m'en suis fait l'écho à de nombreuses reprises, ma pratique de formateur (dans le monde des bibliothèques et de la documentation) m'incline à penser que la fracture numérique se creuse. Que faute d'être formés aux outils, les professionnels des bibliothèques s'avèrent incapables de les penser en dehors des cadres et shémas préétablis d'une logique bibliothéconomique inflexible et datée, à l'heure de la refonte planétaire d'une bibliothéconomie de masse. Et que laisser perdurer cette incompréhension, c'est le plus mauvais service à rendre à une profession qui si elle n'investit pas massivement le transformation en cours, ne verra jamais se réaliser son rêve d'archithèque et laissera dériver ses usagers autarcithécaires.

Microsoft renonce à Yahoo! Et après ?

Ci-dessous la reproduction (autorisée) d'une analyse d'Hervé Le Crosnier*** à propos de l'ultime épisode ayant vu Microsoft renoncer à l'acquisition de Yahoo!.
====================================
Ayant pris la responsabilité de donner mon avis sur la fusion Yahoo!-Microsoft quelques heures après l'annonce de l'offre du numéro un du logiciel, je me dois de continuer à évaluer à chaud ce qui se cache derrière la suspension de l'offre par Microsoft intervenue ce samedi 3 mai.
Dans mon appréciation de la fusion (dont on retrouve une version retravaillée dans le numéro de mars du Monde Diplomatique - http://www.monde-diplomatique.fr/2008/03/LE_CROSNIER/15673) je plaçais deux points d'analyse :

  • le marché de la publicité, et la nécessité pour Microsoft de contrer la domination de Google. Dans cette optique, Yahoo! apportait deux éléments : sa force dans la publicité de bannières et son moteur de recherche qui permet d'associer plus précisément les centres d'intérêt du lecteur et la publicité.
  • la mutation des logiciels vers le mode "software as a service" et le danger que cela représentait pour les produits de Microsoft. Ce dernier doit maintenant devenir un "acteur de l'internet" à part entière. Pour cela, il a besoin d'intégrer des spécialistes reconnus des techniques spécifiques du réseau (cloud computing, développement partagé, interface utilisateur au travers des navigateurs,...). Sur ce marché, Microsoft est concurrencé de toute part, mais spécifiquement par Google et Adobe (un acteur majeur trop souvent oublié dans les analyses qui se focalisent sur la publicité).

Ces deux éléments restent d'actualité. On aurait cependant tort de limiter l'opération à la seule dimension publicitaire. Mais ces deux éléments sont aussi des forces centripètes dans le cadre d'une fusion.

Yahoo! continue à faire flèche de tout bois pour montrer que sa domination sur le marché publicitaire de marque peut s'étendre aux autres formes de publicité. Ainsi, Yahoo! a racheté IndexTools, une société d'analyse marketing en ligne au début d'avril, en plein période de tension autour de l'offre de Microsoft. C'est aussi début avril que Yahoo! a fait les premières démonstrations de AMP, son futur système de place de marché publicitaire, offrant une plus grande souplesse aux annonceurs et cherchant ainsi à rejoindre les forces de Google en ce domaine. Enfin, c'est Yahoo!-Buzz qui est largement promu en mars (http://buzz.yahoo.com/ ). Ce site s'inspire des sites de promotion par les lecteurs, comme Digg, mais évidemment décuplé par la "puissance Yahoo!" un nombre de visiteurs largement supérieur en raison de la nature multiple du portail de Yahoo (depuis le shopping jusqu'à la recherche de pages web).

Les cultures d'entreprises diffèrent largement entre Yahoo! et Microsoft. Et la fusion de ces deux structures aurait aussi un coût non négligeable (départ de chercheurs de chez Yahoo!, nécessité d'accorder des primes importantes pour garder les informaticiens clé...). Ce surcoût largement prévisible est certainement une des raisons qui incitent Microsoft à ne pas augmenter son offre sur Yahoo!

Or la quantité d'informaticiens de haut niveau disponibles sur le marché du travail est très faible par rapport aux besoins de cette industrie. Microsoft le sait, et sa capacité à maintenir dans son giron les ingénieurs de Yahoo! est un élément essentiel pour lui permettre une nouvelle stratégie sur internet. L'autre fers au feu en ce domaine est l'action de Microsoft pour simplifier l'embauche aux Etats-Unis des meilleurs informaticiens de tous les autres pays (brain drain). Bill Gates a ainsi témoigné le 12 mars devant le congrès US pour l'assouplissement des règles dites "visas H-1B" pour que l'industrie étatsunienne puisse rester dominante dans les nouvelles technologies.
Ajoutons que les techniques pour développer des "data centers", et renforcer le "cloud computing" relèvent largement de compétences qui sont encore rares. Hébergée par la Fondation Apache, le système libre Hadoop permet la diffusion d'une "culture technique" adaptée aux formes nouvelles du combat industriel de l'internet. Or, s'il est basé sur l'algorithme "MapReduce" propriété de Google, Hadoop est soutenu par deux
ingénieurs de Yahoo! C'est aussi cette capacité créer avec la communauté du logiciel libre des outils fondamentaux pour les technologies en plein boom qui intéresse Microsoft. Chaque pas que cette entreprise fait en direction du logiciel open source est entravée par une manie de la "propriété intellectuelle", qui ne s'accorde pas avec les comportements et les objectifs des développeurs du logiciel libre (qui sont aussi souvent des employés d'entreprises, parfois même de concurrents qui trouvent intérêt à une "coopétition" pour créer de nouvelles avancées).
Yahoo! serait ainsi une passerelle convaincante et pourrait instiller un peu de souplesse dans la structure de développement de Microsoft. Ce qui est essentiel, alors que Google et IBM, de longue date utilisateurs et contributeurs à Linux, font une opération commune pour doter les universités étatsuniennes de data-centers en mode nuage afin de leur permettre de former les étudiants à ces nouvelles techniques de parallélisation des logiciels.
Enfin, la question du contenu d'information plane aussi sur ce projet de fusion. Les moteurs de recherche ont tendance à se désintéresser des objets documentaires pour se focaliser sur la mise en relation et les bénéfices publicitaires associés. Or Yahoo! est un moteur de recherche particulier : son histoire de premier "portail" de l'internet le fait aussi ressembler à un média, un "point d'accès" par navigation et pas seulement par recherche comme Google.
Or les tiers-larrons qui ont été convoqués dans la négociation sont aussi des systèmes de production de contenu ayant besoin d'exister comme vecteurs de mise en relation : Murdoch d'une part et AOL de l'autre. Pour l'un comme pour l'autre, il s'agit de se positionner dans le cadre de la "délinéarisation" des médias (on va lire/écouter/regarder telle ou telle émission ou document suivant des "aggrégateurs de programmes" et non suivant le flux régulier d'un média). Ce phénomène tend à s'accélérer avec les techniques du web dit 2.0 (flux RSS, dépôts de vidéos, intégration de vidéos ou d'information au sein des pages web, systèmes de promotion "sociale",..). Chaque "article" ou "émission" devra trouver son lectorat en marge de l'audience générale de la (ou des) chaînes qui vont les diffuser. La recherche prend une place déterminante, le buzz aussi. Yahoo! n'a pas dit ses derniers mots dans ce domaine. Et Microsoft, qui n'a pas bonne presse sur l'internet, a besoin de se positionner rapidement sur ce terrain. D'autant que son propre moteur de recherche, Live Search, reste bien en deça des qualités de Yahoo! ou Google. Selon son propre responsable, Brad Goldenberg : "Aujourd'hui, 40 % des requêtes sur Live Search ne trouvent pas de réponses". La fusion est une façon pour Microsoft d'incorporer dans sa sphère d'influence les médias tels News Corp. ou AOL,... grâce à une stratégie de recherche plus affinée, et ainsi de faucher l'herbe sous le pied à Google.
Pourtant, ce 3 mai, Microsoft a "jeté l'éponge". Les prétentions de Yahoo! ont été jugées excessives. Et l'idée de se lancer dans une OPA hostile, un instant caressée par Steve Ballmer, le PDG de Microsoft, a été abandonnée. Nous touchons là une des nouvelles situations liées au numérique et à la "société de la connaissance" : l'intégration d'équipes ne peut se faire que de façon volontaire. Aussi incroyable que cela puisse paraître aux financiers habitués à considérer les salariés comme quantité négligeable. C'est ainsi que Laura Martin, analyste financière a déclaré à Bloomberg News à propos du refus de la fusion par Yahoo : "This is management putting its employees and its job security ahead of current Yahoo shareholders’ interest".

Que va-t-il se passer maintenant ?
Trop tôt pour le dire, mais on sent bien que cette fusion est à la fois nécessaire à Microsoft et mal vécue par Yahoo! et plus encore par son patron et fondateur Jerry Yang. Il faudra trouver un nouveau compromis. Soit accepter la crise de management de Yahoo!, avec vraisemblablement le départ de ses membres fondateurs, et certainement la perte sa culture d'entreprise... qui est pourtant une des choses dont Microsoft a besoin pour renouveler la sienne et faire face à la nouvelle situation de l'internet. Soit reposer la fusion dans un cadre élargi, avec une plus grande implication des médias et la naissance d'un nouveau type de puissance médiatique. La volonté de Time-Warner de séparer ses activités de producteurs de celle de diffuseur et le statut instable de AOL sont des indices rendant possible une telle opération. Et nul ne peut jamais prévoir où Murdoch va décider de frapper à nouveau sur la scène de l'internet.

Une chose me semble cependant certaine, c'est que le status quo ne pourra pas durer. Yahoo! isolé serait sur une pente descendante... car Microsoft devrait évidemment trouver une solution de rechange qui marginaliserait rapidement une entité comme Yahoo! Surtout au moment où sa propre stratégie est en pleine effervescence, comme souligné plus haut, mais aussi comme le montrent des initiatives telles que l'investissement de Yahoo! dans le web sémantique (avec l'adoption des microformats et des vocabulaires tels Dublin Core ou FOAF) ou son adhésion en mars à Open Social, le consortium sur les réseaux sociaux lancé par Google en opposition à Facebook, ou encore sa promotion de openID pour gérer les identités sur le web.
Rendez-vous dans les mois qui viennent pour savoir ce qu'il en sera de la fusion Microsoft-Yahoo!, mais plus rapidement pour des mouvements tectoniques entre les autres acteurs majeurs. Car le signal lancé par Microsoft en février, et le prix mis sur la table pour la transaction, ont aussi été le signal d'une grande opération de recomposition des méga-industries de l'internet. Et pas seulement de la publicité, qui si elle est importante en terme d'argent immédiatement mobilisé, ne peut suffire à expliquer ces débats, qui sont autant des stratégies globales, industrielles, culturelles et politiques, que des stratégies de captation d'un marché publicitaire, si grand et central soit-il.

Hervé Le Crosnier
Caen, le 4 mai 2008

Texte diffusé sous licence Creative Commons by-nc
=======================================

*** qui s'obstine et s'acharne à ne pas ouvrir son blog alors qu'il écrit pourtant plein de choses intéressantes et qu'il en oblige d'autres à l'ouvrir (leur blog).

Quoi de neuf sous le moteur ?

Bien des choses en somme ... Côté fonctionnalités tout d'abord :

Côté algorithmes ensuite, avec tout d'abord deux outils intéressants pour les praticiens d'une veille sociétale et/ou marketeurs en herbe et/ou les fans de Gala et de Closer.

  • Microsoft lance le X-Rank, un algorithme reposant sur le "volume de recherche" (= la fréquence des noms de personnalités les plus recherchés) qui vous permettra de savoir si Britney Spears est aujourd'hui plus "populaire" que Cindy Sanders.
  • Jean Véronis aboutit au même résultat mais en transformant les "entités nommées" en Buzz du jour.
  • Google lance le VisualRank à l'occasion de la conférence WWW 2008. Il s'agit "d'une sorte de PageRank" appliqué à la recherche d'images : "In this paper, we cast the image-ranking problem into the task of identifying “authority” nodes on an inferred visual similarity graph and propose an algorithm to analyze the visual link structure that can be created among a group of images." L'article scientifique présentant leur approche est disponible : "PageRank for Product Image Search" (.pdf) L'indexation image est un secteur stratégique essentiel pour le futur de la recherche d'information, particulièrement dans la tendance actuelle d'une recherche globalisée et universelle. (Via EcransTechnaute et Blogoscoped). Notez que ledit VisualRank n'est pas encore opérationnel sur le site Google Images. On attendra donc un peu avant de pouvoir juger sur pièces.

Côté économie enfin :

  • Google et IBM, deux petites start-up promises à un bel avenir, unissent leurs forces pour - à terme - dominer outrageusement le secteur du cloud-computing, perspective dont Hervé Le Crosnier vous parlait déjà ici,  et que Jean-Marie Le Ray reprend et commente .
  • l'incontournable suspense pour savoir "qui" se paiera Yahoo! et surtout "quand" (et "combien") ... la blogosphère motorisée ne parle (presque) que de ça. Outre les analyses déjà mentionnées ici et , la dernière à avoir retenue mon attention est celle de Marc Andreessen, partiellement traduite par Jean-Marie Le Ray (l'analyse de Marc Andreessen se poursuit, in english only, ici). Avec le dernier épisode en date : le refus de Microsoft de faire encore monter les enchères devant le refus de Yahoo! de se laisser acheter à ce prix-là. Ne surtout pas croire qu'il s'agit là de la fin de l'histoire ... (voir aussi l'analyse d'Homo-Numericus)