Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Des immédiasphères à l'indexation orientée-objet : l'homme est un appareil comme les autres.

Première transformation : le passage au world Live web.
Jusqu'à il y a peu de temps encore, le web se définissait d'abord comme un espace. Un espace que les moteurs de recherche cherchaient désespérément à embrasser dans sa totalité. Puis, serveurs et algorithmie aidant, l'essentiel de cet espace fut indexé, même si une notable partie (le web dit "invisible") restait encore une terra incognita. Cette illusion de complétude "spatiale" pour les usagers, ajoutée à la course économique que se livraient les mêmes moteurs et aux bouleversements en cours de l'industrie de la presse, tout cela introduisit avec une force inattendue le paramètre de la temporalité comme premier et essentiel. La fréquence de rafraîchissement des index devînt un critère de différenciation capital pour les moteurs. Et puis le web "social", "contributif" arriva. Il fallut alors l'indexer en "temps réel". Ce fut là le désormais célèbre passage du World Wide Web au World Live Web (pour une remise en perspective un peu plus "fouillée" de cette évolution, voir le billet "Bienvenue dans le World Live Web").

Seconde transformation : le tempo des immédiasphères.
Le web, en tout cas le reflet que les moteurs nous en montrent, est aujourd'hui au moins autant caractérisé par son immensité spatiale (faite de densités et de dispersions - les éternels "Hubs et Authorities") que par sa dimension temporelle, dont la dernière déclinaison est l'immédiateté, l'instantanéité. Là encore un sujet sur lequel je m'étais déjà attardé en soulignant l'importance d'une omni-synchronisation comme dernière étape de la dérive des continents documentaires. La seconde transformation dont je parle est celle qui déporte cette instantanéité vers l'ensemble des 3 médiasphères (micro-méso-macro) et non plus seulement vers les seuls contenus de type "blogs" ou "sites d'information" (news)

Donc nous en sommes là.
Indexer le web. Tout le web. En temps réel. En rendant transparente la synchronisation de l'ensemble dans les interfaces d'accès (agrégateurs, moteurs ...). Et en offrant, avec le web synchronisé, une post-synchronisation de l'ensemble de nos interfaces d'accès personnelles (laptops, smartphones, services en ligne avec identifiants personnels).

A y regarder attentivement ...
... on peut aujourd'hui avoir l'impression que sur l'ensemble de ces transformations, Google contrôle l'ensemble. Avoir l'impression que le web est Googleformé à la manière dont les planètes inhabitables pour l'homme sont terraformées dans les récits de science-fiction. De fait Google est celui qui indexe la part la plus large de l'espace du web, il est celui qui mixe le plus habilement les différentes médiasphères, il est celui qui fait la course en tête dans l'indexation temps-réel, il est celui dont l'écosystème de services (et les récentes ambitions en terme d'OS) lui permet de maîtriser l'ensemble des flux désormais vitaux de la synchronisation. D'autant qu'il est un autre sujet dont on parle nettement moins (sauf peut-être chez Jean-Marie) et qui est pourtant également décisif : ce sont les capacités multilingues de Google. De Google traducteur. Des capacités de traduction automatique là encore immédiates, parfaitement synchrones.

Tout le web. Tout de suite. Dans toutes les langues. De chaque langue à chaque autre. Pour chaque langue. Et la Babel mythique de presque atteindre le ciel.

Avoir l'impression donc, que rien n'échappe et ne peut échapper à Google tant il semble anticiper avec une précision millimétrée les moindres mouvement du corps pourtant sans cesse changeant du web, tant il dispose d'une manne financière lui permettant d'absorber ou de racheter les rares soubresauts lui ayant échappé.

Au vu de ce tableau, que reste-t-il encore à indexer ?
Il y a pourtant un petit village planétaire qui résiste encore à l'indexation (de Google et des autres). Ce village, c'est celui des images. L'indexation image a toujours été un sujet extrêmement compliqué, que l'on a longtemps seulement su résoudre en indexant uniquement le texte décrivant les images (balise "Alt" en HTML, ou nom donné au fichier image). L'indexation image a aujourd'hui fait de considérables progrès, elle commence à intégrer la reconnaissance de formes (patterns) permettant ainsi de naviguer à partir d'une image vers des images semblables, mais l'indexation image est encore loin de pouvoir passer à l'ère industrielle dans laquelle est entrée l'indexation texte depuis la fin des années 80.

Troisième transformation : le web texte-image.
Or le web est aujourd'hui au moins autant un média d'images (fixes et animées) qu'un média de texte. Le volume des vidéos diffusées est littéralement hallucinant (tant en nombre qu'en terme d'infrastructure technique nécessaire à son encodage et à son acheminement). Avec l'arrivée de l'indexation temps réel, c'est là probablement LE grand bouleversement du web comme média, de l'Internet comme médium. A compter du moment où ce qui était à l'origine un média textuel déployé dans l'espace (celui de l'architecture client-serveur initiale) devient un media texte-image et temps-réel, les cadres d'analyse changent nécessairement. Pourtant nombre d'entre nous (dans lesquels je m'inclue bien volontiers) analysent les transformations du web de seconde génération avec en tête le cadre théorique qui présidait à l'analyse du web de première génération.

Et donc ??
Et donc, sur l'ensemble des points jusqu'ici traités dans ce billet, la dernière interview de Marissa Mayer dans le Guardian (rappel : Marissa Mayer est blonde ET Vice-Présidente "of search product and user experience" chez Google) apporte un très grand nombre de significatifs éclairages qui sont autant de confirmations. Particulièrement sur l'indexation image : 

  • "For voice, language is language. Sometimes a new word crops up and then you have to figure out how to recognise that. With images, the problem is fundamentally changed. Twenty years ago, all you needed to do was be able to recognise the million celebrities who are likely to show up on the evening news. Now, with the dawn of YouTube and digital photography and 100bn images being uploaded to the web every year, you actually need to be able to identify all 6 billion people. The problem is that in those 6 billion people there's an awful lot of people who look a lot like Tony Blair or Cindy Crawford." What's also lost in a still photo is the contextual information – movement, location, voice – that reality offers. "With a still image all you have are the pixels, and those pixels might look a lot like a photo of someone else, so I do feel for the image recognition people because their problem has become significantly harder in the internet age. We're not getting closer to a solution. The solution just moves further away."

On le voit, la question de la reconnaissance faciale (chantier par ailleurs ô combien stratégique, notamment dans le domaine de la sécurité civile et militaire) préoccupe énormément Google et ce depuis longtemps. Probablement parce qu'elle est le prochain "Next Big Thing" des technologies de l'indexation, et donc le prochain avantage concurrentiel déterminant. 
TSI : Texte. Son. Image.

Google contrôle l'indexation du texte. Dans toutes les langues. De chaque langue vers toutes les autres (ou presque).  Google contrôle également l'indexation du son. Google cherche à contrôler l'indexation image. Mais là n'est pas, loin s'en faut, la seule préoccupation de Google. Et là n'est pas non plus l'intérêt principal de l'interview de Marissa Mayer.
Au-delà du textes, des textes dans toutes les langues, des sons et des images (fixes et animées), que peut-il bien rester à indexer ?? Ou plus exactement, qu'est-ce qui, aujourd'hui, pourrait permettre d'augmenter significativement la qualité d'indexation des sons, des textes et des images en enrichissant simultanément l'expérience utilisateur résultant de ladite indexation améliorée ?? Et bien c'est l'indexation orientée-objet.

Quatrième transformation : l'indexation orientée-objet.

Indexation orientée-objet. Comme l'on parle de programmation et de langages informatiques "orientés-objet." Pour comprendre de quoi il s'agit, il faut faire un rapide détour par un autre grand changement annoncé (et en cours) des usages du web, une quatrième transformation, celle de l'internet des objets. Des objets, des lieux, des supports, tous "communiquants", au moyen - par exemple - de puces RFID ou par le biais de la géolocalisation.
Or si on connaissait déjà le goût et l'intérêt des moteurs pour la géolocalisation, on je ne visualisai pas encore très bien en quoi les promesses de l'internet des objets rejoignaient les préoccupations des maîtres de l'indexation. Après lecture de l'interview de Marissa, cela m'apparaît beaucoup plus clairement. L'internet des objets intéresse les moteurs pour optimiser leur approche de l'indexation, parce que cela leur permettra de mieux "capter" la manière dont chacun d'entre nous caractérise les objets (et donc les potentiels sujets de ses requêtes) de son environnement proche, en synchronie, en mouvement et en temps réel.

Juste une précision avant de passer aux exemples : rappeler le rôle déterminant que joue aujourd'hui l'indexation "sociale". Les Folksonomies en sont une partie importante mais loin d'être exclusive. Ainsi même Google, qui ne met pas spécialement "en avant" l'indexation humaine - son crédo et son confiteor étant l'indexation "machinique" - même Google fait de l'indexation humaine et collaborative : chacune de nos requêtes couplée à chacun de nos clics sur tel ou tel résultat issu de cette requête équivaut littéralement à une qualification humaine du résultat de la requête, qualification qui sera ensuite intégrée dans l'ensemble des paramètres algorithmiques permettant, pour l'utilisateur identifié et/ou pour l'ensemble des requêtes semblables déposées, de faire varier ll'ordonnancement des résultats. Dit autrement, le couple "requête / activation d'un lien de la page de résultat" équivaut exactement à la procédure qui, dans les folksonomies, fait correspondre un ou plusieurs mots-clés librement choisis à une page web. L'indexation à l'ère industrielle est donc nécessairement "sociale". Et maintenant nos exemples (enfin ceux de Marissa ...) :

  • "The first stage of search involved text on web pages; the second stage, which we're in now, does involve humans, who are helping identify images and adding context to web pages, which makes the web appear knowledgeable." Voici la confirmation de l'importance stratégique de la prise en compte de l'indexation "humaine" par Google, prise en compte qui est la condition sine qua non d'un web "knowledgeable", c'est à dire pas tout à fait un web sémantique ou sémantisé (cela renvoie à d'autres technologies), mais bel et bien un web "connaissable", un web dans lequel l'indexation peut permettre d'aller au-delà des informations indexées, jusqu'à idéalement pouvoir en inférer d'autres (ce qui est aussi l'objectif du web sémantique ... mais la voie choisie par Google apparaît ici diamétralement différente, l'approche est plus "pragmatique" et en tout cas plus proche d'un web socio-sémantique)

L'homme est un appareil comme les autres.
"But there's a potential third form of search, she explains, which uses the sensors built into devices around us. "I think that some of the smartphones are doing a lot of the work for us: by having cameras they already have eyes; by having GPS they know where they are; by having things like accelerometers they know how you're holding them." Voilà la clé du problème. L'homme était déjà devenu un document comme les autres, il est désormais, un appareil, un dispositif (" a device") comme les autres, il est porteur de ces appareils et dispositifs qui enrichissent l'indexation du monde réel, en temps réel. L'homme est un crawler comme les autres.

Et Twitter dans tout ça ?
Si Twitter intéresse Google comme paradigme de service temps réel, si Google s'intéresse de si près à ce micro-net, à cette statusphère conversationnelle en perpétuel mouvement et aux unités de publication toujours plus atomiques, toujours plus fragmentées, c'est uniquement pour la globaliser, c'est à dire pour lui permettre d'en faire émerger des motifs ("patterns"), motfis qui viendront corriger l'indexation du monde en temps réel, comme autant de variables d'ajustement :

  • "We think the real-time search is incredibly important and the real-time data that's coming online can be super-useful in terms of us finding out something like, you know, is this conference today any good? Is it warmer in San Francisco than it is in Silicon Valley? You can actually look at tweets and see those sorts of patterns, so there's a lot of useful information about real time and your actions that we think ultimately will reinvent search."

6 milliards de puces RFID géolocalisées. Et moi, et moi et moi. 

  • "We think the real-time search is incredibly important and the real-time data that's coming online can be super-useful"

Real-time search. Real-time data. Real-time web. Real-time dataweb. Dataweb. Web des données. Données immédiates du web. Webmédia des données. Websearch. Datasearch. Google c'est "la" base de donnée. Le monde, tel qu'il se donne à lire quotidiennement en ses différents capteurs, ambiants et mobiles, c'est l'autre banque de données. Dualisme. Dualité. L'une est l'internalité, l'autre son externalité. Les deux faces d'un même ruban. Industrielles engrammations. Industrieuses programmations. Google géolocalise le monde. Il met la carte à l'échelle du territoire. Non pas "une" carte à l'échelle "du" territoire, mais autant de cartes que le nécessite ma mouvante territorialité. Google indexe tout et tout de suite. Dans toutes les langues. A tous les niveaux de granularité. Dans toutes les médiasphères.

Pour réunir en une même sphère d'indexabilité les informations relevant du public, du privé et de l'intime, il avait besoin que l'homme devienne un document comme les autres. Pour indexer le réel il a maintenant besoin que l'homme devienne un "appareil" comme les autres. 6 milliards. 6 milliards d'êtres humains demain ou après-demain tous équipés d'autant de téléphones, smartphones et autres ordinateurs portables ou objets communiquants. 6 milliards de puces RFID, toutes synchrones avec le monde dans lequel elles évoluent, toutes synchrones avec les informations qu'elles produisent et consomment. Toutes synchrones avec les images qu'elles captent, voient ou diffusent.

Et dans l'imaginaire tangible de la firme de Mountain View ... toutes reliées à Google.

Source initiale de ce billet : l'interview de Marissa Mayer dans le Guardian, également disponible en version "intégrale".

Faites briller les Chromes : Google OS est officialisé.

Le 2 Septembre 2008, à propos du lancement du navigateur Google Chrome, j'écrivais ceci :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. (...) En Avril 1975, deux étudiants américains fondent leur société. Ils l'appellent Microsoft. 10 ans plus tard, en 1985, la première version de Windows débarque sur le marché ... En Septembre 1998, deux étudiants déposent le nom de domaine Google.com. 10 ans plus tard ..."

Presque 2 ans plus tard, le 7 Juillet 2009, Google officialise la sortie programmée de "son" OS, basé sur "son" navigateur Google Chrome :

  • "the operating systems that browsers run on were designed in an era where there was no web. So today, we're announcing a new project that's a natural extension of Google Chrome — the Google Chrome Operating System. Google Chrome OS is an open source, lightweight operating system that will initially be targeted at netbooks."

Le WebOS c'est quoi ??
Le webOS c'est la migration du "Desktop" (bureau comme interface du disque dur) vers le "Webtop" (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack avait rédigé sur le sujet un article de référence qu'il n'est jamais trop tard pour relire : "The future of the Desktop".

Le WebOS c'est quand ??
Pas d'affolement. Ce sera pour la seconde moitié de 2010 selon le billet d'annonce de Google. A  moins ... à moins que Microsoft ne lui grille la priorité lors de la prochaine annonce de son prochain système d'exploitation. Laquelle annonce doit intervenir prochainement. Ce qui conduit à se poser la question de l'opportunité d'une telle annonce de la part de Google, à quelques jours de l'annonce du prochain OS de Microsoft (annonce prévue pour Lundi prochain). Car entre ces deux-là c'est naturellement une éternelle course à l'innovation. Et les effets d'annonce ... s'ils sont opportunément ciblés ...
D'ailleurs, finalement, pas besoin d'attendre 2010 pour expérimenter le WebOS : vous l'utilisez tous les jours : chaque fois que vous consultez vos mails en ligne, chaque fois que vous alimentez un compte FLickR ou DailyMotion, chaque fois que vous travaillez sur un Wiki ou échangez et partagez des documents, chaque fois que vous faîtes une recherche sur Google, chaque fois que vous activez un historique de recherche, chaque fois que vous vous identifiez en ligne pour bénéficier d'un service. Le WebOS, vous y êtes déjà !

Le WebOS de Google ressemblera à quoi ??
D'après le billet de Google, il sera Open Source (ce qui permet à la firme de bénéficier des meilleurs développements et de la meilleure diffusion possible à moindre coût), "légér" (c'est à dire qu'à la différence de ses glorieux aînés dont la longue série des Windows, il ne devrait pas nécessiter des kilo-tonnes de ressource mémoire pour lancer une application de traitement de texte). Il sera "rapide", "simple", et "sécurisé", les éternels 3S ("Speed, Simple & Secure").
L'interface sera "minimale" et l'utilisateur, comme dans Google Chrome, n'aura pas à se soucier de problèmes de virus et autres malwares, c'est Google qui se chargera de tout (en maintenant, par exemple, une liste de malwares). Voilà pour la couche de base.
Les applications seront multi-plateformes : "apps will run not only on Google Chrome OS, but on any standards-based browser on Windows, Mac and Linux thereby giving developers the largest user base of any platform."
Et je l'installe où mon webOS ? Premiers visés, les Netbooks (mini-pcs). Et naturellement l'ensemble de la gamme des cellulaires, sur laquelle Google est déjà positionné avec Android. Deux développements qui ne sont pas indiqués comme concurrents, mais qui bénéficieront nécessairement de passerelles ou de couches communes de développement. Mais pas seulement. Les ordinateurs du bureau "classiques" sont également visés.

Que retenir de tout ça ??

Ce qui est frappant à la lecture du billet de Google, c'est l'insistance mise sur les comportements et les attentes "full-web" des utilisateurs (avoir un ordinateur qui "démarre vite", consulter ses mails, partager des documents, etc ...). Frappant mais loin d'être étonnant : tout cela est la suite logique :

  • de la dérive des continents documentaires,
  • de l'essor (et de l'optimisation) des terminaux de téléphonie mobile (dont naturellement l'I-Phone),
  • de la migration "dans les nuages" de l'ensemble des nos comportements informationnels
  • et, in fine, des programmes et outils les sous-tendant.

D'ailleurs, c'est pas pour faire le malin, mais le 21 Avril 2005, Le Monde reprenait à sa une un billet intitulé : "Le jour où notre disque dur aura disparu." Notre disque dur n'a finalement pas disparu mais (c'était la thèse défendue dans l'article), il s'est entièrement déplacé. Il est aujourd'hui "dans les nuages" (cloud computing). Un peu comme dans la métaphore de l'oignon (déjà utilisée par d'illustres aînés), de couches en couches (d'abord les mails, puis les photos, puis les applications permettant de retoucher les photos, puis les "suites bureautiques", puis le stockage massif de fichiers en tous genres, puis les protocoles de travaux collaboratifs en tous genres, etc ...), de couches en couches, ne reste aujourd'hui de feu notre "environnement de travail de bureau" que l'essentiel : un bouton marche-arrêt, une interface, une clé - celle du moteur-monde -, et une porte - celle navigateur planétaire. C'est précisément cet essentiel auquel Google propose aujourd'hui de s'attaquer.

Par le petit bout de la lorgnette.
L'officialisation du lancement d'un OS Google 100% full-web bâti autour de son navigateur ne surprendra donc pas les analystes, même si certains feindront l'étonnement ou affirmeront ne pas y croire en indiquant qu'il s'agit là pour l'instant d'un simple effet d'annonce. Ce que nous raconte l'annonce de ce prochain webOS, c'est l'inversion totale de la stratégie d'équipement d'une grande firme industrielle. Les deux approches (Microsoft et Google) sont des symétries parfaitement opposées. Microsoft à toujours joué la carte de la périhérie : il s'agissait de fournir le pack complet, de négocier avec les fabriquants pour l'installation par défaut de Windows, bref de faire en sorte d'encercler totalement l'utilisateur pour pouvoir ensuite se recentrer sur les services (mises à jour, nouvelles versions, patchs, anti-virus, etc ...). La stratégie de Google est d'une immuable centralité : Le moteur de recherche était là au départ, et c'est, encore 10 ans plus tard le même moteur qui conditionne l'existence même du navigateur (grâce par exemple à la base de donnée constituée en temps réel sur les différents sites de malwares), comme c'est le même moteur de recherche qui conditionne le futur WebOS. Ce que nous raconte l'annonce de Google Chrome au-delà de l'informatique dans les nuages, c'est que cet OS sera développé pour des utilisateurs qui l'ont (déjà) choisi et resteront libres d'en choisir un autre (liberté illusoire tant ils sont déjà prisonniers consentants de l'écosystème Google). Ce qui là encore est l'exact opposé - et le principal souci - de Microsoft.
Ce qui est fascinant dans tout cela c'est que la stratégie de Google apparaît limpide, à l'unisson de l'évolution actuelle du web. Comme une métonymie assumée autant que programmatique. Comme une boucle qui s'achève. Où comme un étau qui se resserre encore davantage. Sur chacun de nous. Inexorablement.

<Update de 5 minutes plus tard> A noter également comme une magnifique et prometteuse illustration du WebOS, cette annonce d'un système d'exploitation complet et open source tenant, avec l'ensemble de ses applications (un 40aine de logiciels également open source), sur une clé USB à 5$ ... le tout dans le cadre du programme OLPC (One Laptop Per Child) ... On en reparle à la rentrée ... </Update>

Z'en parlent aussi :

Industries des données ou écritures industrielles ?

En écoutant Bernard Stiegler hier sur France Culture dans l'émission "du grain à moudre", je me disais que dans la gradation technologique qui mène du Fordisme à Google, on pourrait établir le genre de hiérarchie suivante :

  • Première pèriode industrielle (1950-1980) : les technologies du "faire" (ère industrielle). La valeur, ce sont les matières premières utilisées dans les chaînes de production.
  • Seconde période industrielle (1980-1997) : les technologies de l'intelligence (l'ouvrage éponyme de Pierre Lévy est publié en 1993). C'est l'avènement du web, des réseaux comme nouvelle infrastructure industrielle. La valeur se tient cette fois dans la perpétuelle dispersion / ré-agrégation des contenus disponibles. La valeur, c'est le lien hypertexte pour le dire plus simplement.
  • Troisième période industrielle (1998-2003) : les technologies de l'accès. Dont on pourrait poser la naissance en même temps que celle de Google. La valeur est alors celle de la mémoire. Mémoire informatique externalisée. Externalisation de nos mémoires documentaires. Google c'est "La" base de donnée (pour reprendre l'expression utilisée par Stiegler dans l'émission en question)
  • Et (il me semble en tout cas), nous basculons lentement mais sûrement dans une quatrième période industrielle (2003-200?), celle des technologies de la capillarité et de l'artefact, bâties autour de mémoires informatiques industrialisées mais autour également d'une "industrialisation de l'intime" (pour reprendre l'expression d'Alain Giffard) qui se donnent - notamment - à lire dans les réseaux sociaux (en 2003, nombre de réseaux sociaux "majeurs" ont atteint un large public). Le système de valeur que se choisira cette quatrième période industrielle pourrait être directement "indexé" sur la porosité choisie, induite ou subie entre notre identité documentaire (les traces que nous laissons sur le réseau) et notre présence retournée (= la collecte et l'agrégation de ces traces telles qu'elles se donnent à lire une fois remixées par les industries des données - moteurs de recherche et réseaux sociaux en tête). Soit le passage d'une externalisation de nos mémoires documentaires à une externalisation de nos intimités mémorielles documentées. Une autre dimension essentielle de cette monnaie sera très probablement celle du synchronisme, défini comme la capacité à faire correspondre les traces de nos activités et les indices de notre présence en ligne. Les questions qui se posent sont naturellement innombrables. L'une des plus saillantes me semble être celle de l'industrialisation possible du décalage qui existe entre ce que nous sommes, ce que nous voudrions être, et ce que nous donnons à lire de nous dans nos systèmes d'écriture sur les réseaux, dans les traces documentaires et documentées que nous y laissons. C'est probablement là un nouveau "temps" pour nos systèmes d'engrammation. Davantage peut-être que des lectures industrielles (Alain Giffard encore), la préemption de l'ensemble de nos traces connectées et déconnectées par les industriels de l'accès et des données, me semble relever de stratégies d'écritures industrielles.

Et demain ? Avec l'internet des objets ("everyware"), avec le web des données, avec la sémantisation des protocoles de recherche et d'interactions en ligne, avec la frontière abolie entre l'intime, le privé et le public, avec le réagencement permanent et la rémanence sans cesse accrue des synchronismes entre le monde réel et le monde numérique ... l'ère qui s'ouvre devant nous verra probablement la fusion des "anciens" agencements machiniques supportant nos lectures industrielles (moteurs de recherche et réseaux sociaux) en un seul nouvel agencement symbolique, une seule entité, une seule monade calculatoire - qui restera diversement instanciée. Le risque est d'y voir se dissoudre, autour de logiques de souscription quasi-incantatoires, ces agencements collectifs d'énonciation qui bâtirent le web. Une dissolution au profit (et nécessairement "for-profit") de la génération auto-entretenue d'écritures industrielles singularisées.
Economie des écritures industrielles.
Je note par ailleurs en même temps que je l'écris, que la "génération auto-entretenue d'écritures industrielles singularisées" est une définition qui semble parfaitement circonscrire le périmètre et l'enjeu de l'affichage des publicités contextuelles et ciblées (Adwords et Adsense). Depuis déjà 10 ans, l'industrie des données met toutes ses forces dans la bataille pour ne jamais tarir la source des ces écritures industrielles. Elle peut ajourd'hui y déverser en temps réel l'intimité de nos mémoires documentaires et documentées. C'est peut-être la clé d'un web à venir, un web implicite mais dont l'implicite ne s'analysera plus seulement à l'aune des artefact techniques proposés.

Le web (implicite ?) de demain est celui que construisent aujourd'hui les agencements algorithmiques qui permettent la génération auto-entretenue d'écritures industrielles singularisées.

L'évidence même.

L'index de Google est - ou devrait être - un bien commun de l'humanité. Et à ce titre nous appartenir collectivement. Merci à Pierre Mounier d'avoir souligné cette évidence. Preuves à l'appui.

Du "cloud computing" au "home computing" : comment le web devînt fractal.

Cloud computing.
On connaissait déjà depuis quelques temps l'âge d'or, les promesses (et les dangers) du "cloud computing", de l'informatique dans les nuages. Le réseau internet repose depuis son invention sur une architecture "client-serveur". Le cloud computing permet à chacun de nous d'être les innombrables "clients" (au double sens du terme) d'une gigantomachie dans laquelle Google, Amazon et quelques autres s'affrontent à grands coups de datacenters et autres "fermes de serveurs". C'est là le climax d'une polarisation extrême de l'architecture client-serveur.
Home computing.

Imaginons maintenant que la polarisation s'inverse et qu'au lieu de disposer de quelques giga-serveurs centralisant l'offre de contenus et de données de la planète internet toute entière, nous retrouvions une architecture dans laquelle chacun d'entre nous demeurerait client mais disposerait à part égale de la possibilité de devenir un serveur. Une sorte de forme réinventée et légèrement décalée de l'architecture peer-to-peer (ou le passage par un point nodal externe aux clients connectés reste obligatoire). Imaginons donc que chacun de nos ordinateurs personnels, via son navigateur, puisse devenir son propre serveur et ainsi proposer à des tiers d'accéder librement à son contenu (téléchargement d'images, de films, de musique) voir même auto-héberger des pages web. C'est la prouesse (?) que vient de réaliser le navigateur Opera avec le lancement d'une nouvelle version de son navigateur baptisée "Opera Unite".

Le WebOS enfin réalisé ?

Il y a belle lurette que la guerre des navigateurs fait rage. Il n'est donc pas impossible que cette sortie soit d'abord un coup marketing pour permettre à Opera de sortir de la zone de confidentialité dans laquelle Internet Explorer, Chrome et Firefox le relèguent. Mais. Mais je viens de tester et d'installer Opera Unite avec un camarade de jeux qui a bien voulu en faire de même. Et le fait est que c'est totalement bluffant.
L'avènement de l'informatique dans les nuages a fait du webOS un enjeu central pour les grands acteurs de l'internet. Comme je l'écrivais dans ce billet :

  • "Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur."

Fractale_1 Le web fractal. Le webOS était donc réalisé, incarné, sur la scène et sous les auspices des quelques géants du cloud computing, de l'informatique distribuée, "dans les nuages", mais tout aussi massivement distribuée que commercialement vérouillée.
Si la poursuite des essais d'Opera Unite demeure concluante, si celui-ci tient toutes ses promesses, c'est à un nouvel avatar du web qu'il va falloir nous habituer. Un web parfaitement et rigoureusement fractal. Chaque navigateur de chaque ordinateur connecté au réseau devenant son propre client, son propre serveur, son propre client-serveur, son propre internet. C'est là tout l'enjeu du Home Computing.

Quelques réflexions à chaud : vers une nouvelle partition des flux numériques.

  • Tout comme le cloud computing adressait - au sens strict - d'énormes problèmes de confidentialité, ses principaux acteurs disposant de tous les moyens et de toutes les ressources pour constituer une base de donnée des intentions à l'échelle planétaire.
  • Si Opera Unite s'installe dans les pratiques, les marchés des industries culturelles et les projets ubuesques "Hadopi-like" risquent fort de n'avoir pas 6 mois mais bien 10 ans de retard. R.I.P. Hadopi. R.I.P. Christine Albanel. R.I.P. Pascal Nègre. Ce pourrait être un électrochoc comparable à celui que représenta l'avènement de peer-to-peer il y a de cela quelques - courtes - années.
  • Dans une telle configuration, impossible - sauf pour Opera ... - de contrôler quelque flux que ce soit, sauf à imposer des fichiers mouchards à tous les ordinateurs individuels de la planète, ou sauf à transformer tous les FAI (fournisseurs d'accès à Internet) en zélés délateurs doublés de Vidocqs des réseaux.
  • Cette nouvelles architecture fractale du Home Computing va également poser, non plus aux autorités politiques, commerciales ou judiciaires, mais bien aux utilisateurs eux-mêmes, d'énormes problèmes de confidentialité et de sécurisation de leurs données personnelles. En poussant à peine un peu les scénarios imaginables, on pourrait même se retrouver dans une situation diamétralement inverse à celle que nous connaissons actuellement, situation dans laquelle les particuliers confieront (pour des raisons de sécurité) leurs données importantes aux des acteurs majeurs du cloud computing, pour laisser le home computing transformer leurs ordinateurs personnels en simples terminaux d'échanges. Une virtualisation totale de l'échage et du stockage numérique, mais avec une nouvelle "partition" (au sens informatique du terme) des espaces et des termes mêmes de l'échange. 

Quelques liens pour une découverte plus approfondie de l'outil et des enjeux :

(Sources : sous les liens // Temps de rédaction de ce billet : 2 heures, tests du navigateur non-inclus :-)


Iran net

Published on 16/Jun/2009

"La république islamique d'Iran continue d'étendre et de consolider ses systèmes techniques de filtrage, qui sont parmi les plus étendus au monde. Un système centralisé pour le filtrage de l'internet a été mis en place qui accroît davantage le filtrage déjà effectué au niveau des fournisseurs d'accès à Internet (FAI). L'Iran emploie désormais sa propre technologie pour identifier et bloquer les sites dissidents, réduisant ainsi sa dépendance à l'égard des technologies de filtrage du monde occidental. (...) Les "agences de régulation" chargées de policer l'internet continuent de s'étendre. (...) Conjointement à l'expansion de la surveillance, cette augmentation des "régulations" exacerbe une athmosphère qui encourage l'auto-censure et dissuade de toute pensée dissidente. Le blocage des sites web de partis politiques durant les les élections présidentielles de 2009 a redonné de l'énergie aux opposants à la censure de l'internet en Iran et a attiré l'attention du monde sur le problème du contrôle de la presse."

Version originale disponible ici : http://opennet.net/research/profiles/iran

Suit également un tableau rappelant quelques indicateurs-clés

Iran

L'occasion de (re)découvrir le formidable travail de l'OpenNet Initiative

L'amateur, le web et l'économie de la contribution.

  • "En les soumettant au marché, on détruit le désir, qui est réduit à un calcul. Cela produit une société démotivée, qui a perdu toute confiance en elle, où il n'y a plus de relations sociales, et où triomphe le contraire du désir, à savoir la pulsion : la guerre de tous contre tous, une société policière, comme tend à le devenir la société sarkozyenne. Une société très dangereuse."

Bernard Stiegler. Entretien à lire dans Télérama. On y lit aussi la préférence de Stiegler pour la dénomination de web "contributif" plutôt que "participatif". A propos de l'économie de la contribution et la figure de l'amateur si souvent galvaudée dans le cadre des analyses du web 2.0 contributif, Stiegler déclare :

  • "Il y a cinquante ans, la politique culturelle de Malraux était destinée à former des amateurs d'art, et non des consommateurs de culture. Les technologies culturelles et l'économie de la contribution revalorisent cette figure de l'amateur - c'est-à-dire du public capable de discerner et d'apprécier."

Bien que moins liée aux thématiques de ce blog, vous m'autoriserez tout de même à attirer votre attention sur la conclusion de l'entretien, conclusion dans laquelle Stiegler défend l'idée d'un revenu minimum d'existence :

  • "Je soutiens une vieille idée défendue par le plus libéral des libéraux, Milton Friedman : le revenu minimum d'existence. Idée qui a été relancée par André Gorz et que promeuvent en ce moment Olivier Aubert, Maurizio Lazzarato et Yann Moulier-Boutang. Ils prennent l'exemple de l'abeille, qui produit du miel, mais dont la valeur tient bien plus à sa fonction de pollinisation, qui permet la reproduction des végétaux, la nourriture des animaux et notre propre survie... Aujourd'hui, de plus en plus de contributeurs créent une valeur qui ne s'évalue pas sur le marché mais permet aux autres activités économiques de se développer. Cette « pollinisation » doit être rémunérée et mutualisée."

Bonne lecture sur Télérama :-)

Moteur sous ordonnance.

Octobre 2007. Avant-hier, les moteurs vous offraient de rassembler en un même espace de type "portail" l'ensemble de vos données médicales.
Mars 2008. Hier ils inventaient la médecine 2.0 et en profitaient pour mettre la main sur la gestion de votre dossier médical.
13 Mai 2009. Aujourd'hui, quand vous tapez ibuprofène (ou aspirine), les moteurs médecins vous demandent le motif de votre requête. Ils se renseignent en menant, à l'échelle mondiale, une enquête statistique sur les requêtes ayant trait à la santé

Ibuprofen
Demain ... Quand vous taperez migraine, ils vous délivreront directement une ordonnance ... Vous n'aurez à vous occuper de rien. Votre assurance médicale en sera immédiatement alertée, votre compte bancaire tout aussitôt débité, le dossier laissé dans le dernier hôpital que vous avez fréquenté sera aussitôt mis à jour, et avant même de vous délivrer et de vous permettre d'imprimer votre ordonnance, ils auront au préalable vérifié dans votre dossier médical qu'il n'y a pas de contre-indications à ce traitement.

De Google à la CNIL. Et retour.

Google : bâtisseur de panopticon.
"Si venaient à passer dans toutes les rues de nos villes et villages des camions irakiens ou chinois bardés d'appareils de photographie à 360°, le pouvoir très probablement crierait à l'espionnage et enverrait l'armée pour paralyser sur le champ l'action de ces photographes venus d'ailleurs pour cartographier les infrastructures du pays dans les moindres détails. Car il en faudrait du culot pour venir ainsi jusqu'aux portes de nos maisons, faire la photo du patrimoine de tous les habitants, pour ensuite transférer toutes ces données dans des serveurs énormes, où elles seraient probablement recoupées avec des données d'imagerie satellitaire de très grande précision, puis avec des bases de données nominatives et de toutes autres natures glanées ça et là sur des réseaux sociaux, dans des banques, des commerces, des administrations, achetées ou volées."
Oui mais quand c'est une société californienne qui se livre à ce genre de pratique, nul ne semble s'alarmer. Je vous incite vivement à lire ce billet qui dit brièvement et bien une problématique de plus en plus pesante.

La CNIL au centre du débat.

Quand vous l'aurez lu, je vous invite ensuite à lire attentivement le pathétique et passionnant appel au secours du président de la CNIL, appel relayé par Politis.
"Plus aucun secteur d’activité, plus aucune parcelle de notre vie individuelle et collective, n’échappe désormais au développement et à la pression des technologies nouvelles de l’information. Dès lors, plus aucun aspect de la vie en société n’échappe à la réflexion et à l’action de notre commission. C’est dire combien je mesure le poids de nos responsabilités, mais aussi l’intensité des attentes de nos concitoyens et l’exigence de la demande des pouvoirs publics.
Comment faire face ? C’est simple : il faut être indépendants, compétents et efficaces !
Nous devons être indépendants. A ce titre, l’année que nous venons de vivre a été, une nouvelle fois, mouvementée puisque nous avons dû faire face à une offensive survenue sous la forme d’un amendement parlementaire remettant en cause gravement notre budget. Mais, en même temps, le Gouvernement nous apportait un soutien sans réserve en repoussant l’essentiel de cet amendement et en nous accordant une augmentation substantielle de notre budget de personnel et de fonctionnement. Quoiqu’il en soit, ma conviction est faite : nous ne pouvons plus continuer ainsi et il est devenu absolument nécessaire de mettre en place une nouvelle formule de budget garantissant notre indépendance (...) Dans ce présent rapport, on trouvera une présentation de ce projet appelé « financement à l’anglaise ». Dans le même esprit, nous avons été amenés, dans le cadre du débat relatif à la création, lors de la révision constitutionnelle de juillet 2008, d’un Défenseur des droits fondamentaux, à exposer les raisons pour lesquelles en aucune manière notre Commission ne pourrait se voir soumise à un pouvoir hiérarchique émanant de celui-ci. Mais il est un moyen à la fois symbolique et concret, sur le plan juridique, de mettre en exergue cette légitimité : il s’agirait dans une éventuelle prochaine révision constitutionnelle, de reconnaître le droit à la Protection des données personnelles, au titre de nos droits fondamentaux, comme l’ont fait, à ce jour, 13 Etats membres de l’Union européenne. Mais ceci est une autre histoire… et un autre combat.
"
A lire dans le dossier de presse (.pdf) accompagnant le 29ème rapport annuel de la CNIL (.pdf).

Comme un diffus sentiment de profond malaise ...

La scène se passe au 20h de TF1. Premier journal d'information sur cette tranche là en termes d'audience. Le présentateur reçoit un invité venu parler de son livre dans lequel il attire dénonce les risques qu'encourt aujourd'hui la liberté de la presse. Et puis, tel un Deus ex machina, le PDG de la chaîne, Martin Bouygues, entre sur le plateau du 20h de TF1. Il "passait par là", il "regardait le JT" et il est tout simplement venu dire, en direct à l'invité, que "sa présence sur ce plateau était bien la preuve que la liberté de la presse n'était pas menacée, qu'il en était le garant", que "oui il fallait être vigilant", mais qu'il ne fallait pas non plus crier tout le temps au loup.

Cette scène ne s'est (heureusement) pas produite. En revanche ce matin sur France Inter, première tranche horaire radiophonique en termes d'audience, Edwy Plenel était invité pour parler de son dernier livre "Combat pour une presse libre." Il advînt que Jean-Luc Hees, nouveau président de Radio France nommé par le chef de l'état, passait par là. Et que passant par là il s'introduisit sur le plateau pour indiquer à Edwy Plenel que "sa présence sur ce plateau était bien la preuve que la liberté de la presse n'était pas menacée, qu'il en était le garant", que "oui il fallait être vigilant", mais qu'il ne fallait pas non plus crier tout le temps au loup. "Aboyer" fut ici le terme exact qu'il employa.

En écoutant cette scène dans ma voiture j'ai été saisi d'un très étrange et très persistant malaise. Non pas que Jean-Luc Hees n'ait pas le droit de répondre à Edwy Plenel quand celui-ci aborde la question de la nomination des PDG des chaînes de l'audiovisuel public. Mais Jean-Luc Hees a, ce me semble, toutes les occasions et tous les moyens de le faire, sur "sa" radio ou dans bien d'autres médias. Il y a ce sentiment diffus d'un pouvoir qui systématise l'urgence à circonscrire toute parole potentiellement "déviante", ce sentiment diffus d'une implacable machine à réfuter, à démentir immédiatement et in-médiatement tout argumentaire pouvant laisser accroire que des menaces réelles pèsent sur la liberté de la presse.

En tant que citoyen et fidèle auditeur d'Inter depuis de très longues années, j'ai beaucoup d'estime pour Jean-Luc Hees, pour son boulot, pour ce que je suppose être sa réelle intégrité et pour ce qu'il a depuis de longues années donné à voir de son éthique professionnelle. Et très sincèrement je ne l'imagine pas agir sur ordre. La réalité est naturellement bien plus compliquée que cela. Mais ce matin, j'ai le sentiment "étrange et pénétrant" que la liberté de la presse serait encore davantage garantie si les PDG de chaînes publiques n'éprouvaient pas le besoin de sortir de leur voiture et d'entrer sur le plateau à chaque fois qu'un invité vient dénoncer les risques du système qui les a mis en situation de responsabilité.

Cher Jean-Luc Hees, de grâce, la prochaine fois ... restez dans votre voiture.

<Update> Voir également la réaction et les premiers échos de Télérama, sur la vidéo, l'intervention de Jean-Luc Hees démarre à 13'38, le NouvelObs en parle également </Update>

<Update 15h27> lire également la réaction du SNJ, intitulée "Hees : troublante intrusion" et qui se conclut ainsi : "Que cela plaise ou déplaise à Jean-Luc Hees, et avec tout le respect que nous continuons de lui porter, la question du mode de désignation du PDG de Radio France est bel et bien un problème énorme, ce problème pèse et pèsera sur ses épaules, qu'il le veuille ou non, et ce n'est pas en déboulant sur les antennes qu'il s'en déchargera. Sa seule alternative c'est de couper le cordon ombilical avec celui qui l'a fait roi, en résistant, y compris à lui-même." </Update>


Aïe

Hadopi

Peut-on mettre des DRM sur le Temps ?

Il est quand même des moments ...

Des moments où l'on se dit que
, quand on prétend penser la (les) technique(s) vient le temps où il faut a minima en avoir sinon l'expérience, à tout le moins la connaissance, une connaissance que l'on n'aura pas l'exigence de vouloir empirique (tant la technique lui paraît indigne) mais simplement au moins théorique ou extérieure. Et pourtant Alain Finkielkraut pense la technique. Et pourtant Alain Finkelkraut pense notre rapport à la technique. Il le pense de la même manière que le clown Ronald MacDonald pense notre rapport à la nutrition : avec un gros nez rouge et de son seul point de vue.

Des moments où l'on se dit que si "ceux qui disent la loi" voulaient prêter le flanc à un anti-parlementarisme primaire ils ne s'y prendraient pas autrement. Des moments où l'on se dit que même si la fonction politique n'est pas d'être expert sur tout, elle ne consiste pas non plus à faire voter des textes dont on ne maîtrise aucun des enjeux, dont on ne maîtrise d'ailleurs même pas le seul vocabulaire.

Des moments où l'on observe penaudement les pathétiques et kafkaïennes errances de la machine à décerveler, de la machine à DRMiser ce que pourtant on croyait de toute éternité in-DRMisable. Des moments où l'on se dit qu'il aurait bien rigolé le père Léo de voir son oeuvre ainsi dévoyée. Reviens Léo, ils ont mis des DRM au temps ! D'ici à ce que ces jean-foutre en collent aux basques de Dieu ! Ceux qui ont la cravatte sans cigarette, ils n'ont peur de rien tu sais. Peur de rien pour le seule raison qu'ils ne savent pas ce qu'ils font, ils savent juste pour qui et comment ils le font. Mais une chose est sûre mon vieux Léo, dans tout ce qu'ils font, "de la noblesse et puis du style", et ben ils n'en ont pas. Ooooh non. Pas une once.

"les gens qui pensent en rond ont les idées courbes." Ceux qui votent Hadopi ... aussi.

Juste une question de Tempo.

PASSÉ

  • Le 27 Novembre 2005 je rédige sur mon blog établi scientifique un billet qui "acte" la dérive des continents documentaires, une petite théorie dont l'exploration me permettra d'un peu théoriser le caractère aujourd'hui indexable de l'être humain.
  • le 17 décembre 2007, je présente au CNAM dans le cadre d'un séminaire sur les réseaux sociaux une communication scientifique dont l'intitulé est : « L'homme est un document comme les autres : redocumentarisation et indexabilité au-delà des réseaux sociaux » (disponible ici)
  • Fin février 2008 je suis contacté par une collègue qui prépare la coordination d'un numéro de la revue Hermès sur la question de "l'identité numérique" et me demande de lui faire une proposition d'article sur la trame de ma présentation au CNAM.
  • Le 2 Mai 2008 j'envoie à la revue Hermès un résumé pour une proposition de communication sur ce thème. Proposition acceptée
  • Le 1er Juin 2008 j'envoie à Hermès la proposition d'article définitif.
  • Le 29 Septembre 2008, après quelques aller-retour avec le secrétariat de la revue, l'article a franchi les étapes de l'évaluation et est accepté dans sa forme définitive. 

PRÉSENT

  • Le 10 Avril 2009 paraît le numéro 53 de la revue Hermès, contenant ledit article sous le titre :  "L'homme, un document comme les autres". 25 euros.
  • (Rappel légèrement hors-sujet : l'auteur - moi - ne touche rien. Le 25 euros servent à couvrir les frais d'édition et - dans certains cas - de secrétariat de rédaction. Le referees - relecteurs - non plus ne sont pas payés ... je ne précise pas cela pour vous mais pour mon ami Christophe Barbier qui croit qu'on est tout le temps payé, même quand on fait grève)
  • Accompagnant la livraison de "mon exemplaire auteur", le courrier reçu du secrétariat de rédaction de la revue Hermès, daté du 10 Avril 2009 stipule : "Dans 2 ans, votre article sera mis en ligne sur Internet (sur le site de l'Inist), de même que les articles des autres contributeurs du n°53 (et que l'ensemble des autres numéros d'Hermès). Cela afin de diffuser les résultats de vos recherches le plus largement possible.(sic)"

FUTUR

  • 10 Avril 2011 : mon article, présenté sous forme de séminaire en décembre 2007, rédigé dans sa forme finale en Septembre 2008, publié en Avril 2009 dans une revue papier est disponible sur Internet en Avril 2011 ... soit 4 ans plus tard. 

De Décembre 2007 à Avril 2011. J'ignore si en Avril 2011 l'homme sera, ou non, un document comme les autres. Ce que je sais c'est que comme JE ne suis pas payé pour écrire cet article, comme JE ne touche aucun poucentage sur les ventes, comme IL s'agit de recherche "publique", comme ILS (les referees et coordinateurs scientifiques de la publication) ne sont pas payés non plus, IL devrait être possible pour l'organisme public qu'est le CNRS (au travers de sa maison d'édition, CNRSéditions) de trouver de quoi payer l'impression, les frais du secrétariat de rédaction de la revue Hermès, ainsi que la diffusion minimale de la même revue. Plus précisément, concernant les résultats de la recherche PUBLIQUE, je trouve qu'il est un peu dommage que la revue Hermès - qui est dans notre champ une référence - n'offre pas à ses auteurs la possibilité, a minima, de déposer les métadonnées de l'article et la version préprint (= la version initialement soumise AVANT les aller-retour éditoriaux entre les reviewers, l'auteur et/ou le secrétariat de rédaction) dans une archive ouverte. D'autant que côté Archives Ouvertes au CNRS, y'a pas non plus à chercher très loin pour en trouver une

Chacun sa route, chacun son chemin
.
... Le travail du chercheur est de creuser inlassablement certains sillons : dans son laboratoire, sur sa paillasse, dans sa cuisine, et parfois même sur son blog. Ce qui, pour la problématique essentielle de l'article publié par la revue Hermès, est le cas depuis environ fin 2005.
... Le rôle des conférences scientifiques est de permettre de présenter une vision un tant soit peu élaborée de ce patient labourage, devant ses pairs. Et d'en débattre. Et d'y nouer des contacts. Et d'y donner l'essor à des projets de publication scientifique (entre autres). Rôle ici joué par le séminaire du CNAM.
... Le rôle des éditeurs scientifiques est de stabiliser et de fixer les connaissances dans le cadre strict de l'évaluation par les pairs. Rôle ici joué par la revue Hermès. Mais ce rôle est aussi, me semble-t-il, d'en assurer la diffusion la plus large possible, sinon auprès du grand public, à tout le moins auprès des communautés scientifiques possiblement concernées (en évitant si possible certaines pratiques mafieuses). Communautés de plus en plus large du fait de la transdisciplinarité de plus en plus fondamentale (et en un sens fondatrice) qui traverse l'ensemble des connaissances produites aujourd'hui. Cette dernière mission (diffusion la plus large possible) paraît a fortiori naturelle quand l'éditeur est également un organisme de recherche publique, le CNRS en l'occurence pour la revue Hermès.

Si, si. C'est possible. (Et ça c'est cadeau).
Il est aujourd'hui techniquement et contractuellement possible de diffuser dès sa parution un article scientifique. Trop peu d'auteurs le font pourtant. Les raisons sont nombreuses : frilosité des éditeurs à leur signaler cette possibilité, idées reçues et poncifs entretenus, ignorance des enjeux et des moyens, manque de temps, de formation, etc ... Pourtant des revues (DOAJ), des institutions au double sens du terme (MIT) et des universités partout dans le monde (en belgique notamment) sont de plus en plus nombreuses à donner l'exemple.

Juste une question de tempo.
La question des modèles économiques de l'édition scientifique universitaire est une chose. Le droit au libre accès immédiat aux résultats de la recherche financée sur fonds publics en est une autre, et ce indépendamment même des questions (par ailleurs importantes) de visibilité institutionnelle ou de carrière personnelle. Comme autant de variations sur un même thème il est autant de problèmes connus que de solutions possibles : embargo, barrière flottante, dépôt immédiat des métadonnées pour en permettre le moissonnage, obligation de dépôt en archives institutionnelles (quand les universités en possèdent une ...), et quelques autres (variantes) encore. Et comme le dit la vieille devise Shadock : "S'il n'y a pas de solution, c'est qu'il n'y a pas de problème". Mais là n'est pas à mon sens la question essentielle. La question n'est d'ailleurs même plus de savoir combien de temps encore ce tempo là de la publication scientifique sera raisonnablement acceptable, économiquement rentable et épistémologiquement cohérent. La question est ailleurs. La question est celle du tempo.
Le tempo des auteurs à l'heure de leur immédiat de recherche. 
Le tempo des éditeurs et diffuseurs à l'heure de l'in-média.
La question est celle de savoir si oui ou non on décide aujourd'hui de délibérement priver le champ scientifique des possibilités offertes d'une transmission et d'une fabrication de la science in medias res.

Hermes

<Update de qques jours plus tard> Voir également :

</Update>

(Temps de rédaction de ce billet : 3 heures)

Les cons ça ose tout. C'est même à ça qu'on les reconnaît.

Fallait oser. Oser la loi Hadopi. Oser la coupure de l'Internet sans autorité judiciaire. Tant il est vrai que ... que le titre de ce billet.
Que dire de plus que ce qui a déjà été écrit, dessiné, analysé, disséqué, rapporté ... au sujet de cet archétype de la Fausse Bonne Idée (FBI) qu'est la loi HADOPI ?? Rien. Juste vous rappeler ou vous faire partager les analyses les plus - à mon sens - pertinentes sur la question.
Et tout d'abord l'image valant à elle seule 1000 mots :
Msg_industrie_divertissement_de_masse

(Source)
Et comme l'humour est le premier des pédagogues et que Brazil est un grand film, il vous faut naturellement voir sourire encore un peu avec ceci :

.

La vraie bonne idée dans tout cela, la seule, elle vient de Jamendo, qui annonce officiellement le "remerciement gradué" et enverra :

  • Premier avertissement : "un mail de remerciement à tout internaute qui aura téléchargé un des 200 000 titres disponibles gratuitement sur son site. Ce mail incitera l’internaute à partager la musique avec ses amis."
  • Deuxième avertissement : "une lettre de remerciement et un “kit du complice” constitué d’autocollants et de documentation à ses plus fidèles téléchargeurs qui pourront ainsi promouvoir leurs artistes et la musique libre."
  • Au bout de trois, on vous offre l'abonnement Internet : "Les multi-récidivistes ne seront pas oubliés : HADOPI veut suspendre leur abonnement Internet ? Jamendo le leur rembourse ! En effet, chaque internaute ayant réussi à convaincre un lieu public (bar, restaurant, …) de devenir un espace de culture libre avec Jamendo PRO, sera remercié par le remboursement d’un mois de son abonnement Internet."


Hadopi comme un symptome.
Celui d'une gouvernance. Une gouvernance malade des lobbys, malade du copinage, malade de l'image du chef et de l'inféodation caporaliste qu'elle fait émerger, malade d'obstination. L'idée fixe comme programme. La méthode F.U.D. comme seul argumentaire. La tableau d'honneur et le benchmarking bidonné comme seule pédagogie. Et l'obstination.

Obstination ad absurdum. Il ne suffit pas ...

Il suffit de l'avis d'un ami, il suffit du pouvoir d'un lobby dans lequel on compte quelques amis ou sur lequel on compte bientôt pouvoir compter, pour qu'une ânerie d'alcôve qui n'aurait jamais du dépasser le statut d'éructation de fin de soirée arrosée se trouve propulsée au rang "d'idée de l'année", telle la liberté (de couper) guidant le peuple (malhonnête). Et que dès lors, le gouvernement s'y obstine, s'y englue, s'y enferre, s'y enferme. Sidérant. D'autant plus sidérant que comme le rappelle Ecrans, "Contrairement à ce qui a été voté, il y a quelques jours par les députés, la CMP a décidé que l’internaute continuera à payer sa connexion en cas de coupure de son accès à Internet. Elle a également supprimé l’amendement, déposé par Alain Suguenot, qui proposait l’amnistie des internautes poursuivis sur des faits remontant à plus de 6 mois."

Hadopire. Personne n'a de mots assez durs pour qualifier la caporalisation rampante du net. Alain Suguenot (UMP) dans un email adressé à tous les députés après l’une des soirées de débat sur la loi HADOPI à l’assembléee nationale, écrit ceci : "Ce n’est pas la création que l’on protège. Ce sont les principes généraux du droit qu’on assassine."

Foin de diatribe, un peu d'analyse que diantre ! Soit. Mais d'abord un peu de pédagogie avec ce remarquable "digitalmeme" qui reprend l'historique contextualisé de la loi "création et Internet". Or donc maintenant ainsi avisé, précipitez-vous chez Dominique Lahary, sage et vertueux taulier d'une non moins sage et vertueuse Interassociation qui dit, sur ce sujet comme sur d'autres ou (encore) d'autres d'ailleurs parfaitement connexes, l'essentiel en quelques amendements et communiqués. Précipitez-vous également chez Piotrr, qui devant un projet de loi stalinien, fait très lucidement son auto-critique, et nous convie à signer le pacte des libertés numériques du réseau des pirates. Profitez de vos précédentes précipitations pour vous arrêter un moment chez Philippe Quéau et penser la résistance, celle d'un domicile numérique inviolable

Et puis il y eut le 9 Avril. Le jour des "socialists Ninjas". Compte-rendu de séance sur Pc-Impact. Le 9 Avril au matin, Hadopi est ratifiée par le sénat. Le 9 Avril après-midi, Hadopi est ratiboisée à l'assemblée. Arrêtsurimages raconte : "Adoptée quelques heures plus tôt par le Sénat, la dernière mouture du projet de loi Création et Internet, dit "loi Hadopi", a été rejetée sur les bancs de l'Assemblée nationale, à 21 voix contre et 15 voix pour." Crac. Boum. Hue.

Ninja 

Des députés socialistes planqués derrière une colonne de l'auguste assemblée qui se dévoilent au moment du vote pendant que leurs copains du gouvernement sont en train de s'empiffrer de frites à la cantoche

Fritesalacantoche

Beau comme l'antique et tout à fait conforme aux règles en vigueur dans l'hémicycle (voir les détails chez Maître Eolas). Vivifiant comme l'entrée de Sébastien Chabal en impact player à la fin d'un France-Australie d'anthologie. Roublardise ? Certes. Mais une roublardise qui répond à une forfanterie, celle de l'avant 9 avril, avec une loi votée à la sauvette par 16 députés.

Il y eut donc un avant 9 Avril.

16_gugus_hadopi_assemble_nationale_vote2

Il y aura un après 9 Avril.

Fin_hadopi_small1 

Mais n'allez pas croire que tout est fini. Ces gens-là ont l'obstination chevillée au corps. Prochain épisode le 27 Avril. Dans la coulisse législative, on s'arrête à remettre le couvert, pendant que dans la coulisse des intérêts financiers, l'après-Hadopi se prépare : si la castration numérique s'avère inopérante, ce sera la main au portefeuille, le prélèvement à la source. Mais pour quelle offre ? Pour quels usages ? De tout cela, étrangement, il n'est encore guère question. Cette série de débandades parlementaires n'aura donc pas suffit à signer la mort politique de la loi Hadopi. Le plus grave est que quelque soit l'issue parlementaire finale (on peut hélas supposer que les "Government Texas Rangers" ne se laisseront pas (sur)prendre une deuxième fois par les Socialists Ninjas), quelle que soit cette issue donc, le projet politique de l'Hadopi restera comme le stigmate d'un profond divorce. "Si la démocratie étatique ne s'accomode pas d'Internet, l'Internet démocratique se fera sans l'Etat."

Maintenant, et comme le rappelle Lionel Maurel, "il s’agit pour tous les acteurs intéressés d’en tirer la leçon et de construire de nouvelles solutions, par le jeu des contrats, sans plus attendre l’arrivée d’un Godot législatif qui ne viendra pas."

<Update du lendemain> Voir également l'excellent billet de Maître Eolas qui, après en avoir remis une couche sur le grand bazar législatif répressif engendré par l'application de la loi, pointe le fait que le vrai danger ne vient pas tant de l'Hadopi que de la CPD, la Commission de Protection des Droits. </Update>

(Temps de rédaction de ce billet : 4 heures // Sources : sous les liens)

Google (presque) Fatal Error.

Google fait une erreur et la totalité du web devient "indésirable".
Le 31 Janvier la totalité des sites internet accessibles depuis le moteur se voient affublés de la mention "ce site risque d'endommager votre ordinateur", mention assortie d'une page d'avertissement supplémentaire avant de pouvoir accéder à n'importe quel site. L'erreur n'aura duré qu'une heure. 55 minutes exactement. L'explication vint dans la foulée de la bouche de Marissa Mayer, sur le blog officiel de Google : pour filtrer les sites présentant des malwares (logiciels "espions"), Google travaille avec le consortium StopBadware. C'est ce consortium qui envoie à Google des listes actualisées avec les sites "dangereux", listes que Google fait ensuite remonter dans son index. Et là vint le bug ou plus exactement l'erreur humaine : quelqu'un mit le signe "/" dans le champ prévu pour lister les sites indésirables. Du coup, la totalité du web indexé par Google ... devînt indésirable.
Comme toute mésaventure touchant le géant, tout le mode s'est fait l'écho de cet événement, du blogueur anonyme jusqu'au New-York Times en passant par le gazouillis planétaire.
Il y a plusieurs manières de regarder ce "bug".
Le regarder comme ce qu'il est. C'est à dire une avarie d'un moteur, avarie d'origine humaine, promptement réparée, sans réel préjudice (les sites internet restaient accessibles depuis les autres moteurs même si la majorité des réactions dont j'ai été le témoin numérique cherchaient plutôt à comprendre "pourquoi" Google se mettait à planter plutôt que d'utiliser spontanément un autre moteur pour leur recherche ...).
Le regarder pour ce qu'il donne à voir. Un internet soudainement "effacé", subitement "inaccessible", soudainement "malveillant", subitement "filtré". Internet, somme d'un nombre considérable d'informations et de connaissances, Internet, silo informationnel aux dimensions à peine inimaginables. Internet inaccessible par une seule petite erreur humaine. Tous les sites du Net subitement devenus "indésirables" ou dangereux. Imaginez un seul instant que du jour au lendemain, tous les livres accessibles dans toutes les bibliothèques deviennent, par l'erreur ou la volonté d'un seul, subitement "indésirables" ... Fantasme ?
Le regarder comme la préfiguration d'un fantasme. Celui que nombre d'auteurs de S-F ont usé jusqu'à la corde. Le fantasme du crash mondial. Du Bug de l'en 2000. De la mémoire du monde (numérique) aussi subitement qu'irrémédiablement effacée, ôtée de "nos" mémoires. Machines hypermnésiques instrumentant ou occasionnant l'amnésie planétaire. Ce n'est probablement pas au hasard que ReadWriteWeb parle à propos de ce bug d'un "Epic fail".
L'erreur de Google doit nous interpeller.
Elle doit nous amener à reconsidérer nos usages. A sortir de la métonymie si pregnante qui a fait de cette partie (Google) la représentation du tout (le web).
Elle doit nous amener à nous pencher sur la double dimension du moteur. Un outil d'accès à l'information qui n'est pas l'information. Mais également de plus en plus, une infrastructure qui contient l'information : data centers, fibre optique, centres de données offshore, informatique distribuée. Le géant aujourd'hui ne se contente plus d'embrasser "la" toile, il fait exister "sa" toile, son réseau, son Internet, Le Googlenet.
Et le risque est là.
Le risque que "ceci tue cela". Que l'Internet aux contenus et aux accès préemptés par quelques grands acteurs de l'internet marchand ne se superpose à l'internet public avant que de le l'absorber et de le supplanter. Le risque pour l'usager de perdre toute lisibilité dans les tentatives, accidentelles ou organisées, de filtrage des accès ou des contenus.
Et l'on reparle de la neutralité du net et de la tendance actuelle au filtrage arbitraire.

Ce débat sur la neutralité nécessaire du Net est déjà ancien. Mais il n'a jamais été autant d'actualité. Piotrr sur Homo-Numericus nous livre une revue de presse parfaitement éclairante et accessoirement assez déprimante ... Revue de presse qu'il vous faudra compléter par la lecture du billet rebond d'André Gunthert, lequel renvoie vers le rapport "Enhancing Child Safety & Online Technologies", rapport final du Internet Safety Technical Task Force (également commenté ici), décembre 2008. Extrait du billet d'André :

  • "Les conclusions du rapport sont éclairantes. Les problèmes rencontrés en ligne par les mineurs ne sont pas différents de ceux auxquels ils sont confrontés en dehors du web, mais en sont plutôt le miroir. Internet augmente la proportion de contenus illégaux disponibles, mais n'accentue pas nécessairement l'exposition des jeunes à ces contenus. Ceux qui sont le plus susceptibles de les retrouver en ligne sont ceux qui ont déjà des comportements à risques ou des difficultés dans leur vie. Les dynamiques familiales et l'environnement social sont de meilleurs facteurs prédictifs de comportements à risques que l'usage des technologies numériques. Les réseaux sociaux ne sont pas les endroits qui exposent le plus aux déviances. Selon le commentaire qu'en propose Danah Boyd, qui a participé aux travaux de la commission, la question n'est pas «de savoir si internet est sûr ou pas, mais si les enfants vont bien ou pas. Et beaucoup d'entre eux ne vont pas bien.» «Après avoir pris en considération les données, explique-t-elle, je crois fermement qu'il faut arrêter de prendre internet pour la cause, mais au contraire commencer à le voir comme le mégaphone.»"


Les 3 Internets.
Le choix se pose aujourd'hui en ces termes :

  • il existe un internet (infrastructure) et un web (contenus) public. C'est celui des origines.
  • il existe aujourd'hui un risque de lui voir accolé un Internet et un Web filtré par les états.  
  • il existe aujourd'hui le risque de voir se développer, à côté, en parallèle ou en collaboration avec le fitlrage des états, un "Internet privé" dont, progressivement, l'essentiel des contenus et des infrastructures appartiendront aux quelques grandes sociétés marchandes se partageant le gâteau de la toute puissante algorythmie calculatoire qui règle et enregistre inexorablement l'ensemble de nos vies numériques.

Moralité : prenons garde aux coupures. D'où qu'elles viennent ...

(Voir aussi l'article d'Ecrans sur le sujet. // Temps de rédaction de ce billet : 45 minutes)


Anniversaire Wikipedien.

Anniversaire Wikipédien.
On fêtait il y a peu le dixième anniversaire du dernier des mohicans annuaires et celui du premier des moteurs. C'est aujourd'hui (enfin le 15 Janvier exactement) le 8ème anniversaire de l'un des trois piliers de notre révolution cognitive, j'ai nommé, Wikipédia. Wikipédia aujourd'hui c'est 265 langues et plus de 10 millions d'articles.
Un anniversaire et des projets plein sa besace dont ReadWriteWeb nous révèle l'essentiel :

  • une intégration des contenus wikipédiens au programme Search Monkey de Yahoo! avec l'idée de faire remonter un peu de sémantique dans les résultats de recherche de Yahoo!.
  • un passage à l'échelle conséquent : de 2 Terabits de stockage début 2008, stockage "dédié" aux images, fichiers musicaux ou films, Wikipedia passe en 2009 à 48 Terabits de stockage dédié, grâce à une généreuse donation de serveurs Sun.
  • dans un autre article, Brion Vibber, CTO de la fondation Wikimedia, indique que l'un de ses objectifs à long terme est "to let users upload feature-length, high-quality videos, but in addition to capacity limits he says there are challenges related to getting files in the appropriate format and the physical movement of large files."Autre stratégie, à court-terme cette fois, un partenariat ("integration") avec des sites-média comme FLickR. La première stratégie s'inscrit clairement dans la même logique que celle de la fondation Archive.org (on je rêve d'ailleurs d'un partenariat entre ces deux acteurs). C'est de logique "institutionnelle" qu'il s'agit. La seconde option est davantage dans une logique média, qui joue - intelligemment - sur la complémentarité que rend possible la granularité des ressources du net, pour autant que ladite granularité soit sous-tendue pas une "philosophie" d'ouverture et de partage. Archive.org, Wikipedia.org, FlickRCommons ... c'est l'évidence en marche, le même effet de saisissement qui vous étreint fugitivement lorsque vous trouvez enfin la bonne pièce manquante à votre puzzle.  Mais je m'emporte, revenons à nos moutons anniversaires ...

Le mois prochain ce sont les licences creative commons qui fêteront leurs 6 ans. Une autre evidence. A force de simplicité. L'occasion également de rendre hommage à de glorieux aînés.

Pendant ce temps, Knol publie son 100 millième article knol (voir par exemple le billet d'Actulligence sur le sujet)

(Temps de rédaction de cet article : 1 heure)

Funes ou la mémoire : le web hypermnésique.

Je voudrais partager avec vous deux lectures. Sans commentaire. Sans analyse. Parce que ces deux lectures là se suffisent à elles-mêmes.
La première est celle de la vie privée de Marc L., publiée par l'excellente revue "Le Tigre".
La seconde est celle intitulée, "J'ai oublié de ne pas me souvenir", publiée par le tout aussi excellent site Anticipedia.
Commencez par lire ces deux textes. Puis replongez-vous dans le texte de J.L. Borges, "Funes ou la mémoire." On peut y lire ceci : "J’ai à moi seul plus de souvenirs que n’en peuvent avoir eu tous les hommes depuis que le monde est monde. Mes rêves sont comme votre veille. Ma mémoire, monsieur, est comme un tas d’ordure. (...) Il avait appris sans effort l’anglais, le français, le portugais, le latin. Je soupçonne cependant qu’il n’était pas très capable de penser. Penser c’est oublier des différences, c’est généraliser, abstraire. Dans le monde surchargé de Funes il n’y avait que des détails, presque immédiats." Fictions – Funes ou la mémoire – Traduction P. Verdevoye ; Folio.


Google private Life : The Wall.

Quelques infos et commentaires un peu en vrac autour de l'ogre préféré ...

Des photos et des hommes ...
Google a mis depuis quelques temps en ligne l'intégrale des photos du magazine Life, y compris les clichés non publiés par le célèbre magazine. Un appétit insatiable, un fonds documentaire qui semble inépuisable et ... un mur de fortification du "GoogleNet" qui se construit pierre après pierre. Lesdites photos par exemple ne sont pas indexables par d'autres moteurs de recherche comme le signale Philip Lenssen. On pourra m'objecter que puisque les frais incombent à Google et que l'initiative de la mise en ligne lui revient, il n'est pas aberrant que celui-ci s'arroge certains droits. Sauf que. Sauf que ces photos relèvent d'une dimension clairement patrimoniale. Elles sont un bien commun. Et à ne pas y prendre garde, en ce domaine documentaire comme en d'autres, on risque de se retrouver avec un acteur privé en situation de diffusion et d'exploitation exclusive de tout un tas de biens communs de l'humanité. On constatera que c'est dommage. Mais il sera déjà trop tard. Il existe pourtant bien d'autres approches ... Mais encore faut-il que les bibliothèques pourvoyeuses aient les moyens d'en être à l'initiative ...

"Rendre l'information universellement accessible" ... et après ?
Ce mur infranchissable aux autres (moteurs) que Google est progressivement en train de bâtir autour de son corpus, de "son" web, est symptomatique d'un renversement dans la philosophie l'idéologie de la marque, ou à tout le moins d'un retour à un principe de réalité comptable. Renversement déjà remarqué par plusieurs analystes. Je crois que le temps du "tout service, tout gratuit" chez Google sera bientôt révolu. Plus globalement, je crois également que le gimmick "rendre l'information universellement accessible" sera prochainement remplacé par un autre. Jusqu'ici Google ne nous avait pas habitué à préserver un pré carré de manière aussi ostentatoire. Attitude d'autant plus étrange que l'on ne peut pas dire que la concurrence motorisée soit à son apogée. Alors quoi me direz-vous ? La faute à la crise ? Je ne pense pas. Je pense que Google à atteint (ou n'est pas loin d'atteindre) "son" objectif : rassembler en une même sphère d'indexabilité des documents, des informations, des biens communs et patrimoniaux de l'humanité, mais également des comportements, des intentions de navigation, de l'intime (cf ma presque mondialement célèbre "théorie de la dérive des continents documentaires"). "Organiser l'information et la rendre universellement accessible". L'information EST organisée. Les dépêches de l'AFP sont estampillées "Hosted by Google", les photos de Life ne sont consultable QUE dans Google, nos emails personnels sont scannés mot après mot par Google pour pouvoir nous afficher des publicités contextuelles, dans les fables d'Esope on peut désormais lire "Le filigrane Google contenu dans chaque fichier est indispensable pour informer les internautes de notre projet et leur permettre d’accéder à davantage de documents par l’intermédiaire du Programme Google Recherche de Livres. Ne le supprimez en aucun cas." L'information EST organisée. Elle est effectivement universellement accessible. Universellement accessible par chacun d'entre nous SUR les serveurs de Google. SUR le GoogleNet.

La recherche est le centre et les services la périphérie. Mais faut se recentrer.
Maigre rayon de soleil dans cet horizon sombrement Googlien, le même Google annonce l'abandon de son projet Palimpsest (voir ici, ou ) dont l'ambition était tout simplement de permettre aux scientifiques du monde entier de stocker gratuitement leurs données volumineuses sur les serveurs de Google, en les rendant du même coup partageables et accessibles pour les autres scientifiques du monde entier ... et accessoirement pour Google. Vous avez dit "bien commun" ?
L'abandon de ce projet n'est d'ailleurs pas isolé. Le moteur "dont le centre est partout et la circonférence nulle part", une formule qui fut à l'époque l'une des clés pour comprendre la stratégie d'entrisme de Google, semble avoir besoin de se repossitionner "autour de" ses services centraux au prix d'un nettoyage des services périphériques. Après Lively et Palimpsest, ce sont Google Video, Google Mashup Editor, Google Notebook, Google Catalogs (service qui eut son importance pour le développement de Google Book Search), Dodgeball et Jaiku qui sont abandonnés ou arrêtés par Google (voir à ce sujet les billets de Zorgloob, Francis Pisani, Philipp Lenssen ...). Google se recentre donc autour de la recherche, et en particulier de la recherche "universelle" (voir le White Paper signalé par Steven Arnold), nouvelle clé de voûte de son écosystème de services.

A quelque crise malheur est bon ...
La crise économique boursière n'est certainement pas étrangère au recentrage de l'ogre de Mountain View. Mais je crois qu'elle n'en est pas la cause profonde, elle n'en est que le déclencheur structurel. "L'occasion" de passer, en 2009, à une nouvelle étape de déploiement, peut-être à une nouvelle stratégie. Il n'est d'ailleurs pas innocent que l'on voir récemment refleurir la rumeur du Google Drive (souvenez-vous), un espace de stockage "personnel", en ligne. L'information EST organisée. L'information est universellement accessible SUR les serveurs de Google. Particuliers, entreprises mais aussi institutions et demain peut-être états s'y retrouvent. En 10 ans, les habitudes sont acquises. Pour la plupart d'entre elles irrémédiablement. Devant l'omniprésence du moteur, devant la qualité des services offerts, devant l'ancienneté des usages individuels et collectifs que l'on en fait aujourd'hui, qui, oui, qui serait prêt à lâcher Google au profit d'autres services si ce dernier proposait un accès payant à certains de ses services ? Peu de gens à mon avis. Alors bien sûr nous n'en sommes pas encore là, mais s'il fallait cette année encore jouer au jeu des prédictions, je dirai que du côté de Google, l'année 2009 sera celle de l'établissement de sa suite bureautique en ligne comme principal sideman du moteur de recherche. Et que pour s'installer définitivement dans les habitudes, il ne manque plus à la suite bureautique en ligne qu'un espace de stockage personnalisé en ligne. Je crois donc qu'on verra bientôt apparaître le fameux GDrive, dont la rumeur court depuis déjà deux ans ... GoogleNet pour l'infrastructure, GoogleWeb pour le guichet unique d'accès à l'information avec son moteur (Google) et son navigateur (Chrome qui vient de sortir de son statut "béta"), GoogleOS pour les usages, usages eux-mêmes archivés dans la ruche mondiale du GoogleDrive.

"... dont le centre est partout, et la circonférence nulle part." comme disait l'autre ...

=====================
Et puis aussi ...
=====================

  • Sur le sujet des photos de Life - mais sous un tout autre angle, voir la tribune d'Augustin Besnier dans Le Monde, lointain écho de préoccupations déjà abordées ici et là ...
  • De manière plus anecdotique, Google offre également la possibilité de télécharger le dictionnaire Littré développé en version open source. Il n'est certes pas le premier à le proposer mais la concentration de services offerts et l'effet de marque jouant à plein, qui se souviendra demain qu'il ne fut pas le premier à le proposer et que l'initiative ne lui en revient pas ? Qui d'ailleurs ira télécharger le Littré ailleurs que depuis Google ?
  • Et puis malgré tous les risques qu'il fait peser sur nous, il y a ces éclairs de génie, ces outils dont la puissance nous émerveille au sens propre, et qui nous laissent entrevoir toutes les potentialités des mises en abyme que permet le web : je parle ici des 14 toiles du musée du Prado qui sont visibles en très haute résolution via Google Earth. Vagabondages vous explique tout, ainsi que Le Monde (et son portfolio dédié). Je ne vais donc pas en rajouter une couche, juste un petit cadeau bonus pour d'autres approches de la perspective muséale : le mur d'images d'ArtScope, avec, (deuxième petit cadeau bonus), en toile de fond, une empreinte de plus en plus forte de ces technologies y compris pour le grand public et sur des corpus non nécessairement patrimoniaux ou artistiques, tel le site "Zoomorama", qui permet de mettre en ligne des photo en haute définition avec là encore des effets de zoom proprement vertigineux. De la larme de Saint-Jean à l'infinie navigation du monde telle qu'elle se déploie dans Google Earth, de 1435 à 2009, derrière cette technologie, derrière ces 14 toiles c'est toute la dimension et toute la puissance dilatoire du web qui se donne à lire, toute la courbure si particulière de l'espace-temps internet, de notre espace-temps numérique, de notre macroscope.

(Temps de rédaction de ce billet : 2h45)

Contributions wikipediennes

(nota-bene : suite à la nouvelle mouture de Typepad, les titres des billets d'Affordance seront désormais sans accents, désolé pour les puristes ...)

Il est un vieux débat autour du web 2.0 en général et de Wikipédia en particulier, c'est celui de l'échelle réelle de collaboration et de contribution qui structurent ces deux univers. En d'autres termes, qui contribue "réellement" et qui en profite "simplement".

Un article du Silicon Alley Reminder revient sur une étude déjà commentée ici en Octobre 2006 à propos du nombre de contributeurs réellement actifs dans Wikipédia. L'étude signalée en 2006 indiquait que "50% des modifications sont faites par seulement 0,7% des utilisateurs … soit 524 personnes" et que "les 2% les plus actifs (1400 personnes) ont fait 73.4% de tous les modifications." Pour aboutir à ce résultat, Jimmy Wales avait à l'époque comptabilisé le nombre de modifications ("edit") réalisées sur les articles. La conclusion était que quelques "insiders" (ou "heavy editors") étaient responsables de l'essentiel du contenu de l'encyclopédie.
L'article du Silicon Alley Reminder propose de ne pas compter les "modifications" (edit) d'articles mais plutôt leur nombre de signes (lettres). Et le résultat (à nuancer étant donné que ladite étude est - de l'aveu même de son auteur - simplement empirique) est radicalement différent de celui de Wales : on s'aperçoit que les plus "gros" contributeurs en "nombre de signes" sont plutôt des "outsiders" (utilisateurs non-réguliers), les "heavy editors" se contentant de faire de nombreux "edit" mais essentiellement pour des questions de mise en forme et de calibrage ou de rectification.
OK mais et alors ???
Alors la question qui est ici posée est celle de la nature même du projet d'encyclopédie collaborative. Dans l'hypothèse 1 (celle de Wales), Wikipédia serait en fait une encyclopédie "comme les autres", avec un très petit nombre d'encyclopédistes labellisés et actifs. La seule différence - mais de taille - avec un projet encyclopédique classique étant que lesdits encyclopédistes n'ont pas été choisis ou recrutés es qualites. Soit disons 80 % d'un fonctionnement encyclopédique traditionnel et 20 % d'un fonctionnement "en rupture" avec les modèles éditoriaux traditionnels.
Dans l'hypothèse 2 (celle du Silicon Alley Insider), c'est la situation exactement inverse qui est décrite. Le coeur du projet Wikipédien est serait bien celui d'une collaboration ouverte reposant sur la contribution d'usagers "extérieurs" et non-nécessairement réguliers ou accrocs pour fournir les connaissances et les informations, collaboration ouverte "complétée" par un travail d'édition plus traditionnel (correction, mise en forme, etc ...) effectué cette fois par quelques "heavy editors". Soit 80% de collaboration et 20% de fonctionnement éditorial "classique".

Soit pour résumer :

  • hypothèse 1 : les encyclopédistes sont des gens "à/de l'intérieur"
  • hypothèse 2 : les encyclopédistes sont des gens "à/de l'extérieur"

La fonction crée l'organe.
Au delà des chiffres et des pourcentages, ce débat est important voire essentiel car il reflète et illustre notre rapport au savoir dans un environnement numérique. L'hypothèse 1 serait la preuve qu'au-delà de la forme (innovante) du Wiki, le projet encyclopédique n'a pas réellement changé de nature dans son mode de fonctionnement. L'hypothèse 2, de mon point de vue beaucoup plus séduisante et beaucoup plus réaliste (même si elle demande à être confirmée), indique a contrario qu'en sus du changement de nature de l'objectif encyclopédique, il y a bien également un changement de nature du mode de contribution et d'accumulation des savoirs. Wikipédia procède donc bien d'une nouvelle forme et d'une nouvelle ambition pour le projet encyclopédique du XX1ème siècle, nouvelle forme et nouvelle ambition qui ont su, pour partie, asseoir la rupture qu'elles proposent sur des schémas de fonctionnement éditoriaux ayant déjà fait la preuve de leur efficacité. Et ce n'est pas l'un des moindres intérêts de ce projet que de constater que cette stratégie n'a pas été bâtie et pensée en amont du projet lui-même, mais qu'elle s'est organiquement déployée au fur et à mesure de son avancement. Work in progress. Et si l'on observe Wikipédia comme un organisme numérique en croissance, on vérifie une fois de plus la formule de Lamarck selon laquelle "La fonction crée l'organe."

==============================
Et pour compléter cette petite réflexion (et accessoirement expurger mon agrégateur), une petite revue de liens autour de l'encyclopédie collaborative.

  • et tout d'abord une excellente idée : "Un chercheur, qui soumet un article à la revue RNA Biology, devra également écrire un résumé de ses travaux dans Wikipédia." Source et suite de l'info sur Prosper et ReadWriteWeb.
  • ensuite un article de Pascal Duplessis : "Wikipedia : un objet-problème en information documentation." Rapide extrait pour vous donner envie : "Qui, sans en avoir été longuement averti, peut-il appréhender l’extraordinaire complexité dont fait preuve le deus ex machina à l’œuvre derrière la scène de tout article encyclopédique collaboratif ? Comment imaginer ne serait-ce que le perpétuel mouvement de création et de re-création de l’édifice puisqu’il se fige à l’instant même où on le regarde ? Pour en faire prendre conscience aux élèves, il faudrait un logiciel de type morphing où l’on verrait en l’espace de quelques secondes merveilleuses l’article se développer et se réduire sous l’effet erratique des contributions, varier ses formes du simple au caricatural, laisser et abandonner ses traces, et vivre et mourir en quelques palpitations de son être documentaire."
  • voir également mes voeux de bonne année 2009

(Temps de rédaction de ce billet : 1h30)

Micro, méso et macro-net : les médiasphères et le moteur.

(billet inspiré par quelques rapides tests sur Whostalkin, découvert chez Steve Rubel)

En ce temps-là ...
En ce temps là
, la vie était plus belle simple : on avait les annuaires, les moteurs et les méta-moteurs.
En ce temps-là l'unité de publication était la page (web).
En ce temps-là, ceux qui publiaient sur le net ne publiaient (généralement) QUE sur le net, pas dans les grands médias. Et ceux qui écrivaient dans les grands médias ne publiaient pas sur le net.
En ce temps là, ce qui était écrit, restait écrit, restait fixé.
Et puis ...
Et puis les annuaires disparurent. Ne restèrent que (quelques) méta-moteurs et surtout les moteurs et surtout LE moteur.
Et puis les unités de publication se réduisirent, se fragmentèrent. L'unité ne fut plus seulement la page mais également le billet (de blog), voire le fil (de discussion sur un forum ou de commentaires sur un blog) ou le micro-fil (twitter limite l'unité de publication à 140 caractères). Une unité de publication parfois simplement confinée à une unité de présence en ligne, laquelle unité de présence est elle-même composée des traces éparses (profilaires ?) de notre social stream tel qu'il se constitue par exemple au travers de nos différents profils sur différents réseaux sociaux,
Et puis les instances d'énonciation éditoriales se floutèrent. Publier ici n'empêcherait plus de publier là. Les journalistes écrivent "dans" le web, les blogueurs écrivent "dans" les journaux, passent à la télé. Certains journaux ne sont faits que de reprises d'écrits de blogs (vendredi.info), certains blogs (maître Eolas) jouissent d'une crédibilité supérieure à certains journaux.
Et puis ce qui était écrit par l'un devînt modifiable par l'autre, par tous les autres (Wikipédia). L'auteur, l'autre. Figure gemellaire de l'hypertextualité. Agencements collectifs d'énonciation. La trace céda la place à sa propre traque.
Voilà ce qui changea. Ce qui ne change pas en revanche, pour vous, pour moi, c'est le besoin de s'y retrouver (au sens propre mais également et de plus en plus souvent au sens figuré également ...), d'y trouver parfois simplement "quelque chose", plus rarement "ce que l'on cherche".

Editorialement parlant, on dispose donc désormais de trois "médiasphères" :

  • le micro-net de type twitter mais également composé de nos traces profilaires,
  • le meso-net de type "blogs" individuels et non-institutionnels, ainsi que de la longue cohorte des pages personnelles
  • et le macro-net de type journaux ou chaînes de télé implantés sur le web (libération, le figaro, l'Obs ...)

Machiniquement parlant, pour rendre compte de ce nouveaux paysage éditorial du net, on ne dispose pourtant plus que des seuls moteurs qui, de plus en plus souvent, mal étreignent à force de trop embrasser.
Idéalement, il faudrait pouvoir disposer d'un moteur pour chacune de nos trois médiasphères. Car il va sans dire que la spécificité éditoriale de chacune d'entre elles conditionne à la fois la nature des recherches qui y sont effectuées mais également la nature, la granularité documentaire des résultats qui y figurent. Et l'on se prend à rêver d'un retour des moteurs à curseurs avec un même moteur permettant de régler le "grain" de la recherche depuis les macro-médias du macro-net jusqu'aux micro-médias du micro-net. 

Aujourd'hui, on dispose de :

  • Nano-moteur : pour chercher dans le micro-net. Exemple : WhosTalkin?
  • Meso-moteur : pour chercher dans le meso-net. Exemples : Blogsearch, Technorati, Wikio.
  • Macro-moteur : pour chercher dans le macro-net. Exemple : Google et Google News.

Cette granularité est inédite à cette échelle, et il y a fort à parier que 2009 lui donnera ses lettres de noblesse, l'enracinant comme une composante à part entière du Giant Global Graph. Alors que l'étage supérieur, le macro-net, apparaît aujourd'hui stabilisé, ayant atteint un rythme de croissance optimal, le micro-net et le meso-net continuent d'exploser, sur le même type d'échelle logarithmique que le web à ses débuts. Après la croissance des blogs, c'est aujourd'hui la croissance des réseaux sociaux et des sites de micro-blogging. La valeur de ces deux espaces, du dernier particulièrement, réside dans leur nature conversationnelle. Une conversation certes souvent tenue par des idiots et pleine de bruit et de fureur, mais également une conversation qui aiguille, qui stimule, qui signale, et qui est en tout état de cause le complément aujourd'hui indispensable de la plénitude du net comme médiasphère. Bref une conversation qui mérite d'être indexée et suivie pour pouvoir être ensuite accédée de manière asynchrone, dans la verticalité qu'impose le couperet d'une recherche et non plus simplement dans la linéarité d'un échange.

Signalons pour finir que cette granularité se superpose à une autre granularité préexistante et depuis déjà longtemps consubstantielle au net : la granularité des médias (vidéos, images, audio, texte) qui le composent. C'est à la croisée de ces chemins, à la croisée de cette granularité bipolaire que devront se positionner les acteurs de la recherche d'information pour répondre aux besoins de l'usager du web de 2009 et d'au-delà.

(Temps de rédaction de ce billet : 2h00)

L'UMP rachète la crise financière mondiale.

L'UMP avait déjà trouvé la solution à la crise des banlieues, voilà qu'elle se met à racheter la crise financière mondiale. La preuve en image ...

Ump

Pendant ce temps, la presse continue de s'essayer aux technologies de l'artefact pour masquer une bague à 15 600 euros, une paille à côté des 220 000 euros (soit l'équivalent de 12 bagues de Rachida Dati) d'argent public que le ministère investit pour surveiller les leaders d'opinion.

Nous vivons donc décidément une époque formidable. Et si vous êtes encore convaincu qu'il n'y a aucun lien entre ces différentes informations, et bien ... cherchez mieux :-(

Collusion ?

En France, le magnat des médias (Arnaud Lagardère) est aussi "l'ami" du président de la république (Nicolas Sarkozy) et le témoin de son (premier) mariage. Collusion ? Collusion.
Aux Etats-Unis, le PDG du premier moteur de recherche de la planète vient d'entrer au "conseil des sages" du président Obama (Interview vidéo d'Eric Schmidt). Goobama donc. Les accointances démocrates de l'équipe dirigeante du moteur Google ne sont plus un secret. Pas davantage que n'est secrète la position démocrate sur les enjeux de la neutralité de l'Internet. Pas davantage que n'est anodin le rôle joué par le média Internet dans la campagne présidentielle américaine. Collusion ? Difficile d'en juger pour le moment. Seule certitude : la question hier posée ("qu'arriverait-il si nous répondions mal au mot 'socialisme' ?") se reposera demain avec une acuité nouvelle.

"Les cons ça ose tout."

" ... c'est même à ça qu'on les reconnaît " disait le maître. Diego Maradona et Lutz Heilman osent tout. Le premier, nous apprend Zorgloob, a demandé (et obtenu !!!) des versions locales de Google et de Yahoo!, qu'elles ne fassent plus apparaître de résultats sur la requête "Diego Maradona." La page suivante est donc collector : à vos copies d'écran, car c'est à ma connaissance la première fois dans l'histoire de l'Internet qu'une telle disparition est opérée.
Le second (via le toujours excellent Ecrans et de ReadWriteWeb), Lutz Heilman, 42 ans, aujourd’hui député au parlement fédéral du parti die Linke (La Gauche), et ex-agent de la fameuse police secrète est-allemande (Stasi), a demandé et obtenu la fermeture immédiate et ce deux jours durant, de la version allemande de Wikipedia (enfin pas tout à fait mais presque).

Deux réflexions croisées :

  • c'est la première fois qu'un particulier obtient l'application aussi radicale et disproportionnée d'un tel "effacement".
  • seuls des états avaient jusqu'ici réussi à faire plier de tels mastodontes, et la négociation n'avait pas porté sur le terrain judiciaire mais uniquement sur le plan ... financier.
  • cela laisse songeur sur plein de plans ...

Et une morale façon "vieux con des neiges d'antan" : on n'effacera jamais les livres. On peut les censurer, les brûler, les détruire, les pilonner mais les effacer ... jamais. Et si vous voulez lire une belle histoire à ce sujet, vous pouvez vous précipiter sur Globalia.

Nous sommes tous des américains (fauchés) et notre ministère est un Ponce Pilate numérique

============================================================================
Billet d'humeur publié un lundi mais rédigé un vendredi soir (très tard) sur un (non?) événement qui a presque un an mais qui me semble assez fidèlement traduire une certaine logique ...
============================================================================

Préambule. Aux Etats-Unis, les grandes firmes de l'informatique ont pignon sur rue dans les universités et dans les écoles. Elles les financent pour partie, elles les fournissent en ordinateurs et autres équipements, elles recrutent et payent des étudiants pour évangéliser sur tel ou tel produit leurs petits camarades, elles recrutent et payent des professeurs, elles leurs offrent des licences logicielles gratuites. Bref, elles "font le job" de la formation aux technologies de l'information.

Google et les 140 classes de collégiens.

En France, l'éducation à la culture informationnelle est, suite à la volonté acharnée de quelques-uns, de plus en plus l'objet de discussions, de colloques, de publications. En France, on a (péniblement) mis en place des dispositifs aux noms abscons mais à l'efficacité qui commence à être prouvée : B2i, C2i, et tutti quanti. En France, le Sénat, dans sa session ordinaire du 22 Octobre 2008, a diffusé un rapport d'information sur l'impact des nouveaux medias sur la jeunesse (Téléchargement r08-0461.pdf). A la page 123 dudit rapport, on peut lire le compte-rendu de l'audition de Mr Olivier Esper et Mme Myriam Boublil, respectivement "chargé des relations institutionnelles" et "directrice de la communication", chez ... Google Inc. L'audition se conclut comme suit :

  • "M. Olivier Esper a enfin souhaité faire la présentation des initiatives de Google France en matière d'éducation aux médias : le tour de France des collèges, qui consiste en des actions d'apprentissage de l'utilisation d'Internet à des élèves, le soutien des actions d'e-Enfance (hébergement de leurs vidéos sur Youtube et campagne publicitaire gratuite sur Internet) et ChercheNet, jeu concours monté en partenariat avec la Délégation aux usages de l'Internet, qui vise à éduquer à la création de contenus et au respect de la propriété intellectuelle.

Intrigué par ce "Cherche Net", et quelques clics plus tard, je tombe sur le communiqué de presse de Google France, dans lequel j'apprends qu'il ne s'agit pas vraiment d'un tout petit projet puisqu'il concerne tout de même "140 classes de collégiens de 6ème et 5ème des départements du Finistère, de l’Ille-et-Vilaine, du Morbihan, des Côtes-d’Armor, de la Sarthe, du Maine-et-Loire, de la Loire-Atlantique, de la Mayenne et de la Vendée." Le titre du communiqué de presse est le suivant : "Calysto lance Cherche Net avec Google et la DUI". Pour information, Calysto est une société de conseil, la DUI est une excroissance du pouvoir politique (ministère de l'enseignement supérieur principalement), et Google est ... Google.

Et maintenant les faits : le fond du projet Cherche Net.

Sur la page du communiqué de presse, je retiens les informations suivantes :   

  • "A l'initiative de Google France, et avec le soutien de la Délégation aux Usages de l'Internet, Calysto mènera dans les collèges de Bretagne et des pays de Loire, une opération inédite et ludique d'éducation à Internet et ses usages pour les enfants : le jeu concours Cherche Net. (...) Cherche Net a pour vocation de (...) mettre en pratique les informations enseignées aux enfants sur l'Internet, (...) :
  • comment rechercher efficacement sur Internet ?  Comment éviter de tomber sur des contenus choquants ? Comment utiliser des outils de retouche d'image ? Comment créer un blog ?
  • les sensibiliser et  les éduquer aux règles à respecter sur Internet (sécurité, droit d'auteur, droit à l'image…)
  • valider leurs compétences du B2i (Brevet informatique et internet)
  • favoriser une démarche collaborative et une prise de conscience collective
  • développer leur curiosité et leur créativité."

Et maintenant, reprenons ...

  • Qui ? "A l'initiative de Google France" : c'est assez troublant. Ce genre d'initiative est normalement attendu de la DUI, dont la mission est - sauf erreur de ma part - "la formation et l'accompagnement au TIC" (sic). C'est d'autant plus troublant que derrière la mention "à l'initiative de", il faut naturellement comprendre et lire "avec le financement de". Donc si on résume : Google est à l'initiative du projet, le finance, le fait réaliser par une société de service (Calysto) et demande sa bénédiction à la DUI (à moins que la bénédiction de la DUI ne lui soit acquises dès avant)
  • Quoi ? On va donc apprendre aux collégiens "comment rechercher efficacement sur Internet". Il serait à la fois plus honnête et plus exact d'indiquer qu'on va leur apprendre "comment chercher efficacement sur Internet avec Google." Ce qui est déjà une bonne chose. Mais ce qui n'est pas tout à fait la même chose. On va également apprendre aux collégiens "Comment utiliser des outils de retouche d'image ?" Alors là j'avoue que j'en reste baba. Dans le même temps, je mesure la force de mes prophéties auto-réalisatrices concernant les technologies de l'artefact. Et je m'en désole.
  • Pourquoi ? Pour "valider leurs compétences du B2i (Brevet informatique et internet)" Et ben voilà. C'est Google qui va valider le B2i. OK. Et demain, on l'envoie valider quoi ?? Le bac ? La licence ? La première étoile de ski ? Et puis aussi on va faire ça pour "favoriser une démarche collaborative et une prise de conscience collective et développer leur curiosité et leur créativité." Et pour en faire de bons clients. Bien souples. Bien captifs. Bien formés formattés.  

Moralité courte.

A l'initiative de Google et sur les fonds de Google, Google forme les futurs utilisateurs et clients de Google là où ils sont, c'est à dire dans les collèges. Il les forme à l'utilisation de Google et des outils de Google. Il le fait avec l'aval du Ministère de l'enseignement supérieur et de la recherche (dont la DUI est l'émanation directe), ce dernier se vautrant dans le confort de la figure d'un Ponce-Pilate numérique (dont on connaît la propension à "s'en laver les mains").

Moralité longue

C'est parfois dans les "petites" opérations de communication que se donnent le mieux à lire les grands desseins ministériels ... Car soyons clair, ce n'est en l'occurence pas Google (ni Calysto) que je blâme (quoi que pour Calysto ...). A tout prendre, j'aime autant que ce soit eux qui se chargent du boulot plutôt que la DUI et ses experts nommés. Ce qui est particulièrement irritant me fout dans une rogne noire c'est de constater l'incurie des "pouvoirs publics" à l'échelon national à capitaliser sur les réseaux de compétence e-x-i-s-t-a-n-t-s, leur refus castrateur de leur octroyer quelques maigres subsides pour permettre à ces mêmes réseaux de compétence d'opérer un passage à l'échelle, pour leur permettre de démultiplier leur offre de formation, bref pour leur permettre de faire ce que s'apprête à faire Google, mais en le faisant mieux (et probablement pour moins cher).

Pour être plus clair, il existe en France dans les universités, les lycées et les collèges toutes les structures nécessaires à la réflexion (déjà bien avancée) et à l'action (chroniquement en manque de moyens). Nous disposons :

Alors pour passer ma rogne, je fais un rêve. Celui de voir un jour l'auto-complaisance ministérielle et ses effets d'annonce à la consistance d'étouffe-chrétien se resaisir, décrocher son téléphone, convoquer non pas des blogueurs influents mais des gens capables, leur demander où ils en sont de leur réflexion, leur demander quelles sont leurs préconisations, leur demander quels sont leurs besoins ... et leur donner les moyens de gagner un pari. Un pari formidable. Celui de l'entrée réussie d'une classe d'âge dans la société de l'information. Et puis je me réveille. Et je vois le temps qui passe. Et je voie le temps perdu. Et le Cheval à Phynances qui galope, et la Machine à Décerveler qui fait son office (et réciproquement). 

Conclusion : nous sommes tous des américains.
Le projet Cherche Net date de Décembre 2007. J'en ignore les résultats. Je ne les ai pas trouvés sur le site de la DUI. Le site Cherchenet.fr n'est de toute façon plus en ligne. La seule trace qui en subsiste est celle-ci. Le nom de domaine est par ailleurs disponible si vous êtes tentés par une spéculation hasardeuse (plénonasme ?). J'ignore s'il sera reconduit cette année. Mais le projet Cherche Net n'était que la partie émergée de l'iceberg. Aujourd'hui, les mêmes perpétuent le tour de France des collèges et des écoles. Avec les mêmes partenaires, plus quelques autres. C'est du Cherche Net  mais à l'échelle industrielle. Du biberonnage dès le berceau. Voilà pour l'existant. Voilà pour hier et aujourd'hui. Et demain ? Demain aux Etats-Unis en France, les grandes firmes de l'informatique auront pignon sur rue dans les universités et dans les écoles. Elles les financeront pour partie, elles les fourniront en ordinateurs et autres équipements, elles recruteront et paieront des étudiants pour évangéliser sur tel ou tel produit leurs petits camarades, elles recruteront et paieront des professeurs, leurs offriront des licences logicielles gratuites. Bref, elles "feront le job" de la formation aux technologies de l'information.
Demain ce sera Ubu Roi. UBU : Université des Baudruches Unanimes. ROI : retour sur investissement à la hauteur du désinvestissement constaté. Ubu roi vous dis-je. 

(Temps de rédaction de ce billet : 3h30 - oui je sais c'est long, non je n'avais rien de mieux à faire vendredi soir)

Politburo motorisé : Goobama ou MicroCain ?

Dans la série "le politique et son reflet motorisé", et dans une quête éperdue de notoriété mise à mal, je vais donc sacrifier à la tradition médiatique. <Teasing> A la fin du billet que vous êtes en train de lire, vous connaîtrez, en avant-première mondiale, le résultat de l'élection présidentielle américaine. </Teasing>

Préambule.
Les rapports entre le politique et la représentation du monde que donnent à voir les moteurs sont de plus en plus étroits, de plus en plus complexes, de plus en plus décisifs. C'est un poncif que de souligner le rôle que joue le net dans les élections américaines aujourd'hui, et qu'il jouera sans nul doute demain à l'échelle de la vie démocratique planétaire, pour le meilleur ou pour le pire. Dans un billet d'Octobre 2006 j'écrivais déjà :

  • "il serait alarmant que Google puisse ne serait-ce qu'envisager de prendre le contrôle d'une centralisation du vote, par la biais des machines électroniques à voter. Ce scénario n'a aujourd'hui rien plus rien de fantaisiste. Google dispose des financements, des appuis politiques et de l'architecture informatique qui lui permettraient d'organiser le vote planétaire à l'échelle de chaque pays le désirant. (...) Nos sociétés occidentales n'hésitent par ailleurs plus (...) à confier à des sociétés privées la gestion d'intérêts et d'énergies fondamentales, qui sont le bien commun des 6 milliards d'êtres qui peuplent la planète. Hésiteront-elles longtemps avant de lui confier la démocratie ?"

A l'heure ou les médias du monde entier ont tous leurs sens numériques entièrement braqués sur l'élection en train de se jouer aux USA, regardons ce que la chose numérique apporte comme éclairage et comme décryptage à la chose politique.

Realnumerik et/ou Realpolitik.
Le billet de ReadWriteWeb, "Your election Day Web Toolkit",  nous offre une vue exhaustive de cette boîte à outils numérique : informations en temps réel sur le vote en cours, vote participatif sitôt filmé et sitôt posté sur YouTube, groupes de microblogging décryptant les résultats là encore en temps réel, sondages divers et variés, et bien sûr, marketing et merchandising citoyen avec de grandes enseignes vous offrant un café tiède ou un nuggets moisi si vous entrez chez eux en hurlant "j'ai voté".

Moteurs et politiques : une affaire de résultats.

Mais au-delà du gadget et de l'insondable sondage, les moteurs savent également offrir de très beaux outils de décryptage et de suivi des résultats. Dans cette catégorie, la palme revient probablement au "Political Dashboard" de Yahoo!. A l'heure où j'écris ce billet, seules les projections de vote sont naturellement accessibles, mais vous avez la possibilité de créer votre propre scénario en cliquant sur les différents états pour en faire changer la couleur politique et disposer donc d'autant de scénarios et de résultats que possible. 
Google n'est naturellement pas en reste et se fend d'un billet sur son blog officiel pour détailler l'ensemble de "son" dispositif : une GoogleMaps qui permettra de visualiser les résultats, une page Google News dédiée avec un affichage en colonne des résultats état par état, etc.

Là où cela se complique ...
Jusque là, au final, pas grand chose de nouveau, sauf que chacun peut se rejouer en solo et dans son salon la grand messe télévisuelle des soirées électorales, avec des joujous capables de déclencher une soudaine moiteur intime chez le chroniqueur politique d'astreinte ou la directeur d'institut de sondage sur le pont. Là où cela se complique c'est quand on en arrive aux authentiques stratégies motorisée d'un vote (prétendûment ?) à valeur ajoutée.

De nouveaux espaces synoptiques
L'exemple le plus frappant est celui du canal vidéo créé sur YouTube pour l'occasion et baptisé : Video Your Vote. 596 vidéos sont pour l'instant (4 Novembre, 22h, heure française) répertoriées. Là encore, une carte GoogleMaps sert de support, d'accrochage, aux vidéos envoyées par des citoyens (ou des personnalités), lesquelles vidéos sont répertoriées et visualisables selon un certain nombre de thèmes : les "Notable voter" par exemple, personnalités diverses (mais essentiellement politiques) qui se fendent de leur propre reportage sur eux-mêmes et leur vote ; plus intéressantes, les vidéos des "First Time Voter" (sous la catégorie "voting perspectives") qui font part de leur état d'esprit. Beaucoup plus étonnante, la catégorie "Voter Intimidation". Et oui. "Voter Intimidation" On y découvre des vidéos qui dénoncent des tentatives d'intimidation plus ou moins graves, dont l'essentiel provient de groupes de pression ou de lobbys politico-industrialo-religieux. Mais on trouve également dans la même catégorie une "interview" (?) de Sally Morgan, étudiante à l'université de Virginia Tech (?) qui raconte comment on (?) a tenté de l'intimider dans sa faculté. On a donc d'un côté des vidéos amateur dont la valeur sociologique est avérée, mais pour lesquelles on ne peut disposer d'aucune valeur de vérité propre (cf mes points d'interrogation dans la phrase précédente), et de l'autre côté, mises sur le même plan dans le même dispositif, des reportages "classiques" de médias "traditionnels", dé-portés sur YouTube. Là encore me direz-vous, rien de nouveau : toute soirée électorale combine les micro-trottoirs anecdotiques avec les analyses politiques plus "sourcées". Mais ce qui change ici c'est l'industrialisation du processus. Alain Giffard (parmi d'autres, dont B. Stiegler) a parfaitement décrit cette industrialisation de l'intime. Ce même intime qui est à l'oeuvre dans l'isoloir, dans cet acte politique fondateur. Tout cela est pour le moins troublant et mériterait à lui seul une analyse complète. Dernière catégorie sur laquelle je vous invite à jeter un oeil dans la chaîne Video Your Vote, c'est la catégorie "Polling Place Problems" et la sous-catégorie "Machine Problems". Aux USA, les machines à voter sont en place dans un très grand nombre d'états. On y découvre de courtes vidéos aussi hallucinantes qu'effrayantes qui, après les ambiguités de la mal-bouffe et du fast-food, nous font découvrir les immenses dangers de demain : ceux du fast-vote, du mal-vote. L'industrialisation du processus de vote se surajoute à celle de l'intime pour lui ôter, à terme, sa valeur propre.

Du passé ne faisons plus table rase.
Les candidats sont naturellement les plus exposés à l'éléphantesque mémoire des moteurs. L'outil Google Citation (tournant - pour l'instant - sur Google News) est capable d'extraire les phrases qu'ils ont prononcé pendant les 5 dernières années sur une thématique donnée et de les resituer en contexte (exemple ici). Autre exemple, l'indexation "textuelle" des vidéos des candidats. Même si peut-être moins que d'autres ils ont, dans l'exercice de leur fonction, le droit à l'oubli numérique, il va falloir réfléchir à l'impact que cet accès direct, permanent et traçable à leurs mémoires aura sur leurs ... discours. La mémoire et la mer l'amer comme disait l'autre

Vers une logique de panoptique.

L'ensemble de ces dispositifs, de ces artefacts, de ces cartes synoptiques s'enrichissent rapidement et nécessairement d'une dimension supplémentaire à la problématique bien plus lourde : celle d'une dérive panoptique inévitable. C'est la logique du genre. Nous filmons, ils enregistrent. Pour en revenir à l'analogie avec les soirées électorales d'antan, dans les dispositifs offerts par les moteurs, toute l'éditorialisation est camouflée. Elle semble avoir disparue (aucun chroniqueur, analyste ou journaliste n'est là pour "faire des choix" de reportage ou de questions à poser ou à ne pas poser), mais elle est plus que jamais présente. Saut qu'il ne s'agit plus d'une éditorialisation à priori mais a posteriori. Ce que changent les moteurs, c'est la temporalité du "moment" politique. La valeur ajoutée maximale de ce moment est, pour les usagers, le temps des sondages qui le précèdent et naturellement celui du temps présent de l'élection. Mais la valeur ajoutée maximale pour les moteurs est tout autre. Elle est dans l'éditorialisation rendue a posteriori possible de ces milliers de données, de comportements et de requêtes collectés de manière cadrée, de manière expérimentale et quasi-scientifique.

"Qu'arrivera-t-il si nous répondons mal à des requêtes comme 'socialism' ?"

Car avant et parfois même pendant le vote, les gens cherchent. Et l'on sait ce qu'ils cherchent. Là encore le blog officiel de Google nous livre les requêtes les plus courantes. Je m'attarde 5 minutes sur les 10 sujets politiques les plus recherchés ("Top Political Topics") :

  1. debate
  2. Social Security
  3. presidential debate
  4. polls
  5. voter registration
  6. gas prices
  7. oil prices
  8. FDIC
  9. electoral college
  10. Socialism

Le "socialisme" est donc le 10ème mot-clé le plus recherché en ce moment par les américains. Outre que cela ferait probablement plaisir à la cellule communication du PS français, cela nous en dit déjà beaucoup sur "l'angoisse" et "l'incompréhension" de l'amérique républicaine face à ce fléau. Mais ce qui m'intéresse ici, ce n'est pas tant la requête que le résultat de cette requête dans Google. Première étape : la fonction Google Suggest est là encore riche d'enseignements.

Socialism     

C'est bien le socialisme d'Obama qui inquiète, qui intrique, qui est la chose recherchée. Deuxième étape : les résultats. Wikipédia, Dictionary.com, la Britannica, un site de bibliothèque numérique en économie. Les 4 premiers résultats donnent donc dans une "neutralité" de bon aloi. Le cinquième résultat est déjà plus surprenant : une page personnelle d'un "socialiste indépendant". Le premier site offrant un rapport direct entre la requête ("socialism") et le contexte de la requête (élection américaine) arrive en 9ème position et il s'agit d'un site clairement républicain. A tout cela il faut ajouter que ladite page de résultat n'est pas nécessairement celle qui sera affichée en réponse à toutes les requêtes déposées sur ce seul mot-clé. En effet, nombre d'internautes utilisent le moteur Google en étant identifiés sur leur compte Google (gmail par exemple). A partir de là (principe de la personnalisation persistante : diapos 29 et 39 à 42), les "préférences" et l'historique de recherche de l'internaute sont convoqués pour proposer un remix personnalisé de résultats. Autant dire que les républicains qui cherchent des infos sur "Obama le socialiste" trouveront dans lesdits résultats de quoi largement alimenter leur socialophobie. Tout cela nous ramène donc aux préoccupations du précédent billet sur le sujet : "qu'arrivera-t-il si nous répondons mal à des requêtes comme 'socialism' ?" Ou comment passer du nez de Cléopâtre au socialisme d'Obama : la face du monde en sera peut-être changée. Pour le meilleur ... ou pour le pire.

Et maintenant chose promise chose dûe : le résultat du vote en avant première mondiale.

(Sources : sous les liens // Temps de rédaction de ce billet : 2h15)

Epistémologie wikipédienne : vérité et vérifiabilité sont dans le bateau du web centripète.

(Nota bene : le titre de ce billet est en compétition pour le festival du plus mauvais titre de billet dans une logique de référencement. Il concourt également dans la catégorie "comment enseigner les règles de l'écriture multimédia à ses étudiants et ne pas se les appliquer à soi-même")

Epistémologie et écosystème sont dans un bateau.
L'épistémologie désigne "l'étude de la connaissance scientifique en général". En philosophie en particulier, elle a pour objet "l'étude critique des postulats, conclusions et méthodes d'une science particulière, considérée du point de vue de son évolution, afin d'en déterminer l'origine logique, la valeur et la portée scientifique (...)."
En tant qu'écosystème informationnel, Wikipédia avance à visage découvert : elle cite ses sources, s'efforce de mettre en avant des sources fiables, "oblige" à les vérifier, s'efforce d'adopter une neutralité de point de vue. Un écosystème par ailleurs récemment analysé dans sa diversité de services, et qui donne à voir un visage relativement monolithique :

Piechartscorrected

Monolithe numérique en ligne donc, même si ce dernier connaît également depuis peu des versions "papier-like" ou même "DVD-like"

Toutes ces choses dites, le débat reste entier autour de la place qu'occupe actuellement ledit écosystème et du modèle qu'il propose. Pour clarifier ce qui suit, je rappelle en préambule tout le bien que je pense de Wikipédia. Ce qui ne m'empêche pas d'être critique.

Vérité et vérifiabilité sont dans un bateau.
Un article de Simson L. Garfinkel dans la MIT Technology Review propose une analyse intitulée : "Wikipedia ans the meaning of truth." L'article revient d'abord sur la contamination opérée par Wikipedia dans l'ensemble des sphères professionnelles et informationnelles : les journalistes s'y reportent, les étudiants y sont accrocs, les enseignants s'y mettent peu à peu, et l'encyclopédie occupe très (trop ?) souvent la première place dans les pages de résultats des moteurs de recherche. Le deuxième point abordé par l'article est celui du "contrat social" wikipédien : pour survivre, l'encyclopédie ne peut se permettre d'être bourrée d'erreurs et de contre-vérités (sinon personne ne la consulterait). La politique de publication qui s'est ainsi progressivement mise en place et la rapidité avec laquelle la plupart des erreurs sont corrigées sont le fondement dudit contrat social. Pour autant, Wikipédia ne repose pas, épistémologiquement parlant, sur une logique de vérité, mais sur une systématisation de la vérifiabilité :

  • "A la différence des lois mathématiques ou scientifiques, la vérité wikipédienne n'est pas basée sur des principes de cohérence ou d'observabilité. Pas davantage qu'elle n'est basée sur le bon sens ou l'expérimentation. Wikipedia a construit un ensemble de standards épistémologiques radicalement différents (...) qui doivent interroger ceux qui sont concernés par le sens traditionnel des notions de vérité et de précision. Sur Wikipedia, la vérité objective n'est pas la plus importante. Ce qui fait qu'un fait ou une information peut être intégrée dans l'encyclopédie est qu'il apparaisse dans une autre publication -- idéalement en Anglais et qui soit disponible en ligne. La ligne officielle de Wikipédia est d'ailleurs la suivante : "La condition d'inclusion d'un article dans Wikipédia est la vérifiabilité, et non sa vérité."."

Et Garfinkel de conclure ainsi son article :

  • "Alors qu'est-ce que la vérité ? (...) En pratique, le standard d'inclusion des articles mis en place par Wikipedia est devenu, de facto, le standard pour la vérité, et depuis que Wikipédia est la source en ligne la plus lue sur la planète, c'est également le standard de vérité que la plupart des gens utilisent quand ils font une recherche sur Google ou Yahoo. Sur Wikipédia, la valeur de vérité de la vérité est la vue concensuelle d'un sujet. (On Wikipedia, truth is received truth: the consensus view of a subject.)"

Rappelons-le ici, Garfinkel reste plutôt enthousiaste et "pro"wikipédia. La raison est simple : il fait partie du trop peu d'enseignants-chercheurs qui ne se contentent pas d'utiliser l'encyclopédie mais qui, dans leur domaine de spécialité, corrigent et complètent les erreurs ou approximations qu'ils y rencontrent.
Ce qui est en jeu dans l'article de Garfinkel, ce sont finalement les répercussions systémiques des modes opératoires qui, par effet de contamination, peuvent s'étendre de Wikipédia au Web dans son ensemble. En d'autres termes, la capacité centripète des forces qui agitent et animent ladite encyclopédie. Dans un ancien billet, j'écrivais de mon côté :

  • "Une autre des grandes forces de Wikipédia, au-delà même des processus de collaboration centrifuges qui animent la communauté des Wikipédiens, ce sont les logiques d'appropriation centripètes qu'autorise l'architecture "ouverte" de l'encyclopédie : les différents outils cognitifs qui fleurissent ces derniers temps autour du projet illustrent bien ces logiques."

Mais tout le monde n'aime pas cet effet centripète. Ainsi Nicolas Carr (qui lui, n'aime pas Wikipédia pour différentes raisons) écrit dans un billet intitulé "Le web Centripète" :

  • "Wikipedia offre un magnifique exemple du pouvoir formel qu'exerce la force centripète du web. La populaire encyclopédie en ligne est moins la "somme" des connaissances humaines (...) que le trou noir de la connaissance humaine. Son coeur : une vaste exercice de copier/coller qui bannit explicitement toute pensée originale ; Wikipédia aspire d'abord les contenus des autres sites, puis leurs liens, puis leur place dans les résultats des moteurs de recherche, puis leurs lecteurs. (...) Les articles de Wikipédia sont devenus les liens externes par défaut de beaucoup de créateurs de contenus, non pas parce que Wikipédia est la meilleure source existante, mais parce que c'est la plus connue est qu'elle est généralement "assez fiable"."

Un réquisitoire comme qui dirait "sans appel" et qui en arrive à la même conclusion que l'article de Garkinkel : le danger n'est pas dans Wikipédia, il est dans les usages naïfs de Wikipédia. Un débat vieux comme le monde (scientifique) : la découverte de la fission nucléaire n'est pas un danger. C'est son instrumentalisation (pour fabriquer des bombes) qui en est un. Wikipédia ne menace personne, sa politique de publication est parfaitement lisible et explicite. Ce qui ne la met naturellement pas à l'abri de la critique.

Wikipédia est un go-between culturel planétaire.
Parce qu'internet, parce que la surcharge informationnelle, parce que l'infobésité, parce que nos comportements connectés, parce que l'émergence de nouveaux modèles d'autorité, parce que, parce que, parce que ... Wikipédia s'est construite et a émergé dans ce contexte là. Elle n'est pas réductible à une encyclopédie classique (argument mis en avant pas ses idolâtres), pas davantage qu'elle ne l'est à une anti-encyclopédie (argument mis en avant par ses détracteurs). Elle est une forme neuve, intermédiaire, de la mise en circulation et de l'agrégation des connaissances.

La formation sur les berges du Styx.
Là où Carr et Garfinkel ont tous les deux raison, c'est que nous sommes tous des Wikipédiens, et parfois presque "malgré nous". Comme nous sommes par ailleurs tous des Googlers. Nous utilisons tous l'encyclopédie et le moteur. Nous ne comprenons pas tous comment ils fonctionnent. Nous ne les alimentons pas tous de manière consciente ou inconsciente, de manière honnête ou détournée. Mais nous les utilisons tous. Nous y sommes tous perméables. Et il n'y a que très peu de chances pour que cela change avec les prochaines générations. Celles-ci seront victime de ce que vous me permettrez d'appeler le talon corps d'Achille numérique. Keskesékessa ? Souvenez-vous d'Achille, de son corps invulnérable une fois trempé dans le Styx, et de son seul point faible, le talon par lequel sa mère le tenait lors de son immersion. Les usagers de l'écosystème numérique de demain seront tous des achilles numériques à l'envers. Ils seront entièrement perméables au mode d'accès, de représentation et d'organisation des connaissances et des informations que leur proposent dès aujourd'hui l'encyclopédie et le moteur. A ces usagers là, il reste une force. C'est leur talon d'Achille : ce petit bout d'eux-mêmes qui ne fonctionne pas uniquement sur des habitus numériques induits, et qui, ce faisant, leur permet d'interpréter ces outils avec la distance critique suffisante. Suffisante ET nécessaire. Alors le dire. Et le répéter encore : seule la formation, seule la formation à une culture de l'information permet cela. La dynamique de propagation des habitus numériques, la façon dont ils modèlent notre monde de manière aussi structurante que parfois pernicieuse, cette dynamique réduit progressivement ce talon d'Achille à une peau de chagrin. L'urgence en termes de formation est réelle. Elle est même vitale.    

(Temps de rédaction de ce billet : 2h15)

Atlas of Cyberspace.

Aujourd'hui la "cartographie" du web est devenue courante. Et ce n'est pas un hasard. Occupants maladroits ou simples visiteurs, cybersquatteurs en quête perpétuelle d'ameublement, nous "habitons" désormais littéralement le cyberespace. Nous ne pouvons donc tout simplement plus nous permettre de ne pas en avoir de carte. On ne compte plus les projets de recherche pionniers, les blogs de référence, les moteurs cartographiques, les outils aussi riches que variés. Cartographie de tout (ou à peu près) et partout. Derrière tout cela (et ceux-là), il existe un ouvrage de référence. Une bible. LE livre de chevet de tous les cyber-géo-cartographes professionnels et amateurs. C'est l'Atlas of Cyberspace de Rob Kitchin et Martin Dodge, paru en 2001, alors que Google avait 3 ans, que Rome remplaçait Sparte, que Déjà Napoléon pointait sous Bonaparte. Si la cybergéographie est aujourd'hui reconnue comme un authentique champ de recherche (à l'étranger tout au moins ...), c'est essentiellement à cet ouvrage qu'elle le doit. Et si je vous en parle aujourd'hui c'est parce que l'ouvrage en question est désormais intégralement disponible en ligne sous licence Creative Commons.  A lire donc ou à relire ... La version Haute définition de l'ouvrage est un petit bijou pour les illustrations :-))
Ce que cet ouvrage à de pionnier, s'il fallait le résumer, c'est qu'il fut le premier (?) à s'intéresser à la géographie des flux de données en tant que telle, comme on s'était auparavant intéressé à la géographie des flux humains ou financiers. Cette Cybergeographyflow là est aujourd'hui naturellement essentielle. Elle l'est d'autant plus qu'elle éclaire sous un angle impensable à l'époque, ces géographies "parentes" des flux humains et financiers. Demain peut-être elle les supplantera définitivement (cf le très à la mode et très disruptif "cloud computing"). Il faut également avoir cela en tête pour relire avec gourmandise l'Atlas du Cyberspace.
En cadeau bonus, cette photographie d'un Internet qui paraît avoir 1000 ans et qui ne date pourtant que de ... 14 années.
Cybergeo
Et oui ... Qui se souvient des Monster List de l'espace FTP, qui se souvient que la liste arborescente du CERN était à l'époque l'une des seules entrées "grand public" de l'internet ? S'il y en a qui ont le temps, il y aurait un joli travail de graphisme et de réflexion à faire pour redessiner cette carte en l'adaptant à l'Internet actuel ...
Autre aspect visionnaire de l'ouvrage, un chapitre entier (le n°4) est consacré à la "cartographie des conversations et des communautés". Je vous rappelle que nous sommes en 2001 et que (même aux Etats-Unis) personne ne sait encore ce que c'est qu'un blog ...
Un ouvrage majeur qui se termine pas ces mots : "And remember : there is no true map of cyberspace."

Et si vous êtes tentés d'approfondir la question, la bibliographie d'Eric Guichard sur le sujet est une autre ressource incontournable (même si elle date un peu). Et puis un dernier lien opur la route, signalé par InternetActu : le manifeste pour la géographie numérique, et une synthèse sur le développement de la cartographie collaborative en ligne.

(Sources : The End of Cyberspace // Temps de rédaction de ce billet : 2 heures)

Vendredi ou l'entorse creative

Préambule : des licences creative commons en général et de celle d'Affordance en particulier.

Certains d'entre vous le savent, d'autres pas. L'intégralité des contenus de ce blog est disponible sous licence Creative Commons. Ce qui vous donne le droit de les réutiliser comme vous voulez, à condition que ce soit en citant la source, et à condition que cela reste en dehors de tout cadre commercial. Voilà les faits. Il m'arrive parfois (très rarement) de déposer certains de ses billets sur d'autres plateformes (Agoravox principalement). Cela me permet de me confronter à un autre type de lectorat que les habitués d'Affordance. Mes rares expériences en ce domaine (seulement 7 ou 8 billets publiés sur Agoravox sur les 1408 que compte ce blog), m'ont plutôt dissuadés de continuer l'expérience (vu la teneur polémique et souvent assez peu constructive des commentaires, même si, depuis mon dernier essai, la politique de modération a été entièrement revue), ou alors de publier dans ces plateformes des billets entièrement re-rédigés et re-formatés pour l'occasion (ce que je n'ai pas le temps de faire). Il m'arrive également d'être parfois sollicité par la presse "nationale". A ce moment là et pour de bonnes (diffusion beaucoup plus large de mes cogitations) ou de mauvaises raisons ("vanitas vanitatum ..."), j'effectue une entorse relative à la licence précédemment évoquée, puisque que les journaux qui publient ou republient mes billets le font dans un cadre commercial "relatif" (ainsi les articles d'Ecrans, le mag de Libé, sont librement consultables, mais les archives du Monde sont payantes). Bref, pas de quoi fouetter un labrador, de toute façon, tout reste disponible gratuitement pour les lecteurs d'Affordance (c'est l'essentiel de mon point de vue) et je ne touche pas un sou pour cette éphémère "renommée". (Nota Bene en passant : cette logique va même plus loin puisque je m'efforce également de l'appliquer à mes publications scientifiques, déposant systématiquement une version de mes articles acceptés dans des revues payantes, sur des sites d'archives ouvertes, ce qui m'a déjà valu et me vaudra probablement encore quelques - petits - conflits).

Vendredi, ou les limbes du pacifique "le lundi au soleil" des blogueurs.
Avec le lancement d'un nouvel hebdo intitulé Vendredi, me voilà dans une configuration inédite que je vous soumets (parce que vous êtes souvent de bon conseil et qu'on se dit tout :-). Le modèle économique et éditorial de cet hebdo est un peu particulier. Pour faire court il s'agit de reprendre une sélection d'articles parus sur le web, notamment dans la "blogosphère" (mais pas exclusivement). De faire un hebdo "papier" reposant uniquement sur des contenus "Internet amateurs" (c'est à dire, si j'ai bien compris, des amateurs plutôt "éclairés" - chercheurs, avocats, simples citoyens - ou dotés d'indéniables qualités rédactionnelles, mais ne disposant en tout cas pas de carte de presse). Parce que j'aime bien l'idée, parce que je crois que dans le contexte actuel (états généraux de la presse et rapport Giazzi) elle mérite en tous les cas d'être testée, parce que j'ai été sollicité par Jean-Marc Manach et que j'aime bien ce qu'il fait en général, parce qu'à l'initiative de ce projet on trouve Jacques Rosselin et que ce dernier fut en sont temps à l'initiative de Courier International, parce que Philippe Cohen (Marianne2.fr) est également de l'aventure, parce que parce que parce que ... j'ai accepté qu'ils reprennent un billet pour le prochain numéro de Vendredi (24 Octobre), et si l'occasion se représente, j'accepterai encore. Et au moment où j'ai accepté, je l'ai fait dans mon état d'esprit habituel (c'est à dire sans demander de dédommagement financier).
Mais j'ai ensuite reçu ce mail :

  • " (...) l'idée est de proposer aux auteurs que nous apprécions et dont nous sommes susceptibles de reprendre les textes de temps à autres, de signer une convention nous autorisant la republication de leurs articles ou billets; ce qui nous permet aussi d'établir, chaque mois, le montant à vous reverser, à raison de xx euros par republication (hors les citations dans les brèves, bien évidemment)"

Qui suis-je, où vais-je, et combien suis-je payé ?

Et c'est là que je suis coincé. En admettant (cas d'école) que même si la blogosphère est très large, le magazine Vendredi soit amené à reprendre les articles de certains blogueurs plus fréquemment que d'autres, et en admettant que je sois parmi ces quelques élus (cas d'école, je le répète), je suis donc en situation de tirer quelques revenus de mon blog (pas de quoi fouetter un poney je vous l'accorde, mais de quoi augmenter un tout petit peu mon pouvoir d'achat) et je fais une entorse à la "philosophie" ou en tout cas à "l'esprit" de la licence creative choisie en acceptant donc, par convention, d'être rétribué (peu et tout à fait aléatoirement) pour certains articles. Bref je deviens pigiste-joker pour un organe de presse. Une solution serait naturellement de refuser non pas d'être "repris", mais d'être payé pour cela. Or, pour bien comprendre mon état d'esprit actuel, sachez que je n'ai pas d'états d'âme à percevoir quelques dizaines d'euros de temps à autre (encore une fois rien ne dit que cela se reproduira à une fréquence suffisamment régulière pour être pécuniairement significative) vu le temps que je passe à alimenter Affordance (et comme en plus c'est la crise hein ...), le tout en "supplément" de mes activités de recherche et d'enseignement (pour lesquelles, afin que tous les éléments soient sur la table, je touche 1800 euros nets par mois).

Et donc ?? Donc disons, pour faire simple, qu'en acceptant cela, pour le moment, et pour ce journal particulier, je change (me semble-t-il) légèrement sinon la nature de cette publication (mon blog), du moins le "contrat éditorial et lectoral" qui le caractérisait jusqu'à lors. En clair : vous êtes toujours sur un blog de chercheur, ce blog est toujours sans autre filtre éditorial que celui de la subjectivité assumée par son auteur, mais ledit chercheur vient d'accepter d'être (occasionnellement) rétribué par un organe de presse, organe certes innovant mais organe tout de même. Vous me direz il y a encore une grande marge avant que je me mette à publier des publis-rédactionnels vantant les mérites de la Seat Laguna de Mitsubishi, mais ... "mais tout de même","en cherchant bien", "s'il l'a déjà fait une fois", et patati et patata ...

Alors à votre avis :

  • je me fais des noeuds tout seul ? Si c'est le cas, TAPEZ 1 (prends l'oseille et tais-toi)
  • ce sont de vraies questions ? Si c'est le cas TAPEZ 2 (t'étais "juste" chercheur, tu deviens juste "un peu" - plus ? -  journaliste/vulgarisateur scientifique).

Ceux qui ont tapé 1 peuvent arrêter ici la lecture de ce billet.

Vers un lissage des espaces de publication.
Pour les autres (ceux qui ont tapé 2), au-delà de tout cela, reste entière la question de savoir si cette "carotte" potentielle impactera à terme le mode de publication et le rédactionnel d'Affordance (non à 99,9%) ou d'autres blogs/sites (je n'en sais rien mais suspecte que "oui, probablement, pour certains en tout cas"). Question subsidiaire encore, si le modèle Vendredi prend (ce que je lui souhaite), va-t-on vers un lissage des espaces de publication existants et des autorités afférentes : citoyens / journalistes / auteurs ? Et si oui, ce lissage est-il une bonne chose ? Pour préciser ma pensée, et en mettant cette fois de côté le cas particulier d'Affordance et des blogs tenus par des scientifiques en général, il est un grand nombre de rédacteurs dans la blogosphère auxquels il ne manque que la carte de presse pour s'installer journalistes : <Polémique> le travail souvent minutieux d'écriture qu'ils effectuent, la vérification et le croisement souvent tout aussi minutieux de leurs sources, la qualité du rédactionnel et du style, la fréquence et/ou la régularité de publication, l'expertise métier dont ils peuvent se prévaloir ... tout cela leur permettrait (à mon sens) de ne pas prétendre "abusivement" à l'obtention d'une carte de presse (pas plus abusivement en tout cas que Jean-Pierre Pernaud). </Polémique> Dans le même temps, et c'est aussi un peu cela qui fait l'intérêt des médias "de niche" vis à vis des médias "mainstream" (à mon sens toujours), dans le même temps disais-je, le fait de ne pas disposer de carte de presse est également une liberté formelle importante, du genre de celle qui constitue une ligne de démarcation intellectuelle servant de repère aux lecteurs des uns (bloggueurs) et des autres (journalistes). Nul ne nous oblige en effet à être en permanence "en situation de journaliste" ou à tout le temps "jouer" au journaliste : on a le droit à l'erreur (les journalistes aussi me direz-vous), le droit à la mauvaise foi, à la mauvaise humeur, le droit de décréter un jour avoir une ligne éditoriale à tenir et le droit tout aussi imprescriptible de s'y soustraire le lendemain.
A partir de là, il y a deux manière de traiter le problème : soit façon "café du commerce" sur la vieille antienne "tous citoyens, tous journalistes", soit avec talent et sous différents angles problématiques (Ecosphère, Novövision, etc ...). Dans cette optique, l'initiative lancée par Vendredi devrait rapidement permettre d'y voir un peu plus clair dans les stratégies éditoriales à l'oeuvre sur le net et dans la blogosphère. Comme serait tenté de le dire le chercheur qui sommeille en moi, voilà qui interroge sérieusement le paradigme éditorial en amont (filtrage et sélection) comme en aval (réécriture et distribution), en synchronie (phénomène du temps-réel) et en diachronie (fixation de la durée lié au support papier), dans son unicité (le choix éditorial d'un seul ou de quelques-uns) et dans sa pluralité relative (la blogosphère et le web sont en fait ramenées à 600 sources suivies par Vendredi).

Tactique de la citation et stratégie de la présence. Ou réciproquement.
Je voie encore une problématique intéressante dans ce lancement : l'écriture "pour le web" est pour l'instant majoritairement une écriture pensée dans une stratégie de présence. Il faut "occuper l'espace" (virtuel) du Net. Une écriture de la présence : il faut être présent dans les résultats des moteurs. Une écriture du placement : il importe d'être bien placé, bien référencé. Or ce que nous enseigne l'héritage de l'écriture scientifique, c'est la manière dont s'est progressivement constituée une écriture de la citation. Il ne s'agit cette fois plus "seulement" d'occuper la place, mais bien d'être (bien) cité par d'autres, parce que c'est là le meilleur moyen ... d'occuper la place. Dans l'écriture scientifique, la présence est une tactique et la citation une stratégie. Dans l'écriture blogosphérique mainstream, la citation est une tactique (les hyperliens), et la présence une stratégie**. Un phénomène que confirme d'ailleurs la dernière étude de Jean (Véronis) qui fait état d'un très faible taux d'utilisation des liens hypertextes dans les billets de blogs (à peine un lien tous les 12 billets**** ...). De fait, le travail de réécriture (ou plus exactement d'adaptation au média papier) que vont se coltiner les journalistes de Vendredi sera peut-être dont moins ardu que prévu. 

Au final, ce que permettra peut-être de synthétiser rapidement l'initiative Vendredi, c'est la symbiose de ces écritures, de ces deux logiques éditoriales : écrire pour être présent, et écrire pour être cité (d'autant que l'on n'écrit naturellement plus de la même manière quand on sait que l'on sera, peut-être, cité dans un autre contexte que celui du rédactionnel initial). Une fois cette symbiose réalisée (si elle se réalise), peut-être verra-t-on émerger un nouveau pacte éditorial, ou ... ou peut-être ne fera-t-on que retomber dans un schéma aussi ancien que connu : celui des spécialistes qui expertisent, celui des journalistes qui reformulent et interprètent, et celui des lecteurs qui lisent.

Et moi, CQFD, j'ai gagné ma poignée euros si ce billet est cité dans un prochain numéro de vendredi ;-)

** sur la différence entre tactique et stratégie, voir par exemple ici.

**** </Digression> un lien tous les 12 billets ... j'avoue en être tombé de ma chaise à la lecture de ces résultats :-( J'ignore à quoi cela est dû, mais de mon côté je ne conçois pas de rédaction de billets sans déployer de liens externes (je suis très souvent frustré par la lecture de blogs - par ailleurs excellents - mais qui ne renvoient qu'à eux-mêmes). A l'époque un outil comme PubSub (qui fut, sauf erreur de ma part, le grand précurseur des outils de classement blogosphériques façon Wikio), un outil comme PubSub fournissait de très intéressantes statistiques détaillées sur les blogs répertoriés dans sa top-list, notamment concernant les liens entrants et sortants (la preuve en image). D'ailleurs, si Jean me lit (bonjour Jean), dans la série des bonnes idées à mettre en oeuvre pour les WikioLabs quand les journées feront 48 heures, je verrai bien une reprise de ces fonctionnalités à l'intérieur de Wikio. </Digression>

Sur le sujet (du lancement de Vendredi et de l'intérêt ou du non-intérêt de son modèle éditorial), voir aussi : InternetActu pour le clin d'oeil amical et les infos discutées en commentaire du billet, Marianne2 pour un reportage la veille de la sortie, Ouinon pour l'opinion de quelqu'un qui n'y croit pas et qui dit pourquoi, le fil Twitter de Joel (Ronez) qui n'y croit pas non plus, Ecrans pour le pitch, Novövision pour plein d'autres bonnes questions.

P.S. : concernant la "poignée d'euros" évoquée dans ce billet, inutile de me poser la question en commentaire (je vous connais ;-). J'ai demandé à l'équipe de Vendredi si je pouvais communiquer ce chiffre, ils m'ont répondu qu'ils ne le souhaitaient pas, principalement "pour éviter un buzz autour de cet aspect-là de la cuisine interne de Vendredi." J'avoue ne pas bien comprendre ce mystère (d'autant que la somme est minime), mais je me plie aux volontés de mon ex-futur-probable-employeur-occasionnel :-)))

(Temps de rédaction de ce billet : 4h30 heures ... mais pas d'affilée)

Le web en son reflet motorisé : Google invente le monopolien.

Le 11 Avril 2008 sur son blog Webmaster Central, Google annonçait qu'il allait désormais se donner les moyens d'indexer certaines données disponibles "derrière" un formulaire, faisant ainsi reculer encore un peu le périmètre du web invisible. Comme je l'avais souligné au moment de cette annonce, un certain nombre de paramètres restaient encore dans le flou (quels formulaires ? sur quels sites ? comment ?). Six mois plus tard, sur le même blog, Google vient d'annoncer sa solution partielle au problème : cela s'appelle le First Click Free. Et comme souvent avec Google, c'est une très bonne idée, une idée par ailleurs très simple ... mais une idée que lui seul est en mesure de proposer et d'implémenter de manière significative du fait de sa situation quasi-monopolistique, une idée qui met également en péril une certaine conception du Net. Mais revenons au First Click Free.
De quoi s'agit-il ?
Les webmasters proposant du contenu protégé (par exemple sur le modèle payant par abonnement, comme les grands quotidiens de presse), auront la possibilité d'ouvrir leurs pages "privées" au crawler du moteur. Résultat ? Ce contenu sera indexé par Google, et l'internaute qui arrivera sur cette page depuis Google, y aura accès. Et oui. L'internaute qui arrivera sur cette page depuis Google. Pas "depuis un autre moteur". Google offre comme garantie que l'internaute qui souhaitera consulter les pages liées au contenu ainsi "dé-protégé" ne pourra pas le faire. C'est donc la technique bien connue des marchands d'aspirateurs du siècle dernier qui est retenue : celle du pied dans la porte. Le problème, c'est que ladite fonctionnalité instaure de facto un web à deux vitesses, qui semble contraire au principe que Google se fait par ailleurs fort de défendre, celui de la neutralité du Net en tant que réseau, en tant qu'infrastructure. Pour bien comprendre et sans faire trop long sur le sujet, rappelons que derrière la problématique de la neutralité du Net, la question est de savoir si les fournisseurs d'accès ont ou non la possibilité d'élargir ou de restreindre "sur mesure" la bande passante dédiée à certains sites. Naturellement, dans le cas des First Click Free, Google ne se positionne pas sur le créneau de l'infrastructure (ce qui lui permet de continuer à "militer" pour le maintien d'une neutralité du net), mais sur celui (c'est son métier) des contenus.
Alors en quoi est-ce contraire au principe de neutralité du Net ?
Et bien jusqu'ici, les moteurs se différenciaient par deux points : leur algorithmie, et leur infrastructure technologique leur permettant d'indexer le plus grand volume possible d'informations disponibles et de mettre à jour leur base d'index. Pour le dire différemment, si certains contenus étaient disponibles sur certains moteurs et pas sur d'autres, ce n'était en rien dû au fait que les éditeurs de ces contenus avaient ou non passé un "contrat d'indexation" avec tel ou tel moteur, mais simplement au fait que les routines d'indexation de tel moteur étaient plus efficaces que celles de tel autre. Avec First Click Free, la donne est radicalement changée. Pour la première fois à l'échelle du Net, des éditeurs vont pouvoir contractualiser l'accès à des parties payantes de leur site, avec un seul acteur au détriment des autres.
Tempête dans un verre d'eau ?
Pas vraiment. On savait déjà que les moteurs aimaient bien tisser des liens d'affection, soit avec des services dépendant directement de leur propre écosystème (ex : les vidéos de YouTube et les blogs de Blogger sont légèrement surpondérés dans les résultats de Google), soit avec des services tiers desservant prioritairement leur propre modèle économique (Ebay, Amazon ...). On savait également que les mêmes moteurs prospéraient sur des liens d'affiliation (offre Google Adsense).
Après les liens d'affiliation et d'affection, voici venue le temps des monopoliens.
Ce qui est explicitement proposé aux webmasters (pardon d'insister un peu lourdement), c'est l'indexation exclusive de certains contenus. Jusqu'ici, l'ouverture d'un contenu à un moteur, signifiait également l'ouverture de ce même contenu à tous les autres acteurs de la recherche d'information.
Quelle est la cible ?
Poser la question des (monopo)liens, c'est nécessairement poser la question de la cible d'un tel service. Pas besoin en l'occurence d'aller chercher bien loin. Si certains sites de particuliers ou certains portails d'entreprises peuvent être intéressés par cette visibilité accrue sur des contenus jusqu'ici inaccessibles, c'est (à mon avis) très clairement la presse en ligne qui est visée. Souvenez-vous en la matière de la complexité de l'indexation des contenus de la presse par Google (service Google News). Après les procès intentés par les sites de presse dans différents pays, après les accords passés avec certaines agences, Google ne se contente plus de son pourtant déjà très remarquable coup du chapeau. Prenons la question du côté d'un site de presse généraliste national ; les données sont les suivantes : je veux que mon contenu (y compris une partie de mon contenu payant) soit indexé et visible sur les moteurs de recherche. Je veux cela parce que je n'ai pas le choix et que je ne peux pas me passer du traffic généré par les moteurs. J'avais donc jusqu'ici le choix entre "garder mes contenus fermés à l'indexation" (et donc me priver du traffic qu'ils auraient pu générer), ou "donner mes contenus ouverts" (et là aussi me priver du traffic généré puisque les internautes consulteront lesdits contenus sur Google News plutôt que sur mon propre site). Avec les monopoliens, j'aurai désormais la possibilité d'amener du traffic vers mon site, en contrôlant la visibilité de mes contenus, sans risquer de voir mon audience sur lesdits contenus "déportée" vers les moteurs de recherche et leurs services d'agrégation d'actualités. Cette proposition de Google va donc probablement ravir ou à tout le moins donner du grain à moudre à ceux qui planchent en ce moment sur l'avenir de la presse.
Monopoliens sous conditions.
Si vous n'êtes pas encore convaincus que c'est bien la presse en ligne qui est directement visée, les conditions (Guidelines) fixées par Google (bé oui, en plus il fixe des conditions) devraient achever de vous convaincre. Pour ceux qui choisiront de mettre en oeuvre ces monopoliens, il faudra : (1) "que les internautes qui arriveront sur ces pages puissent voir le texte intégral du contenu", (2) "que le contenu affiché soit identique à celui offert à l'indexation du GoogleBot", (3) "que si la source liée est un article affiché sur plusieurs pages" (ce que font fréquemment tous les sites de presse) "il soit possible de consulter l'intégralité de l'article en une seule page sans qu'on lui demande (à l'usager) de s'enregistrer ou de payer".
Un nouveau contrat de dupe ?
Concrètement, en autorisant ainsi Google à indexer certaines données "privées / payantes" de leurs sites, et même si Google donne comme garantie que les usagers ne pourront pas aller au-delà du contenu ainsi autorisé, rien n'est en revanche garanti sur le comportement du GoogleBot ... à partir du moment où celui-ci disposera du mode d'accès à l'ensemble des contenus payants du site, il y a de fortes chances pour qu'il ne se prive pas de les indexer à des fins que pour l'instant lui seul connaît (même s'il est naturellement toujours possible de "re"-sécuriser des contenus mais vu le volume et l'architecture des grands sites de presse, il y a de grandes chances pour qu'un certain nombre de pages "fuitent" ainsi vers le moteur, et étant entendu que ce qui intéresse Google ce sont précisément ces contenus d'actualité qui lui restaient partiellement fermés).
Et donc ?
Et donc là encore, comme il le fit déjà avec GoogleBooks pour la partie concernant les ouvrages encore sous droits, Google avance, Google fait sans cesse reculer les frontières de l'indexation, Google alimente son coeur de métier sur des logiques tenant à proprement parler de la dévoration. Ceci doit d'autant plus nous interpeller qu'à mon avis (côté obscur de la force) nous n'avons jamais été aussi près de voir émerger demain un authentique GoogleNet se substituant au réseau Internet tel que nous le connaissons aujourd'hui, et que (côté optimiste de la force) d'autres sont en passe de montrer qu'il est possible d'être à la fois visionnaire et tout aussi "malin" que le Cronos du Net.

(Via Google Blogoscoped // Temps de rédaction de ce billet :1h30)

Le politique et son reflet motorisé : jusqu'ici ... tout va bien.

Vous souvenez-vous du débat télévisé entre Ségolène Royal et Nicolas Sarkozy ? Vous souvenez-vous, dans ce débat, de l'épisode sur l'EPR de 3ème génération ? Vous souvenez-vous de la TRD (tentative de redocumentarisation déviante) occasionnée ? Oui ? (sinon, allez vous rafraîchir la mémoire ici, puis revenez).
L'autre soir, dans un autre pays, un autre débat opposait Sarah Palin à Joe Biden. Et que font aujourd'hui les gens (enfin certains) pendant les débats politiques ? Et bien ils cherchent. Ils cherchent à comprendre. En France ils avaient donc cherché sur Wikipédia la vérité sur l'EPR, et comme les partisans de l'un y trouvèrent la vérité, mais que cette vérité était celle de l'autre, ils se mirent à chacun écrire leurs vérités. Sans dommage heureusement. Aux Etats-Unis, les gens ont cherché ... mais sur Google. Et Google s'est "amusé" avec son outil Google Trends, pour "voir" littéralement ce que les gens tapaient ... dans Google, au fur et à mesure de l'avancée du débat et des arguments. Le compte-rendu que fait Google de cette expérience, est - au-delà du bourrage de mou habituel de la firme - très intéressant. On y apprend d'abord que les gens utilisent énormément la fonction "define:" proposée par le moteur dès qu'ils butent sur un mot (en l'occurence "Maverick" ou "theocracy").
<Digression>M'appuyant sur un panel à peine moins représentatif que celui de Google (mes étudiants), il faut reconnaître que cette fonction (parfois assez indélicate et malgré l'existence d'une remarquable concurrence) remporte effectivement un énorme succès : c'est en effet le seul opérateur qu'ils retiennent sans que j'aie besoin de le leur répéter 17 fois. </Digression>
Donc les gens cherchent. Mais à relire le billet de Google, on s'aperçoit surtout de la fantastique opportunité que représentent pour lui ces grand-messe télévisuelles. Car pendant que les gens cherchent pour comprendre le discours, Google dispose du discours. Google est dans la situation du scientifique qui monte une "manip", une expérimentation, et qui s'efforce d'en contrôler la totalité des paramètres, des variables.  Quand un candidat prononce le nom "d'Ahmadinejad" les gens cherchent [Achmadinijad], [Akmadinijad], [Akmadinajad], [president Iran], [Iran leader]. Et alors ?
Alors avec ce genre de focale (un évènement dont on sait qu'il va - pendant une période de temps donnée -  occuper l'attention d'une majorité de l'opinion), alors à cette échelle (des millions d'américains ont regardé ce débat), c'est l'occasion pour le moteur de faire ce que tous les puissants de ce monde (et aussi quelques scientifiques ...) ont un jour rêvé de faire : sentir le pouls réel de la planète, de l'opinion, disposer de données très peu "bruitées" parce que centrées sur un événement donné, dans une fenêtre de temps fixe, mesurable. Difficile en effet, si l'on ne dispose pas du cadre, du contexte fourni par le temps du débat télévisé, d'apparier les requêtes déposées ([Akmadinajad], [president Iran] ...) à une même entité référente ("Ahmadinejad"). Avec la grand-messe politique, Google tient sa source.
OK mais euh ... et alors ?
Alors vous vous souvenez de ce que racontait l'autre jour Peter Norvig (Google Chief Scientist) à propos de l'intelligence des données ? Avec ce genre d'expérimentation politique à l'échelle d'un pays, Google peut se permettre d'avancer considérablement plus vite que les outils du web sémantique. Il peut littéralement "zapper" le recours à des logiques sémantiques au profit d'un apprentissage via des logiques d'auto-renforcement. Le volume des données traitées, "l'intelligence" que leur confère ce genre d'expérimentation sont, dans l'instant et à ce volume, beaucoup plus prometteuses et plus efficientes que ne peut prétendre l'être un web sémantique (ou sémantisé) toujours en manque d'un volume de données (et de métadonnées) suffisamment vaste ou suffisamment homogène.
Oui mais ...
Oui mais le problème c'est que les données, même interprétées, même compilées à cette échelle, ne sont jamais exemptes de variables, d'imprévisibles, d'impondérables variables. Le fameux "grain de sable" capable de détraquer un immense engrenage. Tout ceci pose donc deux questions : l'architecture de Google, autant que son approche, autant que son quasi-monopole, le mettent aujourd'hui clairement en situation (délibérée ou non) de pouvoir fausser les représentations communes, et ce à l'échelle d'un pays, d'une nation. "Je me dis parfois que je peux sentir les sentiments du monde, ce qui peut aussi être un fardeau. Qu'arrivera-t-il si nous répondons mal à des requêtes comme "amour" ou "ouragan" ?" disait déjà Apostolos Gerasoulis (le papa d'Ask Jeeves, 4ème moteur de recherche au monde tout de même). Dans sa situation actuelle, Google peut légitimement se poser la question de savoir : "Qu'arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?"
Quand les gens tapent [Akmadinajad], [president Iran] au moment d'un débat électoral majeur, qu'arrivera-t-il, que pourrait-il arriver si "je" les renvoyais vers des résultats même légèrement, même infinitésimalement partisans ?
Vous êtes perdus, vous ne voyez toujours pas où je veux en venir ?
Quand les gens ont cherché des informations sur l'EPR lors du débat télévisé français, que serait-il arrivé si on leur avait majoritairement affiché des sites renvoyant davantage à la version d'un candidat au détriment de l'autre ?
Ca y est ? Vous voyez où je veux en venir ?
Avec Wikipédia, nous avons encore la possibilité de contrôler, "d'éditer". Et être capable d'éditer, c'est encore être capable d'éditorialiser, et donc de contextualiser, de diversifier, de distancier. Avec Google nous sommes le nez dans le guidon, le nez dans le miroir, nous n'avons plus que la seule liberté de souscrire à l'ordre de la liste affichée de résultats. Alors bien sûr Google n'oriente pas les résultats en fonction de tel ou tel candidat. Bien sûr la question n'est pas là. La question est de savoir s'il est ou non aujourd'hui déraisonnable de poser de telles questions. Je pense que non. La question est de savoir combien de temps encore la neutralité des données, la neutralité de Google pourra résister aux sirènes de la puissance du politique. A mon avis plus pendant très longtemps. Une question annexe est de se demander s'il ne devrait pas être obligatoire de mettre l'ensemble de ces données à disposition de scientifiques confirmés et ("si possible" aujourd'hui ou "s'il en reste" demain) non salariés de Google (ou d'une autre holding de l'infotainment) ? Ou au moins de permettre auxdits scientifiques d'y mettre un peu plus que le bout de leur nez, ne serait-ce que pour avoir la certitude que Google ne sera pas tenté, un jour, de se poser la question  "Qu'arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?".

(Source : ReadWriteWeb, qui souligne et titre "Google has change political debate for ever" // Temps de rédaction de ce billet : 2 heures et 15 minutes)

<Update de plusieurs jours plus tard> Google s'intéresse également aux prochaines élections au parlement européen </Update>

Technologies de l'artefact et traçabilité "positive" : l'écriture dans le ciel est-elle soluble dans l'informatique en nuage ?

=======================================
Où il est question de "technologies de l'artefact", "d'éthique hacker", de "perte du sens", "d'intelligence des données", de "traçabilité positive" et de quelques autres babioles ...
=======================================

Ecrans nous offre un beau panorama d'outils relevant du champ des technologies de l'artefact. Fake is a Fake vous permet de détourner (presque) n'importe quel site officiel. L'outil est à la fois robuste et astucieux : il utilise la plateforme Wordpress avec des thèmes (gabarits) reprenant la charte graphique des grands quotidiens (Le Figaro, New-York Times ...) de sites institutionnels (Maison Blanche, Elysée ...) ou événementiels (Pékin 2008 ...).
Dans une autre catégorie, permettant celle-là d'atténuer les technologies de l'artefact par le développement d'une heuristique "technologisée" de la preuve, Logo-Wiki (qui s'inspire de Wiki Scanner) permet de suivre les "Big brother Editors" de Wikipedia, en remplaçant le logo de l'encyclopédie, par celui de la compagnie ou de l'institution à l'origine d'une modification d'article. Pour une démo, voir ici.
Et donc ??
Tout cela fait écho a ce qui s'est raconté lors des dernières rencontres d'Ars Industrialis et notamment à l'intervention d'Alain Mille : il est (heureusement) encore possible d'inventer une ingénierie "positive" de nos traçabilités numériques. Echo également à l'intervention de Peter Norvig indiquant que l'avenir était à une formule du web contenant de moins en moins de "code" et de plus en plus de "données" (le fameux "less code, more data"). Or seul le code, seule l'écriture peut donner "un" sens à l'alignement et à l'empilement des données. Leur seul recoupement ne leur confère que "du" sens, différemment interprétable, différemment "compilable", différemment instrumentalisable, et en tout cas seulement lisible de ceux qui peuvent et pourront disposer d'une agrégation, d'une représentation suffisamment vaste desdites données. Donc accepter de se priver du "code", de le laisser tomber en désuétude, reviendrait - pour nos sociétés numériques - à s'interdire l'écriture et tout ce qu'elle autorise : le détournement parfois, l'explicitation souvent. Et à l'heure où le web se dirige effectivement vers une "intelligence des données", il faut redonner ses lettres de noblesse à l'écriture, au code. A ce titre, le rôle des Hackers est tout à fait salutaire. Ils disposent pour l'instant d'une maîtrise suffisante du code pour interpréter les données d'une manière "différante". Ce faisant, ils offrent une alternative à la fois possible et crédible - parce qu'incarnée - à l'agglomérat mainstream de données dans lequel nous engluent chaque jour davantage les multinationales du net, dans lequel nos pratiques, coupées de l'écriture, nous engluent tout autant. Et c'est probablement dans cette articulation complexe que le Web 2.0 prend sa vraie mesure : en nous offrant des outils nous permettant de ne nous soucier que des contenus, il nous conforte dans l'illusion d'entretenir une écriture alors que nous n'entrons que des données. Web2dizzaster (également repéré par Ecrans) illustre parfaitement ce paradoxe : quand les contenus s'effaceront, quand les données s'effondreront sous leur propre poids, seule subsistera l'écriture, le code. Mais cette écriture en sera réduite à sa plus simple expression : elle ne sera plus qu'ornementale. Et il y aura longtemps qu'en acceptant d'en perdre la maîtrise, nous en aurons perdu la profondeur, nous en aurons perdu le sens.

Et donc pour résumer le tout en une deux trois phrases ? Il faut que le Skywriting (et pas seulement académique ou universitaire) trouve sa place dans l'univers du Cloud Computing. Que "l'écriture dans le ciel" rivalise de présence avec "l'informatique en nuage." Attendons nous sinon, à de très fortes précipitations dans la manière dont nous y prêterons (notre) attention, dans la manière dont cela modèlera toute une économie de l'attention.

// Temps de rédaction de ce billet : 45 minutes //

God Save the Cloud (computing)

Quelques ressources et réflexions en vrac à propos d'informatique dans les nuages (Cloud Computing).

  • ReadWriteWeb nous offre un billet sur les 5 tendances (trends) du Cloud Computing : (1) des serveurs "blades", en français "lames" (c'est à dire des serveurs dont a été viré tout ce qui est "inutile", afin d'optimiser leur puissance ... si vous avez une traduction française du terme ... je prends :-), (2) une fonctionnement plus écologique (le cloud computing et ses immenses "fermes "de serveurs et autres Data Centers sont très gourmands en énergie ... premier concerné et premier à réagir : Google), (3) Virtualisation (au sens informatique du terme), (4) passage à l'échelle (pour gérer l'inflation des données portées en ligne ... ils 'agit de pouvoir gérer plusieurs péta-octets de données), (5) équipement Linux comme couche de base (aujourd'hui et d'après l'étude citée, un serveur sur 5 tournerait sous Linux)
  • Le Guardian rappelle le point de vue de Richard Stallman sur le sujet, qui est pour le moins sans ambiguité. "C'est pire que de la stupidité", pointant le risque énorme qu'il y a à confier systématiquement nos données à des systèmes qui - même s'ils sont "ouverts" en consultation et en dépôt - restent, par nature, propriétaires. Stupide donc, ET dangereux. A croiser avec le billet "Démocratisation des données" d'Hal Varian (économiste en chef chez Google), qui est un plaidoyer pour que les entreprises (spécialement les petites et moyennes), usent et abusent de la délagation de services que rend possible Google. A terme, c'est un vrai risque de dépendance informationnelle qui se profile.
  • Le prochain OS de Microsoft pourrait s'appeler "Windows Cloud". C'est en tout cas ce que confie Steve Ballmer au Register : "We’re not driving an agenda towards being service providers but we’ve gotta build a service that is Windows in the cloud". Une manière désormais stratégiquement incontournable pour Microsoft d'achever sa mue vers un OS au moins autant en ligne que sur des machines locales. Plus précisément, ce sont deux logiques convergentes parce que diamétralement opposées qui se dessinent chez les deux géants Google et Microsoft. Google offre "naturellement" la totalité de sa gamme applicative en ligne, avec la possibilité d'une synchronisation (Gears) laissant encore possible la survivance de comportements et de consultations dé-connectées. Microsoft offre tout aussi "naturellement" une gamme logicielle "locale" avec la possibilité d'une équivalence partielle en ligne afin de cannibaliser les comportements et les consultations connectées. C'est l'idée d'un "light editing" permettant d'éditer dans des applications en ligne tout ou partie d'un document, l'essentiel (ou le reste) du document, restant édité localement. Conclusion ? Ca vaudrait peut-être le coup que la bande à Roger se remette au travail sur ces sujets, pour nous aider à penser la granularité documentaire dans une globalité réticulée d'instanciations et de comportements dont elle est désormais indissociable.
  • Précipitez-vous sur la dernière conférence d'Hervé Le Crosnier à l'EBSI. Vous en sortirez plus intelligent et surtout vous contribuerez à faire exploser les serveurs de l'EBSI, ce qui permettra à un passionnant débat de rebondir, débat que l'on peut résumer comme suit : les institutions doivent-elles céder à l'extraordinaire facilité du "Cloud Computing par délégation", si non, de quels autres choix disposent-elles, et si oui, quel est le risque ? Cette question apparaît effectivement centrale : l'informatique distribuée permet aujourd'hui (et ça ne va pas s'arranger demain), d'institutionnaliser la notion de "délégation de services (informatiques)". Rappelons que nombre d'institutions publiques (mais on pourrait faire la même analyse pour le secteur privé) se sont déjà engagées sur une pente glissante en confiant leurs contenus à des prestataires externes, et en se coupant - in fine - d'une grande partie de leur public (l'exemple le plus frappant me semble être celui de Google Books). Si en plus des contenus, elles externalisent durablement (l'externalisation durable et persistante étant le principe au coeur de la délégation de service qu'autorise l'informatique distribuée), si, disais-je, elles externalisent également leurs services ... elles ne devront pas s'étonner de se trouver un beau jour sans public, et donc sans légitimité, sans raison d'être. Une question qui est d'autant plus d'actualité que les grands acteurs du cloud computing (Google et Microsoft) entrent chaque jour un peu plus dans l'université, dans l'institution (la preuve sous les deux liens précédents).
  • Voir également sur le sujet du Cloud Computing en général, un (déjà ancien) billet de Louis Naugès, qui fixe bien le problème et les enjeux du Cloud Computing. Sans oublier, bien sûr, l'article "fondateur" d'Hervé Le Crosnier.

La polygamie est génétique.

"The spitoon". Littéralement "le crachoir" est une lecture très instructive. Il s'agit du blog "corporate" de la société "23andMe", dont je vous ai souvent parlé, et qui est spécialisée dans le séquençage du génome pour les particuliers. Pourquoi une lecture instructive ? Parce que l'un de leurs derniers billets est tout simplement intitulé : "Empreintes génétiques de la polygamie". Et ben oui. Vous ne le saviez pas, mais la polygamie est génétique. L'argumentaire est exactement le même que celui de Sergei Brin annonçant l'autre jour sa maladie de Parkinson : on prend un article ou une étude scientifique sérieuse. Et on extrapole. De chaque hypothèse, on fait une certitude. L'article scientifique n'indique évidemment jamais que la polygamie est génétique. Il démontre même l'inverse. Il étudie le polymorphisme du chromosome X est propose la polygénie dans certaines populations et certaines cultures comme  une hypothèse expliquant certaines de ces variations de forme. Une fois cela mouliné dans la machine à décérébrer biotech le billet du crachoir, cela devient : "il y a un gène de la polygamie", sous-entendu : contactez-nous et nous vous dirons si vous l'avez ou non. Naturellement, 23andMe ne propose pas à la fin de son billet de faire votre profil génétique de polygame. Tout simplement parce qu'ils en sont incapables, et surtout parce que cela est impossible. Mais l'essentiel (pour eux) est fait : après lecture de leur billet, sans bien sûr prendre le temps d 'aller lire l'article scientifique mentionné, vous aurez intégré le fait "qu'un article scientifique établit une origine génétique de la polygamie". Votre conscience vous titillera un peu moins la prochaine fois que l'homme marié que vous êtes reluquera en plein rue une blonde acidulée au décolleté plongeant ("mince, revoilà mon gène de polygame qui se manifeste"), et surtout, surtout, vous serez devenu un énième client pour l'essor de ces sociétés biotech.

Le plus dangereux dans tout cela ? La banalisation de ce genre de discours. Souvenez-vous de ces chefs d'état affirmant leur "croyance" dans l'origine génétique de la pédophilie. Et maintenant fermez les yeux et imaginez ... imaginez qu'un chef d'état soit l'ami d'un capitaine d'industrie (exemple). Imaginez que ce capitaine d'industrie soit le mari (et le principal financeur) de la gérante d'une société biotech de séquençage personnalisé du génôme (exemple). Imaginez enfin que l'on puisse vivre dans une société dont le ministre de l'immigration veut instaurer des test ADN pour les immigrés (exemple). Et maintenant ... je vous laisse imaginer la suite.

(Temps de rédaction de ce billet : 1h30)

Recherche vers le futur ...

A l'occasion de ses 10 ans, Google met en place un petit outil qui vous permet de fouiller le web ... d'il y a dix ans. L'occasion d'un petit exercice d'ego-surfing toujours instructif.
==> 6 résultat en 2001 (dont certains assez croustillants ...)
Egosurf
==> 11 500 résultats en 2008 (dont certains toujours aussi croustillants mais très très très loin dans les pages de résultats)
Egosurf1

Au final un petit gadget sympathique mais qui est également la meilleure preuve que "Tout ce vous avez dit ou écrit sur Internet durant les 35 dernières années pourra être utilisé contre vous."

(Via Zorgloob)

Séminaire Inria : IST 2008

De retour de Dijon ... Mon diaporama est visible et téléchargeable sur SlideShare.

Le chapitre paru dans l'ouvrage "Métadonnées : mutations et perspectives" est disponible dans ArchiveSic.

  • Ertzscheid Olivier, "Moteurs de recherche : des enjeux d'aujourd'hui aux moteurs de demain", in Métadonnées : mutations et perspectives, Collection : Sciences et techniques de l'information, pp.59-89, 2008. <en ligne> http://archivesic.ccsd.cnrs.fr/sic_00325690/fr/

30 pages, 3 heures d'intervention lundi après-midi.
L'ouvrage complet est une mine, et je dis pas ça parce que j'étais invité ;-) La preuve ? Il m'a tenu éveillé durant les 7 heures de mon retour en train, ce qui est un signe incontestable d'intérêt.
Juste un petit regret pour ce séminaire : son tarif est prohibitif pour que les universités y soient représentées. Seuls les grands organismes de recherche français peuvent payer ce truc-là à leurs chercheurs et responsables de documentation. Et de fait, à de trop rares exceptions près, il n'y avait là que des gens (forts sympathiques par ailleurs) de l'INRIA (organisateur), du CNRS, de l'INSERM, de l'INRA ...  Ce serait pourtant important que vu la richesse et la qualité des intervenantes (enfin celles que j'ai entendues), les cours puissent être diffusés en vidéo sur Internet.
Merci en tout cas à Lisette Calderan de l'INRIA pour l'invitation et pour l'organisation.

Victoire de la bande à Bono.

Vous vous souvenez du petit père castrateur ? Et bien il ne pourra pas couper votre accès Internet sans passer par une décision de justice. Et c'est heureux. La "riposte graduée" est donc enterrée. Pour plus d'infos et pour les détails de l'affaire voir Ecrans et l'Expansion.

<Update> Ne manquez pas non plus l'épisode 2 sur Ecrans </Update>

Sociologie de l'amateurisme.

On parle beaucoup, dans le contexte du web 2.0, de la figure de l'amateur, notamment à propos des "User Generated Content" (contenus générés par les utilisateurs). Mais la frontière de l'amateurisme est souvent floue. L'article de Valérie Stienon, "Des "univers de consolidation". Note sur la sociologie des écrivains amateurs", offre une approche sociologique très complète des pratiques amateurs dans le champ littéraire. Les observations formulées proposent quelques clés de lecture importantes pour une sociologie de l'amateur à l'échelle du web, même si après lecture (rapide) de son article, l'amateurisme du web n'offre que peu d'écho à l'amateurisme littéraire qu'elle décrit.

  • Valérie Stiénon, « Des « univers de consolation ». Note sur la sociologie des écrivains amateurs », COnTEXTES, Notes de lecture, mis en ligne le 12 septembre 2008. URL : http://contextes.revues.org/document2933.html. Consulté le 22 septembre 2008.

Sergei Brin souffre de la maladie de Parkinson.

======================================================================
Billet d'humeur où il est question de Sergei Brin, du financement de la recherche médicale, des maladies orphelines, de l'appel de Sauvons la Recherche et de quelques autres choses encore.
========================================================================

Donc Serguei Brin souffre de la maladie d'Alzheimer.

Bon ben en fait non. Derrière cette intox se cachent en fait trois infos.
1 : Sergei Brin a ouvert son blog***. (il a naturellement choisi la plateforme Blogger)
2. Sur son nouveau blog, Sergei Brin nous annonce être client dans fait de la pub pour la société de sa femme (société 23andMe dont Google est largement actionnaire). Et comme tous les clients il a fait faire son séquençage de génôme en bavant sur un morceau de papier buvard (ou un coton-tige, je sais plus) et en l'envoyant par la poste à 23andMe pour 200 euros 399 $ (enfin on peut supposer qu'ils lui ont fait un prix).
3. Et donc résultat des courses : Sergei Brin sur son blog nous annonce qu'il risquerait d'être atteint de la maladie de Parkinson parce qu'il est porteur d'un gêne LRRK2 (vous et moi aussi) et d'une mutation particulière de ce gêne (G2019S) qui est liée à la symptomatologie parkinsonnienne, même si - ça c'est moi qui le précise - il est par ailleurs établi que l'étiologie exacte de la maladie de Parkinson est inconnue (.pdf). Bref, Sergei a le gêne et la mutation du gêne, sa mère avait le gêne et la mutation du gène et la maladie de Parkinson, donc Serguei serait plus que d'autres exposé à cette même maladie. Et là, comme le dit Sergei, merci Anne (sa femme), merci la société de sa femme (23andMe) parce que grâce à elle(s), il a les 20 prochaines années pour se "préparer" à l'arrivée (supposée ...) de ladite maladie de Parkinson. Il va pouvoir faire du sport pour retarder l'arrivée (supposée) de la maladie, filer plein d'argent à des fondations pour la recherche médicale sur la maladie de Parkinson (dommage que 23andMe ne lui ait pas également détecté le gêne du cancer, de la mucoviscidose, de l'amyotrophie spinale, de la leucémie, et de toutes les maladies orphelines existantes ... il paraît que dans ces domaines aussi, la recherche a besoin de pognon), et vivre chacun des jours restant avec l'idée qu'il est plus que d'autres exposé à la maladie de Parkinson. C'est la fête. Youpi.
D'un strict point de vue scientifique (si des généticiens me lisent, qu'ils n'hésitent pas à me corriger), les arguments avancés par Sergei dans son billet, et la manière dont ils le sont, peuvent effectivement l'amener à penser qu'il a peut-être plus de chances que quelqu'un d'autre d'être un jour atteint de la maladie de Parkinson, mais les mêmes arguments pourraient également l'amener à penser qu'il a plus de chances que quelqu'un d'autre de développer un ulcère du foie, un kyste à l'orteil gauche, un annuaire de recherche francophone ou une appendicite <Update>(effectivement, ça se confirme ...).</Update>
Car voilà bien tout le danger que représentent des sociétés comme 23andMe pour des clients lambda. Elles sont l'exact pendant technologique des voyantes et mediums du moyen-âge. En travaillant sur la peur, en instrumentalisant l'ignorance, en habillant "l'a peu près" des atours de la vérité scientifique, en présentant comme des faits scientifiques avérés des suppositions dont aucune n'est à ce jour prouvée, on crée, au pire, les conditions d'émergence de ladite pathologie, et au mieux, une jolie psychose maniaco-dépressive. Il faut ici rappeler que des sociétés comme 23andMe n'ont que faire de la recherche médicale. Seul compte le dogme génétique : une maladie = un gêène ; Vous voulez savoir si vous allez être malade ? Demandez-nous si vous avez le gêène. Seule les intéresse le potentiel marchand de la génomique personnalisée. Leur pouvoir de nuisance n'est (pour l'instant) que "psychologique" ou "psycho-somatique". Mais leur discours, leur fonds de commerce est le même que celui d'un monde dans lequel l'état ou les cigarettiers vous expliqueraient qu'en achetant votre paquet de cigarette, vous aidez la recherche contre le cancer en permettant d'augmenter le nombre de cas existants, donc le nombre de cas cliniques, donc les possibilités de disposer d'un plus grand spectre d'analyse, donc au final les possibilités de trouver un remède.

Le billet de Sergei Brin, sa position à la tête de l'une des plus grandes holdings de l'information et de la conaissance que le monde ait jamais connu, les relations maritales et financières unissant le même Sergei Brin aux sociétés actuellement leader sur le (super)marché du séquençage génomique personnalisé (Google détient des parts substantielles dans 23andMe mais également dans son concurrent direct, Navigenics), tout cela pose par ailleurs une question lancinante : voulons-nous d'un monde dans lequel les progrès et les principaux financements de la médecine devront parier sur le niveau d'hypocondrie de leurs grands dirigeants ou financiers ? Voulons-nous d'un monde dans lequel il nous faudra guetter le cancer de Bill Gates, la maladie de Parkinson de Mickael J. Fox ou Sergei Brin, l'Alzheimer de Ruppert Murdoch pour espérer voir la recherche sur ces maladies bénéficier d'un effort de recherche suffisamment financé ?

Voilà pourquoi les notions si peu sexy et souvent galvaudées d'un "pilotage de la science" et d'une "politique scientifique" sont si importantes, si nécessaires. Voilà pourquoi la question du financement et des orientations de la recherche publique sont si cruciales, si vitales. Voilà pourquoi le politique, les chercheurs et les citoyens doivent s'emparer de ce débat, sans qu'aucun ne vienne déposséder l'autre de ses prérogatives. Voilà pourquoi les chercheurs et les citoyens ne peuvent pas laisser le politique faire n'importe quoi. Voilà aussi pourquoi certains engagements pour la recherche et l'enseignement supérieur m'apparaissent, bien au-delà des intérêts corporatistes qui les meuvent, plus que d'autres légitimes.

***au moment où je publie ce billet, rien n'indique que le blog de Sergei Brin ne soit pas un faux. Mais rien n'indique non plus le contraire :-).

Le poids des mots marchands.

J'aborde souvent, avec mes étudiants ou lors de formations, la question de la marchandisation de l'indexation (liens sponsorisés). J'en profite (quand j'ai le temps ...) pour pointer les dérives malheureusement consubstantielles à ce processus. Je cite souvent en exemple les achats électoraux de l'UMP au moment de la crise des banlieues ou bien encore à l'époque de l'affaire des caricatures du prophète Mahomet. L'actualité vient de me fournir un nouvel exemple pour mes prochains cours. Le mot en question est cette fois : Avortement (abortion). Et la question posée la suivante : les militants anti-avortement ou les lobbys et groupes de pression religieux peuvent-ils acheter ce mot à des fins publicitaires ? Jusqu'ici la réponse était non. Comme le rappelle le NYTimes qui relate l'affaire, l'achat de mots-clés sur Google est relativement encadré et soumis à certaines règles : il est ainsi impossible d'acheter des mots-clés pour des produits dérivés d'espèces animales protégées (par exemple : fourrure en poil d'ours des pyrénées) ou d'afficher dans le texte des publicités des incitations à la violence. Bref, une déontologie a minima et condamnée à un perpétuel ajustement. Mais il est des mots-clés tendanciellement neutres pour lesquels le traitement publicitaire peut être lourd de conséquences. Et c'est le cas du mot clé "abortion". Donc suite à un procès engagé contre Google par le Christian Institute, un accord amiable a été trouvé entre les deux. Il sera désormais possible (pour le Christian Institute mais également pour tous les groupes religieux ou sectaires anti-avortement) d'acheter ce mot-clé "comme les autres". La condition fixée par Google et figurant dans les termes de l'accord amiable est la suivante : "le texte des publicités doit être factuel, et non pas graphique ou émotionnel." Naturellement, rien n'est dit en revanche sur le contenu des pages liées ... et inutile de vous dire que dans lesdites pages liées, le Christian Institute  ne se prive pas de jouer sur le registre émotionnel. Ne reste plus qu'à espérer que le planning familial dispose d'un compte Adwords :-(
Moralité ? Tout change. Jusqu'au XXème siècle, les mots avaient un sens, ils ont désormais un prix. Le risque est que dans bien des cas, leur prix ne fixe leur sens commun.

Sauvons le net Européen

Sauvons le net européen !

Important ... Il ne reste plus que deux jours avant le vote. Sur le même thème mais dans un registre plus léger, on ira lire la "Lettre ouverte à Nicolas Sarkozy" rédigée par l'association « Parents pour la Société de l’Information et de la Communication » (PSICO).

P.S. : pour les plus pressés ou ceux auquels cette bannière ne dirait rien, voir le compte-rendu de l'affaire sur Ecrans.

La gestion de contenu en 2038 (ou à peu près)

============================================================================
L’ensemble du patrimoine écrit planétaire étant désormais numérisé, les supports physiques ont été dématérialisés. Bob Toile, matricule Z3950, né le 5 septembre 2008, prend ses nouvelles fonctions chez Amazoog France.
============================================================================

2038. Paris. Il est 9h00 quand Bob Toile franchit les portes de l’entreprise Amazoog France. Il vient d’être nommé BuMPS : Business Manager of Participatory Streams. Son poste consiste à coordonner la diffusion de l’ensemble des flux de données entrant et sortant de l’entreprise. Et pas n’importe quelle entreprise. Amazoog possède l’ensemble des infrastructure du second réseau : Networld2. L’internet de 1ère génération est mort.
Comme tous les BuMPS, William commence par apposer sa main sur l’interdesk : une table de travail interfacée et interactive. Grâce à la reconnaissance biométrique implantée dans l’interdesk, et aux datapuces sous-cutanées de Bob, il voit instantanément s’afficher ses trois Lifestreams, les trois brins de son ADN numérique. Laissant de côté son Personal Stream (PES) et son Public Stream (PUS), il ouvre son Business Stream. L’interdesk recompose alors instantanément l’ensemble de ses données professionnelles : coordonnées, messages, agenda, tâches, projets mais aussi toutes ses interopdocs en cours (INTERactions OPératoires DOCumentées). Son bureau est juste au dessus de l’archithèque**  intégrée d’Amazoog France. Sept cent téra-octects transitent ici chaque jour. Ils sont une centaine comme lui à coordonner l’ensemble. Entre eux ils se baptisent les « aiguilleurs ». Grâce à l’infrastructure gigantesque dont dispose Amazoog, chaque information, chaque donnée, chaque échange, chaque interaction est stockée en permanence. Bob et ses collègues s’occupent spécifiquement de l’aiguillage des échanges et des interactions. Les anciens « documents » n’existent plus. Entièrement dissous dans la colossale mémoire de Networld2, ils ne sont plus qu’un flux de données en mouvement perpétuel. Mais grâce au travail de Bob ils peuvent être « instanciés », recomposés, reconfigurés à chaque instant, pour être basculés en affichage personnalisé dans l’interdesk du profil qui en fait la demande.
A 13h, Bob descend dans l’archithèque. Chaque succursale d’Amazoog en possède une, de taille variable (bien que toujours colossale). La température y est artificiellement maintenue à 7 degrés pour éviter toute surchauffe. Les murs de ce gigantesque local sont en effet constitués d’un seul et unique interdesk. L’archithèque d’Amazoog France est spécialisée dans la gestion des flux historiques et littéraires. L’ensemble du patrimoine écrit planétaire étant désormais numérisé, les supports physiques ont été dématérialisés. Networld2 les contient tous, et peut sur simple demande les traduire dans toutes les langues parlées sur la planète. Parmi l’ensemble des supports physiques, seuls les livres sont encore systématiquement conservés par enfouissement. A l’échelle de la planète, les réserves d’enfouissement représentent l’équivalent d’un continent comme l’Amérique du sud : à 100 mètres sous terre, d’immenses entrepôts de titanium affichant un degré d’hygrométrie adapté à la conservation du papier. Les anciennes bibliothèques ont été remplacées par des guichets individuels de visionnage répartis dans toutes les rues des grandes villes, pour les gens ne pouvant pas s’offrir d’interdesk personnel. Ces guichets permettent d’adresser une demande d’accès aux différentes archithèques : Bob et les aiguilleurs récupèrent la demande, l’apparient au Personal Stream du profil qui l’envoie et retournent un flux composite avec les éléments nécessaires. Une zone de l’archithèque est réservée aux versionneurs. A l’inverse des BuMPS ils n’ont pas la possibilité d’interférer sur la circulation des flux. Leur travail consiste à maintenir des flux stabilisés et en nombre suffisant pour satisfaire aux requêtes les plus courantes adressées à l’interdesk central.
Vers 18h en sortant du travail, Bob jette un œil distrait au fronton du bâtiment d’Amazoog où scintille la devise de la firme. « Your Lifes. Our Memory. »

Vos vies. Notre mémoire.

**Clin d'oeil et excuses à Jean-Michel Salaün à qui j'emprunte, pour le détourner, le concept d'archithèque.

 

================================
Texte "de commande", paru dans la revue Documentaliste, Sciences de l'information, vol. 45, n°3, Août 2008, p.82

"Less code. More Data."

J'ai retenu trois phrases-clé de la vidéo de la table-ronde réunissant Howard Bloom, auteur deThe Evolution of Mass Mind from the Big Bang to the 21st Century, Peter Norvig, Directeur de la recherche chez Google Jon Udell, "Evangeliste" chez Microsoft et Prabhakar Raghavan, Head of Research and Search Strategy chez Yahoo!.
Première phrase clé : "Moins de code, plus (+) de données".
L'idée notamment exprimée par Peter Norvig (mais faisant l'unanimité chez les autres), est que si nous avons suffisamment de données, nous n'avons plus besoin "d'intelligence". C'est pour lui l'avenir proche de l'intelligence artificielle. Non plus singer le fonctionnement de l'esprit humain et ses capacités de raisonnement, mais s'appuyer sur l'étendue des données, des données toujours plus "intelligentes" (intelligence étant probablement ici à entendre dans le sens de l'intelligence d'un organisme en croissance exponentielle, c'est à dire sa capacité à embrasser un nombre toujours plus grand de ramifications, de recoupements, dont émergent au final des motifs ("patterns"), des représentations directement interprétables ou signifiantes. Je n'ai pas le temps de vous les retrouver mais nombre d'observateurs francophones se sont déjà exprimés sur ce "Web of Data" et sur cette "intelligence des données" (jetez un oeil chez Got et ses petites cases, dans la maison "InternetActu" d'Hubert ou encore chez Christian Fauré)
Deuxième phrase clé : "We don't need taxonomy of knowledge. We need taxonomy of desire".
Cela renvoie à toutes les analyses dérivées de la "base de donnée des intentions" de John Battelle. P. Raghavan parle également de la création d'une "place de marché des intentions" (A marketplace of intent).
Troisième phrase clé : "From a world wide web to a web wide world".
C'est cette fois Nova Spivack (modérateur de la conférence) qui s'exprime et souligne la migration du web "dans" le monde réel (cf mes propres analyses sur la dérive des continents documentaires et le passage du World Wide Web au World Life Web).

Concernant le web sémantique, Peter Norvig rappelle qu'il y a troies voies pour atteindre le web sémantique : les bases de données structurées, les formats particuliers (rdf) et ... les contenus. Les textes. Les écrits. Pour lui, la vraie sémantique est là. Dans les textes. Et là encore, pour pouvoir extraire cette sémantique, il (leur) faut d'immeeeeeeenses gisements de données textuelles. GBS ?

Technologies de l'artefact : rebonds ...

Ma petite analyse de l'autre jour à propos des technologies de l'artefact et de la nécessité de (re)bâtir une heuristique de la preuve, de développer les outils et d'enseigner les méthodes d'une rétro-ingénierie documentaire, ma petite analyse de l'autre jour disais-je, trouve un écho dans un article paru dans l'édition du Monde du 10 septembre. Elle est également relayée par Narvic (dont je recommande la lecture pour ceux qui ne connaissent pas encore son blog).

<Update de 5 minutes plus tard>à lire aussi - je ne l'ai pas encore fait - "Les bidouilleurs de la société de l'information" dans le dernier Monde Diplo </Update>

Culture informationnelle, fracture cognitive, redocumentarisation de soi et plus si affinités.

Quelques extraits de mon intervention de vendredi dernier à propos des technologies de l'artefact et de la capillarité :

  • à propos des réseaux sociaux et du processus de redocumentarisation : "Dans le monde réel, nous disposons tous de « documents d’identité », factuels, lesquels documents et identités peuvent être « documentés » de différentes manières, par exemple par des services de police ou par les services sociaux. Dans le monde « virtuel », les sites de réseaux sociaux comme Facebook permettent de redocumentariser notre identité connectée, qu’elle soit ou non en adéquation avec notre identité réelle : la description identitaire est ici fragmentée, enrichie et complétée par d’autres. « Je » me définis par la manière dont je me décris mais également par la nature de mes relations, des réseaux auxquels j’appartiens, des opinions des « groupes » ou des « communautés » que je fréquente. Cette redocumentarisation particulière est à la fois très frappante et très prégnante du fait de l’essor et de l‘engouement auprès des publics jeunes des sites de réseaux sociaux. Ce qui permet d’indiquer que pour la première fois à l’échelle de la culture informationnelle, le premier terrain documentaire, c’est celui de ma propre subjectivité. C’est « moi ». L’une des toutes premières explorations documentaires de ces publics n’est plus celle d’un document physique ou même numérique : c’est celle de leur subjectivité connectée. Ceci peut peut-être expliquer un certain nombre de changements, de dysfonctionnements, de naïvetés constatées dans l’approche qu’ont les étudiants et les publics « novices » du « fait » documentaire. Une autre manière de voir les choses est de se dire que c’est là un retour au « Je suis moi-même la matière de mon livre » de Michel de Montaigne. A cette différence qu’en s’inscrivant sur Facebook à 15 ans, on n’a que très peu souvent conscience d’entrer en documentation de soi."
  • à propos de l'éducation à l'information : "il faut arriver à structurer un enseignement, une « éducation à l’information » qui accepte de s’affranchir de ses habituels repères euclidiens pour réorganiser ses fondamentaux selon troix axes. Primo : les pratiques individuelles sont indissociables de leur inscription communautaire. Deuxio : les typologies des contenus documentaires sont pour partie à revoir (à l’aune des critères précédemment énoncés). Tertio : le double mouvement de massification des accès et de marchandisation des pratiques (et des accès) conditionne l’ensemble dans le contexte d’une « économie sociale des documents numériques »."
  • à propos d'une possible fracture cognitive : "la vocation des filtres technologiques (navigateurs, agrégateurs, moteurs de recherches ...) est de disparaître ou de s’intégrer : intégration dans des artefacts technologiques plus anciens ou mieux maîtrisés, ou intégration qui peut également passer par une externalisation du service produit. Mal analysé, cet affaiblissement constant des « barrières » technologiques peut avoir un effet de contamination problématique : si on ne pense pas la culture de l’information en s’inspirant des leçons précédentes, le risque est de voir la même culture de l’information transporter des pratiques « n-1 » dans des environnements technologiques « n+1 ». En d’autres termes, le risque est de créer au mieux un décalage (effet retard ou effet diligence selon Perriault) et au pire une fracture cognitive."

Le texte intégral de mon intervention est disponible Téléchargement oegrcdi.rtf . Soyez indulgent, il ne s'agit pas d'un "article scientifique" mais d'un simple texte d'accompagnement. Il a juste pour vocation de vous permettre de mieux cerner le contenu de chacune des diapos de ma présentation. Laquelle présentation est également téléchargeable : Téléchargement oegrcdi.ppt (et sera bientôt sur Slideshare dès que le service voudra bien fonctionner).

Technologies de la capillarité et de l'artefact.

Je suis en train de préparer une intervention que je ferai ce vendredi 12 Septembre lors d'un séminaire organisé à Rennes. Le thème est le suivant : "Contextes est enjeux de la culture informationnelle, approches et questions de la didactique de l'information."
Mon intervention "Redocumentatisation du monde et culture informationnelle", peut être ainsi résumée : "quelles grandes évolutions affectent les processus documentaires, les technologies et les usages informationnels ? Quelles leçons peuvent en être tirées pour la réflexion sur la culture informationnelle ?"
Vaste programme donc ... L'occasion d'aborder deux "notions" qui m'apparaissent aujourd'hui essentielles et que je vous livre "brutes de décoffrage".
La première c'est le passage des "technologies de l'intelligence" (pour reprendre l'expression de Pierre Lévy), aux "technologies de la capillarité". La capillarité, nous apprend Wikipédia, est "l'étude des interfaces entre deux liquides non miscibles, entre un liquide et l'air ou entre un liquide et une surface." Cette emprunt au vocabulaire de la physique me permet de décrire la logique actuelle d'enregistrement et de conservation par les moteurs de recherche, de toutes les traces, actions, documents et comportements qui caractérisent et marquent notre présence connectée. Captation, par capillarité donc, de tout ce que rend possible la confusion des pratiques que génère la redocumentarisation globale du net et la dérive des continents documentaires qui le composent. L'objectif est simple : la constitution d'une base de donnée des intentions. Dernier exemple en date, le lancement très controversé de Google Chrome qui, par capillarité, agrège, rassemble et mixe des informations en provenance de sphères informationnelles jadis distinctes et non-miscibles.
La seconde c'est le passage des artefacts technologiques (navigateurs et interfaces d'accès au sens large + programmes (algorithmes) et bases de données et d'index au sens large) aux technologies de l'artefact. Ces technologies de l'artefact sont celles qui rendent possible, pour l'amateur, la création de représentations volontairement altérées et artificielles de la réalité dans une recherche (une "mimesis") de la vraissemblance. Parmi ces technologies de l'artefact (de l'artefacture dirait probablement Bruno Bachimont), on pourra citer en exemple les "Photoshop Naked Contest", les "Fake Vidéos" (comme celle de l'étoile noire volant au dessus de San Francisco), cette application permettant à tout le monde de vieillir instantanément une photo, les guerres d'édition et les tentatives de redocumentarisation déviantes sur Wikipedia. Ces technologies de l'artefact réclament d'urgence la construction d'une heuristique de la preuve, de la traçabilité de la preuve, une heuristique qui tienne compte de ces phénomènes, qui les explicite, et qui permette (c’est le plus délicat) de les « monitorer » non pas tant en temps réel mais bien a posteriori, c'est à dire dans l'optique d'une rétro-ingénierie documentaire. Une approche enfin qui tienne compte de la babélisation des expertises et qui redonne à chacun, à chaque contenu, à chaque fragment de contenu, la part d’autoritativité** qui lui incombe, et celle-là seule.
Naturellement si cela vous inspire des commentaires, ils sont ouverts :-)

**Définition de l'autoritativité par Evelyne Broudoux : "attitude consistant à produire et à rendre public des textes, à s’auto-éditer ou à publier sur le web, sans passer par l’assentiment d’institutions de référence référées à l’ordre imprimé."

Bureau d'enregistrement des anomalies numériques publiques.

============================================================================

Ci-dessous la traduction (autorisée) d'un billet de Phillip Lenssen daté du 25 Juillet 2008

===========================================================================

Date: 7 Août 2032
From: Bureau d'enregistrement des anomalies publiques.
Subject: Notification.

Cher citoyen,

Comme vous le savez, depuis l'acte des enregistrements publics de 2030, tous les citoyens sont soumis à un contrôle régulier des anomalies. Ce contrôle s'effectue via la collecte et la fouille de vos traces numériques sur les sources publiques uniquement. Selon nos conclusions, qui sont exactes dans  99.5% des cas, donc légalement admissibles comme preuves au-delà de tout doute raisonnable, nous en sommes venus aux conclusions suivantes : 

  • Vos 56 critiques et évaluations de livres sur Amazon : le choix des livres consultés aussi bien que les critiques exprimées portent notre système à croire que vous faites preuve d'un intérêt supérieur à la moyenne pour les sujets et opinions anti-gouvernementaux. L'horodatage de vos consultations atteste d'une activité essentiellement nocturne, ce qui est souvent l'indicateur du comportement d'une minorité.
  • Vos 4,550 commentaires FriendFeed : par l'analyse de votre style d'écriture et de sa fréquence, notre système conclut qu'il y a une forte chance d'anomalie.
  • Vos 28 albums photo publics sur Picasa contenant 2,050 photos : notre technologie de reconnaissance de forme indique à notre système que vous êtes susceptibles d'avoir un comportement criminel. De plus, notre technologie de reconnaissance faciale appliquée aux personnes présentes sur vos photos nous ont permis de les identifier et de fouiller également dans leurs données en ligne.
  • Vos 38 billets de blog et les 8,014 commentaires postés sur d'autres blogs : la catégorisation automatique de vos sujets de prédilection montre une très forte corrélation avec les sujets de prédilection d'anciens criminels. Notre système conclut donc à une intention criminelle au dessus de la moyenne.
  • Vos 6,600 votes sur des sites sociaux tels que Digg et Reddit : Votre implication dans un très grand nombre de sujets et d'articles politiques, incluant vos votes en faveur d'opinions potentiellement anti-gouvernementales ou d'autres sujets criminels, a envoyé une alerte à notre système.
  • Vos 3 vidéos YouTube enregistrées avec une webcam : un algorithme de reconnaissance vocale montre des signes de détresse vocale qui corroborent les autres observations sus-mentionnées.
  • Votre profil public affiché sur un réseau social : nous avons dépisté vos hobbies et centres d'intérêt et trouvé 5 indicateurs de forte anomalie et de comportement potentiellement dangereux.

Par ailleurs, nous avons pisté 45 autres sources de services publics, incluant les citations et mentions qui sont faites de vous, notamment dans les blogs, les forums et les réseaux sociaux.

Avec ces informations, comme la loi nous y autorise, nous avons ordonné la captation d'autres données personnelles de sources non-publiques, incluant - de manière non-limitative - vos couriers électroniques stockés chez votre fournisseur d'accès, vos brouillons de couriers électroniques, vos historiques de recherche remontant aussi loin qu'ils ont été stockés, vos logs de clavardage, la liste des sites auxquels vous vous connectez régulièrement pour établir votre comportement de navigation, vos données médicales numériques, ainsi que la liste de toutes les transactions bancaires effectuées sur des sites marchands utilisant les systèmes de paiement PayPal ou GoogleCheckOut.

Selon l'analyse cumulée de ces 34 266 données nous concluons que vous êtes fortement susceptible ou probablement sur le point de commettre un acte criminel. Nous sommes donc forcés d'en référer aux autorités compétentes pour qu'elles donnent suite à ce dossier.

Ceci est un message automatique. Vous avez le droit de garder le silence. Tout ce vous avez dit ou écrit sur Internet durant les 35 dernières années pourra être utilisé contre vous.

Salutations.
Le Bureau d'enregistrement des anomalies publiques.
Protéger les citoyens du monde entier.

============================================

Google Books : un appétit de Lyon.

Impossible de faire l'impasse sur cette nouvelle d'importance. Et c'eût été dommage de la noyer dans le fatras des petits billets de rentrée ... donc ...
Cela fait déjà longtemps qu'on en parlait, c'est désormais chose faite. Le dernier petit village gaulois résistant encore et toujours au grand numérisateur d'outre-atlantique ... ne résiste plus. Google numérisera le fonds des 500 000 ouvrages de la BM de Lyon. Cela devrait lui prendre 10 ans. Voici quelques billets incontournables pour comprendre les enjeux de ce nouveau contrat : Alain Pierrot et BiblioFrance. Je rappelle simplement qu'avec le retrait de Microsoft du marché de la numérisation d'ouvrages libres de droits (arrêt du programme Live Book Search) confortant la situation de monopole de Google (exception faite de l'OCA qui n'a cependant pas les mêmes finances et donc le même rythme de croisière ni la même force de frappe), et avec les temps de disette culturelle qui se confirment chaque jour davantage, la question d'une alternative publique "crédible" ne méritera bientôt - hélas - même plus d'être posée. Faute de grives ... on pourra toujours s'occuper en relisant divers guides de bonnes pratiques pour une numérisation réussie ...

Sur ce sujet, prenez également le temps de lire la réaction en forme de coup de gueule de Jean-Claude Guédon, postée sur Biblio-fr, dont je reproduis ici un (large) extrait et que je partage entièrement (cf mes nombreuses alertes à propos du risque d'un eugénisme documentaire):

  • " (...) La numérisation à la Google est un piège. En effet, le document numérisé demeure la propriété de Google et la bibliothèque impliquée doit empêcher tout autre moteur de recherche autre que Google d'indexer sa collection numérisée. En d'autres mots, Lyon pourra consulter la version indexée en interne, et ne pourra exposer au reste du monde que du "papier numérique" (pages images). Il est vrai que nous aurons ainsi accès à des milliers de livres rares, mais ces ouvrages ne seront disponibles que sous la forme de pages-images que l'on ne pourra que lire. Toute recherche plein texte devra s'effectuer par le truchement du site de Google. Toute autre opération sur le texte sera impossible, sauf à refaire le travail de reconnaissance des caractères. Bref, le "cadeau" de Google, c'est un document numérique aussi proche du papier que possible. (...) Ce que Google recherche actuellement, c'est un monopole sur la capacité d'appliquer toute forme d'algorithmique à la documentation numérique mondiale. En bref, Google veut devenir le système d'exploitation de la documentation numérique et pourra ainsi contrôler toutes les opérations de récupération, identification, analyses sémantiques, etc. que l'on peut effectuer ou imaginer dans le monde numérique. Il y va de la mémoire collective de tous les peuples; il y va aussi de l'accès à l'information (et sa manipulation), etc. Bref, il y va de conséquences fondamentales pour la culture et la vie politique mondiale. Bravo, Lyon ! Vous voilà complice d'un magnifique holdup culturel !
    Une alternative beaucoup plus intéressante aurait été L'Open Content Alliance. C'est un peu moins efficace, un peu plus coûteux, et un peu plus lent, mais c'est entièrement libre. Malheureusement, le mirage d'une numérisation de masse rapide et gratuite conduit à ignorer ou négliger les côtés plus subtils du cadeau empoisonné de Google. Google a su produire une offre qui détient un réel pouvoir de fascination pour certains bibliothécaires. C'est regrettable, mais cela révèle aussi les limites de certains bibliothécaires, ceux qui jouent avec Google (comme l'on joue avec le feu) : ce sont de parfait spécialistes des incunables numériques et ils observent l'avenir dans leur rétroviseur (pour
    reprendre une formule bien connue de Marshall McLuhan).

    *Jean-Claude Guédon*
    *Université de Montréal*

Je ne croie pas en revanche (je n'ai jamais cru), comme l'analyse Jean-Michel, que le livre soit une danseuse pour Google, une maîtresse que l'on (qu'il) entretient à fonds perdus. Et ce pour plusieurs raisons que je vais brièvement résumer :

  • Primo, rien dans les pratiques de Google (corporate management) ne laisse place à la notion de "danseuse". Les fameux 20% de temps octroyés aux employés pour qu'ils travaillent sur des projets à eux n'ont de sens que dans la mesure où ils permettent de faire émerger des projets et des applications rentables pour la firme (Gmail, GoogleMaps ...).
  • Deuxio, en accord avec les arguments de Jean-Michel (mettre en place une barrière d'entrée suffisamment haute sur le marché de la numérisation de masse, s'attirer les faveurs d'une partie des intellectuels), le service GoogleBooks tient également une place de choix dans l'écosystème algorithmique de la firme : la base de connaissance ainsi constituée n'est probablement pas étrangère aux remarquables capacités de traduction automatique du même Google.
  • Tertio, même si, comme le note encore Jean-Michel, l'arrivée de Google sur ce marché "n'a pas modifié l'économie du livre, ni celle des bibliothèques", elle a en revanche considérablement fait bouger les lignes. Elle a contraint l'ensemble des acteurs de la chaîne du livre (des éditeurs aux auteurs en passant par les libraires et les bibliothèques) à se (re-)positionner. Davantage encore, elle a pris une place à l'horizon du débat sur la numérisation de masse au regard de laquelle chacun doit placer ses pions et redéfinir ses stratégies dans un mouvement de jeu initié là encore par le même Google et son service GoogleBooks. L'impact sur l'économie du livre et des bibliothèques pourrait dès lors être tout à fait retentissant lorsque le marché de la lecture électronique (liseuses notamment) prendra son véritable essor.

Je pourrai lister d'autres arguments mais ce serait un peu long pour un billet de rentrée, donc je résume : une danseuse qui s'inscrit dans une stratégie globale de management, un danseuse dont les effets d'optimisation sur des services tiers sont certainement importants (d'aussi loin en tout cas que l'on puisse en juger), une danseuse qui modifie les postures et les stratégies d'un ensemble d'autres acteurs, d'individus et de corporations ... ne me semble pas vraiment correspondre à la définition d'une danseuse ;-)

Dans un monde ou la circulation, le flux, prennent chaque jour davantage le pas sur l'inscrit, sur le fixe, le service GoogleBooks, plutôt qu'un danseuse, pourrait rapidement s'avérer être une pièce maîtresse dans le jeu du contrôle de l'accès aux contenus et du formattage des pratiques afférentes.

Et puis encore ... Repérés par Alain Pierrot, ces 3 articles du dernier congrès de l'IFLA dont celui consacré à l'accord de la bibliothèque de Bavière avec Google (.pdf) a retenu mon attention. Il n'offre aucun scoop mais livre une foule de détails intéressants, dont celui-ci :

  • "la coopération entre Google et la BSB implique que, pour la première fois dans l'histoire des bibliothèques allemandes, un projet de numérisation à l'échelle industrielle soit planifié techniquement et logistiquement. Une "sélection" d'ouvrages est faite uniquement en fonction de leur état - et donc la capacité de ceux-ci à être scannés dans une perspective de conservation, et selon certaines exigences de taille et de volumes dues à la technologie de numérisation propriété de Google. (...) Il faut souligner dans ce contexte que le critère "conservation", sous-jacent à la décision de déclarer un ouvrage en état satisfaisant pour être numérisé ou non, a été décidé conjointement par la BSB et Google. En cas de doute, le verdict final est toujours rendu par la bibliothèque. (...) Les normes de qualité fixées en accord avec Google comprennent également une marge de manoeuvre, comme il est d'usage dans ce genre de projets financés par des fonds privés. La BSB a eu la chance de ne pas appartenir aux membres fondateurs de ce projet, lancé par Google en 2004, mais aux membres "tardifs", qui profitent aujourd'hui des ajustements technologiques continuellement apportés par Google."

Navigateur Chromé et WebOS jantes alliage

Attention, ça va buzzer. Google vient d'annoncer (1er Septembre) sur son blog officiel le lancement de son navigateur open source maison. Nom de code : Google Chrome. Le pré-lancement s'est effectué de manière originale via la mise en ligne et la distribution ciblée d'une BD de 50 pages (réalisée par Scott McCloud, une référence dans le domaine) présentant les fonctionnalités dudit navigateur. Le lancement est prévu pour le 2 septembre (aujourd'hui) dans 100 pays. Aucun lien de téléchargement n'est à cette heure disponible.

Les arguments et fonctionnalités mis en avant dans ladite BD sont (seraient ...) :

  • la stabilité (pour éviter les plantages en différenciant et en "autonomisant" chaque onglet comme autant "d'applications"),
  • la rapidité (notamment pour le chargement de java), la sécurité (hum ... hum ...),
  • la perfectibilité (Chrome est Open Source et a bénéficié de la large communauté de développement autour de Mozilla/Firefox)
  • la synchronisation (installation native de GoogleGears) : élément clé, cette synchronisation étant en effet (comme je me plais à le répéter), une pierre angulaire déterminante pour déployer un webOS.
  • L'utilisation des ressources mémoires (point certes plus technique mais important ...) : l'idée est en gros la suivante : un onglet = un processus. Si je ferme l'onglet, j'arrête le processus (ce qui n'est pas nécessairement le cas dans les navigateurs actuels et ralentit très souvent les navigateurs tout en mobilisant beaucoup de ressources mémoire).
  • Simplicité et ergonomie : les onglets ne seront plus en dessous mais au-desus de la barre de recherche (comme dans le navigateur Opera). Google indique (c'est à mon sens un élément clé) que le browser et les "tab process" (processus tournant dans les onglets) seront séparés. Le navigateur est donc bien une fenêtre sur le monde (j'ai bien dit une "fenêtre", en anglais "windows", donc browser = OS) et les onglets ses applications. Chaque onglet est indépendant, avec l'affichage de sa propre barre d'adresse.
  • Captations mémorielles : et puis bien sûr, Google ne serait pas Google s'il n'y avait pas dans ce lancement une nouvelle OPA sur nos comportements et ressources mémorielles (externes et objectives : le web) et mnémoniques (internes et subjectives : nos comportements, nos habitus, nos historiques de recherche). Le truc s'appelle "omnibox" et s'inspire de la nouvelle barre de recherche Firefox (dont j'oublie le nom ...) en ce sens qu'il ne permet pas seulement de rechercher la présence d'un mot dans des URL, mais : propose aussi des suggestions de requêtes (comme Google Suggest), farfouille dans les pages que vous avez le plus visitées, vous propose des pages que vous n'avez pas encore visitées mais qui sont "populaires" (résurgence du PageRank ?), et last but not least, propose une recherche full-text dans votre historique de recherche. Cette dernière fonction est d'importance car elle marque, en quelque sorte, la fin des bookmarks. Je m'explique : j'avais déjà il y a longtemps eu l'occasion d'écrire que l'arrivée de Google comme moteur de recherche rendait quasiment caduque l'utilisation des signets. Plutôt que de "marquer" des pages (processus tout de même assez fastidieux même si le web 2.0 - del.icio.us - lui a redonné ses lettres de noblesse) il suffisait de saisir le nom du service dans Google (ou dans la barre de recherche de Firefox), pour retomber instantanément sur ledit service ou le voir apparaître en première place dans les résutlats de recherche. J'avais à l'époque indiqué que Google se constituait ainsi autour d'une double "identité" : moteur de recherche bien sûr, mais aussi moteur "de sources". L'omnibox du navigateur Chrome marque donc une nouvelle étape : plus besoin de "bookmarker" une page, il suffira de resaisir la requête qui avait permis d'y accéder ("photo numérique" par exemple) pour retomber sur la page du catalogue FNAC présentant un comparatif de prix (par exemple toujours). Une prothèse mémorielle supplémentaire donc (à condition d'activer l'historique de recherche et de naviguer "en session" google ... ce qui sera sûrement proposé par défaut). Nouvelle prothèse, et probablement nouvelle entrave.
  • Utilisabilité personnalisée : autre petit gadget : quand vous ouvrez un nouvel onglet, au lieu de vous proposer une page blanche ou un site paramétré par défaut, Chrome vous présentera "vos" neuf pages les plus visitées ainsi que les mots clés que vous utilisez le plus (cf copie d'écran plus bas ... laquelle copie d'écran fait étrangement penser à un univers Netvibes).
  • Privauté : il sera possible de créer un onglet en mode privé ("incognito mode") dans lequel vous naviguerez anonymement et qui effecera les différents cookies quand vous le fermerez. C'est bien, mais cela veut surtout dire que dans tous les autres onglets, et par défaut, vous ne serez pas anonymes ...
  • Sécurité : Chrome téléchargera "en permanence" une liste de sites pratiquant le phishing ou dotés de différents "malwares" et vous avertira lors d'une de vos visites sur ces sites. Soit Google = gendarme du net.

Googlechromess

Donc ?
Côté navigateurs : Google était jusqu'ici (et reste) le principal donateur de la fondation Mozilla. En termes de parts de marché, Internet Explorer est donc directement ciblé et convié à un enterrement de première classe (même s'il reste le navigateur par défaut du plus grand nombre d'OS dans le monde. Faudra donc attendre un peu avant de prononcer l'oraison funèbre). Quant à Mozilla/Firefox, même si officiellement on indique ne pas se faire trop de souci, on sait aussi qu'il n'y aura pas nécessairement de la place pour tout le monde, et on anticipe en réfléchissant au déploiement d'une suite de services en ligne. Bref on songe à se déversifier ...
Côté stratégie : limpide (d'aussi loin que je puisse en juger ...). Une confirmation en tout cas. Après la migration en ligne des applications (bureautique ...), des services (logiciels, Saas) et des comportements (dérive des continents documentaires), le Web est devenu l'OS (operating system) de demain. Manquait encore à cet OS une interface, une fenêtre. Cette fenêtre, c'est le navigateur. Evolution largement annoncée et analysée (dernière analyse en date signalée dans mon billet de rentrée : celle de Nova Spivack). Enfin, rappelons que le déploiement d'une interface open-source pour un webOS n'est viable que si l'on contrôle suffisamment la chaîne de production, de traitement et de monétisation de l'information circulant dans ledit WebOS. Et il ne paraît pas aujourd'hui aberrant de considérer que Google contrôle de facto une bonne part de cette chaîne, ce qui le place en dehors d'un risque concurrentiel immédiat et l'autorise à se parer des atours et des vertus de l'Open source

Ailleurs dans la blogosphère : nombre de chroniqueurs se sont déjà fait le relai de ce lancement. J'ai retenu Ecrans, le billet de Tristan Nitot (et ses commentaires) pour avoir le point de vue en français de la fondation Mozilla, celui de Sébastien Billard (qui complète certains aspects techniques que je n'ai pas pris le temps de développer dans mon billet), et Emmanuel Parody, ce dernier présentant à mon sens l'analyse la plus pertinente de cette annonce. A la lecture du billet d'Emmanuel on s'aperçoit que tout "l'argumentaire de vente" autour de ce navigateur était habituellement dévolu aux systèmes d'exploitation (fiabilité, sécurité, ressources mémoire, etc ...). Je conclue en vous redonnant la fin de son analyse :

  • " (...) si chaque onglet (”tab”) peut fonctionner en toute indépendance et se séparer du corps du navigateur et si dans chaque onglet nous ouvrons une application, alors nous avons reproduit via le navigateur l’exact fonctionnement d’une suite d’applications. (...) et il ne reste plus grand chose qui nous sépare de la suite de logiciels. C’est exactement ce que démontre la présentation de Google Chrome. Saut ultime. Plus besoin de PC complexe, place au terminal connecté au web."

Y va y'avoir du sport ... En tout cas une belle manière de fêter les 10 ans de la firme. Un anniversaire qui pousse à faire le rapprochement avec une autre grosse firme américaine :

(Temps de rédaction de ce billet : 2 heures // Sources : sous les liens)

Google et son pot de Knol.

Knol fait quoi ?

Six mois après les effets d'annonce, Google lance enfin Knol, son projet d'encyclopédie "marchande". A noter au travers des différents billets s'étant fait écho de ce lancement : la possibilité de piocher directement des illustrations dans l'archive des "cartoons" du New Yorker (source), la possibilité d'utiliser différentes licences creative commons (cf copie d'écran ci-dessous), la possibilité "de choisir qui peut éditer vos articles (Ouvert, avec modération ou fermé)" (source), la possibilité d'activer l'affichage de liens publicitaires (ou pas), et le fait que tous les liens sortants seront en NoFollow (source), tirant ainsi les enseignements de ce qui arriva à Wikipedia.

Knol pourquoi ?

Globalement, les différents observateurs s'accordent sur deux points : primo, à la date de lancement de
Knol, on compte essentiellement des articles médicaux (ce qui est tout sauf un signal faible ...), et deuxio, ce projet n'a pas grand chance de concurrencer Wikipedia (seul Christian semble y croire). En revanche, il a de grandes chances de reformater le sens du projet encyclopédique du XXIème siècle vers un alignement, une superposition de deux écritures : l'écriture du "savoir" (écrire pour comprendre) et l'écriture de la publicité (écrire pour être vu).  Pour le reste, j'ai déjà dit tout le mal que je pensais de ce projet ... <Mauvaise foi>Si vous ne me croyez pas, comparez deux entrées tout à fait triviales de l'un et l'autre projet encyclopédique. Pour l'entrée "Toilettes", Wikipedia nous entraîne de l'ancienne cité d'Harappa jusqu'aux derniers avatars défécatoires d'un post modernisme assumé quand Knol nous propose uniquement d'apprendre ... à les déboucher en affichant moult plombières publicités. C'est tout dire :-). </Mauvaise foi> Plus sérieusement, l'approche qui semble mise en avant par Knol est une approche "How To". Comment ... "déboucher ses toilettes ?", "dépister un cancer du sein ?", etc.

Bref, Knol ne me parait pour l'instant pas avoir grand chose à voir avec Wikipedia. Il est par contre tout à fait adapté à l'écosystème Google et devrait lui permettre rapidement de pouvoir "monétiser" une grosse partie du traffic encyclopédique habituellement dirigé (à fonds perdus puisque non publicisés) vers Wikipedia. Ce qui est bien l'objectif premier du projet :-) (un second objectif étant probablement de servir de base de connaissance à Google Health, mais j'y reviendrai dans un prochain billet)

Knol procédural VS Wikipedia déclarative ?

Un positionnement qu'il est intéressant de replacer dans un (très rapide) historique (subjectif) de la "tentation encyclopédique" sur le réseau. Ce genre d'approche - et de tentation - est effectivement consubstantielle au net depuis son origine.

  • Elle émergea très tôt au travers des célèbres FAQs (Foires Aux Questions) : un individu répond "es qualité" (webmaster, éditeur, auteur ou "spécialiste") à sa communauté d'usage, sur des points très ciblés. L'autorité est ici constamment maintenue, affichée, lisible. Le principe est celui d'un ordonnancement, d'une rationalisation pensée, en l'occurence celle des questions les plus susceptibles d'être posées.
  • Passé l'ère des FAQs sur les sites webs, vînt ensuite l'ère des projets "Bidule-Answers" (Yahoo!Answers et consorts) : le principe est ici différent : n'importe qui peut répondre (parfois n'importe quoi) à n'importe qui et sur n'importe quel sujet. La dissolution de  l'expertise est ici totale. Seule compte la temporalité (promptitude, instantanéité) de la réponse. Le principe est celui de l'agglutination (les différentes réponses s'empilent les unes sous les autres) sans autre discrimination que temporelle ou "élective" (il est possible de voter pour telle ou telle réponse).
  • Le troisième temps est celui de Wikipedia. Un palimpseste planétaire de connaissances. Je vous renvoie à la rubrique idoine d'Affordance ou à ma dernière "synthèse" sur cet inépuisable sujet.
  • Le quatrième temps sera celui de Knol, mais il n'enterrera pas pour cela Wikipedia. Car Knol me semble concourir sur un autre terrain. Là où la logique d'accumulation des connaissances dans Wikipedia est clairement déclarative, celle de Knol (même s'il est encore un peu tôt pour être affirmatif et s'il ne s'agit pour l'instant que de pistes d'analyses ...) apparaît plutôt procédurale (question du "comment faire...", "comment dépister ..." ...). Parallèlement à cette macro-approche procédurale (qui n'empêche pas d'avoir des micro-knols déclaratifs sur tel ou tel sujet, tel ou tel concept), l'autre caractéristique de ce quatrième temps est celui de la mise en concurrence des expertises par processus de labellisation de l'auteur (Knol vous "reconnaît" comme expert en s'assurant de la levée de votre anonymat, mais Knol ne vérifie en rien les titres et diplômes dont vous vous parez). Labellisation fantôche donc pour Knol, contre babélisation fantasque pour Wikipedia. L'alibi qualitatif pour Knol, le vertige quantitatif pour Wikipedia. 2 mondes.

Conflits d'intérets en vue ...

L'une des principales questions que Knol va poser dans un très proche avenir est celle du conflit d'intérêt suivant : la "mise en avant" du contenu de Knol au sein des résultats de recherche de Google (nonobstant une prudente mise en avant du NoFollow sur les liens sortants). Sur ce sujet, il faut lire d'urgence l'article de Jason Calacanis (pour qui Google est devenu un authentique fournisseur de contenu - voir aussi la synthèse qu'en fait Martin Lessard), ainsi que l'édito de Wired (ou pour les plus pressés, la synthèse en français de Jean-Marie Le Ray. De fait, il y a de mon point de vue longtemps que Google est devenu un fournisseur de contenus, notamment via ses innombrables rachats (Blogger, YouTube). De fait également, il est tout à fait évident que lesdits contenus des susmentionnés services bénéficient d'un référencement plus "aisé" que d'autres ne gravitant pas dans l'écosystème de services du moteur.

Mythologies.

Google en tant que mythologie contemporaine présente un nombre de plus en plus grand de similitudes avec le mythe de Cronos. Comme lui son histoire commence par une castration : celle de la bibliométrie de Garfield, "amputée" de son rattachement à un circuit de diffusion classique et contrôlé (modèle des revues et de l'évaluation par les pairs) au profit d'un chaos fécond (le web). Comme lui il dévore et ingère ses enfants (Youtube, Blogger, Picasa et tant d'autres furent des petites - ou moyennes - start-ups avant d'être happées par le monstre ...). Comme lui, cette dévoration peut être lue comme le symptome d'une crainte : celle de voir l'un de ses enfants se retourner contre lui une fois atteint son âge adulte. Comme lui, il envoie l'essentiel de ses frères moteurs dans les profondeurs du Tartare, le laissant seul à son hégémonie (parts de marché et de traffic). La fin de l'histoire de Cronos est connue, celle de Google reste à écrire, mais (et j'arrête là avec les analogies mythologiques), il est clair - et le lancement de Knol ne fait que le confirmer - qu'il ne peut y avoir que trois issues à une telle appétence : soit le contrôle total, en amont et en aval, de l'accès à l'information et à la connaissance ; soit un final façon la grande Bouffe, c'est à dire l'effondrement de l'ogre sous le propre poids de son appétence ; soit la naissance d'un fils échappant à cette appétence qui à son tour, pourra tuer le père. Et dans cette dernière option (je reprends là mon analogie mythologique), je verrai bien Wikipedia en mère nourricière, telle Gaïa soustrayant un certain Zeus à l'appétit de son père, et du ventre de laquelle naîtront les initiatives sur le terreau desquelles une nouvelle mythologie s'écrira, une nouvelle génération de moteurs naîtra (songez à Trueknowledge ou encore Powerset, moteurs "sémantisés" travaillant avec Wikipedia comme base). 

Knol encore ...

Pour approfondir et/ou mesurer rapidement les principaux tenants et aboutissants du bidule : voir le billet très complet de Danny Sullivan et celui d'Astrid Girardeau dans Ecrans. A lire également les impressions de FredCavazza pour qui "Knol pourrait bien officialiser la création d’une nouvelle catégorie d’outils de publication qui apportent une information différente des blogs et wikis : un résumé ou plutôt une aggrégation / synthèse réalisée par un auteur identifié." De mon point de vue ces outils existent déjà. La "nouveauté" ne me semble pas résider dans la capacité d'aggrégation et le rattachement à un auteur identifié, mais plutôt dans la cohabitation des deux écritures susmentionnées (écriture du savoir et de la publicité), cohabitation qui ne se fait plus en terrain "neutre" (comme dans certains blogs par exemple), mais au sein d'un projet "labellisé" encyclopédique, qui confère donc à cette cohabitation une légitimité a priori. Heureusement, tous les a priori sont discutables ... 

Ci-dessous une copie d'écran des fonctionnalités proposées lors de la création d'un Knol.

Knol

Et puis pour finir sur un clin d'oeil ... le meilleur moyen de découvrir Knol, c'est encore de consulter l'article de Wikipedia qui lui est consacré :-) (et tout particulièrement les liens figurant en référence de l'article). Une chose est sûre en tout cas, les dîner de knols vont se multiplier ;-)

Dinerdeknol

Un dernier Knol mot.

Une dernière chose encore. Knol n'est pas un projet encyclopédique. Il ne vise pas la connaissance. Parce que la connaissance ne peut pas être la seule mise en concurrence des savoirs (le principe de Knol est que plusieurs "knols" concurrents peuvent être rédigés sur un même sujet, la prime allant au plus accédé, comme c'est l'usage dans l'écosystème Google). La connaissance est avant tout la définition et l'acceptation d'un concensus.  « Le savoir affecte forcément une forme circulaire : c’est en effet la seule manière de se représenter un ensemble de données diverses tel que chacune renvoie à toutes les autres et ait perspective sur toutes les autres. (...) Ce savoir n’est pas simplement cumulatif (...) mais circulaire parce qu’il y a une circulation du savoir d’un point quelconque à tout autre point possible. Sans doute cette circulation se fait elle le long de certains axes perspectifs qui seront par habitude plus fréquentés que d’autres à l’intérieur du tout, mais dont la commodité ne tient jamais finalement qu’à un état momentané du savoir, à un équilibre météorologique métastable. » Varet G., Histoire et savoir - Introduction théorique à la bibliographie : les champs articulés de la bibliographie philosophique. Paris, Les Belles Lettres, 1956.

Le pot de Knol est d'abord et avant tout un pot de miel publicitaire. Et on n'attire pas les mouches nouveaux encyclopédistes avec du vinaigre.

C'est la rentrée ...

Allez, hop hop hop, au boulot. Fini de lézarder. D'autant qu'il s'est passé plein de choses en deux mois ...

Côté encyclopédies :

  • la série rafraîchissante d'Ecrans sur "Inside Wikipedia". Episode 1 : Wikilove. Episode 2 : Wikipompiers. L'intégralité de la série à lire ici.
  • A ne pas manquer, le regard d'Hervé (Le Crosnier) sur l'édition papier de la Wikipedia par Bertelsman et la rémunération de ses ... 90 000 auteurs ...
  • Et puis bien sûr, lancement par Google de son projet encyclopédique baptisé Knol. Gardez patience, le prochain billet y sera entièrement consacré ;-)

Côté Moteurs (enfin ... surtout côté Google ...) :

  • A ne pas manquer : un article de Chris Anderson dans Wired sur l'âge du Petabyte et son héraut (Google). Article court, brillant et relativement impossible à résumer puisqu'il montre en une seule page quels sont les liens entre les théories scientifiques, la fin des théories scientifiques, le moteur de recherche Google, la puissance calculatoire, les avancées de la génomique, l'informatique distribuée, la nouvelle "science des données" et quelques autres trucs encore. Allez, filez le lire et vous comprendrez certainement un peu mieux la manière dont chacun d'entre nous est relié à la machine. 
  • un débat chez Google France sur l'économie numérique avec une conclusion d'Eric Besson. A écouter notamment vers la 67ème minute le point de vue des intervenants (entreprise) sur un aspect du débat autour de la net neutrality (taxation des recettes publicitaires sur internet). J'ai simplement retenu que pour Eric Besson, le fait d'envisager de "prioriser par exemple des données relatives à la télésanté" n'est pas nécessairement une atteinte au principe de neutralité du net. Pour les autres aspects - cruciaux - de la Net Neutrality, voir par exemple ce billet de Martin Lessard : "étrangler le Net".
  • Alors que Google croyait en avoir définitivement fini avec le Google Bombing, voilà-t-y-pas que le Google Bombing ressurgit dans l'outil Google Trends.
  • Pour ceux qui s'en inquiéteraient, Google se porte - toujours - financièrement très bien : chiffres complets ici et résumé sur Zorgloob. Côté "part de trafic", ça va aussi.
  • Un très bon dossier documentaire réalisé par 3 étudiants du cycle supérieur de l'INTD : "Les rapports de Google avec la justice" (.pdf). La première partie du dossier est une recension des procès et actions en justice contre Google, la seconde se focalise davantage sur l'exploitation des données personnelles. Très utile pour avoir une vision "fine" d'un justiciable pas comme les autres.
  • Dans la série "publicisons, publicisons, il en restera toujours quelques chose", LiveSearch (Microsoft) s'installe dans la motorisation de Facebook. (Rappelons pour mémoire que Google motorise - et constitue la régie publicitaire de - MySpace). Voir aussi pourquoi Jérôme Charron s'en félicite.
  • Pour les Googlophiles anglophobes, découverte de Goopilation, un blog qui traduit en français les billets de l'ensemble des blogs officiels de Google.
  • Et puis, et puis ... en septembre 2005, Google faisait disparaître de sa page d'accueil la mention du nombre de pages indexées, laissant les compteurs de notre imaginaire collectif baguenauder librement. Dans un billet en date du 25 Juillet, sur son blog officiel, Google annonce que son crawler a franchi une étape ("a milestone") : 1000 milliards d'adresses uniques détectées, ce qui, comme le rappelle Jean Véronis n'est pas la même chose que le nombre de pages indexées, mais qui est "déjà très impressionnant". Au-delà de son effet subliminal dans l'inconscient collectif (= "c'est Google qui a la plus grosse" ... base d'index), cette annonce révèle ce qui est l'un des tournants marquants dans l'histoire des moteurs de recherche : la principale difficulté, le principal objectif, n'est plus la capacité à atteindre un grand nombre de données (et à les réactualiser en temps réel), mais bel et bien la capacité à faire le tri entre le bon grain et l'ivraie, entre ce qui doit être indexé et ce qui ne doit pas l'être. Soit un retour à la raison d'être et aux fondements de leur algorithmie.
  • En parlant d'algorithmie justement, du côté de Yahoo! on semble s'intéresser de près à la mode des moteurs à la carte. Mais si souvenez-vous, ces moteurs "construits par l'internaute" et faisant de chacun de nous un autarcithécaire en puissance. Yahoo! a donc lancé le service BOSS (Build Your Own Search Service). Pour ne pas répéter ce que d'autres ont très bien décrit, allez lire le billet de Jérôme Charron sur le sujet. La stratégie de Yahoo! paraît claire : étant donné que le monde compte nombre d'excellents développeurs plein de bonnes idées, et étant donné qu'actuellement aucun d'entre eux ne peut bénéficier d'un équivalent de la base d'index de l'un des grands moteurs majeurs, il s'agit donc de leur offrir un accès à cette base, de les laisser bidouiller en postulant qu'il y aura probablement dans le lot une bonne ou une très bonne idée dont on pourra alors librement s'inspirer. Et dans le cas contraire, pendant qu'ils font joujou chez Yahoo!, ils ne vont pas monter de projet concurrent ;-).
  • La dérive des continents documentaires (voir ici) se poursuit, avec cette dernière étape clé de la synchronisation de nos moments connectés / non-connectés : après GoogleDocs et GoogleReader, c'est GMail et GoogleCalendar qui devraient être accessibles via GoogleGears. Rappelons, pour tenter de clarifier la "stratégie" de Google en la matière, que la synchronisation de ces applications est l'un de piliers incontournables du "webtop" ou du "WebOS", webtop dont on reparlera plus bas dans ce billet de rentrée.
  • L'une des dernières études du PewInternet nous apprend que si en 2002 seulement un tiers des internautes utilisaient un moteur de recherche pendant leur journée connectée, ils sont maintenant la moitié à le faire (49%). Les autres "habitudes" sont (de la plus à la moins fréquente) : l'e-mail, la recherche en ligne, la consultation d'actualités ("checking news"), et la consultation de la météo.

Côté Moteurs, outils ET bibliothèques :

  • Je vous l'avais annoncé avant les vacances, la bibliothèque municipale de Toulouse est désormais sur FlickR. Pour les détails et les motivations de cette (remarquable) opération, voir le message posté sur biblio-fr. Une Flickerisation des bibliothèques qui fait flores (6 à ce jour) comme en témoigne cette nouvelle initiative lue chez André Gunthert : "la George Eastman House est le premier grand musée de photographie à mettre en ligne en libre accès dans la section des Commons de Flickr plusieurs extraits de ses collections." Sans oublier, comme le rappelle Patrick Peccatte en commentaire du billet d'André, "les institutions présentes sur Flickr qui présentent des fonds intéressants mais pas sous le régime des Commons, comme la Biblioteca de Arte-Fundação Calouste Gulbenkian." Je croie qu'il y a là l'amorce d'un mouvement de fond (et de fonds ;-), dont l'impact à moyen terme pourrait être assez semblable à celui des projets de numérisation (Google Books).
  • et puis bien sûr, l'annonce de la numérisation de la BM de Lyon par ... Google. Là encore, un peu de patience, c'est le sujet d'un prochain billet.

Côté bibliothèques ...

  • Le discours de Barak Obama : sources, références et larges extraits à lire chez Jean-Michel Salaun.
  • Côté bibliothèques ET revues : Valérie Pécresse (ministre enseignement supérieur) et son copain Bruno Racine (BnF) avaient bien caché leur jeu. Le ministère de l'enseignement supérieur vient d'annoncer le déblocage de 10 millions d'euros pur la création d'une archive pour les revues de recherche françaises. L’objectif de cette archive est de conserver sur le long terme les revues scientifiques qui ont un faible usage. Cette archive sera sous la responsabilité de la BnF qui assurera également l’accès aux articles, sur support papier ou électronique, par son service de fourniture de documents. Ah ben non désolé. Fausse alerte. C'est pas en France. C'est au Royaume-Uni. A mettre en balance avec l'approche et l'existant hexagonal.
  • Et puis les diaporamas du dernier congrès de l'ABF (blog du congrès) sont regroupés en ligne sur le site de l'ABF.

Côté livre/document/lecture numérique :

  • André Gunthert nous livre une belle analyse d'un beau concept : la lecture exportable (ou les affres d'un copyright en bout de course). De mon côté je prolongerai bien l'analyse d'André en indiquant que ce qu'il décrit à juste titre comme une lecture exportable est en fait la réalisation concrète la plus proche de l'idée originale de transclusion (chez Ted Nelson - père fondateur de l'hypertexte - la transclusion désigne des contenus non plus "inclus" mais situés simultanément à divers endroits, sans altérer pour autant leur localisation originale ... pour plus d'infos voir sous le lien précédent).
  • L'iPhone devient liseuse : Virginie Clayssen rappelle à quel point la nouvelle pourrait être d'importance pour le décollage et la structuration d'un marché du livre électronique.
  • A lire : les enjeux du livre au format de poche, une étude de 8 pages de la DEPS, qui ne se termine pas par hasard sur "la perspective numérique", au moment où l'on parle de plus en plus d'une date limite de consommation des livres sous forme papier.
  • Et pendant que l'on réfléchit de plus en plus activement ici ou là sur l'avenir de la chaîne du livre à l'heure du numérique, le rouleau compresseur continue d'avancer : Amazon met la main sur AbeBooks (via Hervé Bienvault)

Côté biblio-scientométrie

  • la face cachée de la bibliométrie existe, et plus simplement au sens figuré. Pour organiser - selon des critères bibliométriques (taux de citation / date de parution de l'article / ... )  - les résultats issus d'une interrogation de la base Medine, imaginez que la liste desdits résultats soit ... une liste de visages dont le froncement des sourcils ou le sourire (ou l'absence de sourire) seont autant d'indicateurs vous permettant d'anayser lesdits résutlats et de mieux vous y orienter. Pas clair ? OK, une image :
    Facebib
  • le site reprend en fait la théorie des visages de Chernoff (voir ici ou pour une définition de ladite théorie) en l'adaptant aux usages scientométriques et en la faisant "tourner" sur une base d'articles scientifiques (PubMed). Gadget diront certains. Sûrement. Sûrement. Aussi sûrement que cela ouvre autant de pistes du côté d'une "humanisation" littérale des résultats de recherche. La source : ici. Pour jouer avec : .

Côté Science 2.0

Côté Web 2.0 ...

  • une petite bibliographie autour du web 2.0 mêlant articles scientifiques, thèses, ouvrages et études diverses, le tout accessible gratuitement.
  • Une jolie mise en image des différents services sociaux autour du web 2.0.
  • Je vous ai souvent parlé (en conclusion de ce billet par exemple) de l'inexorable avançée d'un mouvement d'externalisation de nos mémoires (intimes ET documentaires), lequel, conjugué à une informatique ambiante (everyware) et à une redocumentarisation du monde (internet des objets) et de l'homme (l'homme est un document comme les autres), donne littéralement corps à un hypercortex planétaire. Le résultat à court terme - 2040 -, et en termes beaucoup plus clairs (:-) est expliqué dans un édito du 16 Juillet de Wired, édito chroniqué, résumé et traduit sur InternetActu : "La machine unique pour les relier tous".
  • Prenez la plus grosse base de donnée iconographique gratuite de la planète (FlickR). Prenez ensuite l'une des toutes premières agences commerciales de diffusion de photo (Getty Images). Imaginez un accord entre les deux permettant à la seconde (Getty) de piocher à volonté dans la première (FlickR) pour en revendre le contenu en reversant 20 à 40% de la somme récoltée au photographe amateur. Et vous aurez un système gagnant-gagnant et un exemple très parlant de la manière dont les pro-am deviennent un incontournable levier de l'économie de la longue traîne.

Côté Web 2.0 et après ...

  • Après le Web 2.0, il y a naturellement le cloud computing. Hervé Le Crosnier signe un papier lumineux sur le sujet dans le Monde Diplo. Didier Durand signale un intéressant white paper d'évangélisation (technique) en provenance de chez Amazon : Cloud Architectures (.pdf)
  • Après le web 2.0, il y a aussi le webOS, soit la migration du Desktop (bureau comme interface du disque dur) vers le webtop (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack rédige sur le sujet un article de référence qui récapitule les enjeux et les ambitions de cette nouvelle migratio numérique des contenus et des comportements associés : "The future of the Desktop".
  • Après le web 2.0, il y a l'explosion des contenus gourmands (en bande passante) : voir les chiffres de la dernière étude Cisco, rapportés par Eric Baillargeon. Et de manière corrélée, il y a un phénomène de "dés-appropriation" de plus en plus systématique des contenus demandés par les internautes : voir le billet de Techcrunch rapportant le régne annoncé du "tout streaming". Là encore une nouvelle étape de la dérive des continents documentaires, dans laquelle après avoir confié nos contenus à des sites externes (tout en gardant une possibilité d'archivage en-ligne), nous prenons de plus en plus l'habitude de consommer des contenus comme de simples services, sans appropriation réelle ni possibilité de conservation ou de stockage. Bref, nous faisons avec Internet ce que nous faisions hier avec la télé, avant que l'on invente les magnétoscopes. Sauf que sur Internet, c'est pas très facile de réinventer le magnétoscope, comme en témoigne les mésaventures du service (excelletissime) Wizzgo. Espérons avec Jean-Michel que "S'il y a beaucoup de mythes dans le Web 2.0, il y a aussi beaucoup de préjugés chez les médias traditionnels, à commencer par croire que l'on peut retarder l'expression d'une demande explosive."

Côté énervements récurrents :

  • la fausse bonne idée de l'université entreprise, à lire sur le site de SLR ... pendant ce temps, Valérie Pécresse distribue les médailles en chocolat comme autant de labels vides de sens (et de financements ...)
  • les vraies-fausses promesses de maître Darcos. (= Episode 1 : on va supprimer plein de postes, mais en échange on va revaloriser la grille des salaires. Episode 2 : on va supprimer plein de postes. Euh ... oui oui, on va aussi revaloriser la grille des salaires. Mais pas tout de suite hein ? Episode 3 : relire l'épisode 2)
  • "L'autonomie" (financière) souhaitée des université est vraiment - mais alors vraiment - une notion à géométrie variable.
  • et dans la série "faisons fonctionner de nouveaux trucs avec tous les défauts des anciens machins", je vous recommande la lecture de "l'ANR pour les nuls" sur le site de Sauvons la Recherche.
  • Tout cela nous rappelle que la loi LRU a 1 an. A lire sur EducPros, un rapide bilan des opérations. A remarquer : seulement 9 universités (sur 85) ont décidé de mettre en place les fameux comités de sélection en lieu et place des anciennes commissions de spécialistes. Ce manque d'engouement n'est pas nécessairement la preuve d'un désaveu du système proposé (par les comités de sélection). Simplement le résultat d'un calendrier de mise en place à la hussarde et le symptôme d'un très grand flou dans le "comment concrètement" faire tourner ces nouveaux comités de sélection. Le résultats c'est que la plupart des université, déjà très occupées à mettre leur CA aux nouvelles normes, n'ont pour le moment pas eu vraiment le temps de s'occuper de la mise en place de ces comités. C'est à la fin de cette année universitaire que l'on pourra réellement juger sur pièces, même si de mon côté, mon opinion est faite ... Et par souci d'impartialité, le bilan de la loi LRU, côté communiqué officiel :-)
  • Sans archive(s) pas de mémoire, sans mémoire pas d'Histoire. Le petit monde de l'archivistique est depuis peu en butte à de sévères bouleversements qui engagent tout un pan de notre mémoire collective. Voir ici et là.
  • Edvige et Cristina. La France en (très) bonne place pour les prochain BigBrother Awards. Voir (parmi d'autres) : Politis, Le Monde, le point de vue de Jean-Marc Manach, l'article d'EDRI avec les liens vers les parutions du JO et d'autres couvertures presse. Ils en parlent aussi : l'ADBS. Au moins, cette affaire aura donné lieu, sur France Inter, à un téléphone sonne d'anthologie :-(
  • Et toujours à l'affiche, "les cages de la république".

Côté People et Blogosphere :

  • ce dont tout le monde a parlé cet été c'est la guerre entre blogueurs et journalistes. Rappel des faits.
  • Le départ de Versac tout comme la sortie de route classement de FredCavazza sont d'ailleurs peut-être assez symptômatique d'un changement d'époque. Car outre-atlantique aussi, Francis Pisani nous apprend que Jason Calacanis himself annonce son retrait blogosphérique. Je suis de mon côté depuis longtemps convaincu que les blogs auront permis l'émergence de nouvelles formes de parole (et de prise de parole), côté scientifique notamment, et qu'ils se dirigent lentement mais surement vers une hybridation de plus en plus marquée (voir les exemples très éclairants choisis par Narvic).
  • Et puis le choc de l'été sur les blogs sciences de Wikio : André Gunthert dégringole à la troisième place et Jean Véronis fait une entrée fracassante directement à la seconde (place). De mémoire d'homme, seule Samantha Fox avait, à l'époque du Top 50, réussi une telle entrée. M'est avis qu'avec de tels challengeurs qui ne respectent même pas la pause estivale, ma première place va rapidement être remise en question. Assez bizarremement, ni Closer, ni Gala ni Voici n'ont fait leur "une" de cet événement pourtant incountournable.

Côté identité numérique :

  • A l'heure où la gestion de la réputation numérique est chaque jour plus centrale pour le simple quidam, elle revêt, pour le futur potentiel président des Etats-Unis une importance plus que vitale. On lira donc avec intérêt sur le blog VerbalKint, la stratégie mise en place par l'équipe de campagne de Barak Obama pour contrer les rumeurs en temps réel. Intéressant de noter également l'évolution qui, depuis la dernière élection présidentielle américaine, avait marqué l'avènement des blogs comme outils de lobbying, et qui se décline aujourd'hui sur le mode de la gestion de la réputation. Comme dans la "vraie vie" des "vrais gens" pour qui les blogs, après être devenu un outil d'expression central, sont aujourd'hui l'un des principaux axes de leur visibilité numérique et de ce qui s'y rattache.

Côté "ça peut toujours servir" :

Côté Agenda :

Côté lectures :

Côté visionnage :


Ce qui me frappe dans tout ça ...

Comme dans la nouvelle de Borges, "Funes ou la mémoire", le mouvement d'externalisation de nos mémoires, documentaires et intimes, nous mène droit vers une société à l'hypermnésie latente, activable. Avec Google dans le rôle de Funes, et de son côté, pas la moindre aspiration à s'enfermer dans une pièce vide pour ne plus rien "enregistrer".

Bonne rentrée à tou(te)s :-)

(Sources : sous les liens // Temps de rédaction de ce billet : 2 mois ;-)