Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Is it a bird ? Is it a plane ? No. It's a monopolistic library-bookseller.

La dernière fois que je vous avais entretenu de l'un de mes sujets de prédilection, Google Books, c'était pour me faire l'écho (et tenter l'analyse) de la dernière bombe lancée par Google sur les pauvres casques bleus du commerce du livre :

Nous étions alors en Novembre 2008, et le désormais célèbre Google Book Settlement venait de paraître. Que s'est-il passé depuis ?

Planète Opt-Out.

Le grand numérisateur a tout pris. Livres libres de droits, livres sous droits, livres dans la zone grise et oeuvres orphelines. Tout y est, ou presque. Et même s'il est toujours quasi-impossible d'estimer réellement le nombre d'ouvrage réellement numérisés et disponibles dans Google Books, la fourchette raisonnable se situe entre 7 et 10 millions d'ouvrages numérisés, pas mal pour un projet lancé en 2005.
Et l'heure est désormais aux ultimatums. Soit vous souhaitez jouer le jeu de Google et entrer dans le modèle qu'il propose et qui vous permettra d'être indemnisé pour vos oeuvres (vous avez alors jusqu'au 5 janvier 2010 pour vous déclarer), soit vous décidez de bouder, vous vous réservez le droit d'attaquer Google en justice, et là vous avez le droit de continuer à ne pas toucher d'argent ou si peu, d'entrer en résistance, et là vous avez jusqu'au 4 septembre 2009 pour le faire (la date était initialement celle du 5 mai, mais elle a été prolongée à la demande des associations d'auteurs). Comme le rappelait ActuaLitté le 21 Avril 2009, "éditeurs allemands, autrichiens et Suisses germanophones ont choisi d'accepter le contrat proposé par Google plutôt que d'entrer dans un conflit juridique". D'autres suivront. A n'en pas douter. Il n'y a guère qu'en France (et aussi un peu au Québec), que le SNE et La Martinière décident de se payer le luxe d'un affrontement juridique qui pour en être très noble n'en est pas moins voué à l'échec. Mais au pays de Cyrano, on mise beaucoup sur le panache. La prise de position du SNE est d'ailleurs assez largement ambigüe (pour ne pas dire illisible) dans la mesure ou il recommande tout à la fois aux éditeurs de participer au réglement (settlement) tout en dénonçant le fait que celui-ci est contraire aux principes du droit d'auteur en France (mais cette territorialisation du débat est-elle réellement viable, y compris juridiquement ...) et en maintenant donc une ligne d'affrontement juridique déclaré (tribune détaillée du SNE à lire en .pdf chez Légipresse).

Masse critique.
Alors que les usages de E-books émergent massivement et rencontrent un marché qui dépasse largement les seules "niches" ou certains experts voulaient le cantonner, la question de l'offre, et plus précisément du volume de l'offre s'affirme chaque jour davantage comme absolument cruciale. Et là encore, quand Google décide de faire feu, ce n'est pas quelques dizaines, ce ne sont pas 1000, quelques milliers ou quelques dizaines de milliers d'ouvrages qu'il verse au pot commun, mais bien 500 000 ouvrages libres de droits, lisibles au format E-pub pour la liseuse Sony. Et oui. Car on parle aussi désormais de plateforme technologique. A ma gauche, Amazon, son Kindle et son format. A ma droite, Google, son thesaurus (qui est aussi un trésor) de guerre, et ses partenariats avec la liseuse Sony dans un format (E-pub) non supporté nativement par le Kindle. Le combat des chefs.
Mi-mars 2009, l'e-Book Store de Sony affichait plus de 600 000 livres suite au dernier "versement" de Google. Amazon affiche de son côté plus de 230 000 titres. Il va sans dire que la granularité des deux offres est sans commune mesure, les 500 000 ouvrages de Google étant pour l'essentiel (la totalité ?) libres de droit quand ceux d'Amazon sont pour l'essentiel des ouvrages sous droits. Ceci étant dit, c'est là un bien beau produit d'appel dont on Lionel Maurel ne sait quoi penser :

  • "D’un côté, on peut y voir pour l’instant un progrès dans l’accessibilité aux œuvres du domaine public, qui vont trouver une nouvelle vie par le biais du Reader. Mais plusieurs commentaires envisagent déjà le risques qu’à moyen terme l’accès à ces e-books ne devienne payant, une fois que les liseuses auront trouvé leur public. Et dans ce cas, il y aurait une forme de “privatisation” du domaine public, préjudiciable et d‘autant plus contestable que les originaux papier de ces livres ont été fournis par les bibliothèques partenaires de Google.Notons par ailleurs que visiblement, lesdites bibliothèques partenaires n’ont absolument pas eu leur mot à dire lors de cette transaction avec Sony … une des conséquences directes de l’exclusivité exigée par Google en contrepartie de ses largesses …"

(Voir aussi le mode d'emploi pour la récupération desdits titres, mode d'emploi qui rappelle très justement l'occasion ainsi donnée à Sony d'étoffer un peu son fichier client ...)

Google'Zon & Amaz'oog : l'infanterie et l'artillerie.
L'erreur serait de penser l'opposition frontale entre Google et Amazon comme un affrontement se jouant à armes égales. Cet apparent duopole n'en est pas un. Amazon est dans une logique d'artillerie : il est à la fois son alpha et son oméga, fixant les prix d'une offre qu'il maîtrise de bout en bout pour une tablette qu'il fabrique. Soit une artillerie pensée comme une architecture en vase clôt mais à la puissance de tir phénoménale. Google est dans une logique d'infanterie. Même s'il dispose d'autant de verrous que nécessaire, il laisse les éditeurs monter au créneau et défendre ses positions en leur permettant d'établir une liste indicative de prix de vente dont il déterminera seul lequel doit être in fine retenu. Amazon contrôle son stock, son flux de marché, et fait du prosélytisme autour de sa tablette et de ses formats. Google contrôle "un" stock (qui n'est pas encore "le" stock mais pourrait bientôt le devenir), et avec le Google Book Settlement se met en position de contrôler le marché et ses flux. Sur ce terrain, c'est Google qui a l'avantage sur le long terme, car il dispose des moyens de piloter (au sens cybernétique du terme) l'ensemble de l'offre d'ouvrages sous droits en laissant l'infanterie (auteurs, libraires et éditeurs) essuyer le feu nourri et les pertes qui ne manqueront pas de subvenir dans cette période d'engagement.

Un flux de marché multi-canaux. Autre avantage de poids pour Google, son flux de marché ne se limite pas aux seules tablettes électroniques, c'est toute la chaîne des périphériques (informatiques) et des services (numériques) dont il est en capacité de se servir pour déployer son offre. Google annonce (à l'occasion de la Book Expo America) qu'il se positionnera sur ce marché (celui de la lecture et non du "livre" numérique) d'ici à la fin de l'année 2009. Mais il ne parle pas d'e-books mais bien plutôt de terminaux orientés Web ("web-enabled devices"). Plus d'un million et demi d'ouvrages libres de droits sont ainsi dès maintenant lisibles sur votre téléphone portable (et si vous n'avez pas d'IPhone, vous pouvez quand même "faire comme si" ... ici) Quand Amazon pense "structuration du marché et de l'offre", Google, selon un gimmick bien ancré dans la culture de la firme, raisonne en termes d'offre de service. Ce qui, jusqu'ici, ne lui a pas trop mal réussi ...

Éditeur dans les nuages. Quand Amazon conditionne (une partie de) son marché à l'adoption des Ebooks, Google se moque de savoir si lesdits ebooks constitueront un jour ou non un marché de masse (ou de niche suffisamment rentable). Google s'en moque parce que ce que vise Google ce n'est pas un marché, c'est un écosystème, celui du Cloud Publishing, de l'édition dans les nuages. Et faut-il rappeler qu'il est déjà leader dans le domaine du "cloud computing" ...

BVL. Bureau de vérification de la littérature. Le commandement général de cette infanterie sera assuré par l'algorithmie et l'écosystème de services de la planète Google, mais plus précisément incarné par Michael Healy, récemment nommé à la tête du BRR (Book Rights Registry), cet organisme créé de toutes pièces par Google (et financé par Google ... tant qu'à faire hein ...), et chargé de créer et d’administrer LA base de données des ayants-droits de la totalité des livres concernés par le Google Settlement. 

Le monde se réveille. Avec la gueule de bois.
Ce qui depuis 3 ans paraît évident et nécessaire aux yeux des analystes (dont très modestement votre serviteur) à savoir l'affrontement entre les deux géants Amazon et Google autour d'une offre marchande d'ouvrages n'existant qu'en leur flux numérique, apparaît aujourd'hui subitement dévoilé. Et c'est le New-York Times qui ouvre le bal dans un article daté de son édition du 31 Mai : "Preparing to Sell E-Books, Google Takes on Amazon."

J'ai mal à ma poldoc. ("poldoc" : en jargon bibliothéconomique, désigne la "politique documentaire", c'est à dire le choix des fonds accessibles) Il est un point qui est moins discuté - parce que moins "vendeur" - dans le cadre du Google Book Settlement, c'est la manière dont les ouvrages pourront être mis à disposition des bibliothèques. Et là aussi, fort heureusement, mais peut-être un peu tardivement, on commence à appeler un chat un chat. Il y eut bien sûr le lumineux papier de Robert Darnton (version originale ici) qui dit avec une profondeur d'analyse séduisante, tout le danger potentiel que représente la main mise de Google sur la prescription documentaire :

  • "Après avoir lu l'accord passé entre Google, les auteurs et les éditeurs, et s'être imprégné de sa philosophie - ce qui n'est pas une tâche facile puisque le document s'étire sur 134 pages et 15 appendices-, on en reste bouche bée : voici posées les fondations de qui pourrait devenir la plus grande bibliothèque du monde. Une bibliothèque numérique, certes, mais qui battrait à plate couture les établissements les plus prestigieux d'Europe et des Etats-Unis. De surcroît, Google se hisserait au rand de plus grand libraire commercial de la planète - son empire numérique relèguerait Amazon au rang de boutique de quartier. (...) Google Book Search est sur le point d'inaugurer la plus grande bibliothèque et le plus important magasin de livres de l'histoire. Quelle que soit la manière d'interpréter cet accord, ses dispositions s'imbriquent de manière si inextricable qu'elles s'imposent en bloc. Aujourd'hui, ni Google, ni les auteurs, ni les éditeurs, ni la cour de district de New York ne sont en mesure d'y apporter des changements notables. C'est un tournant majeur dans le développement de ce que nous appelons la société de l'information. Si nous ne rééquilibrons pas la balance, les intérêts privés pourraient bientôt l'emporter pour de bon sur l'intérêt public. Le rêve des Lumières serait alors plus inaccessible que jamais".

Il y a désormais le débat posé en termes clairs, celui de savoir si la partie "bibliothèque" du Google Book Settlement représente ou non une privatisation des "ressources" tout autant que des "fonctions" de la bibliothèque. De mon côté j'avais déjà largement insisté (et je maintiens) sur le risque réel d'un eugénisme documentaire, qui dépasse - à mon avis toujours - et de loin, le seul risque d'une privatisation (au sens anglo-saxon du terme) des fonds documentaires planétaires.

Le plus rageant dans cette affaire c'est qu'en en restant au sein de notre hexagone, on compte, ces 10 dernières années, au moins 3 ou 4 rapports pointant la nécessité stratégique de régler le problème des oeuvres orphelines (via une gestion centralisée), cette fameuse "zone grise" de la littérature, qui constitue le coeur de nombre de collections bibliothéconomiques, zone grise sur laquelle Google a irrémédiablement fait main-basse et dont nous ne commençons qu'à peine à entrevoir les potentialités économiques. C'est ce que rappelle (entre autres choses) cet article du New York Times daté du 4 Avril :

  • "While the registry’s agreement with Google is not exclusive, the registry will be allowed to license to others only the books whose authors and publishers have explicitly authorized it. Since no such authorization is possible for orphan works, only Google would have access to them, so only Google could assemble a truly comprehensive book database.
    “No other company can realistically get an equivalent license,” said Pamela Samuelson, a professor at the University of California, Berkeley, and co-director of the Berkeley Center for Law and Technology.
    "

Le lobbying comme dernière arme ? Nul ne semble aujourd'hui réellement en mesure de rivaliser avec Google sur le marché de la capitalisation (au sens propre) des savoirs et des connaissances. Et ce n'est pas, loin s'en faut une question d'argent. La meilleure preuve est le simple abandon par Microsoft de son outil de recherche de livres. Le même Microsoft qui trouve actuellement bien plus stratégique de financer une chaire de recherche "sur" le Google Book Settlement à la New York Law School institute.

Google Books, volet bibliothèques. Comme je l'écrivais plus haut, si l'actualité se concentre sur le réglement Google, lequel concerne les oeuvres orphelines et les oeuvres sous droit, cela ne doit pas faire oublier que le troisième - et historiquement premier - volet de l'entreprise de numérisation continue d'avancer à grands pas. Ainsi, le 26 Mars, Google a annoncé sur son blog être arrivé au terme du contrat de numérisation "historique" l'unissant à la bibliothèque d'Harvard. Il aura mis 5 ans. Je bloguais alors sur Urfist Infos et j'avais relayé ce qui s'annonçait déjà comme un projet "historique". 5 ans plus tard, sur les 15,8 millions de volumes libres de droit de la bibliothèque, on ne sait toujours pas, ni sur la FAQ d'Harvard, ni dans le billet du blog de Google, combien de volumes sont aujourd'hui rendus disponibles. Il nous faudra nous contenter de ceci "we have digitized and made available (...) many hundreds of thousands of public domain books". Plusieurs centaines de milliers ... On ignore combien mais on mesure l'échelle. On connaît aussi la loi de Moore et l'on observe les mutations en cours de l'objet autant que du marché-livre. Et l'on est comme groggy devant l'enjeu.

Nous y voilà. En novembre 2006, dans un article paru dans la revue Les cahiers du SLF, j'écrivais :

  • "les « moteurs de recherche » ne le sont plus qu’à la marge. Leur véritable activité, la seule génératrice de chiffre d’affaire, est celle de la monétisation publicitaire de l’ensemble du bouquet de services qu’ils offrent : de la découverte ou de la création du besoin jusqu’à sa transformation en acte d’achat, l’ensemble du circuit de consommation est ainsi réalisé en cercle fermé.  La bataille de l’information étant gagnée à leur entier bénéfice – la crise de la presse en ligne en témoigne – les moteurs entrent dans une autre guerre commerciale dont le livre n’est que l’un des premiers retranchements (...)."

Et plus loin dans le même article :

  • "la « monétisation » de l’ensemble des services offerts est inéluctable. Le lancement du tout récent Google Checkout , équivalent du site de paiement sécurisé PayPal, confirme qu’un droit d’entrée sera tôt ou tard prélevé par Google sur l'ensemble de sa panoplie de service, livres y compris. Le seule question est : à quelle hauteur ?"

De colloques en conférences, de grands cénacles en petits comités d'initiés, j'ai répété (avec d'autres ...) depuis plus de 3 ans révolus que Google serait nécessairement libraire, bibliothécaire et éditeur. Et que, nécessairement, cela se ferait beaucoup plus vite qu'on ne pouvait le penser (avant l'obtention de leur diplôme de DUT ai-je encore pris le pari avec mes étudiants de l'IUT de la Roche sur Yon ... pari gagné ;-). Avec d'autres j'ai essayé de convaincre de la nécessité absolue d'une contre-offensive "de poids", sur trois axes :

  1. un portail de recherche fédérée regroupant l'essentiel de l'offre des libraires dits "indépendants",
  2. une réflexion de fond sur les usages, avec la mise en place d'expérimentations à couverture ou à portée nationale.
  3. une bibliothèque numérique qui ne soit pas seulement interface mais d'abord et avant tout contenus, contenus moissonnés pour être d'abord rassemblés, et pour être, ensuite seulement, distribués dans le cadre d'un bouquet de services et d'applications.

3 ans plus tard :

  • le portail de la librairie française "indépendante" n'a jamais vu le jour, et ne le verra probablement jamais. Ou alors - ce qui est pire à mon sens - il finira par voir le jour mais ne sera plus piloté par les acteurs (libraires et idéalement auteurs) mais par les fournisseurs (Hachette et d'autres ...)
  • les études de terrain portant sur les usages s'exhibent dans quelques cénacles et dîners mondains sans qu'aucune dimension stratégique réelle ne leur soit dévolue
  • Gallica intègre depuis quelques mois à peine une offre légale d'ouvrages sous droits dont l'indigence du fonds le dispute à l'inadéquation au public
  • les différents projets de bibliothèque mondiale, universelle ou interplanétaire hésitent toujours entre interface et contenus (et font hélas le plus souvent le choix de la seule interface "à rebond", laquelle vous renvoie vers les contenus ... via d'autres interfaces ...)

La proie et l'ombre. Pendant ce temps, Google avance. Pendant ce temps les dispositifs de lecture électronique, Kindle en tête, s'étendent bien au-delà de leur seul supposé "marché de niche", pendant ce temps, l'ombre tutellaire d'un omnipotent GoogleZon a remplacé la proie que constitua pour lui (et pour d'autres) une politique publique du livre et de la lecture. La récente démission de Benoît Yvert et la nomination d'un remplaçant "par interim" à la tête de la DLL et du CNL atteste du niveau de sanctuarisation à rebours de la réflexion et de l'action culturelle de ce gouvernement.

A l'horizon ...

Reste à Google au moins un épineux problème : celui de la valeur juridique de son "accord" au regard de la législation anti-trust d'une part et au regard de la législation européenne d'autre part. La commission européenne va d'ailleurs bientôt se pencher sur la chose. <Message subliminal> une bonne raison de plus pour aller voter dimanche :-) </message subliminal>

Google libraire. Google bibliothécaire. Amazon éditeur. Amis admirateurs de l'ancienne (antienne ?) chaîne-du-livre-en-un-seul-mot, vous voilà désormais affranchis. La messe est pourtant loin d'être dite. L'avenir donnera lieu a de bien beaux débats, a de bien belles analyses délicieusement partisanes, soulèvera de nouvelles questions essentielles pour ce que l'on appelle - par le tout petit bout de la lorgnette - l'avenir de la prescription documentaire, et qui n'est rien moins - sans lyrisme déplacé - que le simple avenir de la transmission des savoirs et de la culture à l'échelle de la planète. 

Compléments ...

A lire également :

(Temps de maturation de ce billet : 2 mois // Temps de rédaction de ce billet : 8 heures ... soit deux - grosses - soirées ...  // Sources : sous les liens avec une mention et un merci particulier à Virginie et Hervé pour leur veille attentive)

Vous aimez les classements Président ? Et bien classons !

Le président de l'égo-république et sa ministre de l'encrassement supérieur aiment bien les classements. Et ils se plaisent à nous le répéter, en matière de recherche, la France est mal classée. Très mal classée. Loin derrière les Etats-Unis mais aussi loin derrière le Royaume-Uni. Voilà pour le classement de Shangaï (dont tous les gens sérieux - même de droite -  s'accordent aujourd'hui à reconnaître sinon l'inanité, du moins l'inefficience pour un pilotage de la recherche s'il est envisagé isolément).
Oui mais il est figurez-vous d'autres classements dans lesquels la France se retrouve devant les Etats-Unis, devant le Royaume-Uni, devant le célébrissime MIT. Ah ben oui les classements ... tout dépend lesquels on regarde et comment ils sont faits. En l'occurence il s'agit du "Ranking Web of World Repositories" mené depuis plusieurs années par un groupement de laboratoires de recherche espagnols, et qui mesure la "visibilité" des différents dépôts d'archives ouvertes sur la planète.
En voici les résultats :
Classement
Vous noterez donc que la France occupe la 3ème et la 6ème place, et que plus globalement les archives ouvertes francophones sont bien représentées grâce à nos amis helvètes (au total 4 places dans le "top 10").
Les crières choisis (correspondant aux 4 colonnes) valent le coup que l'on s'y arrête un instant pour bien comprendre l'enjeu d'un tel classement :

Alors plutôt que d'entraîner les universitaires vers des "objectifs" dont ils ne veulent pas et qu'ils ne pourront de toute façon jamais atteindre (surtout dans le nouveau cadre de la LRU), c'est à dire un dogme étatique de la "course à la publi" et une autonomie "caporaliste" d'abrutissement comptable, peut-être vaudrait-il mieux soutenir significativement les initiatives du monde des archives ouvertes qui, elles, poursuivent un double objectif qui devrait être prioritairement commun à l'universitaire ET au politique : accroître la visibilité de la recherche française ET faire de cette visibilité un atout dans la construction d'une société de la connaissance et du partage des savoirs.

Interview Télérama.fr

J'ai été interviewé l'autre jour par Sophie Lherm à propos de mon billet sur le (non)lancement d'Europeana. L'interview est écoutable, téléchargeable et podcstable sur le site de Télérama.fr.
L'occasion également de découvrir les contenus de la rubrique Podcast de Télérama.fr (que je ne connaissais pas ... n'ayant pas la télé ... shame on me).
P.S. Soyez indulgents pour le son, l'interview a été réalisée par téléphone ...

Le marché du livre comme algorithme (suite ...)

Suite du billet de l'autre jour. Je m'étais arrêté à la page 7 du document mis en ligne par l'ARL (.pdf). Les 13 pages restantes concernent le "volet bibliothèques" de l'accord passé par Google avec les éditeurs. On y apprend que :

  • Google délivrera un PAS (Public Access Service) gratuit à toutes les "bibliothèques publiques" (nous verrons ci-après que la dénomination a son importance ...) qui en feront la demande. A partir de là il sera possible de consulter le texte intégral des ouvrages de la zone grise depuis les postes informatiques de ladite bibliothèque. 
  • Avec ce PAS, si vous voulez imprimer des pages, on Google vous demandera une somme "raisonnable" (sic) : "A user can print pages of material viewed on the PAS terminal for a “reasonable” per-page fee"
  • Pour déterminer ce qu'est une "bibliothèque publique", et pour le secteur de l'enseignement supérieur, Google se base sur la classification Carnegie. Si vous ne correspondez pas aux critères de ladite classification, Google pourra vous offrir 1 PAS pour l'équivalent de 10 000 étudiants. Si vous êtes dans les critères de ladite classification, ce sera 1 PAS pour 4000 étudiants. Et si vous en voulez plus ? "Google (...) can agree to expand the PAS service by making additional terminals available for free or an annual fee, but the settlement provides no further details on the terms for this expansion." Donc ce sera possible. Et ce sera gratuit. Ou pas. Ca dépendra. Ce sera du cas par cas. Qui à dit "diviser pour mieux régner ?". Bref, faudra négocier avec Google. 

Bilan ? C'est un PAS de plus vers un pas de trop. Je connais un certain nombre de marchands du temple de l'édition scientifique qui vont ressentir comme un léger malaise à voir l'ombre du géant de Mountain View venir s'étendre inexorablement sur leur pré carré. Car après la PAS, vient l'ISD (Institutionnal Subscription Database). Et oui.

  • l'ISD c'est le fait que chaque institution va pourvoir acheter, toujours pour les mêmes oeuvres de la zone grise, un abonnement institutionnel pour offrir l'accès à l'ensemble de ces textes à l'ensemble de ses usagers. C'est à dire le principe même des bouquets numériques que contractent actuellement les bibliothèques (universitaires notamment) avec les grands éditeurs scientifiques. Cet accès aura naturellement une durée limitée et devra être périodiquement renouvelé.
  • OK mais combien ça va coûter ces abonnements ? Et bien, là encore, c'est Google et lui seul qui va algorithmiquement fixer le prix. Enfin pas tout à fait. C'est Google et le Book Rights Registry (BRR), c'est à dire le fameux registre d'enregistrement des oeuvres encore sous droits. Sauf qu'en l'état, il faut rappeler que c'est Google qui crée et finance seul ledit BRR et que l'on ne sait rien de ce que sera sa composition ... Et donc, les critères pour déterminer le prix d'un abonnement institutionnel sont : "the pricing of similar products and services available from third parties; the scope of the books available in the ISD; the quality of the scan (sic ...); and the features offered as part of subscription." Plus loin on apprend également que le prix : "will be based on the number of full-time equivalent (FTE) users. For higher education institutions, FTE means full-time equivalent students."

Moralité : c'est ce que l'on appelle vérouiller ses positions. Phase 1 : google crée le marché. Phase 2 : Google prend le marché. Phase 3 : Google en fixe les règles. Phase 4 : Google n'a plus qu'à ramasser les copies les contrats ... Parce que dans toute cette histoire, vous n'avez pas oublié qu'au départ il y avait le projet Google Books ... un projet dans lequel des bibliothèques confiaient à Google des ouvrages dont certains font partie de la fameuse zone grise. Et c'est là que commence la lecture des dernières pages du document de l'ARL. Dans le prochain billet, je vous raconterai comment Google va réaliser le coup du chapeau. C'est à dire faire finalement payer aux bibliothèques l'accès aux ouvrages de leur fonds propre.
A suivre :-)

(Temps de rédaction de ce billet : 1h00)

Le marché du livre comme algorithme.

=======================================================================

Nota-Bene : je déroge à la ligne éditoriale (floue) de ce blog qui veut que je ne publie habituellement le vendredi que mes "petits liens du week-end", réservant le dimanche soir à la publication de billets plus fouillés. Mais en l'occurence, le document analysé dans ce billet vaut la peine que vous passiez une partie de votre Week-end à y réfléchir - enfin si vous avez rien de mieux à faire bien sûr - tant les enjeux sont considérables pour le monde et le marché du livre. Fin du teasing, on peut y aller :-)

=======================================================================

Le très récent accord historique passé par Google avec les éditeurs américains continue de faire causer sur la toile et ne laisse personne indifférent. Prosper nous signale que les mêmes éditeurs ont mis en ligne un document à destination des bibliothèques pour "expliquer" les tenants et aboutissements dudit accord : "A Guide for the Perplexed : Libraries and the Google Library Project Settlement". Ce qu'on apprend dans le document pdf mis en ligne est réellement hallucinant tant cela témoigne de la candeur avec laquelle les éditeurs ont de facto délégué à Google la capacité de faire du marché du livre, "son" marché du livre. Petite explication et extraits ...

Avec tout d'abord les nouvelles règles du jeu : 

  • pour les ouvrages libres de droits, rien ne change (=Google affiche le texte intégral et permet de le télécharger) ; 
  • pour les ouvrages sous droits mais qui ne sont plus dans le circuit commercial, Google pourra afficher jusqu'à 20% du texte, pas plus de 5 pages consécutives, et pas plus de 4 pages qui se suivent quand on fait une recherche par mot-clé à l'intérieur de l'ouvrage, et pour les oeuvres de fiction de cette même catégorie, Google ne pourrait afficher que 5% des pages et pas plus de 15 pages se suivant et jamais les dernières pages de l'ouvrage, et pour les oeuvres - toujours de la même catégorie - du genre "poésie, nouvelles, dictionnaires, encyclopédies, recueils de citations (...)"  c'est une "fixed preview" qui sera mise en place pour - au maximum - 10% de l'ouvrage, y compris dans le cadre d'une recherche par mot-clé sur les contenus de l'ouvrage.
  • pour les ouvrages sous droits et dans le circuit commercial : la règle "par défaut" est que Google n'affichera plus "que" l'information bibliographique, la page de titre, la quatrième de couverture, la table des matières et le ou les index. Terminé l'affichage de "snippets", sauf ... sauf si l'ayant droit (ou son représentant, c'est à dire l'éditeur) l'autorise. Et l'on peut raisonnablement penser que les éditeurs autoriseront cet affichage de "snippets", ne serait-ce que parce que ce feuilletage électronique est un préalable souvent indispensable à l'acte d'achat. Pour cette même catégorie d'ouvrages, s'ensuit également une liste de cas particuliers (que je n'ai pas le temps de traduire) mais qui, en gros, laissent tout de même supposer qu'au final, on continuera de pouvoir consulter des extraits des oeuvres de cette catégorie.

Et puis voici maintenant le "nouveau marché". Un nouveau marché qui confirme ce que je vous annonce depuis bientôt deux ans, c'est à dire que l'investissement de Google dans la numérisation est tout sauf une entreprise philanthropique ou un investissement à perte. Bien au contraire, la coût de la numérisation d'ouvrages libres de droits était simplement le prix du ticket d'entrée sur le marché - colossal - de la vente des ouvrages de la "zone grise". Un ticket d'entrée au prix d'autant plus faible que sur ce nouveau marché, c'est désormais Google qui est seul à fixer les règles. Toutes les règles. La nouveauté donc, c'est l'acte de naissance officiel des "fee-based services" :

  • "Users will be able to purchase online access to the full text of in-copyright, not commercially available books through an account established with Google." Nous sommes donc bien d'accords : Google devient officiellement libraire (l'accord l'ayant déjà institué éditeur puisqu'il sera seul à créer, gérer et maintenir la base dans laquelle viendront s'enregistrer et se déclarer les ayants droits potentiels des oeuvres de la zone grise). Le terrain étant ainsi déblayé, "y' plus qu'à" ... fixer les règles de ce nouveau marché.
  • Deux possibilités : soit les ayants droits identifiés et reconnus fixent leur prix, soit ... c'est Google qui le fixe algorithmiquement. "Google will set the price for all books not priced by the rightsholders based on a pricing algorithm designed to find the optimal price for each book to maximize the revenue for the rightsholder. Initially, books will be distributed in pricing “bins” in the following percentages: 5% of the books available for purchase will priced at $1.99; 10% at $2.99; 13% at $3.99; 13% at $4.99; 10% at $5.99; 8% at $6.99; 6% at $7.99; 5% at $8.99; 11% at $9.99; 8% at $14.99; 6% at $19.99; and 5% at $29.99. The algorithm will place a book in a pricing bin based on aggregate data collected with respect to similar books. Google can change the price of a book in response to sales data. Google also can change the distribution of books in the pricing bins
    over time as the prices of individual books are adjusted based on the pricing algorithm.
    " Je vous fait un dessin ? A la manière dont Apple avait fixé seul le prix du morceau de musique via sa plateforme Itunes, Google vient de fixer, seul, le prix de vente à la découpe des ouvrages de la zone grise. En gros donc, il y aura 12 tranches de prix, de 1;99 $ à 29;99 $. En gros toujours, ce prix sera fixé sur des critères auxquels seul Google a accès ("a pricing bin based on aggregate data collected with respect to similar books"). En gros toujours, Google se réserve le droit d'augmenter le prix d'un ouvrage (= de le faire changer de tranche de prix) en fonction des chiffres de vente ("sales data"), chiffres de vente dont il sera seul à disposer. 

Et voici enfin l'ultime escroquerie : le modèle de l'a-llocation. Mékeskidi ? Cette escroquerie concerne l'acte d'achat. Et bien il n'y en aura pas. Ou plutôt si. On pourra théoriquement "acheter" ces ouvrages de la zone grise. Mais on ne fera pratiquement qu'acheter un droit d'accès (très partiel cf ci-dessous) à ces ouvrages sur les serveurs de Google. Donc une location. Etant donné la puissance de frappe de Google et l'ampleur du marché ici concerné, c'est l'acte de naissance officiel d'un nouveau mode commercial : on ne pouvait jusqu'ici qu'acheter ou louer des produits quels qu'ils soient. On peut désormais effectuer des locations déguisées en achat. Pour célébrer cette naissance il faut un nouveau terme. Je propose celui "d'a-llocation." ("a" pour "acheter" et "location" pour ... location). Concrètement, voici ce qu'on peut lire dans le même document (.pdf) :

  • "After purchasing the book, the user will have perpetual online access to view the entire book from any computer." Retenez bien cette phrase là. C'est un modèle du genre. Traduite littéralement elle signifie : "Après avoir acheté le livre, l'utilisateur aura un accès en ligne perpétuel à sa totalité depuis n'importe quel ordinateur." Traduisez : on pourra donc acheter un truc qu'on ne pourra lire que sur Google via son compte Google. C'est ça la conception du "perpetual online access" selon Google.
  • "The user will be able to copy and paste up to four pages of the purchased book with a single command, but, with multiple commands, can copy and paste the entire book." On ne pourra donc disposer d'une vraie copie numérique correspondant à son acte d'achat QUE SI on fait du copier-coller. Et par défaut, on ne pourra copier-coller QUE  ... 4 pages.
  • "The user will be able to print up to twenty pages of the purchased book with a single print command, but, with multiple commands, can print out the entire book. Google will place a watermark on printed pages with encrypted identifying information that identifies the authorized user that printed the material." On ne pourra donc imprimer - par défaut toujours - que 20 pages. Et en plus on sera "pisté" (grâce aux techniques de marquage = "watermarks") au cas où il nous viendrait l'idée saugrenue d'imprimer plus de 20 pages d'un livre que l'on vient pourtant "d'acheter".
  • "The user will be able to make book annotations of the purchased book. A book annotation is user-generated text that is displayed on any Web page on which a page of a book appears. The user can share his annotations with up to 25 other individuals who have purchased the book through this service and who have been designated by the user." On pourra annoter le livre qu'on vient d'acheter, mais on ne pourrra là encore le faire que "sur" Google, et on ne pourra partager lesdites annotations que "sur" Google et avec 25 autres pigeons qui auront comme nous eu "l'impression" d'acheter ledit bouquin et que nous aurons nommément désignés (pour qu'ils puissent être à leur tour pistés et que Google puisse vérifier, via leur compte, qu'ils ont effectivement achetés l'ouvrage en question).
  • "A user who purchases a book will not see an insert if the insert’s rightsholder chooses to exclude displays of the insert. In this situation, a purchaser (or an institutional subscriber, described below) will not have access to the complete book as published." Livre à la découpe donc. En plus de se faire pigeonner avec un acte d'achat qui n'en est pas un, en plus de se faire pister, on pourra ne pas accéder à certains passages du livre, si l'ayant droit a décidé d'extraire certains passages.

Conclusion ? Ce qui se met en place avec cet accord est passionnant ET révolutionnaire ET (de mon point de vue) scandaleux pour UNE raison : c'est la naissance de la littérature comme algorithmie. Plus précisément, c'est la soumission de la littérature du marché du livre à une nouvelle matrice calculatoire préemptée par Google avec l'assentiment des gardiens du temple, à savoir les éditeurs. Plus précisément encore c'est - à ma connaissance - la première fois qu'un algorithme informatique (dans toute son opacité) préside à la naissance d'un marché et en devient simultanément le seul régulateur.

De la candeur (relative) des éditeurs. Les éditeurs ont ici obtenu une victoire tactique, mais en rien stratégique. Ils ont obtenu que Google n'affiche plus "par défaut" des extraits des ouvrages en vente. La belle affaire. Ils ont oublié que le coeur du procès n'était pas l'affichage des extraits, mais la simple possibilité offerte à Google de numériser TOUS les contenus et de les tenir à sa disposition "pour le jour où ..." Alors oui, candide les éditeurs. Alors oui, dommage les auteurs qui ont laissé cette bataille leur échapper en déléguant pour l'essentiel leur représentativité aux même éditeurs. Mais non, les éditeurs n'ont pas tous les torts. Leur approche est conditionnée par les "règles du marché". Et ces règles du marché les obligent à maintenir à flot la rentabilité de leur boutique. Donc même s'ils disposent d'une vision stratégique à moyen ou long terme, ils n'ont d'autre choix que d'effectuer des choix tactiques à court terme. Ils auraient - pour préférer la stratégie à la tactique - ils auraient disais-je, eu besoin que les autres acteurs (états et institutions notamment) se mobilisent différemment (= mettent de l'argent) et surtout davantage autour de ce projet qui nous concerne tous.

Remarque annexe : ce qui est très fort dans cette approche, c'est qu'en plus de créer un marché qui n'existait pas, en plus de s'en arroger l'exclusivité, et en plus d'en fixer les règles, Google ne va fâcher aucun "concurrent", traduisez, il n'empiète pas sur les plate-bandes d'Amazon ou des autres grossistes suffisamment présents en termes de part de marché, et si un jour ces derniers décidaient de vouloir entrer à leur tour sur le marché créé et contrôlé par Google, ils n'auraient d'autre solution de de se soumettre aux règles fixées ... par le même Google.

Sur le même sujet ou presque (l'impact de l'accord passé par Google avec les éditeurs), précipitez-vous sur la lecture de cet article de l'EFF dont j'extrais le passage suivant :

  • "If approved by the court, the $125 million settlement would buy Google — and only Google — permission not just to scan books for indexing purposes, but also to expand Book Search to provide more access to the scanned books. (...) By settling rather than taking the case all the way (many copyright experts thought Google had a good chance of winning), Google has solved its own copyright problem — but not anyone else's. Without a legal precedent about the copyright status of book scanning, future innovators are left to defend their own copyright lawsuits. In essence, Google has left its former copyright adversaries to maul any competitors that want to follow its lead." Conclusion : "Those kinds of cases threaten to yield bad legal precedents that tilt the rules against disruptive innovation generally." Voir également le commentaire ce cet article sur IP-Watch.

Re-conclusion : ça y est. C'est fait. A compter du jour de la publication de ce document (.pdf), Google est éditeur et libraire. Certes il est pour l'instant uniquement éditeur et libraire des oeuvres de la zone grise. Mas avec un droit d'exclusivité qui laisse clairement entrevoir à quel point il serait aujourd'hui aberrant de considérer qu'il en restera là et s'interdira de grignoter progressivement les "autres" marchés du livre.

(Temps de rédaction de ce billet : 2 heures 15)

Europeana : 3 petits tours, et puis ...

La bibliothèque européenne, Europeana a donc été lancée le 20 Novembre (communiqué de presse.pdf). Europeana se compose actuellement de "2 millions de documents, dont des livres, des cartes, des peintures et des photographies, provenant des bibliothèques nationales et de plus de 1 000 institutions culturelles des 27 pays de l’Union européenne." Et Viviane Redding, dans le sus-mentionné communiqué de presse, lui fixe un objectif de 10 millions de documents en 2010.
Pour bien comprendre le contexte et les enjeux, un artcle de Bruno Texier fait le point dans Archimag :

  • "2,5 milliards de livres constituent le patrimoine des bibliothèques européennes. Seul 1 % de ce corpus est actuellement disponible en format numérique…"
  • Europeana restera en version "béta" (prototype donc) pendant encore deux ans.
  • "La Commission européenne a annoncé qu’elle allouera, en 2009-2010, un budget de 120 millions d’euros afin d’améliorer l’accessibilité en ligne de ce patrimoine."

Le New-York Times nous retourne aussi habilement qu'insidieusement la vieille antienne de l'hégémonie culturelle, en retenant que plus de la moitié des 2 millions de documents ont été fournis par la France, contre seulement "1 % par l'Allemagne, 1.4% par l'Espagne et seulement 10% par le Royaume-Uni."
Le BBF de son côté nous indique le communiqué de presse de l'INA (.pdf) indiquant que la totalité des documents numérisés par l'INA seront également disponibles dans Europeana. D
Dominique Lahary a par ailleurs entièrement raison de souligner l'enjeu d'Europeana pour "le web public, qui est aussi un web de service public."
Europeana c'est donc un petit peu Hourra et Hosanna. Oui mais voilà, Europeana n'a fait sur le web que trois petits tours ... et puis s'en va. Parce que figurez-vous que sitôt le site ouvert, celui-ci a été assailli par des millions d'utilisateurs. 10 millions de curieux, de bibliophiles, d'étudiants, de quidams, de citoyens se sont donnés rendez-vous pour l'inauguration. Et là, c'est le drame. Bousculade à l'entrée, serveurs en rideau. Crac boum hue. A pu Europeana. Europeana.eu aujourd'hui, c'est un temps de chargement d'une minute trente (j'ai compté ...) pour tomber sur le message suivant : "The Europeana site is temporarily not accessible due to overwhelming interest after its launch (10 million hits per hour). We are doing our utmost to reopen Europeana in a more robust version as soon as possible. We will be back by mid-December." Des sites pris d'assaut lors de leur ouverture, cela arrive. Des serveurs qui flanchent, c'est courant. Même le Grand Google a connu ce genre d'affres pour le lancement de Gmail ou d'Analytics. Mais visiblement, l'équipe de conception d'Europeana n'avait pas prévu un tel enthousiasme, une telle curiosité, une telle appétence, une telle bibliophilie planétaire. Faut dire aussi que l'annonce de l'ouverture avait largement dépassé l'étroitesse des frontières de l'union pour atteindre au communiqué de presse planétaire. Même Google s'était pour l'occasion fendu d'un billet relayant, annonçant et se félicitant de ladite ouverture de la bibliothèque numérique européenne, et en profitant pour lancer un appel du pied appuyé (à moins qu'il ne s'agisse d'un tacle sournois) :

  • "As we move ahead with Google Book Search, we look forward to finding new ways to collaborate on initiatives such as Europeana -- and taking part in what could become the biggest technological leap in disseminating knowledge since Gutenberg invented the printing press."

Dans ces conditions, difficile de faire un billet un peu fouillé sur un service inaccessible. Heureusement, quelques chanceux curieux de la première heure ont eu le temps d'apercevoir le site. L'intérieur d'Europeana ressemble donc à ça. Heureusement, on sait aussi que Gallica 2 a servi de prototypage pour le lancement d'Europeana. Et Gallica 2 est encore accessible en ligne, ce qui permet donc de se faire une petite idée de ce que sera l'intérieur d'Europeana en termes d'interface.
Europeana Europeanasearchresults
En attendant la réouverture :

  • on pourra toujours relire la génèse du projet sur La République des Lettres.
  • gloser sur le choix du logotype, avec une stylisation du "E" suivi de deux "O" (évoquant un engrenage ...), qui, si l'on applique un effet miroir au même "E" et aux deux "O" le suivant, nous donne étrangement les initiales d'une autre bibliothèque numérique mondiale : "GOO ..."
  • moquer l'incapacité à anticiper le volume de connexions à l'ouverture ou le délai envisagé pour la réouverture (3 semaines tout de même ...) ... d'aucuns ont envisagé l'hypothèse (naturellement hautement fantaisiste) que Google prête quelques-uns de ses serveurs à Europeana, ou lui propose même d'héberger son contenu ... ce qui, tout à fait sérieusement cette fois, nous renvoie à la question essentielle de l'informatique dans les nuages pour les institutions et services publics (voir par exemple ici et ).
  • prendre des nouvelles de la santé des serveurs d'Europeana sur la page dev.europeana.eu
  • se languir de la mise en ligne de cette collection exceptionnelle...

De tout cela je retiens qu'il faut prendre l'épisode du lancement raté de ce grand projet pour ce qu'il est : une fable moderne pleine d'enseignements sur la mesure et le périmètre d'un service public numérique à l'heure et à l'ère de l'accès comme clé de voûte bibliothéconomique renouvellée.

<Update> Voir aussi le débat nourri - et légèrement "trollé" - sous le billet de Jean Quatremer. Ainsi que les chiffres détaillés de Telerama.fr </Update>

Google Books : le prix de la tranquilité (et du monopole).

(Titre alternatif de ce billet : "Les oeuvres orphelines ont désormais un père : il s'appelle Google")

Nouvel épisode décisif à plus d'un titre dans la saga Google Books. Pour bien comprendre ce qui suit, rappelons d'abord que Google Books est tout sauf une "danseuse", c'est même un projet consubstantiel à l'existence même de la firme.

Bref rappel des faits :

  • Tout commence avec l'accord passé avec des bibliothèques pour la numérisation d'ouvrages dans le domaine public. Numérisation "à fonds perdus" et numérisation initialement garantie sans publicité ni téléchargement.
  • Deuxième volet : les ouvrages sous droits. Google passe des accords avec les éditeurs pour ne donner à voir que des extraits choisis des oeuvres sous droits.
  • Troisième volet : les oeuvres orphelines : c'est ici (comme ailleurs) la règle de l'opt-out qui est choisie et imposée par Google.
  • En 2005 les deux plus grosses associations américaines d'éditeurs (AAP) et d'auteurs (Authors Guild) engagent une action en justice (.pdf) contre Google Books. En gros, elles réclament un système d'opt-in en lieu et place du système d'opt-out pour les ouvrages sous droits ET les oeuvres orphelines.

Depuis 2005 :

  • Google continue de numériser dans les bibliothèques, y compris en France.
  • Dernier rebondissement : la création du Hathi Trust pour contrer ce qui a tous les aspects d'un monopole avec les risques afférents quand ce monopole est celui d'une société commerciale (changement d'actionnariat, faillite, réorientation stratégique ...).
  • De son côté la BnF intègre désormais dans son Gallica2 des ouvrages sous droits. Voilà pour le volet bibliothèques / éditeurs.

Et donc depuis aujourd'hui 28 Octobre 2008, un accord vient d'être trouvé dans le cadre du procès opposant Google aux auteurs et éditeurs américains. Les faits en question relatés dans une syntaxe très Maîtréolassienne :

  • "recours collectif entamé par des auteurs et éditeurs, accusant Google d'avoir porté atteinte à leurs droits d'auteurs et à ceux d'autres détenteurs de droits de Livres et de Hors-textes (cliquez sur les termes pour consulter leurs définitions), en numérisant les livres en question, en créant une base de données électronique et en affichant des extraits sans l'autorisation préalable des détenteurs des droits d'auteurs concernés. Google nie les faits. Ce procès est intitulé The Authors Guild, Inc., et alii vs. Google Inc., Affaire n° 05 CV 8136 (S.D.N.Y.)" (Source)

Et donc qu'est-ce qui va changer ?

  • Tout est expliqué là en en plus c'est en français. Donc je vais pas recopier. Bon d'accord.
  • "Google pourra continuer à numériser des Livres et Hors-textes soumis aux copyrights ou droits d'auteurs, à développer une base de données électronique de livres, à vendre des abonnements à ladite base de données à des écoles, sociétés ou autres institutions, à vendre des livres aux utilisateurs et à intégrer des annonces aux pages de présentation de livres." Donc Google continuera de faire ce qu'il a toujours fait, et ce qui jusqu'ici posait justement problème. Sauf que maintenant, ça ne pose plus problème. Et voici pourquoi.
  • "Google versera aux détenteurs de droits 63 % des revenus générés par lesdites utilisations, via un registre de droits sur les livres ("Registre"), qui distribuera ces revenus aux détenteurs de droits des livres et hors-textes, énumérés dans le Registre."

Une question d'argent.

  • Au final Google déboursera 125 millions de dollars.
  • Pour les détenteurs de droits : 45 millions de dollars. "Google versera en outre la somme de 45 millions de  USD afin de résoudre les procès en cours entamés par les détenteurs de droits dont Google a numérisé livres et hors-textes sans leur permission à compter de la date à laquelle les membres du recours doivent notifier les parties s'ils souhaitent se retirer du Règlement de recours collectif ("Date limite d'exclusion")."
  • Pour mettre en place le fameux "registre" recensant les droits directs et indirects : 34,5 millions de dollars. "Google débourse la somme de 34,5 millions de USD pour l'établissement du Registre et les autres coûts liés à la gestion du Règlement de recours collectif. Le Registre permettra entre autres de situer les auteurs, éditeurs et autres détenteurs de droits et de verser auxdits détenteurs de droits les revenus générés par les utilisations de Google."
  • <Update de 5 minutes plus tard> Voir le commentaire aussi malicieux qu'éclairant d'Alain Pierrot </Update>

Préserver l'Opt-out à tout prix.
Tel était l'enjeu principal de ce procès pour Google. Il y a mis le prix. Il a gagné. 

  • "Les détenteurs de droits auront la possibilité d'interdire à Google tout usage avec présentation de leurs livres ou hors-textes. (...) Les détenteurs de livres en librairie devront mentionner sur le Registre s'ils souhaitent que leurs livres soient utilisés par Google pour l'un ou l'autre de ces usages avec présentation. Les livres épuisés seront automatiquement inclus dans tous les usages avec présentation jusqu'à mention contraire de(s) détenteur(s) de droits du livre."

OK mais CONCRETEMENT pour les usagers, ça va changer quoi ?? Plein de choses. Le billet de Dan Cohen en livre une belle synthèse :

  • Plus d'ouvrages (mais lesquels ?). Primo l'essentiel de l'accord porte sur les oeuvres orphelines ("in-copyright but out-of-print books"). C'est à dire sur une part gigantesque d'ouvrages. Et notamment d'ouvrages académiques (universitaires).
  • A moindre coût (mais lequel ?). Deuxio : le prix des marchés des "bouquets numériques" en bibliothèque risque de bouger pas mal, vu que maintenant, c'est clair, Google entre sur ce marché : "We’ll also be offering libraries, universities and other organizations the ability to purchase institutional subscriptions, which will give users access to the complete text of millions of titles while compensating authors and publishers for the service. Students and researchers will have access to an electronic library that combines the collections from many of the top universities across the country. Public and university libraries in the U.S. will also be able to offer terminals where readers can access the full text of millions of out-of-print books for free." Les éditeurs de la place (Elsevier et consorts) doivent actuellement être en pleine réunion de crise :-) Le modèle ne change donc pas : les bibliothèques achèteront un bouquet numérique accessible gratuitement pour leurs utilisateurs. Comme le souligne Dan Cohen, ce qui va changer (mais nul ne sait encore comment) c'est toute la politique documentaire et la politique d'acquisition des bibliothèques et des consortiums les représentant dans ces nouvelles négociations avec ce nouvel acteur de poids ...
  • A une échelle jamais atteinte. Tertio : Google évoque un accès computationnel à l'ensemble de la base Google Books. "In addition to the institutional subscriptions and the free public access terminals, the agreement also creates opportunities for researchers to study the millions of volumes in the Book Search index. Academics will be able to apply through an institution to run computational queries through the index without actually reading individual books." En clair : on ne pourra pas LIRE gratuitement tous les livres, mais on pourra gratuitement effectuer des recherches et des requêtes (scientifiques) sur l'ensemble du corpus Google Books. Vertigineux. Je connais des historiens, des linguistes, des informaticiens, des sociologues, des utilomanes qui devant une telle nouvelle, vont sauter au plafond comme des gamins devant une PS3. <Digression mais pas tant que ça> Je vous disais en entame de ce billet que Google Books est consubstantiel à l'histoire de la firme. De fait, à l'époque où ils étaient étudiants, Brin et Page avaient mis au point un projet de recherche pour explorer l'ensemble des ouvrages de leur bibliothèque universitaire. Ils viennent de concrétiser leur rêve à l'échelle de la planète. Je vous disais également dans d'autres billets que si Google Books était - à mon avis - si capital pour la firme, c'était probablement en tant que service-corpus servant de passerelle à d'autres services comme la traduction automatique, ou l'amélioration du requêtage et du ciblage utilisateur. En clair, avec la possibilité offerte aux chercheurs du monde entier de disposer "d'accès computationnels", toutes les requêtes seront adressées "sur" les serveurs Google, qui pourra donc lire à livre ouvert dans une partie significative des projets de recherche de l'ensemble de la planète, et pourra donc naturellement en bénéficier. Une sorte d'espionnage académico-industriel avec l'aval des différentes parties. </Digression>

Une petite analyse peut-être ?
Regardons les choses du côté de ce qu'on appelle la chaîne du livre.

  • Libraires = au mieux grands perdants, au pire petits joueurs. L'analyse proposée par Paul Courant me semble très judicieuse. Son billet est intitulé : "De la bibliothèque universelle, à la librairie universelle." Je crois que c'est clair :-) Plus globalement, les libraires ont vraiment du souci à se faire. Vraiment. V-r-a-i-m-e-n-t. Mais vous me direz, ça fait longtemps qu'ils sont avertis.
  • Bibliothèques : ni gagnants ni perdants. Les bibliothèques en général peuvent se réjouir. Elles peuvent se réjouir sur le fond(s) : il continue d'être numérisé par Google. Et se réjouir sur la forme : les nouveaux services développés, la nouvelle offre numérique ainsi constituée (cf supra), tout cela pourra être offert gratuitement à leurs usagers. Au niveau local (et national avec Gallica), la question est de savoir s'il leur restera encore beaucoup d'usagers vu le fonds et les services que va désormais offrir Google :-(( Bref, elles vont devoir se (re)positionner sur un certain nombre de services numériques et continuant de faire leur boulot ("faire collection") et en négociant avec un nouveau partenaire commercial cette fois : Google. Moralité : le facteur sonne toujours deux fois. La première c'est pour vous faire une offre de numérisation gratuite. Et la seconde, c'est pour vous vendre une offre de numérisation payante.
  • Les éditeurs : Gagnants à court terme. Perdants à moyen terme. Y'a pas photo comme disait l'autre. Les éditeurs étaient de toute façon coincés dans leur propre procès. Dès le départ de l'action en justice (2005), ils savaient que Google ne ferait pas machine arrière. Eux-mêmes d'ailleurs n'y avaient pas intérêt. L'accès et la valorisation numérique de Google Books était en effet très vite devenue leur premier rabatteur. Et quand on part à la chasse, on n'attaque pas son rabatteur en justice. Ce procès n'était donc que celui des apparences : faire bonne figure en prétextant défendre les droits des auteurs, et espérer que tout cela finirait par une négociation commerciale avec un gros gâteau pour les éditeurs et une jolie cerise que les auteurs se partageront. Cela prît certes un peu plus de temps que prévu (3 ans donc), mais au final, c'est tout de même 45 millions de dollars qui tombent. Je préfère ne pas savoir combien seront effectivement reversés aux auteurs :-( Mais la deuxième victoire des éditeurs est ailleurs : l'état américain étant incapable (au même titre que l'état Français mais pas pour les mêmes raisons) de mettre en place un registre ou une base de donnée des oeuvres orphelines, et les éditeurs n'ayant pas très envie de se coltiner ce sale et surtout coûteux boulot, c'est Google qui va "faire le job". Et c'est tout bénéf' pour lesdits éditeurs. Sauf que ce que les éditeurs ne mesurent peut-être pas encore c'est que de la même manière qu'en acceptant pour 45 millions de dollars de mettre tous les oeufs de leur numérisation dans le panier Google, en laissant Google mettre en place et gérer le Registre des oeuvres, ils se font dans le même temps déposséder de ce qui demain, leur aurait peut-être permis de gagner leur prochain procès contre la firme. "Quel prochain procès ?!?" Et ben tout simplement celui qui ne manquera pas d'arriver quand après être devenu bibliothécaire et désormais libraire, Google deviendra éditeur. Je lui laisse deux ans. Deux ans maximum.

Il était long ce billet. Intéressant mais long. On se fait un petit résumé ?
Pas de problème. Mieux qu'un résumé, un générique de film. Dans le rôle de la mission régalienne d'établir et d'entretenir un répertoire national et/ou international des oeuvres sous droits : Google. Dans le rôle du libraire : Google. Dans le rôle du bibliothécaire qui fait collection : Google. Bientôt dans le rôle de l'éditeur : Google. Dans le rôle du prestataire commercial venant vendre (bientôt) le plus gros bouquet numérique de la planète : Google.
Le scénario était écrit et connu depuis au moins trois ans. Le film est depuis en tournage et nous en sommes aux toutes dernières séquences. Ce qu'on appelle le climax. Va y'avoir du sang, des larmes, des regrets tardifs, des incompréhensions hypocrites et malvenues. Ce qui est sûr c'est que pour ce film là, il est déjà trop tard pour lui écrire un Happy End.
Mais il n'est peut être pas trop tard pour écrire un autre scénario.   

<Update de 10 minutes plus tard et du lendemain ...>

Sergei Brin interviewé par le Wall Street Journal : le "registry" des livres n'est qu'une étape. Films et musique sont les prochaines (étapes)

Plein d'infos supplémentaires sur PCMag (mais pas le temps de traduire) :

  • "The nation's 16,500 public libraries "would be offered a free, online portal to this trove of books," Aiken said. "Patrons would be able to print an unlimited number of pages for a reasonable per page fee.""
  • "When someone purchases access to a book via Google Print, Google will receive 37 percent and the publisher and author will split the remaining 63 percent. Authors and publishers will also be charged a registry administration fee. That fee has not yet been set, but will likely be between 10 to 20 percent of their 63 percent earnings. Google will share the ad revenue earned from this endeavor in a similar 37-63 percent manner. Ads will be displayed along the side or bottom of the page, but will not be included in the actual text of the books. Meanwhile, rights holders who agree to leave their books in the database will receive about $200 per book, though that won't be paid out for several years, Drummond said. Institutional subscription fees will be based on usage. Google will track access to its data anonymously and bill customers accordingly, but specific details have not yet been announced"

Le prix de la synthèse la plus courte (et la plus claire) est attribué à l'unanimité à Michele Battisti de l'ADBS.

Peter Suber enfonce le clou du monopole étendu.

</Update>

(Sources en plus de celles sous les liens : Bibliobs, Alain Pierrot, Dan Cohen, Paul Courant, Philipp Lenssen, la page grand public sur l'accord en Français, la page plus professionnelle sur le même accord, billet du blog officiel de Google, communiqué de presse, // Temps de rédaction initial de ce billet : 2h15min // ... Probables mises à jour à suivre ... //)

Google books en 8 lettres. MONOPOLE.

Aïe. La nouvelle vient de tomber. Cela ne lui aura finalement coûté "que" 125 millions des dollars. Pas le temps pour l'instant mais j'y reviens bientôt dans un billet plus long.

Rock&Num at the BnF.

Va falloir s'y faire. Ca bouge à la Bnf. Ca bougeait déjà depuis longtemps me direz-vous. Certes ... Mais là, en plus de bouger, ça communique sur le mouvement :-) Donc :

  • Dans la BnF y'a de l'OAI (et dans Banga y'a de l'eau). Ici : "La Bibliothèque nationale de France a ouvert deux entrepôts OAI              destinés à faciliter l'accès à ses collections et à ses données.             Le premier, OAI-NUM, contient les notices de tous les documents numérisés             et accessibles via les bibliothèques numériques Gallica et Gallica2.             Le second, OAI-CAT, a pour vocation de contenir l'ensemble des notices             des documents de la Bibliothèque nationale de France, numérisés ou             non. Il contient actuellement presque 10 millions de notices." Tous les détails ici. Par ailleurs (spéciale dédicace à mes étudiants qui lisent de plus en plus mon blog depuis que j'y publie les sujets d'examen la veille desdits examens), cette page là est une excellente ressource pour notre cours sur les bibliothèques numériques).
  • Dans WorldCat y'aura le catalogue de la BnF : communiqué sur le site de l'OCLC. Pour Bruno Racine, "The Bibliothèque nationale de France is willing to increase the audience of its cultural heritage materials. We are convinced that the contribution of our entire bibliographic catalogue to WorldCat is likely to enhance the value of the library collections". Les mauvaises langues diront qu'il était temps. Les autres comprendront qu'il faut du temps.
  • Pour la numérisation de masse, y'a une vidéo. Eeeeet oui. Va falloir s'y faire. La BnF c-o-m-m-u-n-i-q-u-e sur ses opérations de numérisation de masse. Et elle le fait de manière intelligente (même si le fond musical est discutable ;-) Alors bien sûr c'est (ce n'est que) de la "comm", alors bien sûr c'est un vrai petit film promotionnel pour les partenaires de la BnF sur ladite numérisation, mais "ça parle" et "ça montre" concrètement ce qu'il y a derrière cette expression étrange qu'est la "numérisation de masse". (info glanée via Jérémie Jeanguenin, digne successeur de Katell aux manettes du blog du BBF). Reste plus qu'à mettre ladite vidéo sur YouTube histoire d'aller au bout de l'opération de communication et de viraliser un peu le machin ;-)

Le web en son reflet motorisé : Google invente le monopolien.

Le 11 Avril 2008 sur son blog Webmaster Central, Google annonçait qu'il allait désormais se donner les moyens d'indexer certaines données disponibles "derrière" un formulaire, faisant ainsi reculer encore un peu le périmètre du web invisible. Comme je l'avais souligné au moment de cette annonce, un certain nombre de paramètres restaient encore dans le flou (quels formulaires ? sur quels sites ? comment ?). Six mois plus tard, sur le même blog, Google vient d'annoncer sa solution partielle au problème : cela s'appelle le First Click Free. Et comme souvent avec Google, c'est une très bonne idée, une idée par ailleurs très simple ... mais une idée que lui seul est en mesure de proposer et d'implémenter de manière significative du fait de sa situation quasi-monopolistique, une idée qui met également en péril une certaine conception du Net. Mais revenons au First Click Free.
De quoi s'agit-il ?
Les webmasters proposant du contenu protégé (par exemple sur le modèle payant par abonnement, comme les grands quotidiens de presse), auront la possibilité d'ouvrir leurs pages "privées" au crawler du moteur. Résultat ? Ce contenu sera indexé par Google, et l'internaute qui arrivera sur cette page depuis Google, y aura accès. Et oui. L'internaute qui arrivera sur cette page depuis Google. Pas "depuis un autre moteur". Google offre comme garantie que l'internaute qui souhaitera consulter les pages liées au contenu ainsi "dé-protégé" ne pourra pas le faire. C'est donc la technique bien connue des marchands d'aspirateurs du siècle dernier qui est retenue : celle du pied dans la porte. Le problème, c'est que ladite fonctionnalité instaure de facto un web à deux vitesses, qui semble contraire au principe que Google se fait par ailleurs fort de défendre, celui de la neutralité du Net en tant que réseau, en tant qu'infrastructure. Pour bien comprendre et sans faire trop long sur le sujet, rappelons que derrière la problématique de la neutralité du Net, la question est de savoir si les fournisseurs d'accès ont ou non la possibilité d'élargir ou de restreindre "sur mesure" la bande passante dédiée à certains sites. Naturellement, dans le cas des First Click Free, Google ne se positionne pas sur le créneau de l'infrastructure (ce qui lui permet de continuer à "militer" pour le maintien d'une neutralité du net), mais sur celui (c'est son métier) des contenus.
Alors en quoi est-ce contraire au principe de neutralité du Net ?
Et bien jusqu'ici, les moteurs se différenciaient par deux points : leur algorithmie, et leur infrastructure technologique leur permettant d'indexer le plus grand volume possible d'informations disponibles et de mettre à jour leur base d'index. Pour le dire différemment, si certains contenus étaient disponibles sur certains moteurs et pas sur d'autres, ce n'était en rien dû au fait que les éditeurs de ces contenus avaient ou non passé un "contrat d'indexation" avec tel ou tel moteur, mais simplement au fait que les routines d'indexation de tel moteur étaient plus efficaces que celles de tel autre. Avec First Click Free, la donne est radicalement changée. Pour la première fois à l'échelle du Net, des éditeurs vont pouvoir contractualiser l'accès à des parties payantes de leur site, avec un seul acteur au détriment des autres.
Tempête dans un verre d'eau ?
Pas vraiment. On savait déjà que les moteurs aimaient bien tisser des liens d'affection, soit avec des services dépendant directement de leur propre écosystème (ex : les vidéos de YouTube et les blogs de Blogger sont légèrement surpondérés dans les résultats de Google), soit avec des services tiers desservant prioritairement leur propre modèle économique (Ebay, Amazon ...). On savait également que les mêmes moteurs prospéraient sur des liens d'affiliation (offre Google Adsense).
Après les liens d'affiliation et d'affection, voici venue le temps des monopoliens.
Ce qui est explicitement proposé aux webmasters (pardon d'insister un peu lourdement), c'est l'indexation exclusive de certains contenus. Jusqu'ici, l'ouverture d'un contenu à un moteur, signifiait également l'ouverture de ce même contenu à tous les autres acteurs de la recherche d'information.
Quelle est la cible ?
Poser la question des (monopo)liens, c'est nécessairement poser la question de la cible d'un tel service. Pas besoin en l'occurence d'aller chercher bien loin. Si certains sites de particuliers ou certains portails d'entreprises peuvent être intéressés par cette visibilité accrue sur des contenus jusqu'ici inaccessibles, c'est (à mon avis) très clairement la presse en ligne qui est visée. Souvenez-vous en la matière de la complexité de l'indexation des contenus de la presse par Google (service Google News). Après les procès intentés par les sites de presse dans différents pays, après les accords passés avec certaines agences, Google ne se contente plus de son pourtant déjà très remarquable coup du chapeau. Prenons la question du côté d'un site de presse généraliste national ; les données sont les suivantes : je veux que mon contenu (y compris une partie de mon contenu payant) soit indexé et visible sur les moteurs de recherche. Je veux cela parce que je n'ai pas le choix et que je ne peux pas me passer du traffic généré par les moteurs. J'avais donc jusqu'ici le choix entre "garder mes contenus fermés à l'indexation" (et donc me priver du traffic qu'ils auraient pu générer), ou "donner mes contenus ouverts" (et là aussi me priver du traffic généré puisque les internautes consulteront lesdits contenus sur Google News plutôt que sur mon propre site). Avec les monopoliens, j'aurai désormais la possibilité d'amener du traffic vers mon site, en contrôlant la visibilité de mes contenus, sans risquer de voir mon audience sur lesdits contenus "déportée" vers les moteurs de recherche et leurs services d'agrégation d'actualités. Cette proposition de Google va donc probablement ravir ou à tout le moins donner du grain à moudre à ceux qui planchent en ce moment sur l'avenir de la presse.
Monopoliens sous conditions.
Si vous n'êtes pas encore convaincus que c'est bien la presse en ligne qui est directement visée, les conditions (Guidelines) fixées par Google (bé oui, en plus il fixe des conditions) devraient achever de vous convaincre. Pour ceux qui choisiront de mettre en oeuvre ces monopoliens, il faudra : (1) "que les internautes qui arriveront sur ces pages puissent voir le texte intégral du contenu", (2) "que le contenu affiché soit identique à celui offert à l'indexation du GoogleBot", (3) "que si la source liée est un article affiché sur plusieurs pages" (ce que font fréquemment tous les sites de presse) "il soit possible de consulter l'intégralité de l'article en une seule page sans qu'on lui demande (à l'usager) de s'enregistrer ou de payer".
Un nouveau contrat de dupe ?
Concrètement, en autorisant ainsi Google à indexer certaines données "privées / payantes" de leurs sites, et même si Google donne comme garantie que les usagers ne pourront pas aller au-delà du contenu ainsi autorisé, rien n'est en revanche garanti sur le comportement du GoogleBot ... à partir du moment où celui-ci disposera du mode d'accès à l'ensemble des contenus payants du site, il y a de fortes chances pour qu'il ne se prive pas de les indexer à des fins que pour l'instant lui seul connaît (même s'il est naturellement toujours possible de "re"-sécuriser des contenus mais vu le volume et l'architecture des grands sites de presse, il y a de grandes chances pour qu'un certain nombre de pages "fuitent" ainsi vers le moteur, et étant entendu que ce qui intéresse Google ce sont précisément ces contenus d'actualité qui lui restaient partiellement fermés).
Et donc ?
Et donc là encore, comme il le fit déjà avec GoogleBooks pour la partie concernant les ouvrages encore sous droits, Google avance, Google fait sans cesse reculer les frontières de l'indexation, Google alimente son coeur de métier sur des logiques tenant à proprement parler de la dévoration. Ceci doit d'autant plus nous interpeller qu'à mon avis (côté obscur de la force) nous n'avons jamais été aussi près de voir émerger demain un authentique GoogleNet se substituant au réseau Internet tel que nous le connaissons aujourd'hui, et que (côté optimiste de la force) d'autres sont en passe de montrer qu'il est possible d'être à la fois visionnaire et tout aussi "malin" que le Cronos du Net.

(Via Google Blogoscoped // Temps de rédaction de ce billet :1h30)

La crise, l'éléphant, les bibliothèques et Google ...

Cela n'aura pas échappé à votre perspicacité : c'est la crise. Côté silicon vallée, itou. Côté brontosaures de l'infor(mation)(matique) : pareil. Et maintenant, fermez les yeux et imaginez ... Imaginez que certaines sociétés (Google par exemple) soient, crise oblige, obligées de se recentrer sur un coeur d'activités lucratives et de délaisser les activités sans profit immédiat. Pire. Imaginez l'inimaginable. Imaginez la faillite de Google. Ouvrez les yeux et réfléchissez : qu'adviendrait-t-il de l'énorme volume d'ouvrages publics numérisés par Google ? Certes, chaque bibliothèque disposerait encore de la copie numérique qui lui est contractuellement remise par ledit Google. Mais le temps de fédérer l'ensemble de ces ressources, de les porter en ligne derrière une interface interrogeable unique, ce temps serait considérable. Ce temps serait autant de temps perdu.
Et c'est ici qu'intervient le Hathi Trust, un "entrepôt numérique partagé" à l'initiative d'un consortium universitaire composé comme suit : University of Chicago, University of Illinois, Indiana University, University of Iowa, University of Michigan, Michigan State University, University of Minnesota, Northwestern University, Ohio State University, Penn State University, Purdue University, University of Wisconsin-Madison, University of California system. Trois de ces universités sont les leaders du projet : Michigan, Indiana, Californie.
L'ambition du projet ? Tout simplement considérable : il s'agit de rassembler les ouvrages mais également les journaux numérisés dans les bibliothèques, sur la base initiale du "corpus" Google mais en envisageant des extensions, y compris auprès d'éditeurs pour des fonds encore sous droits. Il s'agit encore de fournir une solution sécurisée de stockage, de préservation et d'accès à long-terme. Il s'agit enfin d'étendre ce processus aux entrepôts institutionnels des unviersités, à condition que la phase initiale du projet soit couronnée de succès. Bref, en un mot, un portail universel de bibliothèque. Et pas un nouveau Worldcat puisque c'est cette fois-ci bel et bien le texte intégral qui est visé et non les "seules" données bibliographiques.
A l'heure actuelle, les compteurs de la numérisation du HathiTrust annoncent les chiffres suivants :

  • 2,091,060 ouvrages  
  • 731,871,000 pages  
  • 78 terabits de données
  • 40,23 kilomètres  
  • 1,699 tonnes  
  • 332,048 volumes (~16% de l'ensemble) dans le domaine public

Ces chiffres prendraient "seulement" en compte les collections numériques de l'university du Michigan et de celle du Wisconsin, "both leaders in mass digitization efforts."
Bon d'accord c'est bien beau, mais et les autres projets de bibliothèque numérique comme l'Open Content Alliance ?
Le HathiTrust annonce que certains de ses "partenaires" sont également impliqués dans l'Open Content Alliance. Et qu'à terme, ils envisagent "d'inclure" l'OCA dans leur portail.
Bon d'accord c'est bien joli, mais, crise oblige, c'est quoi le modèle économique ?
Les partenaires apporteront une cotisation initiale calculée sur le nombre de volumes fournis, plus une cotisation annuelle pour l'entretien desdits exemplaires numériques. Le HathiTrust étant "une extension à visée non-lucrative des bibliothèques qui l'ont fondé", il espère par ailleurs que le partage des infrastructures et des stratégies de numérisation permettra d'atténuer rapidement les coûts spécifiques.
OK. Mais admettons que je veuille bénéficier de l'infrastructure HathiTrust sans nécessairement mettre en accès libre sur Internet certains de mes fonds numérisés ?
Pas de problème. Le HathiTrust mentionne la possibilité technique de mettre en place une "archive noire" (dark archive), même si ce n'est pas la voie qu'il recommande.
Bon ben ça y est, vous m'avez convaincu. Où est-ce que je peux tester cette formidable interface ?
Ah oui mais là euh comment dire, ben en fait ... nulle part. Pour l'instant. Ce qui n'empêche pas les objectifs fonctionnels d'être décrits à court, moyen et long-terme : il y aura un tourne-page, il y aura des watermarks partout (celui de l'institution d'origine, celui de l'agent numérisateur ...), il y aura des API pour adapter le bouzin aux besoins de chaque bibliothèque, il y aura du Shibboleth pour permettre aux publics handicapés d'être reconnus et de bénéficier d'un accès adapté, et ... et ... et ... et il y aura une interface publique. Ce sera une "bétâ" et elle devrait être disponible "début 2009". A moyen terme, chacun (chaque usager ou chaque institution ?) pourra créer ses propres collections. 
Là où le HathiTrust marque incontestablement des points, c'est du côté de la gestion des données bibliographiques (l'envers de la médaille numérique, trop peu mise en avant par Google). Et là c'est du lourd. Une partie des données est déjà là. Le lien avec L'OCLC (Worldcat donc) est déjà négocié, et ce dernier pourra ainsi rapidement référencer les collections du HathiTrust.   

Un petit résumé ?
Un groupement de bibliothèques importantes se regroupent au sein d'un consortium qui est aussi une agence de moyens, sur fonds propres, mais sans s'interdire de faire appel à diverses fondations. L'urgence (et la motivation) pour ce consortium, c'est de partager ses infrastructures, ses documents et ses stratégies pour élaborer un "plan B" face au projet Google. A long terme, il s'agit tout simplement de construire un portail unifié mondial (américain ?) de ressources numériques en bibliothèques : ouvrages libres de droits, rétro-numérisation presse, dépôts insitutionnels, mais là aussi sans s'interdire d'y intégrer une offre sous droits, négociée avec les éditeurs. Il s'agit de faire collection.
Une petite analyse ?
Difficile à ce stade du projet. Ce qui est sûr, c'est qu'aujourd'hui, toute alternative est bonne à prendre. Ce qui est sûr également c'est que toute alternative doit pour pouvoir être crédible, disposer d'une puissance de feu numérique suffisante. C'est le cas les bibliothèques membres du HathiTrust (le choix de l'éléphant comme logo n'est pas neutre). Pouvoir également disposer d'une stratégie et d'un modèle économique clair. Cela semble être également le cas. Le HathiTrust part gagnant sur au moins deux terrains déterminants :

  • par rapport à l'OCLC (worldcat) il mise sur les contenus mais sans que cela se fasse au détriment des métadonnées.
  • par rapport à l'OCA, les bibliothèques restent "entre pairs" : le partage et la mutualisation de ressources en seront probablement facilitées.

Donc ?
Donc satisfaction sans réserve, ne serait-ce que pour l'expression à haute, intelligible et audible voix de l'impérieuse nécessité d'une alternative au projet Google Books. Satisfaction que les bibliothèques reprennent en main de manière concertée et conforme à leurs missions, le chantier de la numérisation de masse, afin de sortir de l'ornière prévisible vers laquelle nous amène le même Google. Satisfaction toujours pour l'aspect "malin" du projet qui retourne les clauses les plus discutables des contrats Google en faveur des bibliothèques (en gros : vous aurez votre exemplaire numérique mais apauvri, et de toute façon vous pourrez pas l'exploiter car vous n'avez pas l'infrastructure suffisante à large échelle). Satisfaction enfin et peut-être surtout, parce qu'en observant ce qui se passe du côté-ci de l'atlantique avec Gallica2 (intégration presse et ouvrages sous droits), il y a ENFIN là un formidable terreau de convergence. Ne reste plus qu'à se mettre au labour.

(Via Urfist Info // Temps de rédaction de ce billet : 2h00)

Google Books : un appétit de Lyon.

Impossible de faire l'impasse sur cette nouvelle d'importance. Et c'eût été dommage de la noyer dans le fatras des petits billets de rentrée ... donc ...
Cela fait déjà longtemps qu'on en parlait, c'est désormais chose faite. Le dernier petit village gaulois résistant encore et toujours au grand numérisateur d'outre-atlantique ... ne résiste plus. Google numérisera le fonds des 500 000 ouvrages de la BM de Lyon. Cela devrait lui prendre 10 ans. Voici quelques billets incontournables pour comprendre les enjeux de ce nouveau contrat : Alain Pierrot et BiblioFrance. Je rappelle simplement qu'avec le retrait de Microsoft du marché de la numérisation d'ouvrages libres de droits (arrêt du programme Live Book Search) confortant la situation de monopole de Google (exception faite de l'OCA qui n'a cependant pas les mêmes finances et donc le même rythme de croisière ni la même force de frappe), et avec les temps de disette culturelle qui se confirment chaque jour davantage, la question d'une alternative publique "crédible" ne méritera bientôt - hélas - même plus d'être posée. Faute de grives ... on pourra toujours s'occuper en relisant divers guides de bonnes pratiques pour une numérisation réussie ...

Sur ce sujet, prenez également le temps de lire la réaction en forme de coup de gueule de Jean-Claude Guédon, postée sur Biblio-fr, dont je reproduis ici un (large) extrait et que je partage entièrement (cf mes nombreuses alertes à propos du risque d'un eugénisme documentaire):

  • " (...) La numérisation à la Google est un piège. En effet, le document numérisé demeure la propriété de Google et la bibliothèque impliquée doit empêcher tout autre moteur de recherche autre que Google d'indexer sa collection numérisée. En d'autres mots, Lyon pourra consulter la version indexée en interne, et ne pourra exposer au reste du monde que du "papier numérique" (pages images). Il est vrai que nous aurons ainsi accès à des milliers de livres rares, mais ces ouvrages ne seront disponibles que sous la forme de pages-images que l'on ne pourra que lire. Toute recherche plein texte devra s'effectuer par le truchement du site de Google. Toute autre opération sur le texte sera impossible, sauf à refaire le travail de reconnaissance des caractères. Bref, le "cadeau" de Google, c'est un document numérique aussi proche du papier que possible. (...) Ce que Google recherche actuellement, c'est un monopole sur la capacité d'appliquer toute forme d'algorithmique à la documentation numérique mondiale. En bref, Google veut devenir le système d'exploitation de la documentation numérique et pourra ainsi contrôler toutes les opérations de récupération, identification, analyses sémantiques, etc. que l'on peut effectuer ou imaginer dans le monde numérique. Il y va de la mémoire collective de tous les peuples; il y va aussi de l'accès à l'information (et sa manipulation), etc. Bref, il y va de conséquences fondamentales pour la culture et la vie politique mondiale. Bravo, Lyon ! Vous voilà complice d'un magnifique holdup culturel !
    Une alternative beaucoup plus intéressante aurait été L'Open Content Alliance. C'est un peu moins efficace, un peu plus coûteux, et un peu plus lent, mais c'est entièrement libre. Malheureusement, le mirage d'une numérisation de masse rapide et gratuite conduit à ignorer ou négliger les côtés plus subtils du cadeau empoisonné de Google. Google a su produire une offre qui détient un réel pouvoir de fascination pour certains bibliothécaires. C'est regrettable, mais cela révèle aussi les limites de certains bibliothécaires, ceux qui jouent avec Google (comme l'on joue avec le feu) : ce sont de parfait spécialistes des incunables numériques et ils observent l'avenir dans leur rétroviseur (pour
    reprendre une formule bien connue de Marshall McLuhan).

    *Jean-Claude Guédon*
    *Université de Montréal*

Je ne croie pas en revanche (je n'ai jamais cru), comme l'analyse Jean-Michel, que le livre soit une danseuse pour Google, une maîtresse que l'on (qu'il) entretient à fonds perdus. Et ce pour plusieurs raisons que je vais brièvement résumer :

  • Primo, rien dans les pratiques de Google (corporate management) ne laisse place à la notion de "danseuse". Les fameux 20% de temps octroyés aux employés pour qu'ils travaillent sur des projets à eux n'ont de sens que dans la mesure où ils permettent de faire émerger des projets et des applications rentables pour la firme (Gmail, GoogleMaps ...).
  • Deuxio, en accord avec les arguments de Jean-Michel (mettre en place une barrière d'entrée suffisamment haute sur le marché de la numérisation de masse, s'attirer les faveurs d'une partie des intellectuels), le service GoogleBooks tient également une place de choix dans l'écosystème algorithmique de la firme : la base de connaissance ainsi constituée n'est probablement pas étrangère aux remarquables capacités de traduction automatique du même Google.
  • Tertio, même si, comme le note encore Jean-Michel, l'arrivée de Google sur ce marché "n'a pas modifié l'économie du livre, ni celle des bibliothèques", elle a en revanche considérablement fait bouger les lignes. Elle a contraint l'ensemble des acteurs de la chaîne du livre (des éditeurs aux auteurs en passant par les libraires et les bibliothèques) à se (re-)positionner. Davantage encore, elle a pris une place à l'horizon du débat sur la numérisation de masse au regard de laquelle chacun doit placer ses pions et redéfinir ses stratégies dans un mouvement de jeu initié là encore par le même Google et son service GoogleBooks. L'impact sur l'économie du livre et des bibliothèques pourrait dès lors être tout à fait retentissant lorsque le marché de la lecture électronique (liseuses notamment) prendra son véritable essor.

Je pourrai lister d'autres arguments mais ce serait un peu long pour un billet de rentrée, donc je résume : une danseuse qui s'inscrit dans une stratégie globale de management, un danseuse dont les effets d'optimisation sur des services tiers sont certainement importants (d'aussi loin en tout cas que l'on puisse en juger), une danseuse qui modifie les postures et les stratégies d'un ensemble d'autres acteurs, d'individus et de corporations ... ne me semble pas vraiment correspondre à la définition d'une danseuse ;-)

Dans un monde ou la circulation, le flux, prennent chaque jour davantage le pas sur l'inscrit, sur le fixe, le service GoogleBooks, plutôt qu'un danseuse, pourrait rapidement s'avérer être une pièce maîtresse dans le jeu du contrôle de l'accès aux contenus et du formattage des pratiques afférentes.

Et puis encore ... Repérés par Alain Pierrot, ces 3 articles du dernier congrès de l'IFLA dont celui consacré à l'accord de la bibliothèque de Bavière avec Google (.pdf) a retenu mon attention. Il n'offre aucun scoop mais livre une foule de détails intéressants, dont celui-ci :

  • "la coopération entre Google et la BSB implique que, pour la première fois dans l'histoire des bibliothèques allemandes, un projet de numérisation à l'échelle industrielle soit planifié techniquement et logistiquement. Une "sélection" d'ouvrages est faite uniquement en fonction de leur état - et donc la capacité de ceux-ci à être scannés dans une perspective de conservation, et selon certaines exigences de taille et de volumes dues à la technologie de numérisation propriété de Google. (...) Il faut souligner dans ce contexte que le critère "conservation", sous-jacent à la décision de déclarer un ouvrage en état satisfaisant pour être numérisé ou non, a été décidé conjointement par la BSB et Google. En cas de doute, le verdict final est toujours rendu par la bibliothèque. (...) Les normes de qualité fixées en accord avec Google comprennent également une marge de manoeuvre, comme il est d'usage dans ce genre de projets financés par des fonds privés. La BSB a eu la chance de ne pas appartenir aux membres fondateurs de ce projet, lancé par Google en 2004, mais aux membres "tardifs", qui profitent aujourd'hui des ajustements technologiques continuellement apportés par Google."

C'est la rentrée ...

Allez, hop hop hop, au boulot. Fini de lézarder. D'autant qu'il s'est passé plein de choses en deux mois ...

Côté encyclopédies :

  • la série rafraîchissante d'Ecrans sur "Inside Wikipedia". Episode 1 : Wikilove. Episode 2 : Wikipompiers. L'intégralité de la série à lire ici.
  • A ne pas manquer, le regard d'Hervé (Le Crosnier) sur l'édition papier de la Wikipedia par Bertelsman et la rémunération de ses ... 90 000 auteurs ...
  • Et puis bien sûr, lancement par Google de son projet encyclopédique baptisé Knol. Gardez patience, le prochain billet y sera entièrement consacré ;-)

Côté Moteurs (enfin ... surtout côté Google ...) :

  • A ne pas manquer : un article de Chris Anderson dans Wired sur l'âge du Petabyte et son héraut (Google). Article court, brillant et relativement impossible à résumer puisqu'il montre en une seule page quels sont les liens entre les théories scientifiques, la fin des théories scientifiques, le moteur de recherche Google, la puissance calculatoire, les avancées de la génomique, l'informatique distribuée, la nouvelle "science des données" et quelques autres trucs encore. Allez, filez le lire et vous comprendrez certainement un peu mieux la manière dont chacun d'entre nous est relié à la machine. 
  • un débat chez Google France sur l'économie numérique avec une conclusion d'Eric Besson. A écouter notamment vers la 67ème minute le point de vue des intervenants (entreprise) sur un aspect du débat autour de la net neutrality (taxation des recettes publicitaires sur internet). J'ai simplement retenu que pour Eric Besson, le fait d'envisager de "prioriser par exemple des données relatives à la télésanté" n'est pas nécessairement une atteinte au principe de neutralité du net. Pour les autres aspects - cruciaux - de la Net Neutrality, voir par exemple ce billet de Martin Lessard : "étrangler le Net".
  • Alors que Google croyait en avoir définitivement fini avec le Google Bombing, voilà-t-y-pas que le Google Bombing ressurgit dans l'outil Google Trends.
  • Pour ceux qui s'en inquiéteraient, Google se porte - toujours - financièrement très bien : chiffres complets ici et résumé sur Zorgloob. Côté "part de trafic", ça va aussi.
  • Un très bon dossier documentaire réalisé par 3 étudiants du cycle supérieur de l'INTD : "Les rapports de Google avec la justice" (.pdf). La première partie du dossier est une recension des procès et actions en justice contre Google, la seconde se focalise davantage sur l'exploitation des données personnelles. Très utile pour avoir une vision "fine" d'un justiciable pas comme les autres.
  • Dans la série "publicisons, publicisons, il en restera toujours quelques chose", LiveSearch (Microsoft) s'installe dans la motorisation de Facebook. (Rappelons pour mémoire que Google motorise - et constitue la régie publicitaire de - MySpace). Voir aussi pourquoi Jérôme Charron s'en félicite.
  • Pour les Googlophiles anglophobes, découverte de Goopilation, un blog qui traduit en français les billets de l'ensemble des blogs officiels de Google.
  • Et puis, et puis ... en septembre 2005, Google faisait disparaître de sa page d'accueil la mention du nombre de pages indexées, laissant les compteurs de notre imaginaire collectif baguenauder librement. Dans un billet en date du 25 Juillet, sur son blog officiel, Google annonce que son crawler a franchi une étape ("a milestone") : 1000 milliards d'adresses uniques détectées, ce qui, comme le rappelle Jean Véronis n'est pas la même chose que le nombre de pages indexées, mais qui est "déjà très impressionnant". Au-delà de son effet subliminal dans l'inconscient collectif (= "c'est Google qui a la plus grosse" ... base d'index), cette annonce révèle ce qui est l'un des tournants marquants dans l'histoire des moteurs de recherche : la principale difficulté, le principal objectif, n'est plus la capacité à atteindre un grand nombre de données (et à les réactualiser en temps réel), mais bel et bien la capacité à faire le tri entre le bon grain et l'ivraie, entre ce qui doit être indexé et ce qui ne doit pas l'être. Soit un retour à la raison d'être et aux fondements de leur algorithmie.
  • En parlant d'algorithmie justement, du côté de Yahoo! on semble s'intéresser de près à la mode des moteurs à la carte. Mais si souvenez-vous, ces moteurs "construits par l'internaute" et faisant de chacun de nous un autarcithécaire en puissance. Yahoo! a donc lancé le service BOSS (Build Your Own Search Service). Pour ne pas répéter ce que d'autres ont très bien décrit, allez lire le billet de Jérôme Charron sur le sujet. La stratégie de Yahoo! paraît claire : étant donné que le monde compte nombre d'excellents développeurs plein de bonnes idées, et étant donné qu'actuellement aucun d'entre eux ne peut bénéficier d'un équivalent de la base d'index de l'un des grands moteurs majeurs, il s'agit donc de leur offrir un accès à cette base, de les laisser bidouiller en postulant qu'il y aura probablement dans le lot une bonne ou une très bonne idée dont on pourra alors librement s'inspirer. Et dans le cas contraire, pendant qu'ils font joujou chez Yahoo!, ils ne vont pas monter de projet concurrent ;-).
  • La dérive des continents documentaires (voir ici) se poursuit, avec cette dernière étape clé de la synchronisation de nos moments connectés / non-connectés : après GoogleDocs et GoogleReader, c'est GMail et GoogleCalendar qui devraient être accessibles via GoogleGears. Rappelons, pour tenter de clarifier la "stratégie" de Google en la matière, que la synchronisation de ces applications est l'un de piliers incontournables du "webtop" ou du "WebOS", webtop dont on reparlera plus bas dans ce billet de rentrée.
  • L'une des dernières études du PewInternet nous apprend que si en 2002 seulement un tiers des internautes utilisaient un moteur de recherche pendant leur journée connectée, ils sont maintenant la moitié à le faire (49%). Les autres "habitudes" sont (de la plus à la moins fréquente) : l'e-mail, la recherche en ligne, la consultation d'actualités ("checking news"), et la consultation de la météo.

Côté Moteurs, outils ET bibliothèques :

  • Je vous l'avais annoncé avant les vacances, la bibliothèque municipale de Toulouse est désormais sur FlickR. Pour les détails et les motivations de cette (remarquable) opération, voir le message posté sur biblio-fr. Une Flickerisation des bibliothèques qui fait flores (6 à ce jour) comme en témoigne cette nouvelle initiative lue chez André Gunthert : "la George Eastman House est le premier grand musée de photographie à mettre en ligne en libre accès dans la section des Commons de Flickr plusieurs extraits de ses collections." Sans oublier, comme le rappelle Patrick Peccatte en commentaire du billet d'André, "les institutions présentes sur Flickr qui présentent des fonds intéressants mais pas sous le régime des Commons, comme la Biblioteca de Arte-Fundação Calouste Gulbenkian." Je croie qu'il y a là l'amorce d'un mouvement de fond (et de fonds ;-), dont l'impact à moyen terme pourrait être assez semblable à celui des projets de numérisation (Google Books).
  • et puis bien sûr, l'annonce de la numérisation de la BM de Lyon par ... Google. Là encore, un peu de patience, c'est le sujet d'un prochain billet.

Côté bibliothèques ...

  • Le discours de Barak Obama : sources, références et larges extraits à lire chez Jean-Michel Salaun.
  • Côté bibliothèques ET revues : Valérie Pécresse (ministre enseignement supérieur) et son copain Bruno Racine (BnF) avaient bien caché leur jeu. Le ministère de l'enseignement supérieur vient d'annoncer le déblocage de 10 millions d'euros pur la création d'une archive pour les revues de recherche françaises. L’objectif de cette archive est de conserver sur le long terme les revues scientifiques qui ont un faible usage. Cette archive sera sous la responsabilité de la BnF qui assurera également l’accès aux articles, sur support papier ou électronique, par son service de fourniture de documents. Ah ben non désolé. Fausse alerte. C'est pas en France. C'est au Royaume-Uni. A mettre en balance avec l'approche et l'existant hexagonal.
  • Et puis les diaporamas du dernier congrès de l'ABF (blog du congrès) sont regroupés en ligne sur le site de l'ABF.

Côté livre/document/lecture numérique :

  • André Gunthert nous livre une belle analyse d'un beau concept : la lecture exportable (ou les affres d'un copyright en bout de course). De mon côté je prolongerai bien l'analyse d'André en indiquant que ce qu'il décrit à juste titre comme une lecture exportable est en fait la réalisation concrète la plus proche de l'idée originale de transclusion (chez Ted Nelson - père fondateur de l'hypertexte - la transclusion désigne des contenus non plus "inclus" mais situés simultanément à divers endroits, sans altérer pour autant leur localisation originale ... pour plus d'infos voir sous le lien précédent).
  • L'iPhone devient liseuse : Virginie Clayssen rappelle à quel point la nouvelle pourrait être d'importance pour le décollage et la structuration d'un marché du livre électronique.
  • A lire : les enjeux du livre au format de poche, une étude de 8 pages de la DEPS, qui ne se termine pas par hasard sur "la perspective numérique", au moment où l'on parle de plus en plus d'une date limite de consommation des livres sous forme papier.
  • Et pendant que l'on réfléchit de plus en plus activement ici ou là sur l'avenir de la chaîne du livre à l'heure du numérique, le rouleau compresseur continue d'avancer : Amazon met la main sur AbeBooks (via Hervé Bienvault)

Côté biblio-scientométrie

  • la face cachée de la bibliométrie existe, et plus simplement au sens figuré. Pour organiser - selon des critères bibliométriques (taux de citation / date de parution de l'article / ... )  - les résultats issus d'une interrogation de la base Medine, imaginez que la liste desdits résultats soit ... une liste de visages dont le froncement des sourcils ou le sourire (ou l'absence de sourire) seont autant d'indicateurs vous permettant d'anayser lesdits résutlats et de mieux vous y orienter. Pas clair ? OK, une image :
    Facebib
  • le site reprend en fait la théorie des visages de Chernoff (voir ici ou pour une définition de ladite théorie) en l'adaptant aux usages scientométriques et en la faisant "tourner" sur une base d'articles scientifiques (PubMed). Gadget diront certains. Sûrement. Sûrement. Aussi sûrement que cela ouvre autant de pistes du côté d'une "humanisation" littérale des résultats de recherche. La source : ici. Pour jouer avec : .

Côté Science 2.0

Côté Web 2.0 ...

  • une petite bibliographie autour du web 2.0 mêlant articles scientifiques, thèses, ouvrages et études diverses, le tout accessible gratuitement.
  • Une jolie mise en image des différents services sociaux autour du web 2.0.
  • Je vous ai souvent parlé (en conclusion de ce billet par exemple) de l'inexorable avançée d'un mouvement d'externalisation de nos mémoires (intimes ET documentaires), lequel, conjugué à une informatique ambiante (everyware) et à une redocumentarisation du monde (internet des objets) et de l'homme (l'homme est un document comme les autres), donne littéralement corps à un hypercortex planétaire. Le résultat à court terme - 2040 -, et en termes beaucoup plus clairs (:-) est expliqué dans un édito du 16 Juillet de Wired, édito chroniqué, résumé et traduit sur InternetActu : "La machine unique pour les relier tous".
  • Prenez la plus grosse base de donnée iconographique gratuite de la planète (FlickR). Prenez ensuite l'une des toutes premières agences commerciales de diffusion de photo (Getty Images). Imaginez un accord entre les deux permettant à la seconde (Getty) de piocher à volonté dans la première (FlickR) pour en revendre le contenu en reversant 20 à 40% de la somme récoltée au photographe amateur. Et vous aurez un système gagnant-gagnant et un exemple très parlant de la manière dont les pro-am deviennent un incontournable levier de l'économie de la longue traîne.

Côté Web 2.0 et après ...

  • Après le Web 2.0, il y a naturellement le cloud computing. Hervé Le Crosnier signe un papier lumineux sur le sujet dans le Monde Diplo. Didier Durand signale un intéressant white paper d'évangélisation (technique) en provenance de chez Amazon : Cloud Architectures (.pdf)
  • Après le web 2.0, il y a aussi le webOS, soit la migration du Desktop (bureau comme interface du disque dur) vers le webtop (navigateur comme interface de nos disques durs "en ligne"). Nova Spivack rédige sur le sujet un article de référence qui récapitule les enjeux et les ambitions de cette nouvelle migratio numérique des contenus et des comportements associés : "The future of the Desktop".
  • Après le web 2.0, il y a l'explosion des contenus gourmands (en bande passante) : voir les chiffres de la dernière étude Cisco, rapportés par Eric Baillargeon. Et de manière corrélée, il y a un phénomène de "dés-appropriation" de plus en plus systématique des contenus demandés par les internautes : voir le billet de Techcrunch rapportant le régne annoncé du "tout streaming". Là encore une nouvelle étape de la dérive des continents documentaires, dans laquelle après avoir confié nos contenus à des sites externes (tout en gardant une possibilité d'archivage en-ligne), nous prenons de plus en plus l'habitude de consommer des contenus comme de simples services, sans appropriation réelle ni possibilité de conservation ou de stockage. Bref, nous faisons avec Internet ce que nous faisions hier avec la télé, avant que l'on invente les magnétoscopes. Sauf que sur Internet, c'est pas très facile de réinventer le magnétoscope, comme en témoigne les mésaventures du service (excelletissime) Wizzgo. Espérons avec Jean-Michel que "S'il y a beaucoup de mythes dans le Web 2.0, il y a aussi beaucoup de préjugés chez les médias traditionnels, à commencer par croire que l'on peut retarder l'expression d'une demande explosive."

Côté énervements récurrents :

  • la fausse bonne idée de l'université entreprise, à lire sur le site de SLR ... pendant ce temps, Valérie Pécresse distribue les médailles en chocolat comme autant de labels vides de sens (et de financements ...)
  • les vraies-fausses promesses de maître Darcos. (= Episode 1 : on va supprimer plein de postes, mais en échange on va revaloriser la grille des salaires. Episode 2 : on va supprimer plein de postes. Euh ... oui oui, on va aussi revaloriser la grille des salaires. Mais pas tout de suite hein ? Episode 3 : relire l'épisode 2)
  • "L'autonomie" (financière) souhaitée des université est vraiment - mais alors vraiment - une notion à géométrie variable.
  • et dans la série "faisons fonctionner de nouveaux trucs avec tous les défauts des anciens machins", je vous recommande la lecture de "l'ANR pour les nuls" sur le site de Sauvons la Recherche.
  • Tout cela nous rappelle que la loi LRU a 1 an. A lire sur EducPros, un rapide bilan des opérations. A remarquer : seulement 9 universités (sur 85) ont décidé de mettre en place les fameux comités de sélection en lieu et place des anciennes commissions de spécialistes. Ce manque d'engouement n'est pas nécessairement la preuve d'un désaveu du système proposé (par les comités de sélection). Simplement le résultat d'un calendrier de mise en place à la hussarde et le symptôme d'un très grand flou dans le "comment concrètement" faire tourner ces nouveaux comités de sélection. Le résultats c'est que la plupart des université, déjà très occupées à mettre leur CA aux nouvelles normes, n'ont pour le moment pas eu vraiment le temps de s'occuper de la mise en place de ces comités. C'est à la fin de cette année universitaire que l'on pourra réellement juger sur pièces, même si de mon côté, mon opinion est faite ... Et par souci d'impartialité, le bilan de la loi LRU, côté communiqué officiel :-)
  • Sans archive(s) pas de mémoire, sans mémoire pas d'Histoire. Le petit monde de l'archivistique est depuis peu en butte à de sévères bouleversements qui engagent tout un pan de notre mémoire collective. Voir ici et là.
  • Edvige et Cristina. La France en (très) bonne place pour les prochain BigBrother Awards. Voir (parmi d'autres) : Politis, Le Monde, le point de vue de Jean-Marc Manach, l'article d'EDRI avec les liens vers les parutions du JO et d'autres couvertures presse. Ils en parlent aussi : l'ADBS. Au moins, cette affaire aura donné lieu, sur France Inter, à un téléphone sonne d'anthologie :-(
  • Et toujours à l'affiche, "les cages de la république".

Côté People et Blogosphere :

  • ce dont tout le monde a parlé cet été c'est la guerre entre blogueurs et journalistes. Rappel des faits.
  • Le départ de Versac tout comme la sortie de route classement de FredCavazza sont d'ailleurs peut-être assez symptômatique d'un changement d'époque. Car outre-atlantique aussi, Francis Pisani nous apprend que Jason Calacanis himself annonce son retrait blogosphérique. Je suis de mon côté depuis longtemps convaincu que les blogs auront permis l'émergence de nouvelles formes de parole (et de prise de parole), côté scientifique notamment, et qu'ils se dirigent lentement mais surement vers une hybridation de plus en plus marquée (voir les exemples très éclairants choisis par Narvic).
  • Et puis le choc de l'été sur les blogs sciences de Wikio : André Gunthert dégringole à la troisième place et Jean Véronis fait une entrée fracassante directement à la seconde (place). De mémoire d'homme, seule Samantha Fox avait, à l'époque du Top 50, réussi une telle entrée. M'est avis qu'avec de tels challengeurs qui ne respectent même pas la pause estivale, ma première place va rapidement être remise en question. Assez bizarremement, ni Closer, ni Gala ni Voici n'ont fait leur "une" de cet événement pourtant incountournable.

Côté identité numérique :

  • A l'heure où la gestion de la réputation numérique est chaque jour plus centrale pour le simple quidam, elle revêt, pour le futur potentiel président des Etats-Unis une importance plus que vitale. On lira donc avec intérêt sur le blog VerbalKint, la stratégie mise en place par l'équipe de campagne de Barak Obama pour contrer les rumeurs en temps réel. Intéressant de noter également l'évolution qui, depuis la dernière élection présidentielle américaine, avait marqué l'avènement des blogs comme outils de lobbying, et qui se décline aujourd'hui sur le mode de la gestion de la réputation. Comme dans la "vraie vie" des "vrais gens" pour qui les blogs, après être devenu un outil d'expression central, sont aujourd'hui l'un des principaux axes de leur visibilité numérique et de ce qui s'y rattache.

Côté "ça peut toujours servir" :

Côté Agenda :

Côté lectures :

Côté visionnage :


Ce qui me frappe dans tout ça ...

Comme dans la nouvelle de Borges, "Funes ou la mémoire", le mouvement d'externalisation de nos mémoires, documentaires et intimes, nous mène droit vers une société à l'hypermnésie latente, activable. Avec Google dans le rôle de Funes, et de son côté, pas la moindre aspiration à s'enfermer dans une pièce vide pour ne plus rien "enregistrer".

Bonne rentrée à tou(te)s :-)

(Sources : sous les liens // Temps de rédaction de ce billet : 2 mois ;-)

Tectonique du livre

Ca bouge. Ca bouge même beaucoup dans le monde des livres, de l'édition, du numérique et des bibliothèques. Petite revue d'effectif (en vrac ... pas le temps d'un billet d'analyse ...) :

  • l'un des bastions de la loi Lang est en train de tomber : les livres pourraient être soldés après 6 mois et non deux ans (délai actuellement de rigueur). Tout le monde est - à juste titre - en émoi comme en atteste le communiqué conjoint du SNE, du SLF et de la SGDL (communiqué de presse du 22/05/2008)
  • j'Hachette Numilog : Hachette s'offre Numilog. Hachette se distingue déjà par une politique numérique très "offensive" et très en avance, notamment du côté des manuels scolaires, et notamment outre-atlantique. Cet achat s'inscrit donc dans une continuité qui creuse l'écart avec le reste du peloton. Voir l'interview du PDG d'Hachette Livre sur le Figaro. (repéré chez Aldus et Kotkot)
  • le SNE crée une commission numérique (communiqué de presse du 21/05/2008). Il était temps diront les mauvaises langues. Le communiqué indique : "Alors que d’autres industries culturelles ont déjà été touchées par l’arrivée du numérique, le livre fait face aux mêmes enjeux tout en ayant encore le temps de réfléchir (...)" J'aimerais en être convaincu mais ce n'est hélas pas le cas (cf les points suivants de ce billet). A noter : il s'agit - notamment - pour cette commission, de pérenniser l'offre légale d'ouvrages sous droits dans le cadre de Gallica 2. A noter aussi : "La commission Numérique est présidée par Stéphanie van Duin, directrice du développement du groupe Hachette". Lequel groupe Hachette (filiale du groupe Lagardère), vient - je vous le rappelle - de racheter Numilog, principal fournisseur de la même offre légale d'ouvrages sous droits. Je vous fais un dessin ?
  • (repéré via Alain Pierrot) Microsoft arrête le service Live Book Search (recherche d'ouvrages numérisés libres de droits, le concurrent de Google Book Search) ainsi que le service Live Academic Search (le concurrent de Google Scholar) : Communiqué de presse. Il y a en fait deux niveaux de lecture dans ce communiqué : Microsoft continuera d'indexer les ouvrages et les articles de recherche, mais dans son index standard, et non plus de manière séparée. En revanche, Microsoft arrête les frais de la numérisation. C'est très clairement le côté financier qui est mis en avant. Le communiqué indique encore : "Nous prévoyons que la meilleure manière pour un moteur de recherche de rendre accessible des ouvrages numérisés est d'indexer les entrepôts créés par les éditeurs et les bibliothèques. Grâce à nos investissements (sic), la technologie pour créer ces entrepôts est désormais disponible à moindre coût pour tous ceux qui ont un intérêt commercial ou une mission de service public dans la numérisation d'ouvrages." Mon analyse (rapide ...) est que Microsoft est coincé : d'une part par l'urgence de se positionner clairement sur le secteur du "search" en particulier et du Web en général (cf le récent feuilleton à propos du rachat de Yahoo!), ce positionnement risquant d'engager dans un avenir proche de très importants frais de trésorerie, et d'autre part, le retard du projet Live Book Search par rapport à l'offre Google Book Search est trop important pour pouvoir être comblé (avec là également quelques considérations de trésorerie à prendre en compte). Donc Microsoft arrête. Pour le reste des enjeux, voir le billet d'Alain Pierrot.
  • De son côté, non seulement Google continue de déployer son arme de numérisation massive tout en piochant avec délectation, sans retenue et avec notre consentement bénédiction éclairée dans les entrepôts numérisés existants, mais en sus, il ne manque aujourd'hui plus grand chose au tableau pour pouvoir filer jusqu'à son terme la métaphore de l'ogre dévorant ses enfants. Je m'explique : pour fonctionner en "vase-clos", c'est à dire pour centraliser au maximum les accès (lock-in syndrom) tout en externalisant au minimum ses services**, il ne manque à Google qu'une seule chose, les données catalographiques (métadonnées donc) des ouvrages déjà numérisés (par lui ou par d'autres), ou en voie de l'être (par lui ou par d'autres). Or l'OCLC (organisme derrière l'outil Worldcat) vient de passer (10 Mai 2008) un accord avec Google pour partager avec lui leurs données bibliographiques, lesquelles données sont elles-mêmes gracieusement fournies par la masse des catalogueurs anonymes (en fait c'est même un peu plus compliqué que ça puisqu'il faut parfois payer pour faire "remonter" ses notices dans l'interface de l'OCLC, mais passons ...). En échange, Google continuera de faire ce qu'il fait déjà (c'est à dire renvoyer vers les sites des bibliothèques possédant les ouvrages), mais il le fera "mieux" ... Et dans l'intervalle il jouira sans entrave du petit bijou qu'il vient ainsi de s'offrir à moindre frais : c'est à dire, ne tournons pas autour du pot, l'ensemble d'une certaine idée de la chaîne du livre, depuis la numérisation des ouvrages jusqu'à leur prescription et leur délivrance aux utilisateurs, en passant par la richesse et la souplesse que confère à cet ensemble la maîtrise de la chaîne de catalogage (= notices bibliographiques). La morale de l'histoire ne dit pas ce qu'en pensent les catalogueurs qui se trouvent ainsi "employés sans être payés" (sinon de reconnaissance symbolique) par la firme de Mountain View. Mais n'est-ce pas là in fine notre lot à tous ? (Via le Chronicle of Higher Ed)
  • Et puis aussi, on a appris la disparition de la DLL (Direction du livre et de la lecture). Et alors ? Et ben alors ... allez lire Olivier Tacheau, Dominique Lahary  et l'onctueuse extrême onction de François Bon sur le sujet).

Bon, on résume ?

  • En France, les bibliothèques s'éloignent inexorablement de l'Etat (DLL requiescat in pace), alors que dans le même temps les éditeurs multipolaires (Lagardère) s'en rapprochent (dangereusement ?).
  • Ailleurs dans le monde, l'insolente réussite de Google condamne les meilleures volontés - OCLC - (et les projets alternatifs pourtant les plus crédibles) à se féliciter d'être - pardonnez le raccourci - corvéables à merci, alors même que les rivaux les plus solides (financièrement) préfèrent botter en touche (Live Book Search).
  • En ligne de fond, la loi Lang sur le prix unique du livre est patiemment mais sûrement détricotée au seul profit des éditeurs et des grandes centrales.
  • Et au final, et ben au final je ne serai pas très prompt à me réjouir de voir ainsi les destinées du livre (numérique ou non) laissées entre les mains de deux régies publicitaires : Lagardère et Google. Tout cela "me fait penser au prestige du rince-doigts ou du baise-main. Ce n’est pas le rince-doigts qui fait les mains propres, ni le baise-main qui fait la tendresse."

** à l'inverse de toutes (ou presque) les autres organisations qui, elles, externalisent leur activité documentaire vers Google ou les grands firmes proposant une offre Saas (cf le dernier billet de Jean-Michel Salaun à propos de Cloud Computing)

Lecdi.net passe aux livres

Je vous avais déjà parlé (en bien) du site lecdi.net. Et bien celui-ci continue sur le crédo "redoutablement basique, redoutablement efficace". Il propose désormais une page Livres en ligne qui permet d'interroger simultanément plusieurs bibliothèques numériques. Comme le précise le mail reçu de Philippe Martin,
professeur documentaliste et auteur du site en question, "si l'on excepte les livres proposés avec l'accord des éditeurs par Gallica 2 et par Google, les livres ainsi accessibles sont des livres gratuits parce qu'appartenant au domaine public." GoogleBooks y est interrogé de façon à ce qu'apparaissent seulement les livres pour lesquels « l'affichage du livre entier » est permis et la même page propose également un accès rapide aux livres audio gratuits de Litterature audio.com et de LibriVox.
Je crois que j'ai trouvé un autre utilomane :-)

Google Books à la télé.

Un très bon reportage à propos de Google Books et de la bibliothèque numérique en général. C'est (toujours) en ligne sur France 24 dans l'émission "le magazine de l'intelligence économique". Avec un sus le point de vue coup de promotion (mérité) de François Bourdoncle. Beaucoup plus clair, précis et factuel que les habituels reportages des grandes chaînes sur la question, et beaucoup plus digeste que ma petite théorie de l'eugénisme documentaire ;-)

Salon du livre 2008 : Louez des livres pour une heure ...

Scoop n°1 ...
Nous sommes à quelques heures de l'ouverture du Salon du livre, un salon qui au-delà des polémiques de rigueur, devrait permettre d'avancer sur plusieurs points liés au livre, au numérique, au livre numérique ... et à leurs usages. Parmi ces points, la fameuse offre légale d'ouvrages sous droits, promise dans le cadre d'Europeana. La société Numilog (l'un des agrégateurs partie prenante de l'offre précédente), vient de lancer un dispositif de feuilletage en ligne (Numilog-reader) permettant l'accès partiel à des ouvrages sous droits avec la possibilité d'y rechercher en "plein-texte", exactement à la manière de ce que propose Google Book Search donc, mais avec en plus un système de location des ouvrages (sous droits et récents) à l'unité. Le communiqué de presse en date du 12 Mars (Téléchargement CP-Numilog.pdf) précise que :

  • "Les extraits consultables peuvent représenter, selon les éditeurs, jusqu'à 50 % de l'ouvrage."
  • "Au-delà du feuilletage gratuit, les internautes pourront consulter le livre en ligne pendant de courtes durées d'une heure ou de vingt-quatre heures. Les premiers prix pour cette location seront respectivement de 1 € de l'heure et de 2,5 € des 24 heures." Le dit service est baptisé "Books on demand".
  • "33 éditeurs ont ainsi choisi Numilog comme e-distributeur"

Seule inconnue à l'heure où j'écris ces lignes, le nombre d'ouvrages qui sera effectivement accessible.
Ce dispositif de feuilletage est d'ores et déjà disponible dans la version 2 de Gallica (voir un exemple concret ici). Toujours selon le même communiqué de presse :

  • "Les fonctionnalités de feuilletage et de location (...) seront proposées à la fois dans le cadre de Gallica 2 et sur tout le site de Numilog. Lorsque l'internaute sera un visiteur de Gallica 2, des liens lui seront proposés non seulement vers la librairie Numilog, mais également vers les sites d'autres librairies en ligne (...) afin soit d'acheter et de télécharger la version "ebook" à des formats variés (PDF, PRC) sur ces librairies partenaires, soit d'acheter la version imprimée quand elle est disponible."
  • et last but not least : "La démarche du projet Gallica 2, que partage Numilog, est en effet d'associer tous les libraires qui le souhaitent à ce nouveau canal de promotion et de vente des livres."

Au-delà des lignes d'affrontement que ne manquera pas de faire (re)naître ce communiqué, c'est, me semble-t-il, la première alternative crédible à GoogleBook Search, qui prend - enfin - en compte des usages partout avérés, ce qui n'est déjà pas si mal ... Pour autant, elle doit encore prouver qu'elle sera une alternative efficace :

  • inconnue sur le nombre de titres disponibles ou à tout le moins la "volumétrie" visée,
  • inconnue sur la "ligne éditoriale" d'une telle entreprise, même si à la lecture des noms des 33 éditeurs engagés, la littérature académique et les manuels universitaires y occuperont certainement une grande place,
  • inconnue sur l'adhésion ou le refus des libraires et des autres éditeurs,
  • efficacité également à confirmer sur l'accès aux dits ouvrages via le moteur de recherche de Gallica.

(Source : communiqué de Numilog arrivé dans ma boîte mail // Temps de rédaction de ce billet incluant quelques petits tests sur les sites mentionnés : 2 heures)

Le petit lien du week-end

Pour continuer avec notre série engagée il y a peu du "petit lien du week-end", c'est cette fois Régis Debray qui s'y colle avec cet excellent canular paru dans l'édition du Monde du 6 Mars et intitulé : "Dépoussiérer les livres".
Tous les ingrédients du parfait canular y sont réunis : sérieux du ton, rigueur de l'exposé, et surtout, suuuurtout, crédibilité de la thèse présentée. Un cas d'école donc.
J'en reprends juste pour la bonne bouche les points les plus saillants :

  • "1. Fin du dépôt légal. (...) Qu'une ordonnance de François Ier (1537) fasse encore loi à l'ère du numérique confine au grotesque. Feront désormais l'objet d'un dépôt obligatoire les seuls ouvrages qui répondent à une demande réelle du consommateur : la liste des meilleures ventes hebdomadaires de L'Express fera foi. (...)"
  • "4. Abrogation du prix imposé.  (...) la loi Lang, typiquement corporatiste et n'hésitons pas à le dire d'inspiration soviétique, punit en fait le consommateur pour complaire à une profession protégée. Prix unique, parti unique, pensée unique (...)"
  • "5. L'affaire Google. (...) Il est clair qu'un vague consortium d'établissements publics européens n'aura pas les moyens financiers de rivaliser avec le pionnier d'outre-Atlantique. Pourquoi ce dernier nous voudrait-il du mal ? L'Occident ne doit pas disperser ses forces, qu'il s'agisse de la lecture sur écran comme de la chasse au taliban. Il est temps de rallier le Google Book Search en même temps que les commandements intégrés de l'OTAN." (rappelons pour mémoire qu'on lui demande déjà plein de conseils ...)
  • "6. Mécénat d'entreprise. (...) Plus d'une serait logiquement intéressée à attacher son logo à la version numérique d'ouvrages de qualité. Dassault, à Vol de nuit. Hermès (les écharpes), au Petit Prince. Pfizer (les molécules contre l'asthme), à la Recherche du temps perdu. Ou encore l'American Express, à Paul Morand." (rappelons pour mémoire que les ouvrages du domaine public disponibles sur Google Book Search le sont avec le filigrane de la firme).

Du pur bonheur. Et un court canular qui alerte autant sur le sujet qu'une thèse académique de 400 pages. Le danger que pointe Debray est bien celui d'un pragmatisme décomplexé à courte vue, celui d'une politique culturelle littéralement aveugle, c'est à dire sans aucune "vision" à part peut-être celle, en ligne de mire, de la collecte de subsides qui lui permettront d'asseoir et de reconduire ce "manque" politique. Ou comment vendre une "politique de civilisation", en appliquant une politique du chiffre et de la statistique : les "chiffres" du nombre d'étrangers reconduits à la frontière, les "chiffres" du nombre de chômeurs en moins, les "chiffres" du nombre d'entrées d'un film, les "chiffres" de fréquentation des musées. Les chiffres. L'alpha et l'oméga d'un électroencéphalogramme politique dont la ligne varie à l'unisson de celui des marchés. Ceci n'est pas une politique.

Million books Baby

L'université du Michigan vient de fêter son millionnième livre numérisé (dans le cadre du programme Google Book Search). Elle a pour l'occasion :

C'est incontestablement un jalon historique dans la grande histoire de la numérisation, histoire pour laquelle Nicolas Morin rappelle l'argumentaire massu de Google : "Getting things done". Comme le rapelle par ailleurs Paul Courant, ce n'est là qu'une étape et il reste 9 ans pour atteindre l'objectif de 7,5 millions d'ouvrages numérisés, avec toute l'organisation bibliothéconomique que cela réclame.
Du côté de l'héxagone, on attend impatiemment le prochain salon du livre pour en (sa)voir un peu plus sur Gallica 2 qui - rappelons-le - présentera aussi bien des ouvrages libres de droits, que des ouvrages sous droits, en partenariat avec les éditeurs. Dans une récente entrevue au journal Libération, Bruno Racine revient sur ce projet dont je vous parlais déjà ici. Le même Bruno Racine donne également dans la rupture décomplexée et radicale avec son prédécesseur Jean-Noel Jeaneney : après avoir, pour ce dernier (Jean-Noel), tenté de mettre en ordre de bataille les bataillons bibliothéconomiques européens face à la déferlante de l'artillerie lourde Googléenne, le ton du premier (Bruno) se veut résolument plus pragmatique et court-termiste :

  • "Selon moi, il n’y a pas de guerre de religion dans ce domaine. (...) En ce qui me concerne, je n’ai pas l’intention de faire la leçon aux bibliothèques qui ont signé avec Google. La force du modèle américain est de savoir faire converger par moments l’intérêt privé avec l’intérêt public. Notre objectif doit être de faire converger ces programmes distincts." Y'à qu'à demander.

Dans le même entretien, Bruno Racine rappelle que la décision de la BM de Lyon pour la numérisation de 500 000 ouvrages anciens est imminente et pourrait inaugurer le premier partenariat Français avec Google Books. Là encore, mon petit doigt me dit que le Salon du Livre 2008 devrait être riche en effets d'annonces ...
Dans ce paysage agité, on notera avec attention que de plus en plus de bibliothèques étrangères, à l'image d'un pragmatisme initié par la British Library, signent parallèlement avec les deux principaux acteurs de cette course aux contenus : ainsi l'université de Columbia, après avoir signé en Décembre 2007 avec Google, vient de signer avec Microsoft dans le cadre de l'Open Content Alliance. Le communiqué ne donne pour l'instant aucun chiffre sur le nombre d'ouvrages concernés. On sait seulement qu'il s'agira d'ouvrages libres de droits et que :

  • "Microsoft will digitize selected portions of the Libraries’ great collections of American history, literature, and humanities works, with the specific areas to be decided mutually by Microsoft and Columbia during the early phase of the project."

Le point que je grasseye n'est pas anodin : ce n'est certes pas la première fois que les grands moteurs-numérisateurs s'intéressent, en tant que prestataires, aux collections qu'ils numériseront ("leur contenu, leur caractère encyclopédique et multilingue, leur état" ...). Mais si cette démarche se systématise et si elle dépasse la simple prise de renseignements techniques nécessaires à la prestation, bref si les moteurs-numérisateurs se font également désormais les agents zélés de la force bibliothéconomique présidant au choix des collections et ouvrages à numériser ... que restera-t-il aux bibliothécaires à part peut être à inventer une nouvelle forme de sérendipité bibliothéconomique, la prescription aléatoire :-(
Enfin, sur ces questions je vous renvoie à l'intéressante table-ronde sur "Les perspectives de l'édition face à la numérisation" (.pdf) du colloque "Pour une nouvelle dynamique de la chaîne du livre", organisé en Octobre 2007 par la SGDL.

Une offre légale d'ouvrages sous droits ?

On apprend dans BiblioFrance que lors du prochain salon du livre (Mars 2008), il devrait être (enfin) possible de consulter légalement des extraits numériques d'ouvrages commercialisés, soit "une offre légale d'ouvrages sous droits" pour reprendre les termes du communiqué du ministère de la culture. Cette consultation se fera dans le cadre de la mal-nommée Europeana (mal nommée car pour l'instant seule la Hongrie, le Portugal et la France y tiennent boutique), et devrait concerner (toujours selon le même communiqué) près de 9000 titres d'ouvrages récents. Ce projet "pilote" concerne :

  • 18 éditeurs :  Agone, Albin Michel, Arthème Fayard, Climats, EDP Sciences, Flammarion, Gallimard, La Découverte, Lavoisier, Magnard, Nathan, Perrin, Presses universitaires de France, Quae, Retz, Robert Laffont, Univers Poche et Salvator ;
  • et 3 agrégateurs : Cyberlibris, Editis Groupe et Numilog.

On ne peut pour l'instant :

  • que se réjouir suite à cette note d'intention et en prendre acte.
  • que s'interroger sur le reste : les ouvrages sous droits y seront-ils consultables intégralement ou sous forme d'extraits ? Comment se fera le prêt (copies chronodégradables ?) ? Quelle sera la montée en puissance et le taux de renouvellement du service ? Quelle ouverture aux autres éditeurs ? Sous quelles conditions ? A quelle échéance ? Quel financement pérenne ?  etc, etc ... (quelques infos mais essentiellement sous forme de questions ouvertes dans le document mentionné à la fin de ce billet)

Restera aussi à voir si l'ogre de Mountain View peut encore s'immiscer dans la partie (souvenez-vous ...) ... ou s'il prépare déjà sa riposte à cette contre-offensive (tardivement) annoncée ...
Et puis une dernière chose enfin : cette heureuse initiative, si elle fera le bonheur des gros poissons embarqués, risque de mettre à mal le projet (en est-ce encore un ?) d'un portail de la librairie indépendante, et de crisper les positions entre les petits (libraires, éditeurs) et les gros.

Voir aussi le billet de François Bon qui renvoie vers la très complète revue de problématiques autour du livre numérique de Denis Zwirn (PDG de Numilog) : "Etude en vue de l'élaboration d'un modèle économique de participation des éditeurs à la bibliothèque numérique européenne" (.pdf).

MareLibri : un nouvel Electre ?

Le portail de recherche MareLibri.com vous offre l'accès aux références de 20.000.000 titres en ligne, proposés par plus de 2.000 librairies. L'initiative en revient à 5 sites européens dédiés à la littérature (notamment les livres "rares" et "anciens") qui ont uni leurs forces et leurs catalogues pour proposer ce portail très très très intéressant (et gratuit). Outre l'intérêt du "volume" et de la nature des ouvrages accessibles, il faut saluer la sobriété et l'efficacité de l'interface : une recherche avancée avec tout le nécessaire (par titre, par auteur, par librairie, par thème, par ISBN), la possibilité d'afficher les résultats avec un tri "par auteur", "par pertinence" ou "par prix", et la possibilité de recevoir les résultats d'une recherche par mail ou en .pdf, ainsi que de s'y abonner via un fil RSS.
Tout y est ma bonne Dame ! Seule l'entrée par "Catalogue thématique" ne fonctionnait pas ah ben si c'est réparé, mais le site est en bêta test, donc on leur pardonne. Quand on voit tout l'intérêt de ce genre de portail, on regrette d'autant plus de n'apercevoir aucun frémissement dans le projet de portail de la librairie indépendante (à moins qu'à trop frémir et qu'à force de se disperser, il ne finisse par se dissoudre ...)
(Découvert via Brainsfeed)

La bibliothèque du congrès et FlickR : des accès desaxés

3000. C'est le nombre de photos que la bibliothèque du Congrès vient de mettre en ligne sur ... FlickR. Oui, oui. Vous avez bien lu. Sur FlickR. Après les ouvrages dans Google Books, les fonds iconographiques des bibliothèques (et non des moindres ...) sur FlickR. A méditer d'urgence.
Non, la LC (Library of Congress) n'a pas réalisé un site en flash hébergé sur ses serveurs et accessible depuis son propre site. Non elle n'a pas monté son exposition virtuelle. Elle est pourtant des quelques bibliothèques de la planète qui peuvent se permettre ce genre de fantaisie sans rencontrer de blocages financiers majeurs. Mais elle ne l'a pas fait. A la place, elle est allée mettre ses donnés, là ou sont les usagers. Ces mêmes usagers qui quand ils cherchent de l'information ... vont sur Google, qui quand ils cherchent des bouquins ... vont sur Amazon ... et qui quand il veulent voir des photos ... vont sur FlickR.
Ce que traduit cette (heureuse) initiative c'est la simple reconnaissance par le monde des bibliothèques de la logique de l'accès qui prévaut aujourd'hui pour l'ensemble des industries culturelles, dont elles - les bibliothèques - font partie (même si c'est le plus souvent à leur corps défendant).

A la question : "pourquoi la LC met-elle ses photos sur FlickR ?", la réponse de la FAQ du projet est limpide :

  • "Pour partager ces collections photographiques avec ceux qui ne visitent pas notre site"
  • "Pour mieux comprendre en quoi l'indexation sociale pour nous apporter des idées d'amélioration de nos services et de nos fonds"
  • "Pour accroître notre expérience et notre implication dans des communautés web partageant des centres d'intérêts communs avec les collections de bibliothèques."

C'est à mon avis incontestablement la bonne direction à suivre. Il faut aller chercher les usagers là où ils sont. Et si l'on peut être sûr d'une chose, c'est que les usagers ne sont pas sur les sites des bibliothèques. En tout cas certainement pas de prime abord, certainement pas de "prime accès". Mettre à disposition des fonds documentaires professionnellement construits et administrés, sur des services privés mais publiquement accessibles et massivement accédés, autoriser les publics, TOUS les publics, à indexer à leur tour ces fonds documentaires quelle que soit leur nature, laisser les publics se les approprier (l'un des objectifs du projet est de permettre aux usagers d'indexer, de tagguer ces images), c'est probablement le meilleur moyen de recréer le désir ... d'aller en bibliothèque.
De son côté le service FlickR a compris tout l'intérêt stratégique de tels partenariat, et il vient en conséquence d'ouvrir un espace "FlickR Commons", destiné précisément aux organismes publics.

Rendons-donc grâce au maître Yoda de la Force bibliothéconomique et méditons, jeunes padawans que nous sommes, son lumineux enseignement :

  • "ce qu’on a de plus intéressant ce ne sont pas nécessairement des interfaces, mais des données; et il faut aller mettre nos données là où sont les usagers, en leur permettant de se les approprier."

CQFD.

(Source : le blog de la LC & Maître Yoda Morin. Autres points de vue : Descripteurs - qui insiste sur l'aspect animation et valorisation patromoniale du projet - Ecrans)

28 ème bibliothèque pour Google Books

Depuis le 13 décembre 2007, la Columbia University est devenue la 28ème bibliothèque universitaire à entrer dans le projet Google Book Search. Le contrat liant les deux parties s'étend sur 6 ans. Seuls les ouvrages appartenant au domaine public sont concernés. Comme le rappelle la page d'information sur le site de l'université, la bibliothèque de l'université de Columbia (cette entité regroupe en fait 25 bibliothèques) est l'une des 10 bibliothèque américaines les plus importantes : 9.2 million de volumes, 65 650 périodiques et beaucoup de précieuses collections spécifiques.
Malgré quelques anecdotiques bugs, la puissance de feu de Google Book Search continue d'augmenter.

Googlepedia s'appellera "Knol", ou comment monétiser l'autorité

Le dernier billet du blog officiel de Google annonce le lancement prochain, sur invitation seulement, d'une béta version de "knol". Qu'est-ce que "knol" ? Pour mémoire, rappelons que Google, après avoir gagné la guerre de l'information en s'étant de facto positionné comme un guichet unique (dans les usages courants tout au moins) sur l'ensemble des services "informationnels" aujourd'hui disponibles, Google depuis 2004 s'est lancé dans une bataille autrement plus délicate mais également plus essentielle : la bataille de la connaissance. Sa première offensive concerna la connaissance "labellisée", "inscrite", faisant autorité et disposant d'auteurs "in nomine" : ce fut le projet GoogleBooks. Un projet qui donna chair et corps à la notion de "société de la connaissance" qui n'existait jusqu'à lors que dans les arrières cours de la commission européenne ainsi que dans les travaux de quelques scientifiques (Pierre Lévy notamment mais pas exclusivement).
La deuxième offensive est aujourd'hui lancée : "knol" (contraction de "Knowledge") se veut un service encyclopédique "à la manière de wikipédia" qui ne dit pas son nom.
Le mieux est encore de traduire la description dudit service telle qu'elle est livrée sur le blog de Google. Extraits choisis donc (et traduits) :

  • Un projet en quête d'auteurs / d'autorité
  • "Notre but est d'encourager les personnes qui connaissent bien un sujet à écrire un article de référence ("authoritative article") sur ce sujet."
  • "L'idée clé du projet est de mettre les auteurs sur le devant de la scène. (...) Nous pensons que savoir qui a écrit un article aidera de manière significative les usagers à faire un meilleur usage du web."
  • "Un "knol" sur un sujet particulier a vocation à être la première chose que doit lire quelqu'un qui cherche quelque chose à ce sujet sur le web."
  • La toute puissante infrastructure frappe encore
  • "un "knol" est juste une page web (...) Google fournira les outils faciles à utiliser de création et d'édition et hébergera gratuitement les contenus." <= ce dernier point est important pour ne pas dire crucial quand on connaît les difficultés d'hébergement auxquelles est confrontée Wikipédia.
  • Politique éditoriale : pas de politique éditoriale
  • "tous les sujets seront couverts : concepts scientifiques, information médicale, histoire, géographie, produits ("information products"), loisirs ..."
  • "Les gens pourront proposer des commentaires, des questions, des contenus additionnels. Tout le monde pourra voter pour un "knol" ou donner ses impressions. Les knols inclueront des références bibliographiques et des liens vers des informations complémentaires" => c'est ici une différence de taille avec Wikipedia puisque le contenu des articles de sera apparemment pas éditable.
  • Autorité = monnaie
  • "A bon vouloir de l'auteur, un "knol" pourra inclure de la publicité. (...) Google lui reversera alors une part substantielle de ces revenus publicitaires." L'indication de cette part "substantielle", ainsi formulée, peut laisser penser qu'elle sera supérieure à celle traditionnellement reversée via les offres publicitaires standards de Google. Ce qui là non plus n'est pas sans risque, une société commerciale se trouvant de facto en situation de rétribuer des auteurs (scientifiques ou non) sur la base de la notoriété qui sera accordée à leur(s) article(s), ce qui entraînera mécaniquement une course à l'écriture d'articles susceptibles d'être les plus lus, les plus vus, et donc les mieux rétribués. Je vais endosser une nouvelle fois ma panoplie de Cassandre, mais imaginez ce que peut donner un tel système non-régulé dans le cadre, par exemple, des publications en pharmacie ou en médecine, quand on connaît déjà les dérives de certaines publications dans ce domaine, largement sponsorisées par des grands groupes industriels et pharmaceutiques ... (l'exemple choisi par Google pour illustrer son projeet Knol n'est d'ailleurs pas innocent : il s'agit d'un article de médecine traitant de l'insomnie, rédigé par un auteur "faisant" autorité - une prof. de l'université de médecine de Stanford). Si le modèle marchand de la bibliothèque (GoogleBooks) est porteur de grands dangers (prime à l'accès, pas de roulement des fonds, aucune représentativité de l'état des connaissances à l'instant "t", etc.), le modèle marchand de l'encyclopédie - et plus globalement du cycle de validation de l'autorité - l'est tout autant, et peut-être davantage.

Conclusions ?

  • Primo, l'analogisme avec Wikipedia, ou plus précisément avec les projets dérivés en quête d'autorité (Véropédia, Citizendium) est trop frappante pour ne pas être soulignée. Avec son projet knol, Google réalise stricto sensu le projet initial de wikipedia (baptisé Nupedia) : une encyclopédie "populaire" par la couverture des sujets autorisés (= non-exclusivement scientifiques), et reposant sur des experts. C'est bien connu, les bonnes idées n'appartiennent à personne. Mais tous les obstacles ayant fait avorter le projet initial de Larry Sanger (difficulté à mobiliser des experts, difficultés de stockage et d'hébergement ...) sont d'emblée solutionnés par l'effet de la marque Google, et par ses infrastructures hors du commun.
  • Deuxio : Citizendium va avoir du mal à se faire une place au soleil dans l'ombre d'un tel géant ...
  • Tertio : ce lancement de "knol" par Google renvoie à une vision assez fine des attentes de ses utilisateurs.  On avait déjà remarqué la place très particulière et prépondérante - près de 30% des premiers résultats - qu'occupaient les liens Wikipédia dans les résultats des principaux moteurs (voir notamment ici, ici et récemment ), ce qui était en soi la meilleure confirmation possible de l'intérêt du "projet encyclopédique". En développant son propre service, Google régle en une seule fois deux problèmes : celui de l'accusation qui pouvait lui être faîte de survaloriser les liens en provenance de Wikipedia, et - surtout - celui de voir ses utilisateurs sortir de la sphère Google pour s'en retourner sur l'encyclopédie wikipédia, à peine y étaient-ils entrés (dans la sphère Google) : le public est ainsi encore plus captif qu'auparavant, et Google à tout loisir de monétiser, d'analyser et de profiler nos navigations numériques.
  • Quatrièmement : Google va même plus loin en inversant ce risque potentiel (celui de voir ses utilisateurs captifs "migrer" vers un autre service) : "Google ne demandera aucune exclusivité pour ses contenus et les rendra accessibles à tous les autres moteurs de recherche", qui seront donc gentiment invités pour accroître leur propre "pertinence" à renvoyer ... vers un service Google ...
  • Cinquièmement : c'est l'avènement d'une nouvelle forme d'encyclopédisme. Un encyclopédisme non plus savant mais "d'usage" : "L’accès aux documents n’est plus subordonné aux modes de classement et d’organisation. Ce sont les modes de classement et d’organisation qui sont inférés de l’accès au document et de l’analyse de son contenu. On parlera d’un encyclopédisme d’usage à partir du moment où ces parcours de recherche, d’accès et de consultation sont récupérés et réinjectés dans l’organisation de la bibliothèque virtuelle (Internet en est évidemment le premier exemple) pour organiser, à l’aune de ces parcours, les nouvelles données devant être
    classifiées.
    " (p.307 de ma thèse) Le danger ne vient donc pas de ce nouvel avatar du projet encyclopédique, mais de la logique marchande qui le conditionne.
  • sixièmement : le défi que s'apprête à relever Google est d'importance et nous concerne tous, bien au-delà du simple enjeu technologique qui le sous-tend : il s'agit de savoir quelle est la meilleure manière possible de croiser autorité ET notoriété, autrement dit de savoir quelle place accorder à l'autorité au sein d'un principe de classement et d'une représentation du monde reposant essentiellement sur un indice de notoriété. Cet enjeu tient en une phrase dans le billet de Google, mais il prime à mon sens sur tous les autres : "Notre boulot au département "Search Quality" sera de classer (to rank) les knols de manière appropriée quand ils apparaîtront dans les résultats de recherche". En ce domaine, la transition d'un PageRank à un modèle de type TrustRank ne sera pas aisée. Sauf à croire que le test de Turing est résolu, et qu'un "simple" agencement machinique est aujourd'hui en capacité de tracer les frontières de l'autorité dans l'accès de chacun à la connaissance.   

Il ne reste plus qu'à attendre pour voir si l'effet Google jouera à plein, et si "knol" sera le nouveau pilier d'une révélation cognitive en comptant déjà 3. En attendant, il est clair que la stratégie de Google est bien cadrée : "standing on the shoulders of giants" comme l'affirme l'incipit du service Google Books. Asseoir l'autorité de Google (et de ses services) sur la question de la mise en avant "des autorités".

Voir aussi ce qu'en disent : Didier Durand, Read/WriteWeb, Jean-Michel Salaun, Google Blogoscoped (qui insiste également sur les risques de l'impact de ce service sur la neutralité de la recherche)

<Update PUB>Télérama a bien aimé mon billet</Update>
 

Kindle Surprise

Donc voilà. Le Kindle (e-reader liseuse) d'Amazon sera lancé officiellement lundi prochain. Ce qui, à la différence du titre de ce billet, n'est pas vraiment une surprise. Le blog Engadget fut le premier à le chroniquer le 11 Septembre 2006. Un an plus tard, le marché du livre et ses circuits de distribution ont connu de sérieux bouleversements, et les usages de lecture numérique ont mûri en même temps que les technologies les accompagnant. Comme mes collèges bloggueurs ont déjà fait le boulot - et autant vous le dire tout de suite, ils sont loin d'être enthousiastes - je vais tout simplement me contenter de piller leurs billets pour vous indiquer que le Kindle :

  • sera cher : 400 $. Cette barrière à l'entrée constitue à mon sens un sérieux frein au déploiement réellement grand public de ce que Jeff Bezos n'hésite pas à désigner comme le "livre 2.0". En l'état, on en est encore au lecteur électronique à deux zéros à la fin du chèque.
  • que le Kindle permettra d'accéder d'entrée à un catalogue entre 88 000 et 90 000 ouvrages. Sur la nature desdits ouvrages (livres "utilitaires" - cuisine, bricolage - livres "fonctionnels" - manuels scolaires et universitaires - livres "tout court" ...) je n'ai en revanche rien trouvé.
  • qu'il en coûtera 9,99 $ pour télécharger un livre. Ce qui fait dire à certains qu'Amazon vient de fixer le prix maximum (unique ?) du livre électronique, comme Apple l'avait fait en son temps pour les morceaux de musique avec l'IPod.
  • qu'il utilisera une technologie d'accès pour l'instant payante (mais annoncée comme bientôt gratuite) via Whispernet, un réseau à haut débit lié à Sprint, permettant de se connecter et de télécharger directement les livres sur le site d'Amazon, sans passer nécessairement par des spots Wifi et assurant au Kindle une couverture plus large (cf plus bas)
  • que le Kindle ne permettra pas seulement d'acheter des livres, mais aussi de télécharger et de lire directement la presse (NYTimes, Le Monde, WSJournal) ainsi que différents blogs, moyennant finance. Une réintermédiation à la hussarde qui risque de déclencher quelques couinements.
  • que le Kindle est très bien positionné en terme de "service". Qu'en revanche, côté design et ergonomie, il semble dépassé avant même sa sortie, même si l'essentiel technologique est là (e-ink <Update> finalement il y aurait bien innovation de ce côté là </Update>, autonomie, capacité de stockage)
  • que le Kindle est plein de DRM et qu'il est centré sur le format Mobipocket (firme rachetée par Amazon) et qu'il ne reconnaît même pas le .pdf
  • que dixit Jeff Bezos "Les livres sont archivés sur le serveur d’Amazon; si vous les perdez vous pouvez les télécharger gratuitement." Tiens, ne serait-on pas en train de nous refaire le coup de la "location" déguisée en "acte d'achat" ...
  • que dixit le même : "Au lieu de faire des achats depuis votre PC, vous le faites depuis l’appareil. Le contenu est délivré très simplement. Nous avons décidé d’utiliser EVDO au lieu de Wi-Fi qui nécessite des Hotspots. Nous avons créé Amazon WhisperNet qui permettra d’utiliser le réseau EVDO sans aucun engagement ni paiement.Le jour où notre disque dur aura disparu se rapproche ... comme disait l'autre.
  • que le Kindle est lié à une place de marché (LE coeur d'activité d'Amazon) et que les utilisateurs du Kindle pourront gentiment envoyer leurs documents Word et le vendre directement sur ladite place de marché. Donc, ce que le Kindle révolutionne d'abord, c'est le secteur de l'édition au moins autant que celui de la diffusion (si tant est que ces deux secteurs là puissent se penser dans l'ignorance l'un de l'autre)

Donc ?

Donc comme le souligne Francis Pisani, les lignes (numériques) vont bouger et cette Kindle surprise va obliger les concurrents à se positionner très rapidement sur ce secteur, et au jeu de la concurrence, Apple et son IPod sont bien placés. Du coup, les coûts pour le consommateur devraient être revus à la baisse, mais surtout, s-u-r-t-o-u-t, loin d'être l'affrontement de deux liseuses, de deux gadgets technologiques, cela s'annonce comme l'affrontement de deux places de marché. Amazon a défini la stratégie de la sienne (devenez votre propre éditeur) avec pour le reste encore une zone de flou sur les titres qui seront disponibles au catalogue. Il faudra voir quelle sera la réponse d'Apple.

Et puis un pressentiment ... ce genre de places de marché préemptées par des géants comme Amazon pourraient tirer le meilleur parti d'une économie de la recommandation dans laquelle les certains réseaux sociaux pourraient peut-être (enfin) trouver une juste place de prescripteur.

Et puis enfin, on ne saurait mesurer toute l'ampleur de la Kindle surprise sans prendre connaissance des billets de François Bon qui n'a pas envie du livre numérique, et de Jean-Michel Salaun chez qui le livre fait de la résistance, parce que ... tout est une question de temps.
Mon avis ? Ce système de place de marché (la vraie Kindle surprise donc), en unifiant les temporalités jadis si nécessairement distinctes de la lecture, de l'écriture, de la diffusion, de l'accès, de l'achat et de la simple consultation, "incarne" au sens propre ce qu'est (peut-être) le vrai livre numérique. Un livre qui n'en est pas un. De fait, la problématique tant vantée du "livre numérique" est renvoyée à sa triste condition de simple support. En revanche la centralisation, l'unification des flux de production et de réception d'écrits numériques par le biais d'un dispositif technique (le Kindle ou un autre), voilà peut-être la bonne définition du "livre 2.0".
Le livre est une temporalité et une totalité, l'envers et l'endroit indissociables d'un dispositif et d'un contenu. Le Kindle est une clé de lecture instantannée. Une clé de lecture"s" au sens propre. Et une clé de lecture au sens figuré, c'est à dire qu'il permet de mieux entrer dans les logiques de nos lendemains numériques. Dans le Kindle, comme dans un trousseau de clés, tout est dissociable, segmentable. Et c'est précisément cela qui intéresse Amazon.

<Update de 5 minutes plus tard> Et ben voilà. J'étais super content de mon joli titre. Et paf. En relevant mon agrégateur voilà-t-y pas que Virginie Clayssen l'avait trouvé avant moi, et avec une splendide illustration en plus. </Update>

(Sources : Principalement Francis Pisani, Francis Pisani encore, LaFeuille, Techcrunch-fr et Techcrunch.com, Nicolas Morin, FredCavazza, Hervé Bienvault ainsi que les autres sources sous les liens)

Google Rififi Book Search

Google Books on le sait, ne laisse personne indifférent. Dernier épisode en date, celui opposant par voie de presse interposée, un professeur nommé Guy Laflèche (département des littératures de langue française de l'Université de Montréal) à Lise Bissonnette (Présidente-directrice générale, Bibliothèque et Archives nationales du Québec (BAnQ), l'équivalent de notre chère BnF).
Dans un premier article publié dans le journal Le Devoir, Guy Laflèche regrette que ladite BAnQ ne participe pas au projet Google Books. Je vous invite à lire cet article, non pas tant pour la nature des propos qui y sont tenus mais pour le langage fleuri du sieur Laflèche (qui traite notamment Europeana de "petit pet informatique"). La réponse, non moins fleurie de Lise Bissonnette ne se fit pas attendre. Là encore la lecture vaut le détour.
Ah la belle province ... En la matière le sieur Guy Laflèche n'en est pas à son coup d'essai. Je m'étais moi-même joyeusement emplumé avec lui sur la liste Litor (Littérature et Ordinateur), après qu'il m'ait traité de "petit nono sans intérêt" (sans savoir que j'étais abonné à la liste). Je vous restitue le message simplement pour mieux vous permettre de cerner le personnage au nom décidemment programmatique :

  • (le débat portait sur le signalement de mon billet à propos des comptes bidons de Google Books) : "Il s'agit, si je ne me trompe pas, d'un site anonyme où l'auteur, manifestement, ne sait pas de quoi il parle, ni d'ailleurs ce qu'il fait, nous décrivant ses «actions» sur Google Print en découvrant l'affaire, en grand novice.  On ne devrait jamais renvoyer à un site anonyme.  Sauf, évidemment, si l'anonymat est justifié.  Ici, il s'agit tout simplement du blogue d'un petit nono, sans aucun intérêt.  Son intervention bloguiste d'un ou deux soirs s'intitule «Les comptes bidons de Google ou la bogbliothèque universelle».  Le contenu en est navrant." Pour celles et ceux qui souhaitent se marrer 5 minutes, tous nos échanges sont archivés ici.

Mais revenons-en au débat et à la réponse de Lise Bissonnette :

  • "Le roman qu'il raconte aux lecteurs du Devoir à propos de la générosité du moteur de recherche américain mérite le prix du conte de fées. Google, dit-il sommairement, numérise gratuitement tous les livres des bibliothèques participantes et pousse la générosité jusqu'à leur permettre de mettre en ligne sur leur propre site les fichiers ainsi «scannés» (le terme anglais est de lui).
    (...) Les fichiers numérisés demeurent en effet la propriété du moteur américain, qui exige d'en devenir l'unique diffuseur commercial, d'en bloquer l'accès à d'autres moteurs de recherche et d'ériger diverses barrières à la circulation des fichiers, qui sont pourtant des biens collectifs."

Raccourci réclamé par le medium, mais qui décrit bien la réalité plus complexe connue sous le nom d'eugénisme documentaire. Voilà donc pour ceux qui sont "contre".
Du côté des bibliothèques contractantes, le discours est naturellement tout autre. Ainsi, Paul Courant, doyendes Bibliothèques de l'université du Michigan, vient d'ouvrir un blog pour défendre son engagement, et publie le 4 Novembre un billet titré "On being in bed with Google". Bien qu'invariant, l'argumentaire des pro-google mérite d'être rappelé.
Tout d'abord les coûts et l'étendue annoncée : pour l'université du Michigan, 7 millions de volumes en 6 ans, gratuitement. Ensuite ... et bien précisément ... il n'y a pas vraiment de suite. Cet argument est le seul avancé. Paul Courant se contente ensuite de rappeler (répondant en cela aux dernières critiques de Brewster Khale dans le NYTimes) qu'il n'y a pas de risque qu'une firme commerciale contrôle un jour l'ensemble de ces biens communs de l'humanité puisqu'un exemplaire est remis à la bibliothèque. Ce qui me semble un peu léger comme argument ... Il faudra attendre un second billet pour voir apparaître l'argument du classement des oeuvres dans les résultats de recherche (prime à l'accès, pas de roulement du fonds), mais ce sera pour rester sur notre faim, Paul Courant n'en sachant pas davantage que nous là-dessus. Quant à la préservation à long terme des copies numériques et leur conformité au niveau d'exigence souhaité par les bibliothèque, c'est là encore très (trop) flou.
Du coup je suis perplexe. Nulle part de ce côté-ci de l'atlantique ou de l'autre, aussi bien du côté des "pros"
que des "antis", dans aucune publication scientifique ni dans aucun média grand public (je préfère passer sous silence les dernières émissions de France Culture consacrées à la question ...), nulle part donc, sauf, de manière claire mais encore allusive, dans les propos de Lise Bissonnette, on ne retrouve les arguments pourtant rédigés noir sur blanc qui figurent dans les derniers contrats signés par Google avec des bibliothèques et qui relèvent de ce que j'ai appelé un eugénisme documentaire. Si vous avez une explication (ou si j'ai manqué la mention de ces arguments quelque part, je suis preneur :-)
Autre bibliothèque contractante, la BCU (Lausanne) nous offre sur son site, quelques éléments du calendrier de numérisation. A noter que sur le catalogue de la BCU on a rajouté un "statut" aux oeuvres qui en plus d'être "empruntées", "exclues du prêt" ou "disponibles", peuvent également désormais apparaître avec le label "googelisés".

Dans un autre genre, mais sur le même sujet, on consultera utilement l'entrevue vidéo réalisée avec Francis Pisani et portant sur l'avenir du livre. Si je devais résumer, Francis Pisani rappelle une nouvelle fois que ceci (le numérique) ne tuera pas ceux-là (les livres) mais amènera probablement à penser différemment cela (le "papier"). J'aime bien également sa citation à propos des "Newspaper" dans lesquels c'est le côté "News" et non le côté "paper" qui fait la spécificité du media. Il faut effectivement penser différemment le livre, du côté de ses usages et des modalités d'appropriation qu'il permet. Mon idée (rapidement ... pour une version plus longue, voir ici ou ) c'est que le numérique va permettre de développer des formes inédites pour les dimensions de l'accompagnement et de la génétique textuelle. On va voir exploser (et on va pouvoir explorer différemment) les dimensions du para-texte et autres péri-textes (auctoriaux, éditoriaux). Et on va également, grâce au numérique, pouvoir créer une nouvelle discipline, celle d'une génétique des usages textuels, comme il y eût avant elle une génétique textuelle s'intéressant à la génèse des oeuvres. Bref, tout cela (google books, les usages, les e-books, le nouveau marketing du livre, les flux, l'organisation de ces flux ...), tout cela ne fera que contribuer "à illuminer le livre plutôt qu'à l'éliminer". Et ça, c'est Anthony Grafton qui le dit a-d-m-i-r-a-b-l-e-m-e-n-t dans un texte magnifique et lumineux (pour les fainéants - mais ce serait dommage - un court extrait traduit est disponible chez Bibliothécaire)

Pendant ce temps, les avancées les plus significatives des bibliothèques ne semblent porter que sur l'un des éléments du catalogue. Une vision qui bien qu'importante et centrée sur leur coeur de métier, ne peut être seule à la hauteur du défi numérique à relever.

(Sources : MonMemex, BiblioFrance, François Bon, Bibliothécaire

Google books : les non-alignés

Au regard du nombre de bibliothèques sur la planète, le nombre de celles en contrat avec Google pour numériser leurs fonds est dérisoire (27 à ce jour).
Au regard de l'ampleur et de la vitesse du programme de numérisation de Google Books (qui vient de franchir la barre du million d'ouvrages), celui des bibliothèques est dérisoire à l'échelle nationale (et hélas trop peu visible et trop peu unifié à l'échelle internationale). Mais, comme le remarque justement Dominique Lahary, et comme je l'avais moi-même signalé dans un vieux billet, les initiatives, hors dudit monde des bibliothèques, sont pourtant foisonnantes.
Or cette barrière, ce front de la dérision (selon le point de vue que l'on adopte), est en train de bouger. Et c'est un article du New-York Times qui raconte le tout, selon un scenario déjà connu des lecteurs d'Affordance (ou d'autres blogs s'intéressant à la question). Les copies des livres numérisés (gratuitement) par Google et remises aux bibliothèques doivent, par contrat, rester inaccessibles à toute autre indexation externe. Facteur aggravant d'un eugénisme documentaire avoué. Il s'agit donc de se positionner. D'autant que d'autres stratégies sont possibles, notamment via l'Open Content Alliance, avec laquelle de plus en plus de bibliothèques semblent signer (dont celles du Connecticut et du Massachussets). D'autres, suivant une "troisième voie", signent avec Google ET avec l'OCA, ce qui n'est d'ailleurs pas pour déplaire à Google, loin s'en faut. La raison en est simple : les ouvrages numérisés par l'OCA sont librement accessibles et indexables par tout le monde, et donc par Google qui n'a en l'occurence pas à supporter les coûts de ces numérisations (qui n'ont donc rien de "concurrentes"). Pour autant, il semble jusqu'ici que seulement une vingtaine de bibliothèques aient signé avec l'OCA.

On peut donc se poser la question suivante : pourquoi les bibliothèques françaises, à l'image de leurs grandes ou petites soeurs anglo-saxonnes, ne signent-elles pas avec plusieurs partenaires, dont l'OCA ? Et bien parce que dans le cas de l'OCA, les coûts de la numérisation sont à la charge des bibliothèques. 30 $ par livre. Oui mais. Mais là-bas, ces coûts sont pour l'essentiel supportés non pas directement par les bibliothèques, mais par le biais de fondations privées (comme la Sloan Foundation, très généreuse sur les budgets d'aide à a numérisation) qui assument la plus grosse part du coût de numérisation incombant aux bibliothèques. Et voilà pourquoi les bibliothèques françaises en particulier et européennes en général ne peuvent que rester en situation d'observation du bouleversement en train de se produire : elles ne peuvent de fait ni compter sur l'argent de l'état, ni sur celui de fondations privées pour supporter les mêmes coûts de numérisation.

Tiens, juste une idée en passant, ne serait-il pas envisageable que la BnF se serve - avec l'accord de leurs initiateurs - des initiatives signalées ici (parmi d'autres signalées ) pour réaliser un fonds numérique qui pourrait rivaliser en masse et en intérêt avec l'avance prise par Google Books ? Non pas un site portail tel que celui déjà déployé par le ministère de la culture (et par ailleurs excellent), mais bien un réservoir de textes ... Il me semble que tout le monde y trouverait son compte, y compris celles et ceux qui sont à l'origine desdites initiatives et dont l'opiniâtreté et la constance seraient enfin sinon récompensées, tout au moins reconnues.

(Via le BBF, if:book, DigitalKoans)

Pendant ce temps, la bibliothèque du congrès et l'Unesco signent un accord pour un bibliothèque numérique mondiale (qui contiendrait des fonds particulièrement rares ou fragiles), et la BnF souffre "d'une faiblesse quasi-insurmontable : elle n'a rien à vendre."

Libreka.

Il y a 3 ans, à l'occasion du salon du livre de Francfort, Google allait annoncer son projet de numérisation. Trois ans plus tard, à ce même salon du livre, un consortium d'éditeurs (combien ?) vient de lancer le projet Libreka (projet décrit ici, et interrogeable ). Il s'agit de remettre en selle la fameuse règle de l'Opt-In. L'ensemble des contenus disponibles sur Libreka le sont donc, après l'accord préalable des éditeurs. Autre point de conflit dans le cadre de Google Book Search, l'affichage d'extraits (snippets) est laissé à l'entière discrétion des éditeurs. Certains ouvrages ne sont donc "accessibles" que sous forme d'une vignette de couverture, pour d'autres, il est possible, comme dans Google Book Search, d'afficher quelques extraits choisis et de chercher dans le texte intégral de l'ouvrage. Il est également possible d'ouvrir différents droits sur les ouvrages numérisés, permettant par exemple aux libraires d'accéder au téléchargement de certaines parties des ouvrages. D'après les différents commentateurs ayant couvert l'annonce, c'est un peu plus de 8000 ouvrages (tous en allemand) qui seraient concernés. Autre différence de taille avec le projet Google, les frais de numérisation sont à la charge des éditeurs (lesquels fournissent également les métadonnées permettant d'ouvrir certains droits). Il leur en coûtera :

  • 15 Euro pour les livres de 300 pages
  • 19,50 Euro jusqu'à 600 pages
  • 39 Euros jusqu'à 1500 pages
  • au-delà de 1500 pages, c'est à négocier ...

Donc ...

  • Premièrement, on ne peut que se féliciter d'une reprise en main par les éditeurs, ne serait-ce qu'au nom d'un risque avéré de monopole sur la diffusion des biens culturels (en l'occurence les livres sous droits)
  • Deuxièmement, on ne peut qu'être sceptique sur l'avenir d'une telle initiative, du fait de la difficulté à atteindre une masse critique pouvant un tant soit peu rivaliser avec celle de Google Book Search. Et je ne parle même pas du public concerné ...
  • Troisièmement, le sceptissisme est d'autant plus grand qu'aucun modèle économique (hors celui de la prise en charge par les éditeurs-demandeurs des coûts de numérisation) ne semble proposé avec Libreka.
  • Quatrièmement, ce projet semble aller dans une voie qui est clairement celle des usages restreints (via diverses possibilités de vérouillage), laquelle voie ne me semble pas être la plus judicieuse actuellement ...
  • Cinquièmement, lors du même salon du livre, Peter Olson, directeur de Random House (maison d'édition qui fut à la pointe des procès engagés contre Google sur la question des droits d'auteurs), a indiqué que sur ce terrain : "I think we are close to resolving our issues. We have so much in common". ArsTechnica (d'où je tiens l'info) ajoute malicieusement que Peter Olson semblait espérer (annoncer ?) que Google renonce prochainement à l'affichage d'extraits, ou plus exactement, que ledit affichage d'extraits pour des livres encore sous droits, soit précédé d'un micro-paiement ... (depuis le temps que je le dis ...)

(Initialement via DigitalKoans)

C'était il y a trois ans, c'était il y a une éternité.

Trois ans en arrière - 2004 - se tenait à Francfort le salon du livre, Google allait y annoncer son projet devenu aujourd'hui Google Book Search. Ce n'était encore que le projet "Océan", avant d'être rebaptisé Google Print puis Google Books, et de créer les remous que l'on sait.
Les premiers billets sur la question datent de Décembre 2004 (à l'époque je blogguais sur UrfistInfo), et il est étonnant de constater rétrospectivement à quel point Google avait en la matière les idées claires sur le devenir et les enjeux d'un tel projet (cf ce billet et celui-là). Le 14 Décembre 2004, 5 bibliothèques et un moteur allaient entamer un processus qui allait incarner, plus que tout autre à ce jour, les enjeux pratiques d'une société de la connaissance.

Les « nouveaux » catalogues ou le catalogue en (r)évolutions

Le dernier numéro d'Arabesques vient de sortir (.pdf). Avec à l'intérieur un papier de votre serviteur à propos de l'avenir du catalogue, et un "scoop" :

  • "L’ABES est pareillement convaincue des limites du catalogue traditionnel, conçu comme un système autoréférentiel et fermé, correspondant au modèle de bibliothèque qui a fonctionné pendant des siècles. Comme la bibliothèque, le catalogue n’est plus isolé du monde. C’est cette voie sur laquelle l’ABES propose de s’engager, après avoir réalisé un prototype début 2006. Cette ouverture du catalogue constituera un des axes de son projet pour les années 2008-2011, issu de plusieurs mois de réflexions internes et qui sera soumis en octobre à la communauté universitaire via l’AURA."

Vous voyez le truc ? Le SUDOC, cette vieilla dame si respectable, tagguée, ouverte aux lecteurs, folksonomisée, rézosocialisée !!! Quand je pense qu'il y a pas plus tard qu'une semaine, c'est sur le ton de l'ironie que je demandais à mes étudiants d'IUT d'imaginer le SUDOC avec l'interface de LibraryThing ! Attendons donc Octobre avec impatience.
Le numéro d'Arabesques est disponible en téléchargement sur le site de l'ABES (comme ça vous pourrez aussi prendre connaissance de l'interview d'une célèbre biblioblogueuse).
Pour archivage, je reproduis l'intégralité du papier sur ArchiveSIC et dans la suite de cette note. Commentaires bienvenus :-)

Lire la suite "Les « nouveaux » catalogues ou le catalogue en (r)évolutions" »

Autour du livre numérique

Via Pintini, je découvre le site du NEF (Net des Etudes Françaises) avec notamment une très complète chronologie du "livre numérique" de 1971 à aujourd'hui. Les autres dossiers réalisés par Marie Lebert se révèlent également précieux sur la question.

Y'a qu'à demander.

Mais pourquoi n'y avait-on pas pensé plus tôt !! Le 1er Octobre comme en atteste son agenda, Christine Albanel, notre ministre de la Culture, a rencontré Mats Carduner (responsable Google France) et lui a demandé de : "formuler prochainement ses suggestions voire ses recommandations à l'attention du ministère de la Culture et de la Communication pour augmenter la visibilité du patrimoine culturel français." (Source : Technaute)
Voilà, ça c'est fait. Le lendemain, elle rencontrait Bruno Racine (président de la BnF). L'histoire ne dit pas ce que cette rencontre donnera, mais elle marque clairement un changement radical depuis le départ l'expulsion de Jean-Noël Jeanneney (JNJ). L'heure en ce terrain comme en d'autres est au déterminisme génétique pragmatisme. Quand JNJ se battait pour la mise en oeuvre d'un projet de numérisation européen proposant une alternance à Google, c'est l'atlantisme numérique qui domine aujourd'hui : on va pas s'embêter à lancer des projets longs et coûteux, on va simplement demander à Google, gentiment, de mieux référencer nos collections. S'il vous plaît. Parce qu'elle est pressée notre ministre de la Culture. Ou parce qu'on lui a demandé de l'être.
Quant à la réponse de Mats Carduner, il est probable qu'elle soit à peu près celle-ci :

  • Mats Carduner : "Augmenter la visibilité du patrimoine culturel français ? Alors vous êtes plus fâchés ? Et vous avez terminé votre complexe d'Oedipe de Google ? Au fait vous avez bien viré l'autre sauvageon de la BnF ?"
  • Christine Albanel : "Oui, oui, pas de problème, on a mis un homme à nous."
  • MC : "Bon, ben alors c'est pas compliqué, le mieux pour être bien référencé, c'est qu'on fasse le boulot nous-même. Vu que sans vouloir être désabréable, quand vous faites un truc, en général vous vous apercevez après quelques années que c'est mal fait ou que d'autres font mieux, et vous le refaîtes." (Rires)
  • MC : "Bon, on va vous faire une fleur et vous éviter des frais. On prend le chantier culture. Vous nous filez les clés, on prend tout, on numérise, on indexe, et voilà, vous serez bien vus."
  • CA : "Chouette. Et euh ... vous nous les rendez nos trucs après quand même, hein ?" (Rires)
  • MC : "Bé ouais poulette, on te refile toutes tes vieilleries, mais ça nous permet de garder une copie de ce qui nous semble le plus intéressant pour le mettre sur nos sites à nous."
  • CA : "Ah, sur vos sites à vous ? Et pas sur les nôtres ?"
  • MC : "Bé si, ça y sera aussi. Mais personne viendra les visiter." (Rires)
  • CA : "bon ben la proposition me semble correcte. Donc vous vous occupez de tout hein ? Je mange avec Bruno (NDLR : Racine) demain soir, je lui dirai qu'il fasse l'état des lieux et qu'il prépare les clés."

<Update> Bibliofrance propose ses propres recommandations, pleines de bon sens :-) </Update>

Et l'on reparle de l'OCA

O.C.A. Open Content Alliance. Un groupement de 40 "partenaires" (dont Yahoo! et l'Internet Archive), "le" projet qui prétendait (et qui prétend toujours) être le seul à pouvoir concurrencer Google Books, et ce avec une stratégie en miroir (Opt-In pour l'OCA - on demande la permission avant de numériser - contre Opt-Out pour Google Books - on numérise d'abord et on vous donne un droit de retrait si vous n'êtes pas d'accord).
Le coeur de ces deux projets, c'est celui de la masse critique à atteindre. Et le nerf de la guerre c'est un peu le même que celui qui conditionne la parution de la feuille de match avant un match de poule décisif (France-Irlande par exemple) : laisser filtrer le moins d'informations possible. Résultat : pour ce qui est de connaître le nombre d'ouvrage réellement numérisés et accessibles dans l'un ou l'autre service, on en est réduit au jeu des devinettes et des approximations. Du côté de Google, on a une visibilité claire du nombre de bibliothèques participant au projet (27), et l'on peut inférer, sur la base des contrats liant les deux parties que la masse à numériser se situe entre 15 et 30 millions d'ouvrages. Quant à la masse aujourd'hui numérisée ... mystère. Les estimations les plus répandues font état de quelques millions. Du côté de l'OCA (qui ne communique quasiment plus depuis son lancement en 2005 et dont logiquement personne ne parle donc plus, cf la page "revue de presse" de leur propre site), du côté de l'OCA donc, et hormis l'annonce datée du 20 décembre 2006 indiquant que 100 000 ouvrages étaient disponibles sur les serveurs d'Internet Archive (initiateur et acteur majeur du projet), rien de mieux à se mettre sous la dent, sauf l'évidence qu'ils disposent de moins d'ouvrages que sur Google Books. Et ce n'est pas la dernière interview de Brewster Kahle (en date du 15 Août 2007) qui nous offrira un scoop : on saura seulement que l'OCA compte actuellement 40 partenaires, dispose de centres de numérisation dans 6 villes, et numérise 12 000 ouvrages par mois soit 4 millions de pages (mais depuis quand ont-ils atteint ce rythme de croisière ? Mystère ...). Ceci étant, l'article mérite lecture car il offre d'utiles informations notamment sur le chapitre de coûts, et rappelle en la martelant une idée simple : le monopole (ou quasi-monopole, ne chipotons pas) d'une société commerciale sur la numérisation d'un bien commun (= les livres libres de droits) pose problème, et continuera de poser problème tant que ladite société n'aura pas explicité la logique d'exploitation et d'usage qu'elle mettra à terme en place sur ce service, et qu'elle n'offrira pas des garanties sur le long terme pour lesdites conditions d'exploitation. "Oui mais est-ce que ce n'est pas en demander beaucoup à une société qui fait tout de même ça gratuitement ?" Si. C'est en demander beaucoup, mais ce n'est en aucun cas en demander trop.

Google Books passe la démultipliée

Lentement mais sûrement, Google Books continue d'avancer et de se positionner comme un service incontournable : après avoir gagné la bataille de la vitesse de numérisation (même si la qualité n'est pas toujours au rendez-vous), après avoir gagné la bataille de la quantité (même s'il est très difficile d'obtenir des chiffres fiables), il s'intéresse aux fonctionnalités sociales gravitant autour du livre, en lançant "MyLibrary", un service de partage et d'annotation de listes de livres qui empiète clairement sur les plates-bandes d'Amazon et de LibraryThing, en permettant de tagguer les livres choisis et d'en faire la critique (book review). Toutes les listes créées seront visibles par l'ensemble des utilisateurs du moteur, et vous serez identifié par le pseudo (nickname) que vous aurez choisi. Imaginons que demain, Google décide de croiser ces tags et ces revues avec les informations bibliographiques "standard" qu'il collecte via l'indexation des catalogues de bibliothèques (dont le français SuDoc), et LibraryThing peut mettre la clé sous la porte. Ou se faire faire un joli chèque ;-)
En sus, une rumeur persistante indique que Google s'apprêterait à lancer un service payant pour le téléchargement complet de certains livres en partageant (pour l'instant ...) les revenus avec les éditeurs.
J'avais de mon côté indiqué dès Janvier 2006 à l'occasion d'une intervention auprès du Syndicat de la Librairie Française, que dans un très proche avenir, Google "monétiserait" le service GoogleBooks au même titre que les autres. Et j'avais pris le pari avec mes étudiants de première année de DUT, qu'avant la fin de leur deuxième année, ils pourraient acheter des livres directement sur GoogleBooks. Peut-être n'auront-ils pas à attendre si longtemps.
Je m'aperçois aussi que le même GoogleBooks permet désormais de visualiser les pages de couverture, en lieu et place de la liste classique de résultats (c'est Hervé Bienvault, initiateur d'Abicia qui va être content ...).

<Update de 5 minutes plus tard> Et GoogleBooks lance aussi son propre widget d'encapsulage de livres (libres de droits).</Update>

Comme disait l'autre, "y va y avoir du sport ..."
(Via Inside GoogleBook Search et le blog officiel Google)

Rentrée des classes

Côté bibliothèques :

  • un tutoriel qui en 15 minutes par jour fera de vous un bibliothécaire 2.0.
  • les supports du congrès ABF Nantes 2007 sont (presque) tous en ligne.
  • un entretien avec Jean-Yves Mollier, à lire dans Télérama, et où il est entre autre question de l'avenir du livre et des bibliothèques. On n'y apprendra pas grand chose rien, mais la justesse de ton et la pondération sont également parfois appréciables :-)

Côté bibliothèques et moteurs :

  • les bibliothèques de l'université de Keio (Japon) rejoignent le programme Google Book Search, qui entre ainsi sur le continent asiatique. 120,000 ouvrages du domaine public sont concernés. Le nombre de bibliothèque partenaires s'établit donc désormais à 26. (Via InsideGoogleBookSearch & le communiqué de presse - .pdf - de Keio). Une étrange affordance au passage en guise de réminiscence, je connaissais le nom de l'université de Keio parce que Ted Nelson, inventeur et précurseur de l'hypertexte et d'une utopie mondiale de la connaissance baptisée Xanadu, Ted Nelson donc y était allé soutenir l'équivalent de ce que l'on nomme ici une "Habilitation à Diriger les Recherches". La signature de cet accord avec Google, dans l'ombre du passage de Ted Nelson à Keio donne à Google Books un étrange aspect d'aboutissement de Xanadu.
  • la bibliothèque de l'université Cornell se joint également au projet Google Book Search. 500 000 des 8 millions de volumes imprimés détenus par ladite bibliothèque sont concernés. Soit donc au total 27 bibliothèques partenaires.
  • Sur le même sujet, ne manquez pas l'article de Paul Duguid dans le dernier First Monday, et le commentaire avisé qu'en fait Jean-Michel Salaun.

Côté OpenAccess :

  • les dépôts OAI francophones en SHS suivent, et c'est tant mieux, une progression lente mais régulière et soutenue : voir le décompte détaillé de Marin Dacos.
  • Plus globalement d'ailleurs, le mouvement de l'open access dans sa globalité suit une courbe dramatiquement (?) ascendante.
  • Ceci expliquant sûrement cela ... la toute puissante AAP (association des éditeurs américains) lance l'initiative PRISM ("Partenariat pour l'intégrité (sic ...) de la recherche en science et médecine"). L'idée est d'alerter le public sur les présumés "risques" de la publication en Open Access. L'attaque est aussi frontale que caricaturale, en pointant les soi-disant "risques d'une censure d'état" liés à une "disparition de l'évaluation par les pairs", ce que personne, même les plus extrêmistes partisans de l'Open Access, n'a j-a-m-a-i-s ne serait-ce que suggéré. On en rirait presque, mais le pouvoir de lobbying de l'AAP est tel que l'on en est plutôt navré et inquiet. Il s'agit en fait de la mise en pratique du plan de guerre contre le libre accès, déclaré en Janvier 2007, pour lequel l'AAP avait eu recours à une agence de relations publiques aux méthodes qui pourraient n'être que tristement célèbres si elles n'étaient pas également largement discutables (désinformation, propagation de fausses rumeurs, etc, etc.). Tout cela est proprement consternant tant les arguments évoqués sont spécieux. Mais tout cela risque surtout de faire de considérables dégâts. Donc, plus que jamais, continuons le combat ... et le prosélytisme ... <Update de 5 minutes plus tard> Via Marlène - qui en parle aussi - je découvre ce billet certes partisan - de l'autre camp - mais qui résume très bien la situation et reprend nombre de réactions blogosphériques à ce sujet </Update>

Côté moteurs :

  • Google ...
  • Google fait preuve d'un appétit dont la constance confine à la boulimie. Voir la liste dressée par Christophe Asselin des acquisitions des derniers semestres. Derrière cet appétit qui peut sembler désordonné, se dessine progressivement une stratégie bien identifiée de positionnement sur le Web OS pour tout type de public et toute taille d'entreprise. De son côté, Henri Labarre nous offre une cartographie synoptique au format .pdf de ladite boulimie.
  • Et puis comme cela ne fait jamais de mal de rappeler quelques fondamentaux, une belle animation flash sur la manière dont fonctionne Google.
  • Google encore qui donne dans le tonitruand, en annoncant l'ouverture des commentaires sur Google News, pour ceux "ayant un lien" avec l'affaire commentée (sic). Nombre de journaux le font déjà, sans qu'il soit besoin de "prouver" avoir un lien quelconque avec l'affaire, mais quand Google touche au modèle média de la presse en ligne, tout le monde s'affole. Techcrunch rappelle les faits dans un billet synthétique. L'immense majorité des observateurs est plus que sceptique, à l'image de Danny Sullivan qui résume l'affaire en un mot : "Weird". Emmanuel Parody dans son analyse à laquelle je souscris entièrement, évoque une "arrogance d'un nouveau genre". Jusqu'au LATimes qui, deux jours après l'annonce, dans une tribue non-signée, compare Google à ... Osama Ben Laden :-(
  • Et les autres ...
  • Technorati s'effondre lentement mais sûrement ...
  • La tendance - ou l'idée que je crois de plus en plus vraie - qui veut que la fabrication de moteurs (indexation, rafraîchissement, parsing et autres technologies) et la fabrication d'interfaces soient deux métiers différents, cette tendance semble se confirmer avec le rapprochement de Groxis (excellentissime interface de Grokker, depuis le temps que je le dis ...) et d'Intellisearch. Pour plus de détails, voir l'article de l'Atelier.

Côté veille :

Côté web :

  • Si le web est implicite, il est aussi granulaire ou plus exactement fractal. Et les Widgets en sont la plus petite unité atomique. Techcrunch nous gratifie d'un billet synthétique sur les origines, les plateformes et les standards de ces petits widgets.
  • L'équipe d'Information Architects nous gratifie de son côté d'une belle carte (.gif) dans le genre "plan de métro", listant un grand nombre d'acteurs et de services du web actuel. Synoptique et fort utile pour repérer quelques "tendances".

Côté réseaux sociaux :

  • Nous nous étions quitté en listant ce que nous savions aujourd'hui des réseaux sociaux, et bien il y a de fortes chances pour que ces réseaux sociaux occupent une très grosse part de l'actualité webienne dans les mois à venir. Avec tout d'abord le coup de poker de Facebook, dont Google a une énorme envie et qu'il pourrait bien tenter de se payer, après que le PDG dudit Facebook a refusé l'offre de Yahoo (1 milliard de $ ...). Si le marché se concluait, Google enterrerait de facto toute possibilité d'émergence en la matière, puisqu'il est déjà par ailleurs installé (motorisation et régie publicitaire attenante) comme moteur officiel de LA plateforme concurrente MySpace. Du côté des trois grands le tableau est donc pour l'instant le suivant :
    • MSN dispose de MySpace. Leader indétrônable pour ce qui est du nombre de teenagers impliqués.
    • Yahoo! (ayant échoué à racheter Facebook) travaillerait sur un projet baptisé Mosh
    • et Google (probablement en train d'essayer de racheter Facebook) aurait de son côté une nouvelle arme fatale baptisée SocialStream (voir le billet de Techcrunch pour plus de détails, et voir aussi le site de présentation du projet SocialStream, présenté comme "réseau social unifié" et dans lequel une large place est faite à la notion de Sérendipité ...). Notons ici encore que sur ce terrain (réseau social "unifié") comme sur d'autres (recherche "universelle") ma petite théorie de la dérive des continents documentaires résiste bien à l'analyse ;-)
    • Si vous êtes un peu perdus, FredCavazza résume tout ça très bien. De mon côté, même si dit comme ça cela peut ressembler à du teasing éhonté, je pense que si FaceBook avait l'intelligence de regarder du côté d'Amazon (et réciproquement), la carte des acteurs plénipotentiaires du web actuel serait entièrement reconfigurée. J'y reviens dans un prochain billet ... enfin si je n'oublie pas et si j'ai le temps :-(
    • Et pour compléter mon dernier billet sur la question, on lira avec intérêt les deux billets que Jean-Michel consacre à cette même question : ici et .
    • Toujours sur le livre des visages (dévisage ?), à lire également la réflexion de François Bon.
    • Pour le côté business, voici une grille très détaillée vous permettant de calculer le retour sur investissement (ROI) d'un réseau social
    • A lire également, les résultats d'une étude menée sur 850 personnes de 54 pays, étude sans prétention scientifique mais qui confirme tout de même quelques orientations, dont la domination de LinkedIn dans la catégorie "réseau social professionnel".
    • On pourra également consulter la liste des réseaux sociaux disponible sur Wikipedia, en complément de celle de Dannah Boyd, ainsi que le rapport d'Avril 2007 de Forrester (.pdf), déjà signalé sur ce blog (pour les plus pressés, voir le récent résumé de Gerry Mc Kiernann)
    • Et puis ... et puis ... et puis il est des programmes de recherche auxquels on aimerait avoir participé ou dont on voudrait avoir eu l'idée, comme celui visant à établir le réseau social ... des superhéros Marvel. Le résultat est à lire sur ArXiv. Avec une grosse déception tout de même, l'étude se base sur l'apparition desdits superhéros au fil des volumes de publication et ne s'intéresse pas aux communautés elles-mêmes (Vengeurs, X-Men, etc.). Impossible donc d'avoir la preuve scientifique que le Fauve ait entretenu une relation avec Miss Hulk :-(

Côté Wikipédia :

  • La polémique (stérile) de l'été.
  • A l'occasion de sa pause estivale, Homo Numericus nous offre trois billets d'analyse sur "l'histoire politique" de Wikipedia, rédigés par Sylvain Firer-Blaess, étudiant de l’IEP Lyon : ici (1), ici (2), encore ici (3), et (4).
  • Un étudiant a mis au point un détecteur de TRDs (Tentatives de Redocumentarisation Déviantes) : pour le tester vous-même, direction le Wikiscanner (tous les journaux en ont parlé - Le Monde, Libé, etc. - mais vous pouvez bénéficier d'un rattrapage de qualité avec l'article de Christophe Deschamps, et d'une ouverture problématique fondamentale chez Jean-Michel Salaun, concernant l'urgence de réinventer le droit à l'oubli)
  • Dans le dernier numéro de First Monday, un autre étudiant s'est penché sur la qualité des citations scientifiques dans l'encyclopédie collaborative, avec deux résultats intéressants : les citations sont pour l'essentiel conformes aux normes académiques, et elles ont tendance à renvoyer majoritairement vers des revues à forte notoriété (Science et Nature en tête), ce qui ne peut effectivement que "contribuer à renforcer la crédibilité" de l'encyclopédie.
  • Et pour prolonger le débat, les 19 et 20 octobre 2007, l’association Wikimédia France organise le premier colloque francophone sur Wikipédia, à la Cité des sciences et de l’industrie sur le thème suivant : "Développer - Valider - Ouvrir". A ce jour, le programme ne fait état que de l'intitulé de 3 "séminaires" sans davantage de contenu ni d'intervenants (un sur les "réseaux d'experts" - tiens, tiens ... - un autre sur les rapports de l'encyclopédie avec le monde de l'enseignement, et un troisième sur l'épineuse question de la validation). A suivre donc ...

Côté identité/identifiants/traçabilité numérique :

  • Après les 3 lois de la robotique, les 7 lois de l'identité numérique. (Via InternetActu)
  • Un billet intéressant sur la gestion des avatars.
  • Naturellement en la matière, la clé résidera dans l'attitude, l'orientation et la marge qu'autoriseront les moteurs sur ces questions. Les habitués d'affordance retrouveront aisément sur ce blog quelques billets concernant la politique de Google en la matière, et durant cet été, Ask a annoncé son service AskEraser permettant aux utilisateurs de ne voir aucune donnée conservée durant leurs recherches. A l'inverse, le moteur Spock entend ficher les individus sur la base des informations collectées par les moteurs. Après un rapide test, il s'avère - heureusement - assez inintéressant (sauf si vous voulez connaître l'âge et le nom des épouses de différents présidents de la république de tel ou tel pays). Un million de personnes seraient ainsi "indexées" dans ce "people specific search engine". En revanche, nul doute que demain, l'un des moteurs majeurs proposera à son tour ce type de recherche.

Côté Outils :

Côté lectures / visionnages :

  • Un numéro du Journal of Computer-Mediated Communication avec notamment une section spéciale de 5 articles concernant les blogs, et quelques autres papiers intéressants autour des réseaux sociaux.
  • Le billet du gourou Nielsen qui a fait couler beaucoup d'encre blogosphérique au début de l'été : "Ecrivez des articles, pas des billets."En (très) gros, Nielsen plaide pour une expertise affirmée, au-delà de la surabondance instantannée d'information qui surgit dans la blogosphère à propos de tout ou de n'importe quoi. L'idée est que - selon Nielsen - si vous voulez affirmer votre expertise et éventuellement la monnayer au prix fort, vous devez écrire des billets longs, privilégier l' "in-depth content". Sébastien Billard résume très bien le tout.
  • « L’impact d’Internet sur l’économie de la presse : quel chemin vers la profitabilité ? » (.pdf) La thèse toute fraîche de Danielle Attias.
  • Et puis pour la bonne bouche, un petit film d'anticipation sur l'avenir du livre, lequel livre, peut-être selon un phénomène de contamination du support, devient de plus en plus "rich"-media.

Côté université :

  • Un très bon numéro spécial (.pdf) du magazine Horizons de l'AIU (Association Internationale des Universités), publié par l'Unesco, et consacré à la thématique du classement, des indicateurs et autres palmarès en vigueur (ou non) dans nos universités. Je vous recommande tout particulièrement la lecture de l'introduction de Jamil Salmi et Alenoush Saroyan, intitulée : "Les classements des universités comme instruments politiques : usages constructifs pour l'enseignement supérieur".
  • Sur le site lautrecampagne.org, une série de 5 entretiens avec des gens concernés et impliqués sur le projet de réforme des universités du gouvernement. Tous les sujets qui fâchent y sont abordés : recrutement, financement, échec en premier cycle, autonomie, etc.

Bonne rentrée à tous et toutes :-)

(Via : l'harassant dépouillement de mon agrégateur ...)

Elsevier dans Scholar

Google Scholar est le site gratuit d'accès à des contenus scientifiques le plus fréquenté et le plus accédé.
Elsevier est le premier éditeur de revues scientifiques.
Elsevier dispose d'une offre spécifique (ScienceDirect) et de son propre moteur de recherche (Scirus).
Pour gagner plus d'argent, Elsevier a besoin que de plus en plus de gens accèdent à ses revues dans le cadre d'une offre payante. Et elle a donc besoin que son offre d'appel (certains articles disponibles gratuitement) et l'ensemble de ses revues disposent de la meilleure visibilité possible.
Elsevier ne pouvait donc logiquement pas se passer d'un accord avec Google Scholar. Le basculement du fonds des revues Elsevier est désormais acté. La communauté des chercheurs et universitaires en sortira incontestablement gagnante. Pour l'instant.
(Via PintiniBlog)

2 ans, 6 mois, 7 jours.

  • Décembre 2004 : Google lance Google Print.
  • Automne 2005 : Google Print est rebaptisé Google Books
  • Juin 2007 : 25 bibliothèques et 10 000 éditeurs (selon Adam Smith) ont signé avec Google pour une mise en ligne de leur fonds, avec une granularité et des modalités différentes.

"2 ans, 6 mois et 7 jours" depuis que les 5 bibliothèques historiques ont signé avec Google. Leurs représentants et ceux de Google étaient l'autre jour réunis en conférence pour fêter et débattre de cet événement. Un compte-rendu sommaire est disponible ici. La conférence n'a pas été webcastée (à ma connaissance).

Google encore ...

Pour commencer, deux billets de ReadWriteWeb qui reviennent :

  • pour le premier sur une conférence d'Udi Mander (Google's VP of Engineering) lequel revient sur les difficultés de la recherche (et oui, même pour Google) :  billet dans lequel on apprend que Google doit actuellement traiter un pouçentage situé entre 20 et 25% de requêtes inédites.
  • pour le second sur une conférence de Shery Sandberg (Google's Global VP of Sales and Operations) sur le thème, "quel avenir pour la publicité ?" :  où l'on apprend sans surprise qu'il est (l'avenir) à la personnalisation.

Et à ne pas rater : un journaliste du NYTimes a passé une journée en compagnie d'Amit Singhal, googler de renom, au coeur même de l'optimisation du célèbre PageRank (au passage, je vous conseille de jeter un oeil au support - .pdf - de sa Keynote à SIGIR 2005). L'article du NYTImes est très instructif et très bien ficelé. Il rappelle utilement que le PageRank (breveté et donc publiquement accessible) n'est que la colonne vertébrale d'un ensemble sans cesse renouvellé de paramètres et autres variables d'ajustements qui font la pertinence du moteur. Le tout étant férocement gardé au sein du département "Search Quality". A lire absolument. (Si vraiment vous n'avez pas le temps,  un billet de LunchOverIP vous en livre quelques morceaux  choisis)

A suivre également (via Lib 2.0), un numéro spécial (Juin 2007) de la revue Library Philosophy and Practice, consacré aux rapports entre Google et les bibliothèques : Libraries and Google.
Sur ce même sujet (Google et les bibliothèques), ce billet nous rappelle utilement qu'au delà de son programme de numérisation massive et la vingtaine de bibliothèques partenaires, l'autre force de frappe de Google (via son service Scholar) est de pouvoir s'appuyer sur un réseau de 1200 bibliothèques affiliées au Library Links Program.

Et puis Google sans la rumeur ne serait pas vraiment Google. Sauf que là, la rumeur en question vient directement de Techcrunch, source notoirement bien informée. Et qu'en plus le rachat de GrandCentral.com (puisque c'est de cette rumeur qu'il s'agit <Update du 02 Juillet> : confirmation du rachat </update>, GrandCentral ayant pour devise programmatique : "one phone number for all your phones, for life") serait parfaitement cohérent avec la stratégie de la firme, et ce au moins pour deux raisons :

  • primo, la téléphonie mobile est LE champ d'application grand public à conquérir pour les moteurs (et Google est déjà bien placé)
  • deuxio :  c'est un canal idéal pour la diffusion de publicités ciblées
  • tertio (et cerise sur le gâteau) : en plus de savoir à qui on écrit des mails, Google pourra aussi savoir à qui on téléphone, et probablement de quoi on parle :-(

Google Books : au tour des consortiums

Le nombre des bibliothèques partenaires du projet Google Book Search est aujourd'hui de 15. Le porte à porte individuel ne suarait être en la matière la seule voie pour Google s'il veut atteindre une masse critique propre à déclencher une adhésion massive. Or voici qu'il vient de signer le premier de ses contrats non pas avec une mais 12 bibliothèques universitaires réunies en consortium (voir aussi l'annonce de la signature sur le site du consortium, et celle du blog de Google qui insiste judicieusement sur "l'assiette" des publics concernés - 400 000 étudiants - et sur la notion de "bien commun").

  • 15 + 12 = 27

La signature de cet accord est d'importance non pas tant pour le nombre de volumes concernés (on nous annonce près de 10 millions d'ouvrages) mais parce que Google dispose maintenant d'une force de frappe (et de conviction) à géométrie variable, capable d'intéresser :

  • les "grandes" bibliothèques
  • les "petites" bibliothèques
  • et les consortiums donc.

Les consortiums français, Couperin naturellement en tête, seraient à mon avis fort bien inspirés de retenir la leçon, et d'aller à la négociation avec le colosse de Mountain View en jouant sur la masse critique des partenaires pour équilibrer ladite négociation. Mais peut-être la négociation a-t-elle déjà commencée ?

(Via Pintini)

Google en tout et pour tout ... et partout.

C'est peu dire qu'il est des périodes où le moteur californien s'affole. Voici donc un petit pêle-mêle pour une actualité Googlienne plus qu'effervescente :

  • tout le monde le sait, Il a racheté Feedburner, et tout le monde le pense, Il va s'en servir pour proposer a ses annonceurs et partenaires de diffuser de la publicité ciblée, et aussi pour mieux nous connaître ...
  • Il a aussi lancé un service Google Maps baptisé Street View qui vous permet de visualiser les détails au niveau du sol, avec un effet de Zoom plus que troublant qui enterre définitivement toute aspiration à une quelconque vie privée (mais peu de gens semblent s'en émouvoir ... voir notamment sur Ecrans, et surtout Zorgloob)
  • et pour mener de front toutes ces actions, il a naturellement un appétit d'ogre et rachète à tour de bras une impressionnante liste de sociétés (Panoramio, Feedburner donc, Greenborder, et dernière en date, PeakStream)
  • dans un autre registre, Google annonce qu'il va rendre disponible son moteur de recherche sous forme "embarquée" pour les sites des éditeurs partenaires du programme Google Book Search (GBS), leur permettant ainsi de n'accéder s'ils le souhaitent, "qu'aux" titres édités par lesdits éditeurs et visibles dans GBS, et enfermant un peu plus l'économie du livre dans un vase clos dont on a de plus en plus de mal à entrevoir les issues autres que Googliennes.
  • Un dernier bonus (via 2803.com), un article très complet qui vous permettra de tout savoir sur le fameux PageRank.

Google Book Search

Et une de plus. C'est la bibliothèque de l'université de Gand (Ghent) qui rejoint le panel. Bibliothèque belge de langue allemande et qui comprend un important fonds francophone, notamment récupéré à l'occasion de la révolution française. La communiqué de presse rappelle par ailleurs fort habilement que l'université de Gand fut la première université belge à signer la déclaration de Berlin sur l'Open Access et qu'elle est également partenaire du projet DRIVER (archive institutionnelle à l'échelle européenne). Il insiste enfin sur le fait qu'en 2010 doit commencer une importante rénovation de ses batiments, période durant laquelle bon nombre d'ouvrages ne seront pas accessibles au public ... mais seront sur Google Book Search :-) Dernier point (important), cet accord est le résultat d'un emission pilotée par le Ministère de la recherche et de l'innovation.
D'après un article du Guardian, c'est 300.000 ouvrages qui sont directement concernés par cette nouvelle vague de numérisation

Sources :

Livre et numérique : un zest d'effervescence

La saga qui rend compte du délicat positionnement du "monde du livre" au regard du numérique nous promet encore quelques épisodes riches en rebondissements :

  • du côté des "gros" libraires indépendants, les 3 pointures que sont Sauramps (Montpellier), Ombres Blanches (Toulouse) et Mollat (Bordeaux) annoncent être en négociation avec Google depuis l'automne dernier. Il s'agit pour ce front uni de sudistes de permettre une remontée quotidienne de leur fonds auprès du moteur pour l'affichage de liens sponsorisés vers lesdits sudistes, au même titre que cela se fait actuellement pour les géants de type Amazon.
  • du côté des "moins gros", c'est le portail de la librairie indépendante qui est en ligne de mire (portail qui fut à l'origine du départ du SLF - syndicat de la librairie française - de Christian Thorel pour cause de "divergence de vue", une divergence que l'on comprend d'autant mieux au regard du paragraphe précédent). On lira donc avec gourmandise cette entrevue d'Hélène Clémente (chargée de mission du SLF sur ce dossier), où l'on apprend que derrière le portail, "base bibliographique commune", et présentant des fonctionalités "amazon-like" (liste de recommandations par exemple), chaque librairie pourra disposer de ses pages personnelles pour continuer le dialogue avec ses lecteurs.
  • du côté des usagers enfin, le modèle Librarything semble faire de plus en plus d'émules, témoin le lancement en béta-test prévu pour dans quelques semaines de Babelio.com

Si tout cela ne réussit pas à vous convaincre de l'intérêt d'être avec nous le 1er Juin à La Roche sur Yon pour discuter de l'actualité (brûlante) et des enjeux (cruciaux) du Livre et du Numérique, ben alors je sais plus quoi faire, sauf vous remettre le lien vers le programme et vers l'inscription (gratuite) ;-)
(Via La feuille)

La suisse n'est plus neutre

La Suisse sort donc de sa neutralité ... pour s'engager dans le projet de numérisation Google Book Search. Et c'est la bibliothèque universitaire de Lausanne (BCU) qui est la première à montrer l'exemple, devenant ainsi la 14ème bibliothèque partenaire (1ère de langue française et 4ème européenne)
L'annonce de la BCU indique que 100 000 ouvrages libres de droits du 17ème au 19ème siècle sont concernés. Mais elle ne fait pas mention du facteur temps que prendra l'opération (omission qui est d'ailleurs de plus en plus fréquente dans les récentes annonces de nouveaux partenariats). 
Comme le fait remarquer Nicolas Morin, cette annonce risque d'aiguiser les appétits des "petites bibliothèques", puisqu'il n'est ici pas question de "millions" d'ouvrages mais "simplement" de 100 000.
Alexandre Moatti pointe de son côté vers un article du Temps, où le directeur de ladite bibliothèque indique que cette décision est le résultat de deux faits :

  1. le projet de Google est jugé "beaucoup plus sérieux" que son concurrent Europeanana
  2. la suisse "ne verse pas un centime" pour la numérisation de ses fonds.

Ce même article indique que le calendrier de numérisation ne sera défini que dans un mois.

Ajoutons à cela le climat politique actuel dans lequel je doute fort qu'une vision de politique culturelle sérieuse puisse émerger, et le départ la démission sous la contrainte de Jean-Noël Jeanneney , et il devient évident que notre petit village Gaulois va avoir de plus en plus de mal à résister à l'envahisseur ;-)
Alors, quelle sera la première bibliothèque française à franchir le pas ? Les paris sont ouverts ...

(Via Librarian Central)

Update : la vidéo du Directeur de la BCU sur YouTube

Panoptique Google : vers une algorithmie impliquante.

Une petite série de 3 billets très instructifs sur différents aspects de Google :

Plus qu'une tentative, un remarquable boulot au sortir duquel on se sentirait presque avocat. Avec une conclusion à méditer : "Quant aux bibliothèques, on ne les entend pas. En dehors de la BnF, bien entendu. Mais elles devraient avoir conscience qu’une victoire de La Martinière et du SNE n’est pas nécessairement dans leur intérêt: plus les droits de Google seront limités, plus leurs propres droits le seront. Et si demain tous les livres français sous droits sont enlevés de Google et de tous les projets équivalents, je ne vois pas en quoi cela servira les intérêts collectifs de la nation, ce qui est pourtant, a priori l’objectif de nos lois (d’auteur ou pas)."

Avec d'abord cette liste de critères très "génériques" : 

    • "popularity of the blog document, an implied popularity of the blog document, the existence of the blog document in blogrolls, the existence of the blog document in a high quality blogroll, tagging of the blog document, references to the blog document by other sources, and a pagerank of the blog document. It will be appreciated that other indicators may also be used."

On y apprend également l'importance du "feed readership" (= lectorat RSS), lequel est moins sujet à controverse que les traditionnels liens entrants (backlinks) et semble donc un indicateur plus "objectif". Et là vous me dites : "Et comment Google sait-il combien j'ai de lecteurs abonnés à mon fil RSS ?" Et bien tout simplement via Google Reader. "Et ceux qui n'utilisent pas Google Reader ?" Et ben ils ne comptent pas :-(
Le brevet souligne également l'importance des Blogrolls, et plus exactement de ce que j'appellerai la "blogrollsroyce" : plus vous êtes dans la blogroll d'un blog à forte notoriété, et plus la vôtre (de notoriété) augmente.
Et puis ... et puis ... sont prises en compte : "[0044] les références vers le blog par d'autres sources peuvent également être des indications positives sur la qualité dudit blog. Par exemple, le contenu des emails ou la transcription de conversations (chat) peuvent contenir l'URl du blog. Les emails ou les clavardages (chat) qui incluent des liens vers le blog sont des indicateurs positifs de la qualité dudit blog".
Et voilà. Un big brother assumé, revendiqué, fonctionnant en vase clos. Bien sûr on sait que Google lit le contenu de nos mails (même si chaque fois que j'en fais la démonstration à mes étudiants, j'ai quelques évanouissements dans la salle). Bien sûr on sait qu'il se sert de l'analyse de ce contenu pour nous bombarder de publicités contextuelles. Mais j'avoue que je suis un peu étonné de voir qu'il se sert également de ce contenu ... comme un critère d'optimisation de son algorithme ... Cela marque la dernière étape de la dérive des continents documentaires :

Derivcontinent

Il est désormais clair que le web s'est effondré sous son propre poids. Ou plus exactement, que la représentation sociale et algorithmique que Google nous donne à voir du web dans une artefacture métonymique réfléchie, est désormais "complète". Elle (cette réprésentation) fonctionne comme un écosystème autarcique avec en point de mire une totale transparence :

  • des contenus
  • de chacune des interactions avec ces contenus
  • de chaque échange public, privé ou intime entre l'ensemble des "habitants/utilisateurs" de cet écosystème

Une redéfinition de l'algorithmie. Un algorithmie "impliquante".

Et pour conclure cette série de billets, celui de Danny Sullivan : "What is Google PageRank ? A guide for searchers and webmasters."
Bonne(s) lecture(s) et n'oubliez pas : "Don't be evil" ;-)

Sudoc Scholar

Comme annoncé ici, les références du SUDOC sont désormais disponibles dans Google Scholar.
(Source officielle : BIM de l'ABES (.pdf), relayée par le Babouin)

La bibliothèque et la tortue.

Cet article d'Infotoday est tout simplement incontournable pour qui prétend comprendre et analyser le volet "bibliothèques" du projet de numérisation de Google.
Il rappelle utilement :

  • que le choix des actuelles bibliothèques contractantes n'est pas innocent, et que, Université du Michigan en tête, toutes les signataires sont non seulement à la tête de collections incontournables (qualitativement et quantitativement) mais également qu'elles furent pionnières en matière de numérisation (et ce dès le début des années 80, un peu comme le fût notre Gallica national, qui s'il n'a pas signé, a très probablement été approché par les VRP de Mountain View). L'article revient à cette occasion sur les différents autres projets de numérisation des contractantes.
  • qu'une nouvelle et essentielle question se pose, du fait de l'énormité de l'échelle de numérisation initiée par Google : celle des infrastructures de préservation (ce qui, malgré des partenariats en cours, notamment avec Sun, risque d'ouvrir une nouvelle porte à Google pour revenir avec une autre offre vers les bibliothèques : "Bon ben maintenant qu'on vous a tout numérisé gratos vos 2 millions d'ouvrages et que vous n'avez pas de place pour stocker vos copies  (sourire carnassier) ... et ben on va vous en vendre ou vous en louer un peu ... d'espace" ... et là, paf, ce qui était une garantie - chaque bibliothèque reste dépositaire et propriétaire d'un exemplaire numérisé - risque de faire tomber le masque d'un marché de dupe, Google raflant habilement la mise, car détenant ainsi sa copie, et l'espace de stockage de la copie propre des bibliothèques, va falloir être un solide rhétoricien pour m'expliquer comme lesdites bibliothèques de sont pas, in fine, perdantes sur toute la ligne ... A moins, à moins bien sûr, que les pouvoirs publics après avoir pathétiquement loupé l'enjeu politique des moyens de la numérisation, prennent soudain conscience de cet autre enjeu qu'est l'utilité publique d'un stockage numérique "d'état" ... mais je suis peu enclin à y croire ...)
  • qu'outre-atalantique, les bibliothèques (et particulièrement les contractantes) ont l'habitude de travailler avec des partenaires privés, et que certaines d'entre elles multiplient d'ailleurs lesdits partenariats, travaillant aussi bien avec Google qu'avec le projet concurrent de l'OCA. Quant à celles (comme Harvard) qui ne travaillent pour l'instant qu'avec Google, elles mentionnent que le contrat qui les lie ne dispose d'aucune clause d'exclusivité.

L'article revient également en détail sur la question centrale de la numérisation d'ouvrages soumis au copyright avec l'état des lieux suivant :

  • "Libraries sticking with public domain (at least for now):
    • University Complutense of Madrid
    • Harvard University
    • The New York Public Library
    • Oxford University
    • Princeton University
    • University of Wisconsin-Madison
    • National Library of Catalonia and affiliates
  • Libraries open to scanning materials regardless of copyright status (at least until the courts decide):
    • University of California
    • University of Michigan
    • Stanford University
    • University of Texas
    • University of Virginia"

L'article se conclut par l'annonce d'un scoop qui fait écho à l'interrogation suivante : "Quand l'OCLC (=Worldcat) se décidera-t-il à suppléer l'absence d'un catalogue-maître pointant vers l'ensemble des ouvrages numérisés dans le cadre du projet bibliothèque de Google ?" Et bien c'est apparemment en train d'être fait, et une maquette du projet pilote devrait être visible en Juin 2007. Et ça, c'est VRAIMENT une bonne nouvelle (qui risque d'enterrer un peu plus encore les éternels atermoiements et autres faux-départs de Dame Europeana). Des atermoiements qui, comme le rappelle la coda de l'article, sont, tous pays confondus, la principale motivation des signatures avec Google, se basant sur des chiffres édifiants : ainsi et malgré un partenariat avec un partenaire privé (GlaxoSmithKline), l'université de Complutense "a numérisé un peu moins de 3000 ouvrages en 12 ans. Avec Google elle espère atteindre un volume qui sans lui, aurait pris 100 ans." La bibliothèque et la tortue.

(Via SearchEngineLand)

BNUE & Google

A écouter : l'émission service public d'Inter consacrée à la BNUE et à Google, avec Jean-Noël Jeanneney sur le départ.
Nicolas (Morin) n'aime toujours pas.

Figoblog dixit

A l'heure d'un premier bilan (10 000 éditeurs partenaires, 13 bibliothèques, plus d'1 million d'ouvrages numérisés), et à l'heure ou sort le petit livre rouge de la numérisation façon Google :

  • "Il s'agit des relations entre l'université en question et le programme Google books, auquel elle a été l'une des premières à adhérer. Peter nous fait part de ses regrets, des "erreurs" qui ont été faites. Ses lamentations ne portent ni sur le projet lui-même, ni sur la participation de l'UC, ni sur les problèmes techniques ou les doutes sur la propriété des images numérisées. Elles portent sur le rôle essentiel de médiation que, dans son empressement à accepter la généreuse proposition qui lui était faite, la bibliothèque a trop vite abdiqué." La suite est , et les lamentations en question ici et .

Il n'est peut-être pas encore trop tard à l'heure où la forêt européenne des bibliothèques se cherche d'autres Racine(s).

Libraires : la clé du portail (et autres nouveautés)

J'avais annoncé un scoop pour le petit monde de la librairie indépendante à l'occasion de la tenue du salon du livre ... et bien ce n'est pas celui- :-)

(Pour mes étudiants - ceux qui me lisent -, vous noterez au passage la différence dans le traitement éditorial de cette information, le Figaro insistant (lourdement ?) sur l'aspect "réduction de la masse salariale", "les libraires devraient aussi voir leurs charges diminuer : d'après la Direction du livre, la masse salariale d'un libraire représente 18 % des ventes, contre 12 % dans la grande distribution culturelle et 6 % dans un hypermarché.")

Notons aussi une certaine effervescence en ce moment du côté des bibliothèques avec l'ouverture officielle de la bibliothèque numérique européenne : Europeana. Une Europe décidémment à géométrie variable puisqu'Europeana ne donne aujourd'hui accès "qu'à" : "environ 12 000 documents libres de droits issus des collections de la BnF, de la Bibliothèque Nationale Széchényi de Hongrie et de la Bibliothèque nationale du Portugal." Manquent donc à l'appel ... 19 pays :-((
Je vais encore être mauvaise langue mais dans le genre montagne accouchant d'une souris ... Doit-on voir là l'une des causes du départ de Jean-Noël Jeanneney ? Update de 19h : D'après JnJ himself que je viens d'entendre sur France-Inter, la limite d'âge atteinte, le fait qu'il n'ait pas été prolongé dans ses fonctions (ce qui est possible depuis peu via la modification d'un décret), est une "mesure politique" lié au fait qu'il est l'un des derniers "nommés par la gauche".

Effervescence encore puisque pendant ce temps, d'autres "modèles" voient le jour, travaillant - c'est selon - sur le processus d'amorçage ou celui de la frustration.

Google Books volet bibliothèque : et de 13.

A quelques jours de l'ouverture du salon du livre, GoogleBooks franchit une nouvelle étape territoriale en passant son premier partenariat avec l'Allemagne. Un million d'ouvrages du domaine public sont concernés.
L'état des contractants de la partie "bibliothèque" du projet GoogleBooks est donc actuellement le suivant  :

  • UK : Harvard, Stanford, Oxford.
  • USA : Princeton, Université du Michigan, de Virginie, du Wisconsin-Madison, de Californie et du Texas-Austin, New York Public Library (NYPL).
  • Espagne : Complutense (Madrid) et la Bibliothèque de Barcelone.
  • Allemagne : Bayerische Staatsbibliothek (le communiqué officiel en Allemand)

Cette partie "bibliothèque" n'est par ailleurs que l'un des volets du projet GoogleBooks. Pour ce qui est des ouvrages sous droits ou appartenant à la zone grise, le débat rebondit une nouvelle fois autour de l'initiative de François Bon. Joël nous livre une analyse éclairée de la situation (voir aussi le commentaire de François Bon). M'est avis que le salon du livre de cette année nous réserve quelques surprises et quelques scoops.

(Via BibNum & NetEco)