« Google books en 8 lettres. MONOPOLE. | Accueil | L'état de la blogosphère : Septembre 2008. »

28 oct 2008

Commentaires

Bibliobsession

waaa, tout lu, deux fois pour bien le croire. C'est juste énorme. Google vient de mettre ne oeuvre la première licence légale privée dédiée au livre, et à une échelle jamais atteinte. pfiou.

Alain Pierrot

Attention, il y a une différence entre les œuvres orphelines à proprement parler (orphan works — dont on ne peut trouver les ayants droit) et les livres épuisés/en rupture d'impression sous copyright (out of print) dont on connaît les ayants droit.

pierre s


Amusant ça : Google affirme que l'accord s'applique aux éditeurs et aux auteurs 'du monde entier' (livres numérisés sur le territoire des Etats-Unis). Wait & see.

Il y a confusion entre oeuvre orpheline et tirage épuisé, me semble-t-il.
http://www.cspla.culture.gouv.fr/CONTENU/rapoeuvor08.pdf

Bertil Hatt

Je pense Alain que l'ambiguité va permettre à Google de passer des incunables au dernier Nothomb, en douceur : on ne sait pas donc on peut faire ce qu'on veut ; on n'est pas sûr donc dans le doute on va vous jeter un chèque pour le tout ; on a une meilleure idée, mais comme c'est compliqué on va faire un paquet grossier ; c'est injuste, donc on facture à l'acte ; c'est tellement pratique — pourquoi ne nous laissez-nous pas vous vendre tous les livres ? On fait ça si bien. . .

Je suis obligé d'être d'accord avec Olivier : Google est libraire et bibliothèque à la fois, et le sera complètement dans deux ans. Éditeur, oui et non : la correction et le traitement de texte, c'est déjà fait, et ça ne va que s'améliorer ; le choix, c'est ce que le moteur de recherche permet depuis le début et ça n'est pas dans le genre de la boîte de reproduire la dichotomie publie/refuse ; l'impression, ça sera certainement avec un système différent, probablement à la demande, éventuellement en rachetant Lulu.com — donc, moi qui lis à l'écran, je répondrais : oui, sauf que c'est déjà fait, mais les amoureux du papier ne vont pas attendre longtemps.

Ce qui est beaucoup plus stupéfiant, c'est que Brin vient de déclarer dans le WSJ que les livres, c'est un début et que l'audio et la vidéo arrivent incessement, le temps de finir de tout scanner et de vérifier les virgules dans le contrat avec les producteurs — inutile de dire combien cet accord est en train de servir de levier pour une négociation o combien plus importante.

“Rendre accessible toute l'information du monde”
12 ans, négociation commerciale comprise.

JM Salaun

Salut Olivier,

Merci pour cette éclairante analyse. Il va en effet y avoir du mouvement. Les conséquences sont difficiles à prévoir, sinon pour Google de capter un peu plus l'attention des internautes sur ses services.

Mais je crois que tu vas un peu vite parfois sur l'analyse. Elsevier ne se trouve pas sur le même marché (les revues). Les libraires non plus (il s'agit des livres épuisés qui par définition ne sont plus en librairies). Et tu as oublié Amazon. Il y aura sans doute du mouvement dans tous ces joueurs, mais il est trop tôt pour conclure.

Alain Pierrot

@Bertil
Il y a déjà un mécanisme prévu pour cela: le 'safe harbor', qui permet de réserver les droits.

Par ailleurs, les éditeurs pourraient aussi voir dans le dispositif une incitation à rééditer des ouvrages du domaine public avec un appareil critique apte à leur donner un copyright sur la nouvelle oeuvre et 'sortir' ces titres du domaine gratuit.

À propos de fonctions éditoriales (correction et traitement du texte), c'est à mon sens loin d'être acquis: la plupart des ouvrages scannés par Google exigent un coûteux travail de correction/amélioration pour dépasser le stade de l'identification d'occurrences suite à une requête (suffisant pour la vente d'espace publicitaire ou une forme de PLV) et passer au stade de la commercialisation directe, que ce soit en impression à la demande, en distribution numérique ou en objet de recherche.

@JM Salaun et Olivier
Les périodiques et l'édition de partitions sont explicitement hors du champ du projet de compromis.

Bibliobsession

D'accord avec JM Salaun pour prendre mieux en compte Amazon et les libraires. N'oublions pas que le système d'affiliation est très efficace. Quand un utilisateur arrive sur un livre via google recherche de livres, il peut l'acheter chez amazon, qui le vend en propre ou le propose via un libraire affilié. Pour les ouvrages encore présents en librairie, c'est un moyen précieux de dynamiser la ventre du fond de catalogue (= longue traîne). Il peut aussi localiser la librairie la plus proche de chez lui, il s'agit d'ailleurs pour cette dernière possibilité d'une intéressante possibilité pour les libraires locaux de retrouver une existence numérique...

Hubert Guillaud

Merci Olivier de ce superbe éclairage comme toujours. Google, comme le souligne malicieusement Alain, vient de passer un très bel accord pour pas cher. Surtout, comme tu le dis très bien, il vient de balayer la difficulté qui empêchait ce type de base d'exister, en conservant le principe de l'opt-out. Ce seront aux détenteurs de droits de se faire connaître (et reconnaître surtout). Ce qui dans le domaine de la propriété intellectuelle me semble tout de même une vraie révolution dont les conséquences vont être nombreuses, même - surtout - sur les autres législations qu'américaines.

Les perspectives computationnelles que va ouvrir la base sont effectivement affolantes et stimulantes (notamment comme tu le dis très bien, par exemple, pour servir de base pour améliorer ses algorithmes de traduction, en puisant dans les différentes traductions de mêmes livres).

La création du registre des droits (que Brin envisage déjà de prolonger dans d'autres domaines) est aussi une annonce importante. Voilà longtemps que les éditeurs l'envisage, sans jamais avoir eu le courage de s'y mettre. Souvent les bases de droits reversent aux producteurs ou éditeurs, pas aux ayants-droits directs, pas jusqu'aux individus. S'attaquer à ce problème, aller jusqu'au détail des individus était capital. En même temps, cela va permettre à Google d'accéder à cette base qui était jusqu'à présent cachée derrière le paravent des éditeurs et des producteurs. Google va pouvoir contacter directement les auteurs... C'est bien plus explosif que ça n'en a l'air.

Sur le reste de ton analyse, il est clair que cette offensive éloigne encore un peu plus les libraires de la vente de livres numériques. Pour les bibliothèques, il va vraiment falloir qu'elles tissent des alliances entre elles, mais il sera dur de se battre face aux offres computationnelles de Google. Quant aux éditeurs, voila longtemps qu'ils savent que leur contenus ont une capacité d'exploitation en ligne qu'ils n'ont pas saisit. Comme tu le dis très bien, en construisant son registre, Google prépare le terrain pour devenir éditeur/producteur. Avec le registre, Google se distingue d'Amazon ou d'Apple : la finalité n'est pas la même.

JM Salaun

Une petite remarque sur l'idée d'utilisation pour l'algorithme de traduction. Je ne suis pas spécialiste, mais c'est une vieille réminiscence des discussions de Roger.

Je crois qu'il faut faire une différence entre la traduction littéraire (même si tous les livres en question ne relèvent pas de la littérature, ils relèvent d'une lecture-écriture lente) et la traduction utilitaire.

Ce à quoi pourrait servir la confrontation des traductions serait plutôt de transformer le style d'un texte quelconque en un texte «à la manière de..» un auteur (Proust, Victor Hugo, Gabrielle Roy, Boris Vian, pour ne parler que de francophones..) ou un genre (roman d'aventure, sentimental, manuel, livre de cuisine etc..) et ceci dans toutes les langues.

Alain Pierrot

@Hubert
Je ne pense pas que le registre des droits permette à Google d'accéder véritablement aux auteurs : on est en pays de copyright, pas de droit d'auteur, et la recherche de propriété pour la majorité des livres s'arrêtera à l'identification du détenteur du copyright. À charge pour celui-ci de voir ce qu'il fait des redevances reçues au titre de l'exploitation par Google.
Un point qui pose évidemment problème pour l'adaptation de ce compromis dans les pays de droit d'auteur.

Et avant de regarder du côté "édition", il y a lieu d'examiner en détail le projet de compromis pour la diffu/distribution des ouvrages, et les conditions proposées : Google libraire avant d'être éditeur (sans pour autant oublier les risques pris par Google et son investissement pour la numérisation, une opération de 'redocumentarisation' à valeur ajoutée, dont je ne vois pas de revendication éditoriale à première lecture du protocole).

@JM Salaün
Pour la traduction automatique, il s'agit désormais d'une tendance forte en TAL. Le recours à des 'alignements' de texte long appuyés sur des corpora gigantesques donnerait apparemment de bien meilleurs résultats que les approches lexiques+grammaires, aussi bien pour la traduction utilitaire que pour des ambitions plus fortes.
Ça donne lieu à de la recherche aussi bien chez Google (+ PARC) que chez Microsoft et ailleurs. (Cf. le lien proposé par Jean Véronis,
http://blogs.msdn.com/translation/archive/2008/10/25/politically-incorrect-machines.aspx .)

@tous: aucune malice soulignée ou non dans mon rappel des montants en jeu et de la portée du projet — ce serait mal me connaître et confinerait à la calomnie de penser que je pourrais être, un jour, ironique!

Il me semble qu'il faut évaluer la situation et ses effet immédiats (là où ils sont mesurables) avant de projeter des intentions et faire une prospective à trop long terme; ou bien il faut procéder méthodiquement à rebours, à partir d'une situation imaginaire (style expérience de pensée) et décliner les facteurs nécessaires à sa viabilité, année par année jusqu'au présent.

biblioroots

Je dis juste bravo à Google...

En tant qu'entreprise, ils se développent qui peut leur jeter la pierre ?

Quand on voit que deux bibliothèques de communes voisines n'arrivent même pas à bosser ensemble... On peut se dire que des projets de numérisation publique auraient pu voir le jour et être vraiment pertinents. De vrais accords auraient pu être signés avec Google...

Le problème c'est que nous sommes dans des professions "frileuses" qui ne savent absolument pas innover mais prennent le train en marche. Ou pire critiquer sans rien mettre en place. Moi je dis une chose :

Je suis pauvre, je n'ai pas les moyens d'acheter candide de Voltaire... Ma bibliothèque à prêté son exemplaire, orphelin depuis des années, à un élève qui découvre ce livre sur son programme scolaire !!!!!!

je lui donne une solution, elle s'appelle google books (mais çà l'usager il s'en fout que ça soit google ou Tartampion qui lui donne, ce qui compte c'est la réponse apportée à sa demande documentaire).

En retour il me sourit et nous sommes tout deux satisfaits.

Dites moi ce qui nous à empêché d'avoir les même projets que Google à part nous même notre frilosité, notre manque d'initiative et j'en passe ???

Celà aurait peut être été judicieux que les "professionnels" se réveillent avant...

Google n'est pas Monsanto et je suis persuadé qu'il y aurait eu des possibilités de négociations et d'aller même beaucoup plus loin que Google grâce à notre expertise professionnelle et notre longue expérience en la matière. Nous n'avons pas su "capitaliser" nos compétences, communiquer sur nos missions, nos moyens .....

Dommage pour nous et tant mieux pour google, leurs actionnaires et salariés. Pour moi ce qui compte c'est les résultats et les actions ... Grâce à cette initiative, beaucoup de gens peuvent accéder à des ressources qui ont ainsi gagné en visibilité et surtout en utilité !!! Car à quoi sert le meilleur livre si personne à part un obscur bibliothécaire ne sait comment y accéder ???

La pierre c'est à nous que nous devons la jeter pas à Google, il ne font que leur métier : développer la rentabilité de leur entreprise, qui s'en étonne ? Leur domaine étant la recherche d'infos il me paraît logique qu'ils se développent dans ce sens.

JM Salaun

@ A. Pierrot,
Je connais ces projets d'alignement de textes qui ne datent pas d'hier. Les documents de l'Unesco traduits dans de nombreuses langues et librement accessibles ont déjà largement servi à cette fin.
Simplement, la traduction de livres relève d'une pratique différente d'écriture, plus interprétative. Mais je ne suis pas spécialiste, je ne fais que rapporter des débats plus anciens menés au RTP-DOC.

@ bibloroots
«Dites moi ce qui nous à empêché d'avoir les même projets que Google à part nous même notre frilosité, notre manque d'initiative et j'en passe ???»

Dépense de Google pour ses datacenters en 2007 : 2,4 Mds USD
Est-ce un argument suffisant ?

pierre s

@ biblioroots :

Le Candide, vous auriez pu le trouver sur Gallica aussi :)

Comme le souligne JMS, bien peu d'acteurs, privés ou publics, ont les moyens d'engager des campagnes de numérisation à cette échelle industrielle, jamais atteinte jusqu'ici.

En revanche, on peut s'étonner qu'aucune bibliothèque en France n'ait tenté une simple expérimentation pour évaluer le process industriel et le modèle proposé - sauf BM Lyon qui s'est réveillée tout récemment.

Biblioroots

Le problème c'est que Gallica, seule la profession connait... et encore, alors que Google à pignon sur Web...

Gallica les gens arrivent à peine à se souvenir du nom ... Alors savoir ce qu'on y trouve c'est autre chose !!!!!!

Concernant le cout des data center de Google, pour moi ce n'est pas un argument...

Google c'est une histoire de développement personnel et d'entreprise, google a commencé avec très peu de moyen (certainement pas 120 milliards !) mais beaucoup d'idées, une réelle stratégie de développement et de vraies compétences...

Ceux qui ont des idées innovantes dans "le public" ne sont pas forcément bien perçus, alors que dans le privé c'est un atout qui est recherché... CQFD

Les moyens sont secondaires... Et je ne peux vous apprendre que les projets les plus ambitieux ne se font pas sans unité, sans investissement et surtout sans prise de risque. Ils se construisent sur la durée et on part petit pour arriver grand.

Je rejoins Pierre S qui souligne le fait qu'on a aucune idée du process réelle de ses couts de mise en œuvre etc...

Ce qu'on ne fait pas d'autres le font à notre place et franchement ils ont bien raison, car dans la sphère économique les considérations d'ordre philosophique passe en second, ce qui compte c'est l'efficacité.

On est d'accord ou pas mais c'est un fait...

Nous nous avons le temps de passer des heures à bloger et commenter l'action de "ceux qui agissent". C'est une posture "luxueuse" que notre statut protégé nous permet.

Beaucoup de choses vues sur le web auraient pu être inventées par la profession, Amazon aurait du être inventé par un libraire par exemple.

Je n'ai qu'un mot : frilosité !!!

Plutôt que d'agir préférez laisser faire les autres et critiquer ensuite !!!!

Y'à que ceux qui ne font pas qui ne se trompent jamais...

Hervé Le Crosnier

Bonjour,

Il y a plein de choses à dire sur cette opération qui me semble un tournant majeur. Je trouverai peut être le courage de m'y lancer, mais aujourd'hui, en marge de ce qui est dit dans le texte et les commentaires, je voudrais ajouter deux petites choses :

1 - l'inscription au registre, c'est en réalité la fin de la Convention de Berne. Je m'étonne que personne ne l'ait dit.
C'est le retour à la Loi US d'avant 1976

C'est aussi ce que préconise, avec par ailleurs pas mal de bon sens, Larry Lessig dans "Free Culture".

Il y a donc un "débat dans le débat" à mener.

- donner une carte d'identité, c'est assurer le pouvoir.

Pour qu'un produit chimique puisse franchir une frontière, il faut montrer son "Registry Number" afin que le gabelou puisse consulter la base de toxicologie. Un numéro attribué par l'entité privée "Association of Chemical Society" et devenu un sésame non seulement pour la recherche documentaire, dans toutes les bases chimiques et pharmaceutiques, et pas seulement Chemical Abstracts, mais aussi un outil de type "administratif".

Amazon, qui a enrichi la base de l'ISBN chèrement achetée, autour de son code "ASIN", a bien du souci à se faire avec l'initiative de Google.

J'ai écrit un article complet sur cette question de la numérotation et les enjeux de pouvoir qui en découlent pour la conférence Documents et Société de 2006... il est disponible dans les actes (aux Editions de l'ADBS)... et peut être en ligne le jour où j'écouterai enfin Olivier et ouvrirai mon site personnel....

On revient sur toute ces questions en direct live lors du prochain Doc-Soc 2008, 16 et 17 novembre au CNAM de Paris.

Hervé Le Crosnier

L'utilisation des commentaires est désactivée pour cette note.

Casssconn
"Mais quiconque affirme qu’il y a de l’argent à faire avec un stock d’ARTICLES SCIENTIFIQUES est soit un idiot, soit un menteur."
Lawrence Lessig. 12 Janvier 2013.
Le blog d'un maître de conférences en sciences de l'information.
Réflexions, analyses, signalements, opinions.

"Where is the Life we have lost in living?
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?"
T.S. Eliot, in Choruses from The Rock (1934)

Where is the information we've lost in Google ?

Botte de foin


Tous les contenus de ce blog sont sous licence Creative Commons. Vous pouvez donc les reproduire, les distribuer ou les communiquer à condition :
  • de citer l'auteur
  • de ne pas en faire d'utilisation commerciale
  • d'appliquer ces mêmes conditions à toute création qui résulterait d'une modification, transformation ou adaptation d'éléments tirés de ce blog.

septembre 2022

lun. mar. mer. jeu. ven. sam. dim.
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    
Identité numérique et e-reputation :
DÉCOUVRIR COMMANDER OU LIRE EN LIGNE L'OUVRAGE