« Scanne moins fort, y'a le petit qui dort. | Accueil | Il paraît que la rentrée à l'université se passe bien. Faut voir. »

27 sep 2009

Commentaires

JM Salaun

Salut Olivier,

Quelques nuances rapides sur tes propos et ceux de BR (ou son avatar ;-).

Il y a bien un fort soubassement politique à cette saga, mais pas exactement où toi et lui le posez. Jeanneney est radicalement gaullien et ne s'en cache pas, Racine parait comme Sarkozy atlantiste. Cela marque fortement leur prise de positions. J'ajoute que les deux postures me paraissent aussi ringardes l'une que l'autre aujourd'hui.

Tu sousestimes largement l'ampleur de l'effort de numérisation concernant les documents en danger. Sans que je sois spécialiste, j'imagine que cela représente, entre autres, toute la presse du 19e ou encore les archives sonores ou audiovisuelles.. de quoi occuper bien des équipes pendant longtemps.

Une numérisation en mode texte commence par une numérisation en mode image que l'on Ocerise. Ton argument à ce sujet me parait spécieux.

Sinon d'accord en gros sur le reste. Mais personnellement, je crois que le pb n'est pas du côté de la BnF, mais de celui de Google et pourrait se formuler ainsi : doit-on laisser une firme assumer une mission de service public sans en assumer les devoirs ? Si la réponse est non, alors il sera possible de préciser quel sera le rôle de chacun, bibliothèques et firmes privées. Mais tant que Google sera libre de sa atratégie, le jeu sera faussé et les dégats risquent d'être importants pour les institutions dont les stratégies seront tâtonnantes et sans doute vouées à l'échec et pour les citoyens qui confient leur patrimoine (informationnel et culturel) et leur liberté de lectures aux intérêts privés de quelques uns. Une comparaison facile avec les aventures récentes des banquiers montre que cela n'est pas très raisonnable.

Olivier Ertzscheid

@JMSalaun > Concernant la numérisation mode texte/image, j'indiquais simplement (et je ne voie pas en quoi cela est spécieux), que la BnF avait pendant longtemps fait le choix de numériser en mode image et que l'entrée sur le "marché" et les usages de Google l'avait obligée à revenir à une numérisation en mode texte (= perte de temps et d'argent ... mais surtout de temps ...). L'affaire me semble avérée (de mémoire il y avait même eu à l'époque un communiqué officiel de la BnF sur le sujet).
Quant à l'effort de numérisation pour les documents anciens, je ne le sous-estime pas. J'indiquais simplement à B. Racine que s'il y avait des choix à faire en priorité, à côté de la numérisation des documents anciens, ils me semblaient être ceux que j'indique dans le billet.
Pour ce qui est enfin de la question des missions de service public et des devoirs associés, 200% d'accord avec toi.

Christophe Deschamps

En parlant d'innovation et de bibliothèque du Congrès : http://read.gov/

Bonne journée

Olivier Ertzscheid

@Christophe > Merci pour ce site que je ne connaissais pas. C'est un vrai cahier des charges des bonnes pratiques à lui tout seul ! :-)

Gilles Mioni

En tant que maître d'ouvrage de projets de numérisation, il semble que la B.N.F. ne tient pas à s'avancer dans des opérations liées à un domaine technologique qu'elle parait connaitre fort mal.

Cet attentisme, faute d'une réflexion stratégique sur le devenir numérique des contenus d'archives, présage d'un recul, s'il est possible de faire pire encore, de la culture et de la civilisation française qui rayonnent de moins en moins dans
« l'état d'exception culturelle » que nous subissons depuis les années 80.

Il serait urgent que les principaux acteurs de la culture et, singulièrement ceux du livre et des archives documentaires s'associent avec des partenaires qui possèdent une expertise indubitable dans les technologies industrielles de l'information.

Les bibliothèques et les éditeurs français ont le sentiment fallacieux de gérer des « trésors inestimables », ces contenus dont ils voudraient
« maximiser » la valeur selon leur convenance en les diffusant en formats numériques.

Rien n'est plus paradoxale que cette attitude ambivalente.

Pour les gestionnaires d'archives publiques qui possèdent effectivement des documents anciens dont l'extrême rareté en font toute la valeur, il est évident que, outre les problèmes techniques que posent leur numérisation, ces documents sont très fragiles, leur duplication entrainera inéluctablement une baisse « dramatique » de leur valeur intrinsèque.

La copie, réalisée à grand frais, mais qu'on peut reproduire à l'infini, n'a plus de valeur en soi. D'autant plus que ces contenus très anciens sont dans le domaine public.

Enfin, tant que ce point ne sera pas clarifié en France, car la question reste pendante, la B.N.F. refusant de répondre, qu'en est-il du régime de droit des contenu des fichiers numérisés dont les contenus sont issus de documents du domaine public?

Il en va de même pour les éditeurs, la valeur d'un contenu baisse considérablement pour ses exemplaires numérisés.
On connait maintenant le prix du marché d'un texte diffusé dan un format ebook : il varie entre 10 et 15 US$ (entre 6 et 10 € dans l'U.E.)

Ce point de vue est « tragique » puisque la valeur de n'importe quel document numérique dépend de ce qu'on appelle les « métadonnées ».

En simplifiant, on dira que ces données concernent particulièrement l'indexation et le référencement du document.
Bref toutes les informations qui permettent de se le procurer facilement.

Il est vraiment symptomatique qu'aucun organisme français, tant public que privé, n'ait cru bon de participer aux travaux des instances internationales qui définissent des normes industrielles de référencement pour internet .

Ces tergiversations sont désolantes puisqu'on ramène tout à un illusoire problème de
« possession » des contenus.

Alors même que la propriété des métadonnées ne fait pas doute :
elle revient de plein droit au maître d'ouvrage de la numérisation des documents.

Cela tombe très bien puisque ces données recèlent toute la valeur qui infère de la numérisation.

Sans elles, en effet, on ne peut pas savoir que le document « existe », serait-il la duplication numérique de la meilleure qualité d'un livre d'Heures du Moyen Âge somptueusement pourvu d'enluminures.

D'ailleurs si Google numérise en mode texte, c'est que ce choix stratégique enrichit ses bases de données de référencement et permet à n'importe quelle requête de recherche de s'appuyer sur la totalité du contenu pour fournir la réponse adéquate.

Ce qui prouve que le contenu n'a de sens (donc de valeur) que s'il « enrichit » les données des moteurs de recherches.

Quand au faux problème des œuvres dites
« orphelines », il n'y a pas pire duplicité que celle de tous les acteurs économiques et des politiciens associés qui se battent pour le partage de ces biens culturels en déshérence de propriétaire, il est pourtant très simple à résoudre :
Le principe de l'intérêt général devrait s'imposer et ces œuvres rejoindraient « naturellement » le domaine public (de façon réversible au cas ou un ayant-droit parviendrait à faire valoir la légitimité de sa propriété sur la dite-œuvre).

Tout autre appropriation par des acteurs publics ou privés serait purement et simplement une prise de possession immorale et dommageable au plus grand nombre.

Au fond, le problème se réduit à l'absence obstinée de moyens financiers et d'investisseurs dans l'U.E. afin de se doter d'une économie numérique qui s'appuierait sur une véritable industrie de l'information.

L'industrie numérique européenne, c'est la même « farce » que celle de Galileo, ce système de localisation satellitaire, l'invisible concurrent du GPS.

Tout le monde le souhaite personne ne veut dépenser quoi que ce soit.

Le secteur public convie avec insistance les investisseurs privées qui, en retour, sollicitent assidument ... les pouvoirs publics.
En attendant, les querelles byzantines vont bon train.

L'utilisation des commentaires est désactivée pour cette note.

Casssconn
"Mais quiconque affirme qu’il y a de l’argent à faire avec un stock d’ARTICLES SCIENTIFIQUES est soit un idiot, soit un menteur."
Lawrence Lessig. 12 Janvier 2013.
Le blog d'un maître de conférences en sciences de l'information.
Réflexions, analyses, signalements, opinions.

"Where is the Life we have lost in living?
Where is the wisdom we have lost in knowledge?
Where is the knowledge we have lost in information?"
T.S. Eliot, in Choruses from The Rock (1934)

Where is the information we've lost in Google ?

Botte de foin


Tous les contenus de ce blog sont sous licence Creative Commons. Vous pouvez donc les reproduire, les distribuer ou les communiquer à condition :
  • de citer l'auteur
  • de ne pas en faire d'utilisation commerciale
  • d'appliquer ces mêmes conditions à toute création qui résulterait d'une modification, transformation ou adaptation d'éléments tirés de ce blog.

septembre 2022

lun. mar. mer. jeu. ven. sam. dim.
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30    
Identité numérique et e-reputation :
DÉCOUVRIR COMMANDER OU LIRE EN LIGNE L'OUVRAGE