« novembre 2010 | Accueil | janvier 2011 »
Rédigé le 17 déc 2010 à 13:28 dans Rubrique à brac | Lien permanent | Commentaires (0) | TrackBack (0)
A quoi sert de numériser des millions d'ouvrages depuis 2005 ? A ça. Disposer de 4% de tous les livres publiés depuis 2 siècles. 7 langues. 2 milliards de mots. 5,2 millions de livres numérisés "inside" (voir l'article du NYTimes).
Deux corpus. Mais qu'est-ce qu'un corpus ?
Dans le domaine du droit, le corpus : "C'est l'élément matériel de la possession, le pourvoir de fiat exercé sur une chose. (Animus)."
Du premier corpus, celui de Google, on ne pourra que se réjouir, pour ce qu'il représente de potentialités ouvertes dans l'aventure linguistique comme compréhension du monde. Et l'on mettra du temps à en épuiser les possibles. Mais nul doute qu'il contribuera aussi à alimenter tous les fantasmes, celui, notamment, d'une "intelligence artificielle" dévoyée, apprenant à penser en déchiffrant ce que le plus grand corpus du monde révèle des pensées de ce même monde. Les ingénieurs ont même inventé un mot pour cela : "culturonomics". Culture et génomique. Enthousiasmant. Pour l'instant. Et pour les linguistes.
Du second corpus, celui de Facebook, on ne peut que continuer à raisonnablement s'alarmer. Surtout lorsque les techniques de traitement dudit corpus prennent cette orientation, rendant plus que jamais nécessaire la mise en oeuvre d'un littéral Habeas Corpus numérique.
Dans l'histoire des sciences, les scientifiques de tous les domaines, de toutes les époques, de toutes les disciplines, se sont en permanence efforcés de prendre l'ascendant sur leur différents corpus ; pour pouvoir être exploitable, le corpus doit pouvoir être circonscrit par ceux qui prétendent en faire l'analyse.
L'informatique, les outils de la linguistique de corpus ont permis aux linguistes de rester les maîtres de corpus aux dimensions exponentielles. Même chose dans le domaine de la médecine : disséquer une grenouille est une chose (et un corpus), séquencer le génome humain en est une autre. Dans tous ces cas comme dans les courbes proposées par Google, le scientifique est parvenu à "ruser" le monde pour user de son corpus.
Et donc ? Nos sociétés de données, nos sociétés d'une exponentielle et inconcevable immensité de données, nourissent en permanence des monstres calculatoires et industriels (voir les textes d'Hervé Le Crosnier sur le sujet, là ou là) qui, dans certains domaines, sont en passe d'être les seuls capables de circonscrire des corpus qui relèvent, pourtant, du bien commun. Aujourd'hui déjà la génomique, demain peut-être la linguistique, après demain qui sait, les traits culturels ? Culturonomics. Le génome de la culture.
S'il est vrai, comme le remarque Jean Véronis dans son billet que "la biologie et le traitement des langues partagent beaucoup de choses du côté des algorithmes et des mathématiques", je pense que le choix terminologique de Google dépasse, de loin, la seule interdisciplinarité ; Culturonomics : dans l'histoire de Google comme dans ses liens les plus intimes, la culture et le génome sont les deux brins d'un même ADN fondateur.
Moralité. Celui qui peut dire que la vie l'emporte sur la mort ne doit jamais se retrouver en situation d'être le seul à pouvoir le dire. Ou à prétendre le contraire. Ou à ne pas le dire. Il est de notre responsabilité collective d'y veiller. Habemus corpus. Ceci est notre corp(u)s.
Rédigé le 16 déc 2010 à 22:23 dans Document numérique, Ecologie de l'info, Moteurs et autres engins, Réseaux sociaux | Lien permanent | Commentaires (0) | TrackBack (0)
Rubrique "bibliométrie"
Rubrique e-reputation et gadgets
Rubrique Economie des moteurs (et de Google)
Rubrique Facebook & lol
Rubrique "plateformes de blog académiques / universitaires"
Rubrique politique (LRU et IUT)
Rubrique à brac
Rédigé le 15 déc 2010 à 15:34 dans Francoblogsciences, Moteurs et autres engins, Métier, Rubrique à brac | Lien permanent | Commentaires (0) | TrackBack (0)
There are currently 3 particularly “hot” topics in the small world of techies and geeks of all kinds:
My students will confirm it, in 2006 I had already announced that Google would one day become a bookseller. And I also said it would not be later than 2010. That was close (just 25 days left before 2011), but I won my bet :-) December 6 will remain as the official date of the launch of Google Edition: http://books.google.com/ebooks.
Available only in the United States, opening for Europe (and France?) is announced in early 2011 (“first quarter 2011″).
One question, first.
Why start Google Edition now and in some kind of hurry? Because it is nearly Christmas and … / … all indicators and all analysts say this Christmas is that of touch pads and other e-readers.
For info, and according to a study by Forrester cited here, “the U.S. market represents nearly $ 1 billion in 2010 and is expected to triple by 2015“, on the other hand, here, “the e-book market is growing : +200% of sales in 2009 for the United States.”
The issue of numbers. Tough one. For some, adopting the firm official communication, Google Edition represents “three million books out of the 15 million books that have been digitalized up to now by the search engine, taken from catalogues of 35,000 publishers and over 400 libraries.” The truth is likely to be sought in the Book Review from the Los Angeles Times: 2.7 million public domain books + 250,000 books copyrighted = close to 3 million books, out of the 15 million that Google said to have digitalized, and in which there are at least 60% of orphan works that would not be, for now and until the court decides, in the introductory edition of Google.
The issue of competitors: well … there are a lot of them: Amazon, Apple, Amazon, Apple, Amazon, Apple. Maybe Barnes & Noble as well (the largest American bookseller).
The issue of (small independent) publishers. Well, yeah. In the crazy world of bookstores, the same Google, which yesterday was the big bad wolf is now poised to become the lifeline of the independent bookstores. Google is to provide them the bricks needed to build their digital library. Unless it provides the tar and feathers necessary for their first-class burial. But suddenly, the big bad enemy of the independent bookstores is Amazon, and Google is liked, forgiven, and gets itself a skilled workforce that will help it to quickly sell … its books. Or how to cheaply create a chain of Google franchised bookstores (let’s recall there are as many independent bookstores in France as throughout the U.S., and if the news is greeted with enthusiasm by the alliance of independent U.S. booksellers, enthusiasm may be less spontaneous on the side of French Bookstore Union…
The issue of reading materials. One can read the books purchased on Google Edition on almost everything and all the touch pads/smartphones/e-readers /Ipad … with the notable exception of Amazon Kindle :-)
The issue of sharing the pie. Yoooo! It’s gonna be tough (see here the “pricing options”). So, many options. We know that for copyrighted works, and only for these:
Let’s recall that since Google regulations (and even if they still have not been finally approved by the U.S. justice) and concerning Orphan Works, if copyright holders are known they can decide of the sale price, but for the vast majority of works without known copyright holders, and unless otherwise agreed (as in the case of Hachette), it is Google and only Google which will set and modify (at its will) the price (in the range of 12 price band between $1.99 and $ 29. 99).
The issue of sharing the pie (again). Since 2009, I keep betting with my students that Google will introduce on Google Edition an equivalent to the adwords model to compensate authors not only on “the percentage of sales” but also – and perhaps especially – on “ consultation “. Others (Forrester’s analyst) are not far from following me and assume the creation of an “ad-supported publishing model ” in which Google sells sponsored links (= offers campaign adwords) on the content of books:
I almost forgot: the weird machine that can print and bind a 300 pages book in 5 minutes is arriving in Europe. It can already be found in 53 libraries and bookstores in the United States. Did I tell you yet that Google was a partner of the Espresso Book Machine?
The moral is: Google Edition is actually a bookstore. Google Print was actually a library. Just have to wait now for the launch of Google Library, which will, in fact, be a publisher. I would see that coming in, let’s say, 2 years time ;-)
Et oui ! Je suis donc officiellement embarqué dans la plateforme e-blogs (blogs européens) de Wikio. Merci à l'équipe de Wikio et aux traducteurs. Pour les autres versions :
. La version longue et originale (en français) est ici.
That's it ! I'm officially engaged in the new Wikio e-blogs platform (European Blogs). Thanks to the wikio team and congrats to the translators. For other versions of this post :
. The original - and long - version of this post (in french) is still accessible.
Rédigé le 14 déc 2010 à 12:48 dans Google Print/Books | Lien permanent | Commentaires (0) | TrackBack (0)
Il est bien des signaux qui permettent de mesurer l'omniprésence des moteurs (et de Google) dans nos vies numériques. Il en est un assez peu souvent évoqué : les moteurs (et Google) comme marque-pages du livre-web, de ce livre en reconfiguration permanente qu'est le web.
En témoignent les "tops", "palmarès" et autres "zeitgeist" des différents moteurs faisant été des mots-clés les plus saisis. Dernier en date, celui de Google indique que "Facebook" est la requête la plus populaire ; même chose chez Yahoo, Bing (moteur de microsoft) donnant davantage dans le people. Il y aurait d'ailleurs là sujet à une belle étude pour établir le profil sociologique des utilisateurs des différents moteurs. Mas là n'est pas l'objet de ce billet. "Facebook" est donc la requête la plus populaire sur Google, mais aussi, pour la France :
Pour l'Allemagne :
Etc.
"Facebook". L'un des sites sur lequel chaque internaute passe pourtant le plus clair du temps de sa vie connectée. Le réseau social par excellence. Pourquoi taper Facebook ou Youtube dans un moteur plutôt que directement dans la barre d'adresse de son navigateur en y ajoutant simplement un .com ou un .fr ? Pourquoi ajouter ainsi une étape souvent inutile dans le processus cognitif de requêtage ?
Probablement parce que la plupart des internautes choisissent de paramétrer leurs navigateurs avec l'adresse d'un moteur comme page d'accueil par défaut.
Probablement aussi parce que les moteurs (et Google) ont passé des accords avec - notamment - Mozilla / Firefox pour que - sauf réglage contraire de l'utilisateur - la page d'accueil du moteur soit aussi, et par défaut, celle de la porte sur le web de l'internaute.
Probablement parce que de la même manière que nous sommes de plus en plus incapables de retenir un numéro de téléphone à 10 chiffres, grâce ou à cause de nos mémoires externes portatives que sont nos tléphones portables, nous sommes aujourd'hui de plus en plus incapables de "mémoriser" des adresses web pourtant évidentes.
Probblement enfin parce que peu de gens utilisent encore les "signets / bookmarks / favoris" de leurs navigateurs, leur préférant des versions plus collaboratives (delicious par exemple).
Google et les moteurs comme marque-pages du réseau livre. Nos marque-pages habituels, ceux du monde non-numérique, n'ont pas de mémoire. Ces marque-pages numériques sont une partie de nos mémoires. Des mémoires pourtant fondamentalement dissemblables. Nos téléphones mémorisent les numéros de nos contacts pour nous en éviter la saisie et pour nous alléger de ces micro-charges mémorielles. Google et les moteurs nous évitent pareillement certaines saisies, nous permettent de faire cette économie du texte de la requête, mais Google et les moteurs se souviennent de ces saisies ; ils les quantifient. Et de cette quantification vient précisément leur qualification.
Moralité. Il est des mémoires (externalisées) qui sont faites pour nous permettre d'oublier certaines choses. Il en est d'autres bâties dans le dessein de permettre à leurs hôtes de se souvenir de certaines choses. La question des mémoires (biologiques, documentaires ou informatiques) appelle directement celle de leur effacement et de leur perte. Nul ne peut dire si quelque chose de nous est en train de se perdre dans ces mémoires là. Pas davantage que l'on n'est en mesure d'anticiper ou de prédire leur effacement accidentel. Des marque-pages à l'image du livre qu'ils balisent : faits pour en recalculer en permanence la marque. Le web comme livre. Un livre de sable. Dont la seule permanence réside dans l'extériorité de ceux dont la puissance calculatoire permet d'en fixer le grain. Chaque grain. Le g(r)ain ou la perte.
del *.*
Rédigé le 13 déc 2010 à 21:57 dans Document numérique, Ecologie de l'info, Moteurs et autres engins | Lien permanent | Commentaires (3) | TrackBack (0)
L'actualité autour de Wikileaks (qui n'est pas prête de s'éteindre) permet de mettre en lumière un certain nombre de points qui me semblent très emblématiques de l'écosystème internet en général et d'une géopolitique du Net en particulier.
Le politique et le juridique. D'abord parce que Wikileaks questionne directement et très pragmatiquement un certain aspect du débat sur la neutralité du net et l'arsenal législatif (Hadopi, Loppsi et tutti quanti) qui lui est assorti. La sortie d'Eric Besson demandant l'interdiction de l'hébergement de Wikileaks en France (et oubliant du même coup qu'il s'expose lui-même à des poursuites pénales) en est l'exemple parfait (et navrant), de même que la réaction d'OVH met l'accent sur la complexité (et le flou juridique) autour de ces questions. La justice a d'ailleurs refusé de se prononcer en indiquant qu'un tel dossier «nécessitait un débat contradictoire». Dont acte.
... ... ... ... ... ... Cultiver "son" jardin fermé.
Les jardins fermés du village global. Le web n'est pas une médiasphère unique et univoque mais la conjonction d'au moins trois médiasphères interreliées et dépendantes, comme cela fut très bien mis en image ici, à partir de l'analyse sus-liée.
Dans l'une de ses récentes tribunes, Tim Berners Lee décrivait Facebook comme un "walled garden". De fait, les contenus du village global s'exposent aujourd'hui à plusieurs types de murs ou de dépendances socio-techniques.
Les dépendances techniques : celles de leur hébergement. Sans hébergement, pas d'accès. Ce qui vaut pour les forums et autres micro-blogs (micro-web) vaut également pour le meso-web mais également - c'est ce que démontre Wikileaks, pour des sites "institutionnels" (macro-net) que l'on pouvait penser "un peu plus" à l'abri.
Les dépendances "sociales". Qui sont en fait des dépendances "morales" ou plutôt "moralisantes" (une "cybernétique de la morale") et de fait totalement aléatoires, d'où le problème. Je fais ici référence à la prise de position des deux grands jardins fermés du web concernant Wikileaks : Twitter et Facebook. Si Facebook refuse, pour l'instant, de supprimer les pages Wikileaks, Twitter en revanche, déjà suspecté de ne pas faire remonter le hashtag "wikileaks" dans ses "trending topics", à la question de savoir si le compte Wikileaks resterait en ligne répond simplement : "pas de commentaires".
Les dépendances socio-techniques à proprement parler, c'est à dire la manière dont les usagers et les sites pourvoyeurs/hébergeurs de contenus s'exposent à différents types de contraintes, dans différents types d'environnements, la manière dont s'organisent, du point de vue de ces mêmes usagers et/ou contenus le ratio entre les gains (facilité d'utilisation, rapidité et ubiquité de l'accès, gratuité, etc.) et les pertes (dépossession, traçabilité accrue, contrôle, perte de l'anonymat, dépendance à l'outil, etc.)
Quels enseignements ? Wikileaks et Julian Assange ont choisi, pour le CableGate la stratégie suivante : mettre en accès sur leur site la quasi-intégralité des cables diplomatiques, et diffuser, via les grands médias (5 journaux de renommée internationale dont Le Monde**) des cables "choisis" et éditorialisés. Assange avait également probablement prévu que les réseaux sociaux mainstream (dont Twitter et Facebook) assureraient une caisse de résonance suffisante et imprescriptible au succès de l'opération. Oui mais.
**outre-atlantique, certains hommes politiques "anti-wikileaks" n'hésitent d'ailleurs pas à poser la question de la responsabilité pénale et juridique des partenaires presse de l'opération.
Oui mais le site principal de recherche et d'accès aux cables diplomatiques est désormais inaccessible (faute de DNS et peut-être bientôt d'hébergeur). Ce qui n'empêche pas le geek de base de passer par l'immensité des sites miroirs à disposition, mais ce qui dissuade le grand public d'y accéder, permettant donc d'atteindre l'objectif des anti-wikileaks. Soit la stratégie 1 : évacuer la population.
Oui mais les "grands journaux partenaires" n'offrent qu'une version très parcimonieuse et expurgée** de cette matière première (300 cables publiés sur plus de 250 000 disponibles). Soit la stratégie 2 : contrôler la communication de l'événement.
** a contrario, l'initiative du journal Libération d'héberger un site miroir de Wikileaks, est à saluer.
Oui mais les jardins fermés du village global, dernier "rempart" pour l'accès du grand public, sont en passe, ou tout du moins en situation, au nom de principes qui n'appartiennent qu'à eux seuls et à leurs CGU (conditions générales d'utilisation) de tarir également la présence et l'effet viral de l'opération Wikileaks. Soit la stratégie 3 : éviter la propagation.
L'écosystème - ou le plan de communication - ainsi réfléchi aurait donc pu - si Facebook et Twitter avaient décidé de vérouiller les pages wikileaks - se révéler un fiasco, coupé de sa base (d'hébergement) et de sa base (populaire et relayée sur les réseaux sociaux).
Les contre-pouvoirs numériques. L'activisme numérique (digital hacktivism) ne date certes pas des derniers rebondissements de l'affaire Wikileaks. Mais comme le montre cet article sur l'opération "Avenge Assange" (vengons Assange), il se tourne aujourd'hui non pas vers les sites "princeps" (on attaque le site de Danone ou celui de Monsanto) mais vers des sites "tiers", en l'occurence Paypal ou Mastercard, lesquels ont "coupé les vivres" de Wikileaks. Il consiste également à utiliser des sites tiers (miroirs) pour garantir la présence en ligne d'une entité d'information donnée (en l'occurence Wikileaks), illustrant une nouvelle fois le principe de "l'effet Streisand" selon lequel toute information que l'on tente publiquement et ostensiblement de censurer ou de faire disparaître reçoit, à l'inverse, une publicité et une visibilité accrue en étant largement disséminée sur différents sites miroirs ou dans des réseaux Peer to peer.
Pour l'instant, ces hacktivistes peuvent également s'appuyer sur le vide juridique sus-mentionné qui permet, en France par exemple, à OVH de continuer à héberger le site. Pour l'instant ...
... ... ... ... ... Le code, c'est le territoire
Le politique est donc contraint de se positionner : soit pour approuver et soutenir l'initiative de Wikileaks (Lula est l'un des seuls à l'avoir fait ouvertement), soit pour gesticuler en censeur (comme en atteste la demande d'interdiction d'Eric Besson), soit pour contraindre. <Update du soir> soit pour entrer à son tour dans un jeu d'hacktivisme : témoin ce faux site miroir mis en place par la CIA et démasqué par une simple requête sur Google ah ben non en fait, c'était bidon, même Boing-Boing s'est fait avoir, j'ai l'air malin, gulp :-( </Update>
Les prises de position et de parole publique des différents états attestent d'ailleurs, s'il en était encore besoin, que c'est bien d'une guerre de territoire et de frontières qu'il s'agit : "La mise en ligne des “cables”, c’est l’annexion par le réseau d’une partie du territoire de l’État !"
Lawrence Lessig avait déjà démontré l'axiome selon lequel : "le code, c'est la loi" (code is law) ; Wikileaks vient de démontrer que le code est aujourd'hui le territoire.
La géopolitique du net. Remember ...
L'épisode Wikileaks pourrait - sans préjuger de son issue - marquer un tournant dans la dissémination des informations sur le réseau. La prédominance écrasante des certains noeuds du réseau (dont Facebook et Twitter) cristallise les effets de viralité jadis consubstantiels à la nature profondément maillée du web. On assiste en parallèle à d'importantes reconfigurations des politiques, des pouvoirs, des autorités sur les contenus. Le web est de moins en moins un espace, il devient chaque jour un peu plus un territoire, le lieu de territorialités affirmées par ceux qui les détiennent, mais non assumées par ceux qui y naviguent. Des territorialités avec leurs frontières. Ce qui, en soi, ne pose d'ailleurs pas particulièrement de problème, à part peut-être aux législateurs d'hier. Le problème vient de la nature des espaces occupés par lesdits territoires : il s'agit d'espaces privés (= appartenant à des sociétés privées), occupés publiquement, ou semi-publiquement.
Au-delà des seules positions de Facebook (pour l'instant relativement neutre) ou de Twitter (plutôt hostile), et comme le fait depuis longtemps Apple pour ses produits, ne perdons jamais de vue que les propriétaires de ces territoires peuvent à tout moment indiquer à leurs occupants à titre gratuit qu'ils entendent éditer leurs propres règles de circulation à l'intérieur de leurs frontières. Et que le poids du politique pourrait n'être pas étranger à l'édiction de ces règles.
Est-ce là le prix à payer pour l'entrée du web dans l'âge adulte ? Est-ce le résultat de cette massification tant attendue des accès et des usages ? Ou ne fait-on que redécouvrir la vraie nature des lieux dans lesquels circulent et se diffusent les informations, c'est à dire de ne pas pouvoir faire l'économie d'une dimension politique qui leur est consubstancielle ? LA bibliothèque fut d'abord et avant tout le lieu de l'exercice d'un pouvoir, celui d'un contrôle sur le monde, sur la dimension collectivement inscriptible du monde, sur l'exercice d'une mémoire collective et sur la volonté de la livrer en partage aux autres, à tous les autres. Les sociabilités aujourd'hui au centre et à la périphérie de la bibliothèque comme lieu (topos) ne se construisirent que beaucoup plus tardivement et à l'initiative du politique.
Le monde numérique tel qu'incarné par les réseaux sociaux en général, en inversant cette logique, en commençant par bâtir des lieux de sociabilité en dehors du politique (au sens noble) pour ensuite seulement ouvrir les vannes de toutes les circulations documentaires possibles entre les sociabilités rassemblées, est dans l'incapacité totale, absolue, intrinsèque, de réguler ces flux de manière convenable - c'est à dire en s'interdisant l'arbitraire.
Voilà pour la version pessimiste de l'affaire. Mais il est également possible de considérer - pour les plus optimistes - que le même monde numérique n'a pas encore eu le temps d'inventer et d'incarner les codes lui permettant de juguler l'arbitraire, son arbitraire. Ces mêmes codes que les bibliothèques mirent des centaines d'années à inventer, à appliquer, et qui, sous l'impulsion politique encore, peuvent en quelques mois être réduites à néant (exemple ici, ou là).
La construction documentaire d'un monde, d'un pays, d'une civilisation, d'un homme, d'un peuple est absolument déterminante. Déterminante parce qu'elle déterminera à son tour la manière dont seront constituées, accédées et partagées leurs mémoires individuelles ou collectives. De ce projet documentaire là, le politique ne peut ni ne devrait être absent. Tout au contraire faut-il qu'il y préside. En son absence, en l'absence d'une vision politique ou d'un projet de même nature, il ne reste de place que pour l'arbitraire et l'ingérable profusion de productions documentaires auto-centrées, nécessairement narcissiques, intrinsèquement vaines, ou pour la mise en oeuvre, identiquement arbitraire - mais téléologique et marchande - de sociétés du contrôle.
Notre monde, notre rapport au savoir (et donc à une certaine forme de pouvoir) est l'héritier direct d'Assurbanipal, l'héritier du projet politique de la bibliothèque d'Alexandrie, plus proche de nous, l'héritier du Mundaneum de Paul Otlet, plus proche de nous encore, l'héritier du web comme un "réseau de réseaux, non-propriétaire, sans droits d'accès", l'héritier d'un web qui avait permis à LA bibliothèque de s'affranchir de sa matérialité en préservant sa dynamique de conservation par acculumation et en lui conférant une amplitude dont elle n'aurait jamais osé rêver ; les moteurs de recherche eux-mêmes n'avaient pas réussi à épuiser cet héritage, Google lui-même restait, d'une certaine manière inscrit dans un ordre documentaire de même nature : s'il fut le premier à pourvoir mettre en place une "mise à l'index" du web qui en respecte ou qui en restitue l'échelle (voir ce billet), cet index ne dénaturait en rien la topologie même du réseau ; il modifie certes radicalement l'ordre documentaire sur lequel nous nous appuyons, mais il ne le modifie pas irrémédiablement parce qu'il le laisse accessible à des catastrophes (au sens de René Thom), à des accidents (au sens de Virilio), à des détournements. Ce qui n'est pas le cas des "walled gardens".
Se souvenir, aussi, que les premières bibliothèques s'érigèrent sur le base de projets confiscatoires :
"[...] Emmène avec toi trois hommes et les lettrés de Borsippa et cherche toutes les tablettes, celles qui sont dans leurs maisons et celles qui sont déposées dans le temple Ézida [...]. Recherche les tablettes de valeur [...] qui n’existent pas en Assyrie et envoie-les moi. J’ai écrit aux fonctionnaires et aux inspecteurs [...] et personne ne peut refuser de te livrer une tablette. Et si tu vois un texte ou un rituel à propos duquel je ne t’ai pas écrit, mais dont tu crois qu’il pourra être utile dans mon palais, cherche-le, prends-le et envoie-le moi" (1).
Facebook est également un projet de nature confiscatoire, dont notre naïf assentiment est le premier des atouts. Il ne nous donne accès qu'à l'archive, c'est à dire à la la masse constituée du simple dépôt de documents, de profils successifs, cependant qu'il constitue, à son usage seul, la première bibliothèque de l'intime (ou de l'extime) de la planète connectée, une bibliothèque comme un rassemblement méthodique, orienté vers un but, organisé de manière systématique.
(à suivre ...)
Le prochain billet tentera de mettre en pespective l'ordre documentaire de Facebook, Google et Apple au regard de celui dans lequel s'inscrivent les bibliothèques, à la lumière de 2 analyses, celle du RTP-DOC sur la théorie du document et celle de Pierre Lévy définissant les 6 principes de l'organisation hypertextuelle des connaissances.
(1) Jean-Jacques Glassner « Des dieux, des scribes et des savants », Annales. Histoire, Sciences Sociales 3/2005 (60e année), p. 483-506. URL : www.cairn.info/revue-annales-2005-3-page-483.htm.
Rédigé le 12 déc 2010 à 21:07 dans Document numérique, Ecologie de l'info, Moteurs et autres engins, Réseaux sociaux | Lien permanent | Commentaires (4) | TrackBack (0)
Coup de tonnerre dans le monde des bibliothèques : le fondateur de Gallica va faire l'objet d'un mandat d'arrêt international par Interpol. Bruno Racine, actuellement à la tête de la BnF et donc en charge du déploiement du projet pourrait également faire l'objet de poursuites pour atteinte à la sécurité de l'état. D'autre part, suite à la demande d'Eric Besson, l'hébergeur de la bibliothèque numérique française empêchera l'accès au site sur tout le territoire français. Gallica diffuse en effet au mépris de toutes les règles de confidentialité des documents sensibles sur l'histoire de la diplomatie française.
Rédigé le 10 déc 2010 à 09:17 dans Rubrique à brac | Lien permanent | Commentaires (1) | TrackBack (0)
Côté Wikileaks
Côté Google Books / Edition / Ebookstore / chaîne du livre et tout le pataques
Côté testing
Côté politique
Côté satisfecit
Côté lol mais alors vraiment lol
Côté ego :
Rédigé le 08 déc 2010 à 21:22 dans Document numérique, Google Print/Books | Lien permanent | Commentaires (0) | TrackBack (0)
Il y a actuellement 3 sujets particulièrement "chauds" dans le petit monde des technophiles et geeks en tout genre :
Mes étudiants vous le confirmeront, j'avais dès 2006 annoncé que Google deviendrait un jour libraire. Et j'avais également indiqué qu'il le serait au plus tard en 2010. Il s'en est donc fallu de peu (25 jours), mais j'ai gagné mon pari :-) Le 6 décembre restera donc comme la date officielle de lancement de Google Edition : http://books.google.com/ebooks.
Disponible uniquement aux Etats-Unis, l'ouverture pour l'Europe (et la France ?) et annoncée pour le début 2011 ("first quarter 2011").
Pas le temps de faire un billet d'analyse, je me lance donc, par défaut, dans une petite revue de liens qui permettront, je l'espère, de circonscrire les principaux enjeux de ce lancement. Car figurez-vous qu'en plus de ce lancement, Google a, ces derniers jours, multiplié les annonces. Mais d'abord une question.
Pourquoi lancer Google Edition maintenant et dans une (relative) précipitation ? Parce que c'est bientôt Noël et parce que comme tous les foyers qui peuvent faire flamber leur carte bleue pour l'occasion sont déjà équipés de cafetières, de micro-ondes, d'ordinateurs, et de lecteurs DVD, tous les indicateurs et tous les analystes le disent : ce noël sera celui des tablettes tactiles et autres e-readers (liseuses). L'Ipad va faire un carton (même si je vous conseille d'attendre la prochaine version). Et outre-atlantique, les ebooks vont se vendre comme des petits pains (ben oui, faudra bien remplir les sus-citées tablettes et autres e-readers). Donc c'eût été digne de la stratégie d'un vendeur de sable en afrique sub-saharienne que de ne pas lancer Google Edition avant les fêtes de Noël (pour info, et d'après une étude de Forrester citée ici, "le marché US représente près de 1 milliard de dollars en 2010 et devrait tripler d'ici 2015", d'autre part, ici, "le marché du livre électronique progresse : +200% de ventes en 2009 pour les États-Unis").
La question des chiffres. Epineuse. Pour certains, reprenant la communication officielle de la firme, pour certains donc, Google Edition c'est "3 millions de livres sur les 15 millions d'ouvrages numérisés à ce jour par le moteur, issus des catalogues de 35.000 éditeurs et plus de 400 bibliothèques." (source) Pour d'autres, dans Google Edition on partirait sur "4000 éditeurs pour environ 200 000 livres mis en vente. Les éditeurs recevront jusqu'à 52 % du prix de vente." (source) La vérité est ailleurs probablement à chercher du côté du supplément Livres du Los Angeles Times :
Voilà. 2,7 millions d'ouvrages du domaine public + 250 000 ouvrages sous droits = pas loin de 3 millions d'ouvrages, sur les 15 millions que Google dit avoir numérisé, et dans lesquels figurent au moins 60% d'oeuvres orphelines qui ne seraient donc pas, pour l'instant et en attendant que la justice se prononce sur la dernière version du règlement Google, qui ne seraient donc pas dans l'offre de lancement de Google Edition.
La question des droits (et des ayants-droit). Problème épineux et consubstantiel de Google Books (cf les différents procès et la mise sous coupe réglée le réglement afférent). Avant de lancer Google Edition, Google s'est aussi efforcé de faire bonne figure auprès des ayants-droit :
La question des DRM. On a beaucoup dit (et écrit) que la caractéristique de Google Edition serait l'absence de DRM. Faux. Il y aura bien des DRM. Reste à savoir s'ils seront limités aux oeuvres sous droits ou s'ils seront étendus aux oeuvres orphelines. Cette question constituera un des points à surveiller tout particulièrement. Le modèle de l'allocation proposé par Google permettant en effet partiellement d'évacuer la question des DRM castrateurs, question certes sensible pour les ayants-droits et les éditeurs mais aussi et surtout facteur ô combien bloquant pour le décollage du marché.
La question des formats. La plupart des ouvrages disponibles sur Google Edition seront - c'était annoncé et cela reste une bonne nouvelle - au format open-source Epub. J'ai bien dit la plupart.
La question des concurrents : ben ... des concurrents y'en a plein : Amazon, Apple, Amazon, Apple, Amazon, Apple. Peut-être aussi Barnes&Noble (plus gros libraire américain).
La question des (petits) libraires (indépendants). Ben oui. Dans ce monde un peu fou de la librairie (et pas que dans celui-là d'ailleurs), le même Google qui était hier le grand méchant ogre est aujourd'hui en passe de devenir la planche de salut de la librairie indépendante. Google leur fournirait les briques et le mortier ("brick and mortar") nécessaires à la construction de leur librairie numérique. A moins qu'il ne s'agisse du goudron et des plumes nécessaires à son enterrement de première classe. Mais du coup, le grand méchant ennemi de la librairie indépendante reste Amazon et Google s'offre une relative virginité ainsi qu'une main d'oeuvre qualifiée qui fera diligence pour aider le même Google à vendre ... ses livres. Ou comment créer à moindre frais une chaîne de libraires franchisés Google (rappelons pour mémoire qu'il y autant de libraires indépendants en France que sur tout le territoire américain, et si la nouvelle est accueillie avec enthousiasme par l'alliance des libraires indépendants américains, l'enthousiasme risque d'être moins spontané du côté du Syndicat de la Librairie Française ...)
La question des supports de lecture. C'est là où Google Edition s'inscrit en rupture du modèle dominant avec sa stratégie de l'allocation. Mais on pourra aussi lire les ouvrages achetés sur Google Edition sur à peu près tout et toutes les tablettes / smartphones / e-readers / Ipad (via une application en cours de développement) ... à l'exception notable du Kindle d'Amazon :-)
La question du nuage (comme support de lecture). Les ouvrages de Google Edition sont (et resteront pour la plupart d'entre eux) dans les nuages du cloud computing. Or on apprend que Google lancerait demain (mardi 7 décembre) son système d'exploitation Chrome OS, permettant d'équiper d'ici Noël les premiers Netbooks tournant sous Chrome OS, le même Chrome OS étant la première version à supporter le Chrome Web Store et son magasin d'application sur le même modèle qu'Apple (apprend-on ici). Donc ? Donc en plus des tablettes, smartphones, PC et e-books, Google se réserve aussi son Netbook comme potentiel support de lecture, et comme fournisseur d'applications pour sa chaîne de libraires franchisés.
La question du partage du gâteau. Houlala. Va falloir s'accrocher (voir par ici les "pricing options") Plusieurs options donc. Les librairies indépendantes franchisées. Le modèle d'agence (c'est l'éditeur et non le libraire qui fixe le prix). On sait que, pour les ouvrages sous droits et uniquement ceux-là :
Rappelons au passage que depuis le règlement Google (et même si celui-ci n'est toujours pas définitivement validé par la justice américaine), et concernant les oeuvres orphelines, si les ayants-droits sont connus ils peuvent fixer le prix de vente, mais pour l'immense majorité des oeuvres sans ayants-droits connus, et sauf accord particulier (comme dans le cas d'Hachette), c'est Google et lui seul qui fixera et modifiera comme il l'entend son prix (dans une fourchette de 12 tranches de prix comprises entre 1;99 $ et 29;99 $)
La question du partage du gâteau (encore). Je fais et refais, depuis 2009, le pari avec mes étudiants que Google mettra en place sur Google Edition un équivalent du modèle adwords permettant de rémunérer les auteurs non pas uniquement "au pourcentage des ventes" mais aussi - et peut-être surtout - "à la consultation". D'autres (analyste chez Forrester) ne sont pas loin de me suivre et font l'hypothèse de la création d'un "ad-supported publishing model" dans lequel Google vendra des liens sponsorisés (= proposera des campages adwords) sur le contenu des ouvrages :
Une question ouverte. Le réglement Google (settlement) n'ayant toujours pas été définitivement validé, reste la question de savoir si les oeuvres orphelines dont les ayants droits ne sont pas connus figureront ou non dans le pack de départ de Google Edition. L'AFP et Letemps.ch semblent penser que non. J'incline à penser que oui, parce que primo, bien malin celui qui réussira à les y dénicher, que deuxio, la "chaîne du livre sous droit" va avoir d'autres soucis immédiats à gérer en terme de positionnement et de choix stratégiques, et que tertio, le contrat avec Hachette risque de faire tâche d'huile et qu'une fois que la tâche sera suffisamment grande, Google pourra alors ouvrir en grand le robinet des oeuvres orphelines, sans grande crainte de représailles ou de procès.
J'allais oublier : la machine bizarroïde qui vous imprime et vous relie un livre de 300 pages en 5 minutes arrive en Europe. Elle est déjà présente dans 53 bibliothèques et librairies des Etats-Unis. Je vous ai déjà dit que Google était partenaire de l'Espresso Book Machine ?
Moralité : Google Edition est en fait une librairie. Google Print était en fait une bibliothèque. Ne reste plus qu'à attendre le lancement de Google Library qui sera en fait une maison d'édition. Je verrai bien ça pour dans 2 ans ;-)
<Update> Lire aussi l'expérience utilisateur et les réflexions d'Hubert sur La Feuille. </Update>
Sources utilisées pour la rédaction de ce billet (dans le désordre). Les ** signalent les articles particulièrement intéressants et/ou synthétiques (de mon point de vue) :
Rédigé le 06 déc 2010 à 23:58 dans Document numérique, Ecologie de l'info, Google Print/Books | Lien permanent | Commentaires (2) | TrackBack (0)
Avertissement au lecteur : billet dans lequel il sera notablement question du web, de son avenir, d'écluses, de navigateurs, de théorie des graphes, de fractales et dans lequel les termes de "graphologue" et de "graphomane" seront délibérement employés de manière parfaitement fantaisiste.
Vous êtes ici.
Pourquoi le web, pourtant si bifurquant, si rhizomatique, si sensiblement épars, nous semble-t-il si aisément abordable, si facilement traversable, embarqués que nous sommes, équipage de moussaillons mal dégrossis derrière leur navigateur (browser), vaisseau amiral en haute mer des hyperliens possibles ?
Est-ce là la seule grâce et le seul fait d'une formidable et trans-maritime écluse répondant au nom de Google ? Est-ce là l'inaléniable mérite de "moteurs" de recherche fixant eux-mêmes le cap, listant par défaut quelles routes seront ouvertes et traversables parce que par eux-mêmes balisées (indexées) et quelles voies resteront inaccessibles sauf à quelques rares mais essentiels navigateurs chevronnés ?
Non.
Si le web, malgré son immensité de contenus donc, nous est rendu appropriable, si le sentiment d'être "lost in hyperspace" s'efface souvent au profit d'une découverte hasardeuse, heureuse (sérendipité) et rassurante, c'est pour une raison simple.
Le web. Aller et retour.
C'est parce que le web est un graphe. Mais un graphe particulier. Un graphe à invariance d'échelle(1), c'est à dire avec de la redondance, beaucoup de redondance, c'est à dire un graphe ni vraiment aléatoire ni vraiment hiérarchique. C'est à dire un graphe dont l'immensité relationnelle, dont l'extraordinaire densité n'oblitère pas la possibilité offerte à chacun d'entre nous d'en mesurer le diamètre ; mieux, de faire l'expérience de cette mesure, de faire le tour du web.
Le diamètre d'un graphe, c'est la plus longue distance entre deux noeuds. Le diamètre du web, c'est la plus longue distance entre deux liens hypertextes. LE spécialiste intergalactique des graphes, Laszlo Barabasi(2) a mesuré ce que nous ne faisons la plupart du temps que ressentir en naviguant, c'est à dire cette impression d'avoir fait le tour, de revenir à notre point de départ ou à quelque chose qui lui ressemble étrangement. Laszlo Barabasi a mesuré le diamètre du web. C'était en 1999. Et il était de 19 liens.
Avec mon camarade Gabriel Gallezot, dans un article fondateur - bien que jamais publié en papier ;-) -, dans cet article nous écrivions derechef que :
D'où ce sentiment de proximité, de complétude, de confort de navigation (plutôt que d'errance), de communauté, de "village global" devant ce qui devrait pourtant nous apparaître comme une immensité par définition non-traversable puisque impossible à cartographier parce qu'en perpétuel mouvement.
Des graphes et des fractales.
Car tel est le web. Tout au moins celui des premiers temps. Car depuis le web - et depuis le temps - sont apparus des graphes dans le graphe. Ils ont pour nom Flickr, YouTube, LiveJournal (plate-forme de blogs) et tant d'autres. D'autres(3) en ont également établi les diamètres respectifs :
Des petits web dans le web. Du genre des petits ruisseaux qui font les grandes rivières. Sur un mode fractal, c'est à dire partageant les mêmes propriétés de graphes invariants d'échelle. Jusqu'à un certain point.
Graphologues contre graphomanes.
Si les graphologues sont (1), (2) et (3) - parmi d'autres - c'est à dire des gens qui font profession de l'établissement de graphes capables d'attester de la naviguabilité réelle du web, existent aussi ceux que l'on nommera graphomanes ou graphophobes et qui font profession ou voeu d'abaisser significativement le diamètre dudit graphe jusqu'à idéalement le réduire à un point, c'est à dire - heureusement - une aporie, mais également le rêve cauchemar d'un monde où tout est univoquement connecté à tout, un monde dans lequel chacun est simultanément en contact avec les autres, avec tous les autres, en permanence.
Abolir le fractal.
Si la dimension fractale du web des origines - comme pour l'exemple célèbre de la côté de la Bretagne - permettait l'agrandissement de ses dimensions (donc de sa naviguabilité, de sa possible exploration) au fur et à mesure du rapprochement de l'observation**, le projet politique des graphomanes est de bâtir des "environnements en apparence semblables à des graphes invariants d'échelle" mais dont la dimension, c'est à dire le spectre de ce qui est observable et/ou naviguable se réduit au fur et à mesure ou l'observateur se rapproche. Soit une forme paradoxale de panoptique.
**si on essaie de mesure la longueur d'une côté avec une unité de mesure donnée, plus l'observateur se rapproche, et plus les dimensions augmentent.
Facebook, YouTube et tant d'autres sont, chacun à leur manière des projets graphomanes. La graphomanie de Facebook est de nature politique (= on est tous amis), celle de YouTube est idéologique (on aime tous les mêmes vidéos rigolotes). Tous ont en commun de tendre vers l'abolition du fractal, c'est à dire d'une certaine forme d'inépuisable. De faire du web un simple noeud. Un seul noeud. L'isolement du graphe. L'avènement du point.
Plus que le web lui-même, plus que l'infrastructure qui le porte, c'est une certaine idée du web comme ressource qui est en danger. Danger d'une concentration, une contraction des liens qui le structurent et le forment ; danger d'une surexploitation de cette ressource naturelle (le web) d'un écosystème informationnel (internet) qui pourrait conduire à son épuisement, à son tarissement au seul profit d'immenses et finalement pauvrement réticulés supermarchés relationnels dont Facebook ou YouTube sont aujourd'hui les emblèmes par l'homogénéité des ressources qu'ils proposent, et les "patterns" qu'ils propagent et auto-alimentent.
Le courroux des gourous.
N'étant ni Chris Anderson ni Tim Berners Lee je ne sais si le web est mort ou s'il peut encore être sauvé. Peut-être ne suis-je que l'un des initiés nourris à la rhétorique d'un web libertaire.
J'observe qu'en-deça d'une certaine granularité, qu'en-deça d'un certain diamètre, qu'au-dedans de certains sites, ce sur quoi nous passons chaque jour davantage l'essentiel de nos navigations n'a pas davantage à voir avec le web des origines que le couteau de cuisine n'a à voir avec l'écriture.
Je rappelle ce que j'écrivais ici-même il y a déjà 3 ans et un mois de cela, à savoir que cette approche fermée, propriétaire, compartimentée, concurrentielle, épuisable de l'économie du lien hypertexte ne peut mener qu'à des systèmes de nature concentrationnaire. Des écosystèmes de l'enfermement consenti, en parfaite contradiction avec la vision fondatrice de Vannevar Bush et selon laquelle la parcours, le "chemin" ("trail") importe au moins autant que le lien. Les ingénieries de la sérendipité n'ont pas plus aboli le hasard que ne l'avait fait le coup de dès de Mallarmé, mais elles en ont profondément et durablement changé la nature (cf l'illustration ci-dessous et l'analyse du billet associé).
Choisir : le lien ou le chemin (de ronde).
De l'ensemble de mes données personnelles récupérées sur Facebook ne se dégage aucun chemin : seulement la litanie de la liste de mes "amis". Les liens, la totalité des liens qui dessinent mon "vrai" profil social, mon véritable cheminement, ceux-là restent la propriété - et à la discrétion - du seul Facebook. Dans l'usage même, quotidien de Facebook, de YouTube et de tant d'autres, je ne parcours aucun chemin, je n'effectue aucun autre cheminement que celui qui place mes propres pas dans ceux déjà les plus visibles ou pré-visibles, dans ceux déjà tracés pour moi par d'autres qui m'ont en ces lieux précédés. Ce chemin là, tant il est à l'avance tracé et déterminé, tant il est en permanence scruté et monitoré par d'autres "au-dessus" de moi, ce chemin-là ressemble davantage à une promenade carcérale qu'à une navigation affranchie.
A ce web carcéral fait écho le discours politique d’une criminalisation des pratiques, alibi commode pour porter atteinte à sa neutralité au seul profit d’intérêts marchands et sans égards pour ce qui fut un jour une terra incognita pleine de promesses. Qui l’est encore aujourd’hui. Mais pour combien de temps ?
Au risque du territoire.
Une fois n'est pas coutume, terminons sur un exemple et sur des données factuelles :
Sur ce critère, Facebook est suivi de Youtube (6.39%). Aux Etats-unis, cela signifie donc qu'une fois sur quatre, je vais naviguer là où "mes amis" ou "les amis de mes amis" m'envoient naviguer. Comme dans la vraie vie me direz-vous. Précisément. Le web fut et doit demeurer le lieu d'un décalage, d'une altérité. La territorialisation est le plus grand risque qu'il encourt. S'il ne doit plus avoir vocation qu'à singer numériquement la trame de nos sociabilités ou de nos déambulations dans le monde physique, il cessera alors d'être ce qu'il promettait de devenir : un lieu d'exploration inépuisable, à l'abri du pesant carcan de nos consubstantielles matérialités.
NOTES
(1) Sur la théorie des graphes en général et sur ce graphe à invariance d'échelle qu'est le web en particulier, voir le remarquable "Introduction à l'exploration du web par la théorie des graphes" de Mathieu Jacomy [en ligne] http://www.slideshare.net/medialabSciencesPo/thorie-des-graphes-mathieu-jacomy
(2) Barabasi, A.-L, Jeong H., Albert R., « The Diameter of the World Wide Web », pp.130-131 in Nature, 401, 1999. [en ligne] http://xxx.lanl.gov/PS_Cache/cond-mat/pdf/9907/9907038.pdf, consulté le 05/07/2002
(3) Alan Mislove, Massimiliano Marcon, Krishna P. Gummadi, Peter Druschel, and Bobby Bhattacharjee. 2007. Measurement and analysis of online social networks. In Proceedings of the 7th ACM SIGCOMM conference on Internet measurement (IMC '07). ACM, New York, NY, USA, 29-42. DOI=10.1145/1298306.1298311 [pdf en ligne]
NOTA-BENE : ce texte est la version longue d'un article publié sur le site du Monde.Fr.
Rédigé le 05 déc 2010 à 18:56 dans Document numérique, Ecologie de l'info, Moteurs et autres engins, Réseaux sociaux, Sérendipité, Web 2.0 | Lien permanent | Commentaires (1) | TrackBack (2)
s'intitule Infographic Labs. Où l'on découvre l'essentiel de Wordpress en une seule image, les princiales techniques du SEO, l'écosystème de Google, le monde de Facebook ...
Rédigé le 03 déc 2010 à 21:11 dans Documents et ressources pédagogiques, Rubrique à brac | Lien permanent | Commentaires (0) | TrackBack (0)
Lien authentique : http://fr.techcrunch.com/2010/11/25/lere-des-curators-aurait-elle-sonne/ Bonne nouvelle pour les métiers de la gestion de l'information.
Rédigé le 01 déc 2010 à 19:38 | Lien permanent | Commentaires (0) | TrackBack (0)
| Le blog d'un maître de conférences en sciences de l'information. Réflexions, analyses, signalements, opinions.
"Where is the Life we have lost in living? Where is the information we have lost in Google ? |
| POUR CITER UN ARTICLE
Style APA
Style MLA |
| Postes McF 71ème section sur Galaxie |
Tous les contenus de ce blog sont sous licence Creative Commons. Vous pouvez donc les reproduire, les distribuer ou les communiquer à condition :
|
| "Mais quiconque affirme qu’il y a de l’argent à faire avec un stock d’ARTICLES SCIENTIFIQUES est soit un idiot, soit un menteur." Lawrence Lessig. 12 Janvier 2013. |
|
| Identité numérique et e-reputation : DÉCOUVRIR ET COMMANDER L'OUVRAGE |
Les commentaires récents