On n'arrête pas le progrès. Voici le premier DRM à l'encre. Ou le premier livre non-numérique avec DRM. Là.
« mai 2012 | Accueil | juillet 2012 »
On n'arrête pas le progrès. Voici le premier DRM à l'encre. Ou le premier livre non-numérique avec DRM. Là.
Rédigé le 29 juin 2012 à 17:58 dans Livre numérique | Lien permanent | Commentaires (1) | TrackBack (0)
On vient donc d'apprendre (Le Monde, Numerama, PC Impact) la conclusion d'un accord secret entre Google et un certain nombre d'associations représentatives juives et anti-racistes pour supprimer le mot-clé "juif" de la liste des suggestions sur un certain nombre de requêtes.
Je ne vais pas revenir sur l'affaire, m'étant déjà largement exprimé sur le sujet. Juste vous rappeler que les billets en traitant sont toujours consultables, principalement ceux-ci :-)
Ainsi que ceux du Maestro Jean Véronis :
Cet accord laisse ouvertes un certain nombre de questions :
Attendons donc de voir si, comme on semble nous le promettre, "(...) vous verrez très prochainement - c’est une question de semaine voire de quelques mois - les résultats de ce partenariat. Cela aura une visibilité extrêmement forte, notamment sur Google" (source). Et dans l'attente, reprécisons une énième fois que le coeur de cette écologie cognitive, de cette écologie de l'information sur le web tient aujourd'hui plus que jamais à notre capacité d'être capable de déterminer ce qui, de l'activité de requêtage à la navigation dans des contenus, participe d'une engrammation (mise en mémoire choisie ou subie) et/ou d'une programmation.
Rappelons également que jamais, j-a-m-a-i-s dans l'histoire de l'humanité, y compris en y incluant la télévision voir même le journal de Jean-Pierre Pernaud, jamais dans l'histoire de l'humanité une seule et unique entreprise ne fut en mesure de peser autant sur la fabrication de nos modes de pensée que ne l'est actuellement Google. Que jamais non plus, la manière dont elle le fit ne fut aussi opaque. Que jamais enfin nous ne l'acceptâmes avec une telle naïveté, avec une telle candeur.
Stéréotypique. Du grec "stéréos" qui signifie "ferme, dur, robuste, vigoureux" et "tupos", qui signifie "empreinte, marque". Comme cela est rappelé dans cet article :
"C'est à Walter Lippmann (1922) que l'on doit la notion de stéréotype dans son acception psychologique. Ce terme de "stéréotype" existe depuis 1798 et désigne un coulage de plomb dans une empreinte destiné à la création d'un "cliché" typographique. Lippmann désigne par là les images que nous nous construisons au sujet des groupes sociaux, des croyances dont il veut souligner la rigidité par le recours à ce terme d'imprimerie. Selon lui, ces images nous sont indispensables pour faire face à la complexité de notre environnement social ; elles nous permettent de simplifier la réalité pour nous y adapter plus facilement. Par ailleurs, ces représentations ne sont pas dépourvues de conséquences négatives. Les comportements discriminatoires tels que le racisme ou le sexisme s'accompagnent en effet de représentations stéréotypées des groupes à l'égard desquels la discrimination s'exerce."
D'autre part (voir cette fois par ici) :
"La stéréotypie désigne un état de simplification des dimensions des stimuli, d’immédiateté de la réaction et, parfois, de rigidité. À un autre niveau, plus fréquentiel, cette notion exprime le degré de généralité d’une opinion, d’acceptation ou de rejet d’une représentation, d’un groupe ou d’une personne. La fonction de la répétition des associations qui contribue à l’établissement du stéréotype, l’orientation polarisée qu’elle engendre imposent le parallélisme avec la propagande."
Et plus loin :
"L'idée de jugement en extrême a pour but de ne présenter qu'une seule réponse, une seule voix, sans aucune solution de rechange. (...) Voilà pourquoi les stéréotypes sont les éléments qui incitent à l'action. Ils donnent la solution ultime. On ne discute pas, on agit."
Nous sommes ici au coeur du choix qui se présente aux acteurs majeurs du Search au travers des derniers programmes de personnalisation et de facilitation du requêtage : il s'agit d'apporter non plus des réponses mais "la" réponse. "Le" résultat, actionnable et monétisable parce qu'il maintient l'internaute au coeur de l'écosystème hôte et/ou lui permet (à l'écosystème hôte) de coupler l'intentionalité présidant au requêtage à une action de consultation qui devient littéralement et immédiatement "capitalisable" (cf le capitalisme linguistique déjà traité).
Le Trésor de la Langue Française nous indique de son côté que le 3ème sens du terme stéréotype, en linguistique et en stylistique, désigne une "association stable d'éléments, groupe de mots formant une unité devenue indécomposable, réemployée après avoir perdu toute expressivité et avec une fréquence anormale." La bascule en train de s'accomplir sous nos yeux fait de cette "unité devenue indécomposable" un préalable, une condition d'optimisation et non plus un résultat, une résultante. Car pour l'abolition programmée du mot juif, l'essentiel des suggestions proposées par Google demeurent essentiellement stéréotypiques, faisant l'économie de tout ou partie des circonstances englobant la requête pour mieux alimenter la pompe à phynance du site.
Google s'installe comme un pourvoyeur de mythologie, une machine à fabriquer du mythe sur des catégorisation stéréotypales.
"En passant de l’histoire à la nature, le mythe fait une économie : il abolit la complexité des actes humains, leur donne la simplicité des essences, il supprime toute dialectique, toute remontée au-delà du visible immédiat, il organise un monde sans contradictions parce que sans profondeur, un monde étalé dans l’évidence, il fonde une clarté heureuse : les choses ont l’air de signifier toutes seules." Roland Barthes. Mythologies. 1957.
Rédigé le 28 juin 2012 à 12:18 dans Ecologie de l'info, Moteurs et autres engins | Lien permanent | Commentaires (2) | TrackBack (0)
J'étais ce jour à la chambre des métiers et de l'artisanat de Vendée pour une formation dans le cadre du DESM devant un public composé de (12) personnes dans une démarche de création ou de reprise d'entreprise. L'objectif : leur présenter les atouts et les risques d'une présence sur les réseaux sociaux et les stratégies pour construire et défendre leur identité numérique (et celle de leur entreprise).
Voici le diaporama de l'intervention (les fidèles d'affordance n'y apprendront rien de nouveau, il s'agit d'un remix de plusieurs "anciennes" présentation sur le sujet)
Rédigé le 26 juin 2012 à 17:02 dans Agenda, Réseaux sociaux | Lien permanent | Commentaires (0) | TrackBack (0)
J'étais l'autre jour sur Rennes pour un séminaire d'école doctorale consacré à la question de l'archive, en l'excellent compagnie de Nicolas Thély.
<HDR>Je me suis efforcé de démontrer quelle était la place aujourd'hui jouée par les nouvelles dynasties de l'archive, la manière dont elles bâtissaient de nouvelles industries de la mémoire, en s'appuyant principalement sur des technologies du souvenir. J'ai également beaucoup insisté (et conclu) sur le fait que circonscrire aujourd'hui la notion d'archive, dans le cadre du numérique, impliquait collectivement et individuellement, d'être capable de déterminer ce qui, de l'activité de requêtage à la navigation dans des contenus, participait d'une engrammation (mise en mémoire choisie ou subie) et/ou d'une programmation. </HDR> Et dans quelle proportion et selon quelles logiques l'une (engrammation) l'emportait ou non sur l'autre (programmation). Le meilleur exemple étant donné sur la 35ème diapositive au sujet de la fonction Google Suggest.
Plusieurs réflexions de l'exposé de Niclas Thély ont éveillé ma curiosité et mon intérêt, notamment cette citation de Pierre-Damien Huyghe : "Il n'y a plus d'expérience vécue sans enregistrement" (voir notamment ici). Question qui traverse naturellement toutes les problématiques de la médiation en milieu numérique et qui recoupe également les réflexions sur notre présence numérique au monde.
L'autre écho fut celui de l'importance du "délaissé" dans le paysage numérique de l'archive : cette conservation du tout, y compris de ce qui est usuellement délaissé ou hors champ de l'archivistique "non-numérique". L'archive numérique non-institutionnelle (= hors le dépôt légal du web tel qu'il est mis en place à la BnF ou à la bibliothèque du Congrès) est une archive de l'usage - à l'instar des archives municipales, naissances, décès, état civil, etc ... - et non un archivage de l'utile - archives à dominante "patrimoniale".
Je veux enfin revenir sur ce qui est précisé à la diapo 26 de mon intervention et que je n'ai pas eu le temps d'approfondir dans le temps qui m'était imparti. <HDR> Les 3 grands paradigmes de l'archivage numérique me semblent pouvoir être sériés comme suit :
Pour le reste, voici le support de mon intervention.
Rédigé le 17 juin 2012 à 22:19 dans Biblio"Tech", Document numérique, Ecologie de l'info, HDR, Moteurs et autres engins, Réseaux sociaux, Wikipedia | Lien permanent | Commentaires (0) | TrackBack (0)
L'une des choses que je trouve les plus fascinantes sur le web (et ailleurs) : la possibilité de passer de l'infiniment petit à l'infiniment grand. Et retour. Et ce qu'il s'agisse :
Rédigé le 15 juin 2012 à 18:43 dans Rubrique à brac | Lien permanent | Commentaires (1) | TrackBack (0)
Je suis actuellement en déplacement. Quand ce billet paraîtra, la nouvelle sera officielle : la copy-party a remporté le 1er prix (ex-aequo avec "la petite bibliothèque ronde") du salon I-Expo dans la catégorie "documentation et bibliothèque du futur". <hurlement de joie> Hip hip hip ... </hurlement de joie>
Ce sont les deux papas et camarades Lionel Maurel (calimaq) et Silvère Mercier (bibliobsession) qui sont allés défendre l'initiative devant le jury. Je ne vais pas vous la jouer cérémonie des césars ou des molières et je suis d'ailleurs de manière générale assez hostile à toute "podiumisation". Mais.
Mais la copy-party est une initiative qui a, bien avant ce prix, été assez unanimement saluée par différents observateurs comme une étape importante de l'avenir des bibliothèques.
Mais la prise de risque sur l'idée même et l'organisation de ladite copy-party était assez élevée, à la fois pour ses initiateurs et concepteurs, ainsi que pour la bibliothèque qui a décidé de jouer le jeu. Il fallait en effet désamorcer très soigneusement le côté "au pays de Oui-Oui, tout est permis", tout aussi soigneusement vérouiller le cadrage juridique de l'opération pour l'inscrire dans une légalité absolument indiscutable, et s'astreindre dans divers cénacles associatifs et professionnels à faire sauter de robustes DRM mentaux. Bref, c'était pas gagné.
Ce prix vient donc s'ajouter à la reconnaissance médiatique et "scientifique" dont avait déjà bénéficié l'opération. Il les complète par une reconnaissance "professionnelle" d'autant plus méritoire et symbolique que dans le jury se trouvaient représentés nombre de grands groupes (Total, BNP-Paribas, Véolia, GDF-Suez ...) ainsi que d'importantes associations professionnelles (ADBU, ADBS).
Donc : joie, champagne, féérie, hourras et bravis partagés avec Lionel et Silvère ainsi qu'avec l'équipe de la BU de La Roche sur Yon. Mais.
Mais le boulot continue. La copy-party en bibliothèque reste encore à ce jour une initiative relativement isolée même si quelques répliques ont été mises en place dans d'autres cadres institutionnels (cantine numérique notamment). Je vous livre un scoop : une autre copy-party aura bien lieu l'année prochaine, toujours dans l'Ouest de la France, mais cette fois dans une grande médiathèque. Ce qui n'est en revanche pas un scoop, c'est que nombre de collègues bibliothécaires nous ayant indiqué leur intention d'en organiser une, se sont heurtés à de très vives réticences hiérarchiques et/ou institutionnelles, réticences qui n'ont pourtant pas lieu d'être.
Espérons donc que désormais quadruplement couverte des lauriers de sa reconnaissance scientifique, médiatique, politique et professionnelle, la copy-party permette, enfin, aux structures qui en auront compris l'importance et en manifesteront la volonté, de s'inscrire à leur tour dans cette nouvelle voie de la pédagogie et de l'appropriation des oeuvres mises à disposition en bibliothèque dans le cadre de la copie privée.
<Mise à jour> Le billet victorieux de Lionel Maurel et celui (beaucoup) plus politique de Silvère Mercier </Mise à jour>
Rédigé le 14 juin 2012 à 14:14 dans Biblio"Tech", Document numérique, Ecologie de l'info, Livre numérique | Lien permanent | Commentaires (0) | TrackBack (0)
A l'invitation du laboratoire ALEF, je serai ce vendredi sur Rennes pour la 4ème séance du séminaire "de l'oeuvre à larchive, de l'archive à l'oeuvre". J'y traiterai de la question de l'archive au regard du numérique, notamment la manière dont les dynasties de l’archive bâtissent les industries de la mémoire à l’aide des technologies du souvenir.
Mon intervention aura pour titre : "Le web et l'archive : des arts de la mémoire aux technologies du souvenir", laquelle intervention reprendra essentiellement les points développés dans ces 4 billets :
Rédigé le 13 juin 2012 à 21:05 dans Agenda | Lien permanent | Commentaires (0) | TrackBack (0)
Si vous êtes curieux de connaître mon pire cauchemar, pour de vrai, sans rire, alors vous devez lire cet article de BastaMag qui est une enquête très fouillée d'Agnès Rousseaux sur les dangers du vote électronique, lequel est déjà mis en place mais sera encore amplifié lors des prochaines élections législatives. De cette enquête il ressort que le vote électronique est d'ores et déjà entâché d'hallucinantes preuves de conflits d'intérêts patents, d'incompétence crasse, de malfaçons et de plantages systématiques. Si l'on continue de ne rien faire, ce sera le grand bug démocratique. Du genre de ceux dont on ne se remet pas.
Il est un homme qui, dès 1955 avait tout compris aux dangers et aux dérives actuelles du vote électronique. Isaac Asimov. Dans une nouvelle baptisée "Le votant", incluse dans le recueil "Le robot qui rêvait". Précipitez-vous pour l'acheter, l'emprunter, la lire, la faire lire. On peut même la trouver facilement en intégralité sur le ouèbe. Tout y est. Juste un extrait :
"Matthew regarda gravement la petite fille, puis il la souleva et l’assit sur son genou.
Il modéra même le ton de sa voix.
— Vois-tu, Linda, jusqu’il y a environ quarante ans, tout le monde votait, toujours. Disons que nous voulions décider du prochain président des Etats-Unis. Les démocrates et les républicains nommaient respectivement un homme et chacun des habitants pouvait dire lequel il préférait. A la fin de la journée de l’Election, on comptait le nombre de personnes qui voulaient le démocrate, et le nombre de personnes qui voulaient le républicain. Et celui qui avait le plus de voix était élu. Tu comprends ?
Linda hocha la tête et demanda :
— Comment est-ce que tout le monde savait pour qui voter ? Est-ce que Multivac le leur disait ?
Les sourcils de Matthew s’abaissèrent et il prit un air sévère.
— Chacun se fiait à son propre jugement, ma fille.
Elle eut un mouvement de recul alors, et de nouveau, il baissa la voix.
— Je ne suis pas fâché contre toi, Linda. Mais, tu comprends, parfois il fallait toute la nuit pour compter ce que tout le monde avait dit, alors on s’impatientait. On a donc inventé des machines spéciales, capables de regarder les quelques premiers votes et de les comparer avec le nombre des voix au même endroit, au cours des années précédentes. Comme ça, la machine pouvait calculer le total des voix et faire savoir qui était élu. Tu vois ?
Elle hocha la tête.
— Comme Multivac.
— Les premiers ordinateurs étaient bien plus petits que Multivac. Mais les machines sont devenues de plus en plus grandes et elles ont pu donner le résultat de l’élection avec de moins en moins d’électeurs. Finalement, on a construit Multivac, il est capable de donner le résultat avec un seul votant.
Linda sourit d’être arrivée à un passage familier de l’histoire et déclara :
— C’est bien, ça.
Matthew fronça les sourcils et la contredit :
— Non, ce n’est pas bien. Je ne veux pas qu’une mécanique me dise comment j’aurais voté, simplement parce qu’un zigoto de Milwaukee a dit qu’il était contre la hausse des tarifs douaniers. Je voudrais peut-être voter dingue, histoire de rire. Ou ne pas voter du tout. Peut-être..."
Et plus loin :
"Multivac soupèse toutes sortes de facteurs connus, des milliards de facteurs. L’un d’eux n’est pas connu, toutefois, et il ne le sera pas avant longtemps. C’est le schéma de réaction du cerveau humain. Tous les Américains sont soumis aux pressions qui les modèlent, ce que les autres Américains disent et font, ce qui leur est fait, ce qu’ils font aux autres. Tout Américain peut être amené à Multivac pour faire analyser sa tournure d’esprit. A partir de là, la tournure d’autres esprits de la nation peut être estimée. Certains Américains valent pour cela mieux que d’autres, selon un temps donné, selon les événements de l’année. Multivac vous a sélectionné comme le plus représentatif de cette année. Non pas le plus intelligent, ni le plus fort, ni le plus chanceux, mais simplement le plus représentatif. Or, nous ne mettons pas Multivac en doute, n’est-ce pas ?"
Fort heureusement de nombreuses associations, de nombreux scientifiques militent déjà contre le vote électronique. Mais ces lanceurs d'alerte ne pourront pas grand chose face aux lobbys en présence sans un ralliement massif des citoyens qui doivent exiger le retrait de ces machines par tous les moyens.
Lorsqu'Asimov publia sa nouvelle en 1955, l'algorithmie à large spectre, les ingénieries relationnelles, les industries de la recommandation étaient inexistantes. Aujourd'hui une conjugaison de facteurs objetivables rend possible toutes les dérives dénoncées dans sa nouvelle. A chacun d'entre nous d'en être comptable et responsable. Aucune boîte noire ne peut ni ne doit se substituer à ce qui doit rester l'inaliénable droit de chacun de contrôler, de l'entrée dans l'isoloir à la sortie des urnes, l'authenticité de son vote autant que de celui de chacun de ses concitoyens et du processus qui y a conduit.
Rédigé le 08 juin 2012 à 18:20 dans Ecologie de l'info, Rubrique à brac | Lien permanent | Commentaires (4) | TrackBack (0)
Après de longues années et de longs atermoiements, Google a finalement (2006) justifié le choix de s'installer sur le marché chinois (voir ma chronique de l'époque, épisode 1, 2 et 3) et accepté pour cela de se plier aux règles de censure imposées, en expliquant que mieux valait que les chinois disposent d'une alternative - même censurée - au seul moteur officiel du régime, plutôt que de n'avoir pas d'alternative du tout.
Depuis ce temps, et au rythme de gigantesques barbouzeries dignes des meilleurs films d'espionnage de la guerre froide, Google perd lentement mais sûrement les parts de marché conquises à son arrivée.
Oui mais voilà, en Chine, certaines requêtes donnent lieu à de bizarres comportements allant de la page d'erreur jusqu'à l'interruption pure et simple de la connexion. Soucieux de voir s'évaporer ainsi du temps de cerveau disponible et les parts de marché afférentes, Google a donc dépéché une dreamteam d'ingénieurs pour trouver l'origine du bug. Lesquels, après avoir analyse en détail les "350 000 requpetes plus plus populaires en Chine", n'ont ... strictement rien trouvé permettant de corriger le bug. Bug d'autant plus étonnant qu'il apparaît, au travers des exemples pris dans le billet de Google relatant l'affaire, totalement aléatoire : ainsi la requête "KFC" (célèbre chaîne alimentaire dédiée au culte du poulet) ne pose aucun souci, mais la requête "Mac Donald" (célèbre chaîne alimentaire dédiée au culte du reste) transforme votre connexion en un électro-encéphalogramme plat.
Et puis à force de fouiller, les ingénieurs de Google ont fini par identifier une série d'idéogrammes "très communs" qui génèreraient la plupart de temps un plantage, lesquels idéogrammes ont la particularité de pouvoir "revêtir différents sens selon le contexte". Faute de pouvoir proposer une solution, Google s'est donc résolu à afficher, en cours de frappe et grâce à sa technologie d'auto-complétion, un petit message d'avertissement :
"attention, l'idéogramme que vous vous apprêtez à taper va mettre votre bande passante en carafe. On est désolé, mais on n'y peut rien. C'est la vie."
Naturellement à aucun moment dans son billet, Google n'évoque ne serait-ce qu'un quart de début de commencement de putatif soupçon de censure comme origine possible du bug. Faut bien entretenir de bonnes relations commerciales avec le 1er marché du monde. Il choisit d'ailleurs à dessein d'autres exemples paraissant tout à fait anodins : ainsi l'idéogramme "zhou" qui veut dire "semaine" pose un problème et avec lui donc, les mots composés à partir de cet idéogramme (comme Jay Zhou, une pop-star japonaise). En même temps, bizarrement, on sent bien qu'il y a comme qui dirait baleine sous gravillon.
La BBC n'entretenant pas avec la Chine les mêmes relations commerciales que Google, n'hésite par contre pas une seconde pour titrer : "Google helps China search users avoid censored keywords". "Google aide les utilisateurs chinois à contourner la censure". Et de citer d'autres exemples plus croustillants. Ainsi en plus d'être le nom d'une pop-star et de vouloir dire "semaine", l'idéogramme "Zhou" est aussi le prénom de Zhou Yongkang, haut dignitaire chinois, "l'un des 9", longtemps "ministre de la sécurité de l'état" et toujours en charge de l'appareil répressif, actuellement au coeur d'une purge, bref un sacré déconneur qui adore être googlé et que tout le peuple chinois soit au courant de l'actuelle purge le concernant.
Pourquoi un billet là-dessus ?
Pour rappeler que les ingénieries linguistiques à l'oeuvre derrière les fonctionnalités d'auto-complétion et autres suggestions sont des armes redoutables. Des armes à double tranchant. Si elles peuvent effectivement, comme le souligne l'article de la BBC, permettre de contourner des procédures de censure, elles peuvent également en devenir les alliées objectives. Le billet rédigé sur le blog de Google peut ainsi donner lieu à 2 lectures totalement différentes.
Le gouvernement chinois pourrait en effet légitimement y voir présentée une technologie linguistique d'une finesse suffisante pour détecter les requêtes déviantes ou hostiles au régime avant même qu'elles ne soient entièrement saisies, et proposer à leur place et de manière instantannée, des pages de résultats politiquement correctes afin de troubler encore un peu plus le fil toujours ténu de l'activité cognitive de requêtage en l'orientant vers d'autres voies. Une sorte de "rééducation par la requête", bien plus efficace qu'une censure explicite renvoyant sur une page d'erreur ou d'avertissement, ou allant jusqu'à interrompre la connexion.
Si, dans le cadre d'un régime politique autoritaire ou anti-démocratique, la question politique posée par ces ingénieries linguistiques semble évidente et cruciale, elle ne doit pas faire oublier que nous sommes tous quotidiennement exposés aux mêmes ingénieries, aux mêmes technologies. Ne pas nous faire oublier que toute auto-complétion est une contrition subie, que toute suggestion est une sujétion imposée. Qu'à ce rythme là nous ne demanderons plus demain aux moteurs de recherche de nous apporter les meilleures réponses possibles, mais simplement de nous laisser la liberté de leur poser toutes les questions possibles.
"L'enfer est pavé d'auto-complétions"
<j'allais oublier> Mettant un point final à ce billet, je découvre ceci, qui ne va pas contribuer à améliorer les relations sino-googléennes ... </j'allais oublier>
Rédigé le 07 juin 2012 à 21:25 dans Ecologie de l'info, Moteurs et autres engins | Lien permanent | Commentaires (2) | TrackBack (0)
Depuis quelques temps, et particulièrement depuis l'introduction en bourse de Facebook, les articles et analyses se multiplient qui prédisent la fin prochaine de Facebook. Voir notamment là là, là, là ou encore ici. Je me contenterai d'attirer votre attention vers deux données factuelles qui me paraissent mettre le doigt au coeur du (double) problème :
J'ai déjà sur ce blog largement mis en avant une analyse d'internet (web + net) comme un écosystème composé de biotopes en interaction permanente. Rappel des interactions types entre les différetns biotopes :
- la réciprocité : échange de liens, backlinks, trackbacks, etc ... La réciprocité est au coeur des biotopes originels du web. Rien n'est possible sans elle.
- le parasitage : il s'agit ici d'une réciprocité subie, tel biotope étant "obligé" d'intégrer un composant de tel autre biotope pour assurer sa propre survie ou sa propre domination. Un exemple dans ce billet qui illustre la manière dont les sites sociaux (Facebook, Twitter) influent sur l'organisation de la hiérarchie de liens des moteurs (Google & Bing).
- le phagocytage (ou phagocytose) : procède et opère essentiellement sur le mode documentaire (exemple détaillé ici)
- la prédation : essentiellement le rachat (au sens économique : telle boîte rachète telle autre) ou l'épuisement (la domination de telle boîte rend caduque des boîtes plus faiblement dimensionnées ou trop spécialisées sur un secteur ou un service)
Or privé à la fois du potentiel attentionnel de ses outils publicitaires et marketing ainsi que du traffic associé aux extériorités qui l'entourent, Facebook est en train de mesurer le côté obscur de sa condition de "jardin fermé", d'autant qu'il n'a (pour l'instant) raté le virage du web applicatif.
Je veux également ici rappeler que, pour reprendre un art de la formule dont nos amis américains sont friands, le modèle documentaire du "ads are content" (initié par Google) est validé et semble pérenne, à l'inverse de celui du "You are the Ad" (initié par Facebook).
Syllogisme du cercle vertueux documentaire - et publicitaire (Google) :
Syllogisme de l'amertume publicitaire (Facebook) :
Rappeler également que le principal problème de Facebook tient à la pauvreté (qualitative) de son contenu informationnel, pauvreté qui s'explique elle-même par le fait que Facebook n'est pas un site de requêtage, qu'il est un site sans requête. Il ne dispose donc pas de cette possibilité d'amorçage (de désir) qui lui permettrait de capitaliser sur une valeur ajoutée documentaire (voir la partie "search hole et social wall" de ce billet).
Je vais oser une analyse un sentiment un peu osé : je suis convaincu que toutes les artefactures (= toutes les constructions humaines, y compris quand elles relèvent de l'ingénierie logicielle ou de la programmation) fonctionnent par paliers, par seuils, et que certains seuils sont indépassables sitôt que sont réunis trois paramètres : une maturité technologique reposant sur une évolution disruptive, un (énorme) public captif, une inscription dans l'imaginaire commun.
En termes clairs, je suis convaincu qu'il n'est plus possible de faire mieux que Google comme moteur de recherche. De la même manière qu'il n'est pas possible de faire mieux que le marteau comme outil pour enfoncer des clous. On peut faire des marteaux différents (plus légers, plus lourds, de toutes formes et de toutes couleurs, des marteaux électriques, des marteaux-piqueurs, des requins-marteaux, etc) mais le seuil indépassable du marteau comme artefacture est celui du manche avec au bout un truc lourd qui comporte une zone plate. Notez bien que j'ai le mérite de la constance puisque je défends cette position depuis plus de 8 ans (ici et là). De la même manière, il ne me semble pas possible de faire mieux que Facebook comme réseau social (la meilleure preuve étant peut-être constituée de l'échec patent de Google à prendre ledit virage social, un échec que l'on ne peut décemment pas imputer à un manque de moyens, à un retard technologique, ou à un manque de public captif).
Ceci ne veut pas dire que Google ou Facebook ne disparaîtront jamais. Pas davantage qu'ils disparaîtront à coup sûr. Car il est deux paramètres qui dépassent les trois conditions rendant une artefacture indépassable : ce sont ceux du marché (mondial) et de la loi (territoriale). Si le marché décide que Facebook n'est pas viable économiquement, Facebook tombera par K.O. La législation peut également, du jour au lendemain, faire "tomber" n'importe quel site (et pas seulement Megaupload), même si le paramètre législatif est soumis à des temporalités et à des luttes d'influence bien plus contraintes (que le marché).
Les nouveaux Yahoo!, Amazon, Apple, Google, Facebook se construiront autour d'horizons technologiques non pas nécessairement disruptifs mais qui n'ont pas encore trouvé leur héraut sur le plan de la maturité technologique, du public captif et de l'inscription dans l'imaginaire commun. Et ces horizons sont nombreux : téléphonie mobile, web applicatif, web sémantique, domotique, IHM (interfaces homme-machine), etc. De ces côtés là et de bien d'autres peuvent encore surgir, par exemple, un moteur de recherche sémantique qui mettra Google à la même place que celle où celui-ci installa Yahoo! De ces côtés là peuvent apparaître des modes de socialisation connectée qui relègueront Facebook à la même place historique que les canaux d'IRC.
Le fait est que, pour l'instant, deux régulateurs fonctionnent à plein régime comme vecteurs de croissance du côté des biotopes de l'écosystème d'internet : celui du traffic et celui de la rente publicitaire. Le fait que Facebook soit incapable d'en tirer tout le bénéfice attendu, son incapacité à trouver un modèle documentaire pérenne (cf les analyses de Jean-Michel Salaün), et ses récentes turbulences boursières permettent objectivement de se poser la question de la viabilité à moyen terme du site.
<Update du soir> En plus, cerise sur le gâteau, il semble désormais acté que sur Facebook on se fait chier : "Les principales raisons de ce désintéressement sont l'ennui, le manque d'utilité et les inquiétudes en matière de vie privée." <Update du soir>
P.S. : sur les autres nombreux problèmes structurels du site (compétition pour l’attention devenue insoutenable, position très ambigüe sur la confidentialité, conversations à faible valeur ajoutée) voir l'excellent billet de Fred Cavazza.
Rédigé le 06 juin 2012 à 15:04 dans Document numérique, Ecologie de l'info, Réseaux sociaux | Lien permanent | Commentaires (2) | TrackBack (0)
La nouvelle est déjà ancienne (dans les tuyaux de la geekosphère depuis Septembre 2011, annoncée "officiellement" dans les médias mainstream depuis Janvier 2012). Et pourtant les faits ne sont pas encore avérés. Je veux parler du déploiement de nouvelles fonctions-boutons Facebook censées compléter l'omniprésent parasite qu'est le "Like". J'aime.
Nul ne peut pour l'instant dire quand ces 3 boutons seront effectivement intégrés au site, mais tout le monde semble avoir acté qu'ils le seront un jour.
<précaution oratoire> Ceux qui m'objecteront immédiatement que Facebook n'est pas une langue peuvent s'épargner de lire la suite de ce billet. Ceux qui pensent que Facebook peut à tout le moins être considéré comme une lingua franca du numérique, peuvent continuer leur lecture. </précaution oratoire>
... est une grammaire du désir. Désir de voir ce qu'aiment les autres. Désir d'être vu "aimant". D'être vu tout court.
... sera une grammaire du pulsionnel. Le désir désinhibé. Fait pour administrer l'impulsivité qui préside à nombre d'échanges numériques.
... sera une grammaire transactionnelle. Clé de voûte d'un système de troc ostentatoire amené à déclencher en écho du désir (j'aime) et/ou de la pulsion (je veux).
Et ainsi de suite. Un équilibre métastable. Un cercle vicieux de versatiles vertus renversées. La sainte trinité du marketing. La trilogie des nos affligeants affects.
Toutes les 3 remplissent des objectifs concordants :
Dans la foulée on vient également d'avoir la confirmation que Facebook envisage désormais officiellement l'ouverture du site aux mineurs de moins de 13 ans. Depuis déjà plus d'un an (Mai 2011) on savait que Zuckerberg réfléchissait à la question. La récente introduction en bourse de la société réclame désormais de franchir au plus vite le cap symbolique du milliard d'utilisateurs (actuellement, le site en compte autour de 900 millions) et, alors que de nombreuses sources indiquent une stagnation (voir une régression) dudit nombre, l'ouverture au enfants constitue l'accès garanti à une corne d'abondance permettant de dépasser très largement le milliard. Le marché des enfants irait également de pair avec une monétisation dopée du "gaming" ("Farmville" et autres applications plébiscitées) et permettrait de soutenir la croissance du magasin d'application récemment lancé, avec l'objectif de tenter de coller aux basques de l'AppStore et autres GooglePlay.
13 ans, c'est la limite d'âge actuelle d'inscription, limite très théorique tant on retrouve de nombreux kids sur le réseau social, d'ailleurs souvent inscrit par leurs parents eux-mêmes.
"Recent reports have highlighted just how difficult it is to enforce age restrictions on the Internet, especially when parents want their children to access online content and services" (...) "A study sponsored by Microsoft Research released last fall found that 36% of parents were aware that their children joined Facebook before age 13 and that a substantial percentage of those parents helped their kids in the effort." (Source WSJ)
Bien sûr Facebook nous promet que les comptes des enfants seront encadrés sous l'autorité de leurs parents :
"Mechanisms being tested include connecting children's accounts to their parents' and controls that would allow parents to decide whom their kids can "friend" and what applications they can use" (Source WSJ)
Bien sûr le moindre étudiant en 1ère année de sociologie ou d'économie est conscient que ce ne sera absolument pas le cas, tout du moins pas avec davantage d'effet ou de réussite que pour l'exercice du contrôle parental censé présider à la consommation télévisuelle de nos chères têtes blondes.
Mais la vraie question est ailleurs. Que les enfants débarquent sur Facebook est d'autant plus inévitable que c'est de toute façon déjà le cas. Même si on peut le regretter (je le regrette), autant sortir une bonne fois pour toutes d'une hypocrisie** qui ne sert qu'à nourrir les universitaires (notamment sociologues et psychologues mais pas que) dont les comportements sociaux - ou associaux - sont le terrain et à remplir les grilles de programmes sociéto-culturello-numérico-télévisuels, programmes dont l'avantage certain et le principal mérite se résume souvent à pouvoir mettre un visage sur les précédents universitaires venus jouer le rôle bien plus télégénique d'expert.
**comme rappelé dans ce billet, l'un des derniers rapports du "Consumer Reports" indiquait que "Facebook a 7.5 million d'utilisateurs en dessous de l'âge minimum requis de 13 ans. Et 5 millions d'entre eux ont 10 ans ou moins."
Le vrai problème ce sont les grammaires de Facebook. Même en admettant - ce ne sera jamais le cas mais admettons pour l'exemple - même en admettant que Facebook arrête de jouer avec les paramètres de confidentialité et d'exposition comme un psychotique affublé de troubles obsessionnels compulsifs avec les boutons de sa télécommande, même en admettant que Facebook place l'intérêt des enfants avant celui de ses actionnaires, même en admettant que Facebook mette en place des dispositifs de filtrage leur évitant toute surexposition aux évangiles du lol et à la bible des "jeunes femmes russes qui attendent l'amour" et "recherchent des célibataires exigents", même en admettant qu'il soit sain que les premiers pas de la socialisation numérique se fassent dans une mégalopole d'un milliard d'individus, même en admettant que l'essentiel des utilisateurs adultes du site en aient une pratique suffisamment éclairée pour ne pas exposer les enfants primo-arrivants à des tombereaux de mauvaises pratiques, même en admettant que la page Facebook de Nadine Morano soit interdite aux mineurs et aux personnes sensibles, même en admettant que cette ouverture aux enfants soit une idée de Steve Jobs, le vrai problème ...
C'est qu'elles deviennent leur cadre expressif de base. Le substrat de l'ensemble de leurs interactions sociales. Je veux. J'aime. Je possède. Alors même qu'ils sont à un âge où ils sont censés apprendre à maîtriser leurs pulsions, à sublimer leurs désirs, et à appliquer une échelle de valeur aux transactions morales, affectives mais également marchandes qui sous-tendent les codes de la société qui les verra grandir. Je veux. J'aime. Je possède.
Le vrai problème c'est que la richesse d'au moins 5 des 6 fonctions du langage de Jakobson se résume à trois possibilités de clics. Je veux. J'aime. Je possède.
Le vrai problème c'est que les vivaces ingénieries de la viralité ne laissent même plus le temps de s'accomplir le miracle de la répétition choisie comme préalable à l'appropriation consentie. Je le veux. Je l'aime. Je le possède.
Le vrai problème c'est que l'approche "sans friction" ne laisse plus aucune place à l'affrontement constructif. Je te veux. Je t'aime. Je te possède.
Le vrai problème c'est que toute catharsis se résume à un cataplasme marketté. Ils veulent que je l'aime. Ils veulent que je le possède.
Pour bien faire il faudrait, en un mot, que le "Facebook for kids" bannisse définitivement le bouton "je possède" et remplace tout aussi définitivement le bouton "je veux" par un bouton "je voudrais", et le "like" par un "I would like to". Il faudrait que Facebook apprenne et institue la conditionnalité, laissant aux adultes la responsabilité d'en être des utilisateurs inconditionnels.
"- Papa, papa !
- Quoi ?
- Papa je veux m'inscrire sur Facebook.
- On ne dit pas "je veux", mon grand. On dit je voudrais. Conditionnel.
- Mais papa, mes copains ils y sont. Même Donovan il y est. Et il aime ça ! Moi aussi j'aime ça !
- On ne dit pas "j'aime ça", mon grand. On dit j'aimerai. Futur."
Futur proche.
Rédigé le 05 juin 2012 à 12:36 dans Ecologie de l'info, HDR, Réseaux sociaux | Lien permanent | Commentaires (3) | TrackBack (0)
Joie et félicité. La copy-party est nommée (nominée ?) pour le "trophée documentation et bibliothèque du futur" du salon I-Expo, LE salon de référence français pour l'information professionnelle et la documentation. La preuve ici. Reste maintenant à défendre le dossier devant le jury, mais le simple fait de cette nomination atteste que quelque chose de significatif est en train de bouger du côté des bibliothèques et de l'information professionnelle.
Rédigé le 05 juin 2012 à 09:12 dans Biblio"Tech" | Lien permanent | Commentaires (0) | TrackBack (0)
La recherche sémantique est l'un des derniers graals de l'industrie du "search". Chaque annonce dans ce domaine est suivie de près, particulièrement quand elle provient du leader Google. Lequel vient donc d'officialiser le lancement de son "knowkedge graph", qui se veut davantage une sémantisation explicite des pages de résultats associés à une requête plutôt qu'un "vrai" moteur de recherche sémantique.
Le théorème du jaguar. Du point de vue des moteurs de recherche, la quête sémantique est d'abord là pour améliorer le service aux usagers en optimisant (et en automatisant) le processus de désambiguïsation lexicale. Soit la résolution du "théorème du jaguar" : que cherche réellement un internaute quand il tape la requête "jaguar" ? Des infos sur la marque de voiture ou sur le félidé ? On peut pour cela utiliser différentes techniques dont celle de l'historique de recherche ou proposer des catégories automatiques pour affiner la recherche (refine search).
Le dilemme du prisonnier. L'autre objectif (au moins aussi important) est de maintenir l'usager dans un écosystème contrôlé par ledit moteur : si je suis capable d'afficher des informations sémantiquement enrichies sur une requête dès ma page de résultats (par ex. les infos biographiques sur un artiste, sa discographie, ou encore les horaires de cinéma pour tel film dans telle ville, etc.), j'évite alors que l'usager ne "quitte" ma page de résultats pour aller consulter ladite bio ou lesdits horaires sur un autre site, quittant du même coup mon écosystème informationnel et se soustrayant à l'affichage de publicités, privant donc du même coup ma régie publicitaire d'une manne financière conséquente.
Illustration. Je cherche des infos sur le groupe "The Cure".
La recherche "sémantique" m'affiche, en colonne de droite, un encadré "sémantisé", c'est à dire qui me propose une structuration sous-jacente à ce que doivent être les informations minimales fournies à un usager déposant une requête sur un groupe de musique :
C'est donc à la mi-mai que Google annonce une mise à jour importante de son algorithme intégrant désormais un "knowledge graph".
D'où viennent ces résultats sémantiques ? Principalement de trois sources :
Renforcer sa position dominante et son avance technologique naturellement. Mais aussi plus prosaïquement économiser ses ressources mémoire. On sait que Google ne traite naturellement pas chaque requête déposée sur le moteur. Pour chaque requête réellement effectuée, il va d'abord vérifier dans une base de donnée si elle n'a pas été saisie, et si tel est le cas (= la plupart du temps), il "se contente" de rappatrier les résultats déjà affichés les fois précédentes, en y ajoutant - ou pas - une dose de personnalisation. Ainsi les "résumés" biographique et autres outils sémantiques vont lui permettre de fabriquer, dans l'un de ses nombreux index, des pages quasi-fixes à renvoyer automatiquement sur une immense batterie de requêtes types. Ce faisant, Google réussit presque paradoxalement à devenir le rival de Wikipédia qu'il avait échoué à être avec le flop de son projet Knol.
Indépendamment des outils et des écosystèmes (Google, Wikipédia) ce pas supplémentaire vers un web sémantique inaugure un profond changement de nature du web media, à moins qu'il ne confirme ce qui en fut l'ADN depuis ses débuts. Le média dominant en termes d'accès (Google) et d'attention, se construit sur une hybridation entre une ingénierie de l'éditorialisation automatisée et donc opaque et propriétaire (les algorithmes de ranking), et des graphes de contenus reposant majoritairement sur des productions humaines ouvertes, transparentes et collaboratives.
Cette sémantisation vient s'ajouter aux fonctionalités déjà actives et passablement envahissantes de l'autocomplétion et de la suggestion (voir mon billet : le complexe du scribe)
C'est autour de l'articulation entre la balance du document décrite par Jean-Michel Salaün, et la balance de la recherche que se dessineront les rapports de force du web de demain.
Là où l'affaire va se corser, c'est naturellement du côté de la régie des annonceurs et des sites tiers, qui comme à chaque nouvelle modification de taille de l'algo. de Google, commencent déjà à pousser des cris d'orfraie à l'idée du traffic qu'ils vont perdre pour les seconds, et des liens adwords dont ils vont être privés pour les premiers. Le fait est qu'avec ce virage sémantique, Google se "densifie", s'épaissit. Il n'est plus le point de bascule et d'accès à des contenus distants, mais devient, partiellement et pour certains types de requêtes, le site hôte contenant suffisamment de réponses pour briser là toute logique de navigation. On peut donc supposer que Google avancera prudemment ses pions dans ce secteur sémantique pour ne pas se priver de ce qui reste sa 1ère source de revenus, le "traffic" généré par sa régie publicitaire (d'où d'ailleurs la balance du search décrite ci-dessus dans laquelle je n'ai à dessein fait figurer sur un plateau que les contenus ouverts et que leurs propriétaires ne souhaitent pas monétiser - comme Wikipédia).
L'autre avantage de cette densification, de celle d'un Google devenant "hébergeur de résultats" et non plus simplement "fournisseurs de liens" est à chercher du côté du marché des mobiles. Il va de soi qu'en contrôlant l'affichage Google optimisera encore un rendu de la navigation sur terminaux mobiles qui reste souvent inadapté ("permettre d’afficher des listes de résultats plus courtes, mais plus riches, ce qui est parfait pour les terminaux mobiles" comme le souligne Fred Cavazza)
Voici quelques copies d'écran illustrant le problème auquel va être confronté Google avec l'arrivée de sa phase sémantique.
D'abord le résultat de la requête "maldives" sur Google.fr, avant l'ère sémantique
Du classique, avec une bonne grosse collection de liens sponsorisés.
Et maintenant la même requête mais sur Google.com, avec sémantique.
La sémantique arrive, et la liens sponsorisés s'évanouissent. (il semble en fait que l'affichage du bloc sémantique s'efface au bout d'un moment pour laisser la place aux liens sponsorisés un court instant, avant de céder à nouveau la place au bloc sémantique, mais je n'ai pas réussi à reproduire la manipulation)
Deuxième essai quelques minutes plus tard :
On y retrouve un peu de publicité. Mais pour la retrouver entièrement, il faut entrer une requête transactionnelle explicite, par exemple "trip to maldives" :
Exit la sémantique. Retour de la pub.
Le virage sémantique de Google va donc l'obliger à travailler encore plus en amont dans la caractérisation du requêtage pour continuer à travailler la double articulation du search : fidélisation / monétisation. Fidélisation des usagers à l'aide de la sémantique qui, s'ils tapent une requête "simple" comme Maldives s'attendent peut-être effectivement à gagner du temps avec l'affichage direct des informations "encyclopédiques" sur ces îles. Et monétisation pour les requêtes qui réclament ou appellent un traitement transactionnel ("meilleur prix maldives" par exemple).
Mais comment garantir que les requêtes transactionnelles l'emporteront toujours sur les autres, pérennisant ainsi le modèle économique du moteur ?
Avec le recul on est alors frappé par le fait que l'arrivée de la sémantique dans l'interface des pages de résultats nécessitait, en amont, de pouvoir disposer d'options d'autocomplétion et du suggestion. Et ce précisément pour garder le contrôle et l'arbitrage sur le ratio de résultats qui peuvent faire appel à la sémantique et ceux qui doivent permettre de faire tourner le coeur économique du moteur (liens sponsorisés). L'autocomplétion et la suggestion permettent à Google de nous orienter vers un type de requêtage spécifique, et ce faisant de choisir à notre place (la suggestion est une sujétion). Après avoir inventé la publicité "contextuelle", les fonctionalités d'autocomplétion et du suggestion permettent à Google de rester maître de la sémantique publicitaire. Car les deux caractéristiques de la sémantique comme branche de la linguistique qui intéressent le plus Google sont :
Soit les deux enjeux et le coeur des fonctionalités d'autocomplétion et de suggestion liées au contexte (statistique ou issu de la personnalisation et de l'historique de recherche). Le problème étant naturellement que c'est le seul Google qui définit statistiquement l'ensemble des conditions de vérité d'un énoncé et qui appose "sa" pragmatique sur l'ensemble de nos requêtes individuelles et collectives.
Dernier dilemme à résoudre pour Google, comment mixer et à quelles proportions ces 3 types de résultats : organiques, publicitaires et sémantisés. On le sait, la part des résultats organiques était depuis longtemps déjà réduite à la portion congrue, particulièrement mais pas exclusivement sur les requêtes transactionnelles. "Ads are content".
<mise à jour du lendemain> Il semble que le knowledge graph permette effectivement de générer plus de requêtes et de publicités </mise à jour du lendemain>
Il semble probable que, pour toute une batterie de requêtes types, les résultats organiques soient presqu'entièrement "absorbés" dans le pavé "sémantique", modifiant ainsi l'organisation de l'interface :
Les nombreuses études d'eye-tracking nous ayant appris depuis longtemps que la place des différents pavés n'était pas indifférente, cette réorganisation de la page de résultats permet à Google de gagner sur tous les fronts :
Par ailleurs, dans le cadre d'un portage sur les terminaux mobiles (désormais 1er moyen d'accès de la planète connectée), et étant donné les contraintes de place desdits terminaux et leur connexion souvent plus lente, cette réorganisation pourrait s'avérer redoutablement efficace.
Dans ce lent glissement vers un web sémantique qui ne peut pour l'instant s'appuyer objectivement que sur une contextualisation sémantisée des requêtes, les logiques et les idiomes du "graph" l'emportent, au moins lexicalement, de plus en plus fréquemment sur celles du "rank". Facebook avait inauguré la mode avec son "Social Graph", avant que Tim Berners Lee en personne n'institue (ironiquement) l'avènement du GGG (Giant Global Graph) au détriment du WWW (World Wide Web). Et donc maintenant le GKG : Google "Knowledge Graph". Un glissement qui n'est naturellement pas neutre en ce qu'il atteste d'un déplacement du centre de gravité de la toile, ou en tout cas de son principal levier de valorisation (et de monétisation) : les routines et algorithmes de classement (ranking) importent désormais moins, ou apparaissent subordonnées aux différentes graph-ies rendues possibles par l'approche sémantique. Une évolution somme toute logique si l'on considère que la sémantisation des résultats permet d'escamoter ou de reléguer au second plan les anciennes routines de classification : si l'on nous propose d'emblée le jaguar que l'on cherche, il n'est plus primordial de classer les pages parlant de l'animal avec celles parlant de la marque de voiture.
Le web sémantique, le Giant Global Graph, est donc avant tout une graphie, qui confirme rétrospectivement la pertinence des analyses d'Alain Giffard sur les lectures industrielles puis sur leurs afférentes écritures industrielles. Les grands acteurs qui contrôleront le web de demain seront ceux qui seront capables de s'assurer non plus simplement la maîtrise d'un graphe orienté le plus large possible entre les personnes et les documents et de contrôler sa représentation, mais ceux qui seront capables de s'en servir pour en initier une graphie, pour en générer autant de graphies différentes qu'il existe de grandes catégories de requêtes, capables également de maîtriser et de remettre dans un cercle contextuel (et sémantique ?) de niveau supérieur les innombrables cacographies résultantes, et les routines kakonomiques qui en découlent.
Il faudra attendre un peu avant de voir si la sauce sémantique prend bien et si elle valide les pistes d'analyse proposées dans ce billet. Mais en tout état de cause, plus qu'un énième changement de nature algorithmique, elle pourrait bien bouleverser la nature même du moteur de recherche, et avec lui, la face entière du web. Une percée technologique qui élève un nouveau mur d'enceinte autour de l'écosystème de Google. Qui fait de lui un nouveau "jardin fermé". Lequel ne devra ni ne pourra pas oublier trop vite que l'essentiel des pierres le composant provient d'abord de contenus "ouverts", "d'extériorités", que la toute puissance des enclosures issues des écritures industrielles en général et des rankings propriétaires en particulier, ne pourra pas éternellement contraindre, même en exploitant tout le potentiel pragmatique issu de l'approche sémantique.
<Mise à jour du lendemain>J'avais, en 2008, commis un article sur la question de l'évolution des moteurs de recherche, article dans lequel je revenais notamment sur la place de la sémantique. Vous verrez que je n'étais finalement pas très loin du compte ;-)
On pouvait en effet y lire ceci :
"Mais ce web sémantique qui apparaissait il y a encore quelques temps comme un simple rêve ou comme un inaccessible idéal, dispose aujourd’hui d’éléments contextuels favorables à son déploiement. Parmi ceux-là : la structuration de plus en plus forte de certains contenus web (cf point 2.2), l’unification des différents gisements informationnels et les options de personnalisation de plus en plus fine qu’elle autorise, mais également le besoin de plus en plus fortement exprimé par les usagers de pouvoir disposer de fonctionnalités de recherche « intelligente », lesquelles ne peuvent être imaginées sans que soit mis en place un formalisme ontologique minimal."
Et plus loin :
"La question d’un web sémantique et de moteurs susceptibles d’en extraire plus « intelligemment » du contenu, ne cesse de se poser depuis l’article fondateur de (BERN, 2001).
Moteurs sémantiques : l’approche « top-down »
Les moteurs de recherche « sémantiques » soulèvent plusieurs questions. La première est celle de la relative complexité de leur prise en main à l’heure où les utilisateurs réclament des interfaces de plus en plus fluides, riches et intuitives. On sait par exemple le rôle que joua la sobriété et la simplicité de l’interface de Google dans son succès. On connaît également la difficulté que posent les interfaces cartographiques à l’internaute lambda. Même les outils de catégorisation ont mis longtemps avant d’être adoptés par le grand public et sont encore aujourd’hui perçus comme plutôt réservés à des utilisateurs avertis. <j'avais raison>Si tant est que le web sémantique puisse un jour être réalisé dans la forme imaginée par son concepteur, encore faudra-t-il que les moteurs proposent des interfaces adaptées.
La richesse d’un web sémantique, du point de vue de la recherche d’information, se situe principalement dans les capacités de navigation optimisées qu’il permettrait d’offrir. S’il s’agit « simplement » de répondre à des questions du type « Quid » ou même de simple désambiguïsation, les moteurs de recherche actuels gèrent suffisamment bien ce genre de questions. En revanche à partir d’une requête initiale, le fait de pouvoir naviguer non plus simplement à l’aveugle ou sur la base des backlinks menant d’un site à un autre, mais bel et bien dans un environnement sémantique explicite et contextualisé pourrait être grandement intéressant.</j'avais raison>
<j'avais tort>Si une réelle recherche sémantique devient un jour possible, elle sera longtemps réservée à l’exploration de corpus dédiés dans des contextes de tâche bien identifiés et au sein de communautés de pratique très délimitées, avant de se trouver à portée d’interface du grand public.</j'avais tort>
<j'avais raison>L’état de l’art actuel indique plutôt que les avancées technologiques se servent du web pour proposer une architecture de navigation inspirée de celle des bases de données relationnelles.
A l’inverse d’une approche descendante impliquant que soient déjà franchis les différents obstacles techniques permettant la mise en œuvre d’un web totalement sémantique, l’évolution des fonctionnalités sémantiques des moteurs de recherche suivra plus probablement une approche ascendante, émergente. Il s’agit cette fois de prendre progressivement en compte les différentes avancées des protocoles, langages et formalismes liés au web sémantique, non pas de manière globale mais sur des contenus très ciblés, ou dans le cadre de contextes de recherche là encore très spécialisés.
(...) La dernière course de fond engagée par les moteurs consistera donc, sans nécessairement attendre une harmonisation globale ou une standardisation univoque de l’ensemble des développements applicatifs en cours, à en prendre le maximum en compte, tout en trouvant le moyen de s’en servir pour « enrichir » l’expérience utilisateur lors d’une recherche d’information, par exemple en présentant des résultats de recherche davantage structurés ou permettant davantage d’interactions synchrones avec d’autres recherches, d’autres services, d’autres terminaux d’accès. Dit autrement, les moteurs sémantiques pourraient fournir une solution aux limitations de la recherche par mot-clé.</j'avais raison>
</mise à jour du lendemain>
Rédigé le 03 juin 2012 à 20:44 dans Document numérique, Ecologie de l'info, HDR, Moteurs et autres engins, Wikipedia | Lien permanent | Commentaires (6) | TrackBack (0)
La nouvelle vient de tomber. J'avais été contacté le 25 avril dernier par la BnF qui m'informait dans un courriel que :
"Madame, Monsieur,
Votre blog a été présélectionné par la Bibliothèque nationale de France en raison de son intérêt documentaire.
C’est pourquoi nous sollicitons votre accord pour l’attribution gratuite d’un numéro normalisé (ISSN*) qui permettra l’identification univoque du titre de votre blog à l’échelle internationale.
En France, l’ISSN est principalement attribué à des blogs sur critères documentaires ; il fonctionne à la manière d’un label qualité. Parmi les blogs scientifiques en cours de numérotation, citons par exemple les Carnets de recherche publiés sur le site hypotheses.org."
Et j'avais été content :-) Et voilà-t-y-pas que c'est précisément en sortant de mon dernier cours d'indexation et de catalogage avec mes DUT métiers du livre de La Roche sur Yon, dernier cours qui portait précisément sur les différents numéros normalisés (ISBN, ISSN, EAN, ISRW, DOI et tout ça et tout ça) que je reçois ceci :
Et voilà. Après 7 ans de boulot sur Affordance, et 10 ans (sur Urfist Info auparavant) à militer pour l'éligibilité des blogs scientifiques au rang de ressources documentaires à part entière, après l'énorme victoire du Cléo sur la plateforme Hypotheses.org, il semblerait qu'on passe - enfin - à une phase de reconnaissance plus large et plus systématique.
P.S. : curieux de savoir quels sont les autres heureux élus ISSNisés. Signalez-vous donc en commentaire :-)
Rédigé le 01 juin 2012 à 15:56 dans Document numérique | Lien permanent | Commentaires (5) | TrackBack (0)
| Le blog d'un maître de conférences en sciences de l'information. Réflexions, analyses, signalements, opinions.
"Where is the Life we have lost in living? Where is the information we have lost in Google ? |
| POUR CITER UN ARTICLE
Style APA
Style MLA |
| Postes McF 71ème section sur Galaxie |
Tous les contenus de ce blog sont sous licence Creative Commons. Vous pouvez donc les reproduire, les distribuer ou les communiquer à condition :
|
| "Mais quiconque affirme qu’il y a de l’argent à faire avec un stock d’ARTICLES SCIENTIFIQUES est soit un idiot, soit un menteur." Lawrence Lessig. 12 Janvier 2013. |
|
| Identité numérique et e-reputation : DÉCOUVRIR ET COMMANDER L'OUVRAGE |
Les commentaires récents