Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Bibliosphère dans la (net)vibe.

Repéré par JMS et effectivement incontournable. Attention tout de même, c'est vraiment un truc d'obsédé.

Blogs et RSS : (pas) demain la veille

En septembre 2005 je publiais un article indiquant toutes les potentialités des blogs et du RSS pour la veille.
Plus de 3 ans plus tard, la dernière étude de Digimind ("Baromètre des pratiques de veille stratégique des grandes entreprises françaises") montre à quel point l'adoption de ces pratiques est encore confidentielle :

  • "plus de 50% des cellules de veille ne surveillent pas ou peu les forums, blogs et autres réseaux sociaux."

Reste à savoir pourquoi ... L'étude de Digimind évoque comme premier frein "la méconnaissance des sources".

MareLibri : un nouvel Electre ?

Le portail de recherche MareLibri.com vous offre l'accès aux références de 20.000.000 titres en ligne, proposés par plus de 2.000 librairies. L'initiative en revient à 5 sites européens dédiés à la littérature (notamment les livres "rares" et "anciens") qui ont uni leurs forces et leurs catalogues pour proposer ce portail très très très intéressant (et gratuit). Outre l'intérêt du "volume" et de la nature des ouvrages accessibles, il faut saluer la sobriété et l'efficacité de l'interface : une recherche avancée avec tout le nécessaire (par titre, par auteur, par librairie, par thème, par ISBN), la possibilité d'afficher les résultats avec un tri "par auteur", "par pertinence" ou "par prix", et la possibilité de recevoir les résultats d'une recherche par mail ou en .pdf, ainsi que de s'y abonner via un fil RSS.
Tout y est ma bonne Dame ! Seule l'entrée par "Catalogue thématique" ne fonctionnait pas ah ben si c'est réparé, mais le site est en bêta test, donc on leur pardonne. Quand on voit tout l'intérêt de ce genre de portail, on regrette d'autant plus de n'apercevoir aucun frémissement dans le projet de portail de la librairie indépendante (à moins qu'à trop frémir et qu'à force de se disperser, il ne finisse par se dissoudre ...)
(Découvert via Brainsfeed)

Fini les vacances, c'est la rentrée ...

Côté moteurs/wikipédia/knol :

  • On a donc pas mal parlé avant et pendant les vacances du projet de Google concernant son "encyclopédie" Knol : dans Ecrans, Florence Devouard s'inquiète à raison en rappelant que 50 % du traffic vient directement de Google. Google Blogoscoped y revient également en soulignant l'argument selon lequel Google ne pouvait plus accepter de voir partir tout ce traffic "non-monétisé" vers un site (wikipedia) indiquant qu'il refuserait toujours la publicité.
  • Voir aussi la rapide analyse comparative de ReadWriteWeb entre Knol, Wikia, Wikipedia et Mahalo autour des trois mamelles de l'argent, de l'attention (comme vecteur de monétisation) et de l'altruisme (comme contribution à la somme des connaissances disponibles).

Côté réseaux sociaux, moteurs de recherche et scientométrie :

  • Medline nous avait déjà habitués à son goût des interfaces innovantes. En voici une nouvelle baptisée GoPubMed qui permet, sur la base d'une recherche de faire émerger des "réseaux sociaux" à partir des noms d'auteurs d'articles et de leurs adresses de courier électronique (Via Cismef). En fait, plutôt qu'un réseau social (ce qui est l'argumentaire marketing du lancement de ce nouveau service), c'est bien de scientométrie qu'il s'agit, c'est à dire de la capacité, via un moteur sémantique, de repérer des collaboratoires, des "collèges invisibles", et de cerner en un instant sur un thème donné, l'état des publications en la matière et les chercheurs les plus en vue. Exemple : en entrant le terme "stuttering" (bégaiement) et en cliquant (à gauche dans la rubrique "What") sur "Hot topics", vous visualisez :
    • un "top 20" des auteurs ayant le plus publié sur le sujet
    • un "top 20" des publications classées par pays
    • un "top 20" des journaux dans lesquels on trouve le plus de publications en rapport avec le bégaiement
    • une courbe temporelle vous permettant de visualiser la progression (ou le recul) du nombre de publications par an sur ce sujet
    • une visualisation sous forme de graphe des réseaux de collaboration entre auteurs (répondant à la question "qui publie avec qui ?")
  • c'est à tomber par terre. Et on se prend à rêver d'un tel outil dans le cadre d'un moteur généraliste majeur à vocation scientifique (maiiiis non, pas forcément celui-là, il y a aussi celui-là). Pour mieux comprendre la puissance d'un tel outil : allez le tester, et lisez le communiqué de presse (.pdf).

Côté moteurs tout court :

  • le 7 janvier 2007, il y a donc de cela exactement un an, Jimmy Wales annonçait le lancement de Wikia, le moteur de recherche dont les résultats seraient validés par des humains. Et bien exactement un an plus tard, on nous annonce le lancement de Wikia (en version béta) pour demain, le 7 Janvier 2008 donc. A ce sujet, voir la revue de presse de Christophe Asselin. Le site de la "communauté" wikia est ici, et comme on peut le lire dans le wiki du projet, Wikia compte s'appuyer sur tout l'éventail des technologies de recherche à valeur ajoutée, à savoir la sémantique (= catégorisation), le "réseau social", l'indice de "réputation", et une infrastructure "distribuée". Lancement demain donc, et affaire à suivre de près pour ce nouveau "moteur de recherche open-source collaboratif".

Côté Bibliothèque "2.0" (ou pas ...)

  • Une conférence qui s'est tenue début Novembre à Berkeley sur le sujet des bibliothèques "2.0" avec les supports de présentation accessibles en ligne (supports présentés parfois sous forme classique - un bon vieux powerpoint - parfois sous forme "2.0" - un wiki). Pas de grande nouveauté mais cela vaut le coup de visionner la conférence inaugurale de Meridith Frakas qui embrasse bien la situation (.ppt)
  • l'un des derniers rapports du Pew Internet nous apprend (via 01.net) qu'outre-atlantique, la première raison de fréquentation des bibliothèques est ... le fait d'y trouver une connexion Internet. De quoi largement réalimenter de vieux démons débats, tant sur le taux d'équipement desdites bibliothèques dans notre bel hexagone, que sur la place des technologies d'accès dans ces enceintes et le taux de formation et d'encadrement qui est dévolu à leurs personnels.

Côté Folksonomies & Indexation sociale

Côté néologismes :

  • Saluons l'arrivée de la Zemblanité, exact opposé de la sérendipité et qui désigne "la faculté de faire de façon systématique des découvertes malheureuses, malchanceuses, attendues et n'apportant rien de nouveau." La génèse du concept et sa présentation détaillée sont disponibles sur Urfist-Infos.
  • Saluons (Via Francis Pisani) l'arrivée  de la "mobiquité" : mobilité + ubiquité. Un néologisme qui traduit bien la place de plus en plus importante qu'occupe dans notre société et dans nos comportements informationnels, l'informatique nomade et/ou ambiante.
  • Reste à savoir si ces deux néologismes entreront au panthéon linguistique aux côtés de la blingocratie.

Côté copyright, Fair-Use et autres creative commons

  • Un rapport intitulé : "Recut, Reframe, Recycle: Quoting Copyrighted Material in User-Generated Video" (.pdf). La question posée est de savoir si dans le cadre des sites de médias participatifs donnant lieu à divers remixages (exemple : YouTube), les détournements, parodies, et autres mashups de diverses oeuvres de fiction relèvent - ou non - du cadre du Fair Use (= usage équitable) et échappent donc à la législation du copyright. La réponse du rapport est claire : Oui. Il y a dans ces "oeuvres" de nouveaux éléments (détournement, transformation, remixage) qui les inscrivent dans le cadre de la constitution d'une culture populaire. "Video remix culture does not violate copyright." Les auteurs du rapport rappellent également qu'il est important de sensibiliser aussi bien les "auteurs" que les "remixeurs-amateurs" à la notion de propriété intellectuelle et d'usage équitable, pour que les premiers soient conscients de la richesse que ces remixages peuvent (parfois) apporter à leurs oeuvres, et pour que les seconds travaillent et s'amusent dans le respect de l'oeuvre des premiers. A noter : le site de présentation de l'étude est très bien fait, puisqu'en sus du téléchargement de l'étude proprement dite, il propose également une courte vidéo en rappelant les principales problématiques et conclusions, et propose également de télécharger un fichier excel du corpus de vidéos utilisées. Il propose enfin, pour chaque type de remixage (détournement, critique, débat, illustration, etc ...) les 5 vidéos les plus parlantes. Certaines d'entre elles sont réellement ... parlantes.
  • Et puis vraissemblablement à ne pas rater (je ne l'ai encore pas visionné en entier, mais il est plein d'interviews avec Yochai Benkler et ne peut donc pas être mauvais :-) un documentaire sobrement intitulé "Steal this Film" qui décrypte les enjeux liés à la notion de propriété intellectuelle et plus largement de "diffusion" dans le contexte actuel. Pour les plus pressés, plein d'extraits sur Google Vidéo, pour les autres téléchargement dans plein de formats possibles directement sur le site du documentaire. Il y en a même qui se sont déjà attelés au sous-titrage en français.

Côté traces documentaires identitaires (ou identité numérique si vous préférez) :

  • nos comportements informationnels laissent de plus en plus de place à l'égotisme forcené. Au service de cet égotisme on compte d'ailleurs de plus en plus d'outils tendant à l'illustrer (les divers outils de classement façon "top 50 de quelque chose"), à le renforcer (économie de la réputation), à en faire naître le besoin (via des interfaces navigo-ludiques dont vous êtes le centre et la circonférence), ou à en faire l'alpha et l'oméga d'un modèle économico-sociétal (facebook). C'est l'éternelle histoire de la poule et de l'oeuf.
  • Got dans ses petites cases, nous gratifie d'un éclairant billet sur FOAF (Friend Of A Friend) dont on aimerait effectivement penser que le modèle réellement ouvert qu'il incarne soit l'avenir des protocoles tournant derrière la plupart des réseaux sociaux. Mais je ne peux hélas pas m'empêcher de penser qu'il y a encore bien du chemin à parcourir ... l'heure étant plutôt pour les grosses cylindrées à la centralisation des profils propriétaires ... ce qui doit nous inciter encore davantage a faire plus de place aux initiatives alternatives et technologiquement éprouvées (dont FOAF).

Côté ressources pédagogiques :

Côté voeux, bonnes résolutions et oracles divers :

  • il y a ceux qui ne croient plus aux blogs sous leur forme actuelle (Jean-Michel Salaun et Jean Véronis) ... mais qui continuent heureusement de blogguer :-) De mon coté je reste sur le créneau de l'enthousiasme (peut-être un peu candide), même si - à l'instar des deux précédemment cités - je constate ici et là une raréfaction des pépites blogguesques, nombre de trouvailles ayant visiblement du mal à tenir sur la longueur, ce qu'on aurait du mal à leur reprocher tant il est vrai qu'en dehors d'un projet affirmé de publication (journal, auto-fiction, carnet de recherche, formation à distance), l'exercice du blog est une gymnastique chronophage, et que "le temps de blogguer" n'est pas nécessairement la chose la mieux partagée du monde. Il n'en demeure pas moins qu'en repensant à ce qu'était la pêche informationnelle d'avant et d'après le temps du blog, ce "format éditorial" a tout de même été l'occasion d'entendre de bien belles voix, et de découvrir de fort pertinentes analyses. L'avenir dira ce la forme blog deviendra, mais les potentialités, l'univers de discours offert par une petite quantité de ces "nanopublications" reste pour l'instant et de mon point de vue, essentiel.
  • il y a ceux qui comme Fred Cavazza, se livrent à leur petit exercice de prospective du nouvel an, et ceux qui comme Francis Pisani, font une revue de presse des principaux exercices du genre.

Et mes prédictions à moi ?

  • A l'instar de ce que décrit Christian Fauré à propos du service Twine, je crois que l'ensemble des acteurs majeurs de la recherche d'information (Google, Yahoo! Microsoft) et quelques-uns de leurs challengers (Exalead, Facebook) vont prendre de plus en plus nettement le grand virage de l'hybridation. Une hybridation entre :
    • des espaces et des services collaboratifs,
    • des technologies sémantiques ou sémantisées de représentation et d'agrégation des connaissances,
    • et des algorithmies de recherche "pures" (ou recherche universelle).
  • Je crois que la diversité des contenus va (enfin) atteindre un équilibre longtemps espéré entre le "texte seul" et la vidéo et l'image.
  • Je crois enfin que l'une des grandes questions en terme de recherche (notamment pour les sciences de l'information et de la communication) sera la mise au jour des nouvelles autorités cognitives qui s'articulent aujourd'hui de manière encore un peu floue derrière la monétisation (ou la non-monétsation) des services à base de connaissance (Knol, Wikipedia).
  • De mon côté je retiens comme éléments et tendances majeures de l'année écoulée : les deux nouvelles étapes de la dérives des continents documentaires que sont :
    • d'une part, la synchronisation transparente entre nos activités informationnelles connectées (on-line) et déconnectées (off-line),
    • et d'autre part, la sphère croissante d'indexabilité (notion de "graphe social" pour faire simple) de l'humain au travers de ses innombrables traces documentaires éparses sur le(s) réseau(x).
  • Ce qui me semble frappant au-delà de tout c'est l'avénement imminent et probable d'une nouvelle génération d'algorithmes ayant capacité à représenter sur un même plan des documents toujours plus fragmentaires, des traces identitaires toujours plus documentées, et à transformer toutes ces traces d'attention en vecteurs d'intentions, pour le plus grand bonheur des grandes industries culturelles et des quelques acteurs qui dominent actuellement le marché (et ce au-delà du discours geignard et misérabiliste que s'obstinent à tenir les mêmes industries culturelles). En un mot comme en cent : la redocumentarisation du monde. Il est certain qu'il va falloir être très très très attentif aux Network sciences, car elles seront le creuset plus que probable de cette nouvelle génération d'algorithmes et de modes de représentation, et qu'à mon sens, elles seules ont aujourd'hui la capacité à réunir en un même cadre d'analyse les fronts de recherche les plus innovants, les techniques d'indexation et de représentation du vivant au sens large.
  • Voilà pour le côté vivifiant et optimiste de la chose. Côté pessimiste (mon éternel côté cassandre :-); je crains que nous ne soyons confrontés à une échéance majeure, celle de la médecine personnalisée et/ou médecine "2.0" et/ou médecine désintermédiée. La montée en puissance et la position désormais établie de ces nouveaux prescripteurs planétaires que sont les moteurs de recherche d'une part, la mise à la portée du grand public des technologies de génomique (notamment à des fins d'auto-diagnostic) d'autre part, les rapprochements entre les premiers (moteurs de recherche) et les secondes (sociétés de génomique), et enfin l'engouement de plus en plus explicite chez tous les grands acteurs de l'industrie médicale (et notamment pharmaceutique) pour des modèles de diffusion et d'accès reposant sur du gratuit financé par la publicité va nécessiter, pour le moins, de grands chantiers didactiques si l'on veut éviter d'aller à coup sûr ... droit dans le mur. Va falloir se trouver dare dare un José Bové de la santé comme bien commun de l'humanité. Sinon ...

Bonne année à vous tous :-)

Les 4 commandements

Ceux que l'on peut lire sur le site d'Amazon, en référence à la nouvelle interface de ce site, pionnier par bien des aspects : "Shopping, Searching, Saving, and Buying". Simple, basique, efficace, programmatique et tellement caractéristique des comportements informationnels les plus courants.
A mettre en relation avec l'autre trilogie des modes de requêtage sur le net : requêtes transactionnelles, informationnelles, navigationnelles, renvoyant elles-même à l'antique schisme entre browsing et searching, qui lui-même est venu récemment s'adjoindre les services du subscribing.
Shopping, Searching, Saving and Buying. SSSB. Les 4 commandements de nos vies numériques. Ainsi qu'une lumineuse grille d'analyse.
(Via Isbn.wordpress.net)

Moteur à facette

A lire sur l'excellent Leçons de choses, une description de l'intérêt et des enjeux d'un moteur de recherche à facettes. Nous on y croit, lui (elle ?) on ne sait toujours pas ;-).

Perspectives documentaires sur les moteurs de recherche

"Perspectives documentaires sur les moteurs de recherche : entre sérendipité et logiques marchandes."
Un article co-écrit par votre serviteur et deux compères : Gabriel Gallezot et Eric Boutin.

  • Le pitch : "Le monde de la recherche d’information est actuellement en train de vivre une période d’intense bouleversement : position hégémonique du moteur Google, question délicate de l’interpénétration des sphères publiques et privées, redocumentarisation du monde, montée en puissance de la logique publicitaire et sa cohabitation avec le modèle « régulé » de la simple application d’algorithmes. De nouvelles modalités d’accès apparaissent, telle celle de la sérendipité que nous interrogeons, après l’avoir resituée dans l’héritage de la bibliométrie, au regard des modèles théoriques de la recherche d’information, pour isoler le rôle d’adjuvant indispensable qu’elle occupe désormais. Son instrumentalisation par les moteurs, sa perception liée au niveau d’acculturation socio-technique des usagers, la diversité de ses instanciations, pose la question de l’opacité des algorithmes et de la nécessaire ouverture d’un débat autour d’un écosystème non plus simplement documentaire mais politique."

Un bien bel article donc, refusé une première fois par une prestigieuse revue, mais que nous ne désespérons pas de pouvoir placer quelque part, à vot' bon coeur m'sieurs dames ;-)
En attendant, il est pour vous, petits veinards : Téléchargement ertzsgallbout.pdf <Update>avec une policie lisible cette fois :-() </Update>
Et surtout, que vous soyez pairs ou impairs, dîtes-nous ce que vous en pensez (à ce jour, nous sommes toujours sans nouvelles de Monsieur 2, et ça risque de durer ...)

P.S. : naturellement, avec l'accord de mes co-auteurs, l'article sera bientôt également accessible sur ArchiveSic. Mais ce soir, ça bugguait. Donc je le mets ici au chaud en attendant. <Update> Ayé. L'article est également consultable sur ArchiveSic </Update>


 

Rentrée des classes

Côté bibliothèques :

  • un tutoriel qui en 15 minutes par jour fera de vous un bibliothécaire 2.0.
  • les supports du congrès ABF Nantes 2007 sont (presque) tous en ligne.
  • un entretien avec Jean-Yves Mollier, à lire dans Télérama, et où il est entre autre question de l'avenir du livre et des bibliothèques. On n'y apprendra pas grand chose rien, mais la justesse de ton et la pondération sont également parfois appréciables :-)

Côté bibliothèques et moteurs :

  • les bibliothèques de l'université de Keio (Japon) rejoignent le programme Google Book Search, qui entre ainsi sur le continent asiatique. 120,000 ouvrages du domaine public sont concernés. Le nombre de bibliothèque partenaires s'établit donc désormais à 26. (Via InsideGoogleBookSearch & le communiqué de presse - .pdf - de Keio). Une étrange affordance au passage en guise de réminiscence, je connaissais le nom de l'université de Keio parce que Ted Nelson, inventeur et précurseur de l'hypertexte et d'une utopie mondiale de la connaissance baptisée Xanadu, Ted Nelson donc y était allé soutenir l'équivalent de ce que l'on nomme ici une "Habilitation à Diriger les Recherches". La signature de cet accord avec Google, dans l'ombre du passage de Ted Nelson à Keio donne à Google Books un étrange aspect d'aboutissement de Xanadu.
  • la bibliothèque de l'université Cornell se joint également au projet Google Book Search. 500 000 des 8 millions de volumes imprimés détenus par ladite bibliothèque sont concernés. Soit donc au total 27 bibliothèques partenaires.
  • Sur le même sujet, ne manquez pas l'article de Paul Duguid dans le dernier First Monday, et le commentaire avisé qu'en fait Jean-Michel Salaun.

Côté OpenAccess :

  • les dépôts OAI francophones en SHS suivent, et c'est tant mieux, une progression lente mais régulière et soutenue : voir le décompte détaillé de Marin Dacos.
  • Plus globalement d'ailleurs, le mouvement de l'open access dans sa globalité suit une courbe dramatiquement (?) ascendante.
  • Ceci expliquant sûrement cela ... la toute puissante AAP (association des éditeurs américains) lance l'initiative PRISM ("Partenariat pour l'intégrité (sic ...) de la recherche en science et médecine"). L'idée est d'alerter le public sur les présumés "risques" de la publication en Open Access. L'attaque est aussi frontale que caricaturale, en pointant les soi-disant "risques d'une censure d'état" liés à une "disparition de l'évaluation par les pairs", ce que personne, même les plus extrêmistes partisans de l'Open Access, n'a j-a-m-a-i-s ne serait-ce que suggéré. On en rirait presque, mais le pouvoir de lobbying de l'AAP est tel que l'on en est plutôt navré et inquiet. Il s'agit en fait de la mise en pratique du plan de guerre contre le libre accès, déclaré en Janvier 2007, pour lequel l'AAP avait eu recours à une agence de relations publiques aux méthodes qui pourraient n'être que tristement célèbres si elles n'étaient pas également largement discutables (désinformation, propagation de fausses rumeurs, etc, etc.). Tout cela est proprement consternant tant les arguments évoqués sont spécieux. Mais tout cela risque surtout de faire de considérables dégâts. Donc, plus que jamais, continuons le combat ... et le prosélytisme ... <Update de 5 minutes plus tard> Via Marlène - qui en parle aussi - je découvre ce billet certes partisan - de l'autre camp - mais qui résume très bien la situation et reprend nombre de réactions blogosphériques à ce sujet </Update>

Côté moteurs :

  • Google ...
  • Google fait preuve d'un appétit dont la constance confine à la boulimie. Voir la liste dressée par Christophe Asselin des acquisitions des derniers semestres. Derrière cet appétit qui peut sembler désordonné, se dessine progressivement une stratégie bien identifiée de positionnement sur le Web OS pour tout type de public et toute taille d'entreprise. De son côté, Henri Labarre nous offre une cartographie synoptique au format .pdf de ladite boulimie.
  • Et puis comme cela ne fait jamais de mal de rappeler quelques fondamentaux, une belle animation flash sur la manière dont fonctionne Google.
  • Google encore qui donne dans le tonitruand, en annoncant l'ouverture des commentaires sur Google News, pour ceux "ayant un lien" avec l'affaire commentée (sic). Nombre de journaux le font déjà, sans qu'il soit besoin de "prouver" avoir un lien quelconque avec l'affaire, mais quand Google touche au modèle média de la presse en ligne, tout le monde s'affole. Techcrunch rappelle les faits dans un billet synthétique. L'immense majorité des observateurs est plus que sceptique, à l'image de Danny Sullivan qui résume l'affaire en un mot : "Weird". Emmanuel Parody dans son analyse à laquelle je souscris entièrement, évoque une "arrogance d'un nouveau genre". Jusqu'au LATimes qui, deux jours après l'annonce, dans une tribue non-signée, compare Google à ... Osama Ben Laden :-(
  • Et les autres ...
  • Technorati s'effondre lentement mais sûrement ...
  • La tendance - ou l'idée que je crois de plus en plus vraie - qui veut que la fabrication de moteurs (indexation, rafraîchissement, parsing et autres technologies) et la fabrication d'interfaces soient deux métiers différents, cette tendance semble se confirmer avec le rapprochement de Groxis (excellentissime interface de Grokker, depuis le temps que je le dis ...) et d'Intellisearch. Pour plus de détails, voir l'article de l'Atelier.

Côté veille :

Côté web :

  • Si le web est implicite, il est aussi granulaire ou plus exactement fractal. Et les Widgets en sont la plus petite unité atomique. Techcrunch nous gratifie d'un billet synthétique sur les origines, les plateformes et les standards de ces petits widgets.
  • L'équipe d'Information Architects nous gratifie de son côté d'une belle carte (.gif) dans le genre "plan de métro", listant un grand nombre d'acteurs et de services du web actuel. Synoptique et fort utile pour repérer quelques "tendances".

Côté réseaux sociaux :

  • Nous nous étions quitté en listant ce que nous savions aujourd'hui des réseaux sociaux, et bien il y a de fortes chances pour que ces réseaux sociaux occupent une très grosse part de l'actualité webienne dans les mois à venir. Avec tout d'abord le coup de poker de Facebook, dont Google a une énorme envie et qu'il pourrait bien tenter de se payer, après que le PDG dudit Facebook a refusé l'offre de Yahoo (1 milliard de $ ...). Si le marché se concluait, Google enterrerait de facto toute possibilité d'émergence en la matière, puisqu'il est déjà par ailleurs installé (motorisation et régie publicitaire attenante) comme moteur officiel de LA plateforme concurrente MySpace. Du côté des trois grands le tableau est donc pour l'instant le suivant :
    • MSN dispose de MySpace. Leader indétrônable pour ce qui est du nombre de teenagers impliqués.
    • Yahoo! (ayant échoué à racheter Facebook) travaillerait sur un projet baptisé Mosh
    • et Google (probablement en train d'essayer de racheter Facebook) aurait de son côté une nouvelle arme fatale baptisée SocialStream (voir le billet de Techcrunch pour plus de détails, et voir aussi le site de présentation du projet SocialStream, présenté comme "réseau social unifié" et dans lequel une large place est faite à la notion de Sérendipité ...). Notons ici encore que sur ce terrain (réseau social "unifié") comme sur d'autres (recherche "universelle") ma petite théorie de la dérive des continents documentaires résiste bien à l'analyse ;-)
    • Si vous êtes un peu perdus, FredCavazza résume tout ça très bien. De mon côté, même si dit comme ça cela peut ressembler à du teasing éhonté, je pense que si FaceBook avait l'intelligence de regarder du côté d'Amazon (et réciproquement), la carte des acteurs plénipotentiaires du web actuel serait entièrement reconfigurée. J'y reviens dans un prochain billet ... enfin si je n'oublie pas et si j'ai le temps :-(
    • Et pour compléter mon dernier billet sur la question, on lira avec intérêt les deux billets que Jean-Michel consacre à cette même question : ici et .
    • Toujours sur le livre des visages (dévisage ?), à lire également la réflexion de François Bon.
    • Pour le côté business, voici une grille très détaillée vous permettant de calculer le retour sur investissement (ROI) d'un réseau social
    • A lire également, les résultats d'une étude menée sur 850 personnes de 54 pays, étude sans prétention scientifique mais qui confirme tout de même quelques orientations, dont la domination de LinkedIn dans la catégorie "réseau social professionnel".
    • On pourra également consulter la liste des réseaux sociaux disponible sur Wikipedia, en complément de celle de Dannah Boyd, ainsi que le rapport d'Avril 2007 de Forrester (.pdf), déjà signalé sur ce blog (pour les plus pressés, voir le récent résumé de Gerry Mc Kiernann)
    • Et puis ... et puis ... et puis il est des programmes de recherche auxquels on aimerait avoir participé ou dont on voudrait avoir eu l'idée, comme celui visant à établir le réseau social ... des superhéros Marvel. Le résultat est à lire sur ArXiv. Avec une grosse déception tout de même, l'étude se base sur l'apparition desdits superhéros au fil des volumes de publication et ne s'intéresse pas aux communautés elles-mêmes (Vengeurs, X-Men, etc.). Impossible donc d'avoir la preuve scientifique que le Fauve ait entretenu une relation avec Miss Hulk :-(

Côté Wikipédia :

  • La polémique (stérile) de l'été.
  • A l'occasion de sa pause estivale, Homo Numericus nous offre trois billets d'analyse sur "l'histoire politique" de Wikipedia, rédigés par Sylvain Firer-Blaess, étudiant de l’IEP Lyon : ici (1), ici (2), encore ici (3), et (4).
  • Un étudiant a mis au point un détecteur de TRDs (Tentatives de Redocumentarisation Déviantes) : pour le tester vous-même, direction le Wikiscanner (tous les journaux en ont parlé - Le Monde, Libé, etc. - mais vous pouvez bénéficier d'un rattrapage de qualité avec l'article de Christophe Deschamps, et d'une ouverture problématique fondamentale chez Jean-Michel Salaun, concernant l'urgence de réinventer le droit à l'oubli)
  • Dans le dernier numéro de First Monday, un autre étudiant s'est penché sur la qualité des citations scientifiques dans l'encyclopédie collaborative, avec deux résultats intéressants : les citations sont pour l'essentiel conformes aux normes académiques, et elles ont tendance à renvoyer majoritairement vers des revues à forte notoriété (Science et Nature en tête), ce qui ne peut effectivement que "contribuer à renforcer la crédibilité" de l'encyclopédie.
  • Et pour prolonger le débat, les 19 et 20 octobre 2007, l’association Wikimédia France organise le premier colloque francophone sur Wikipédia, à la Cité des sciences et de l’industrie sur le thème suivant : "Développer - Valider - Ouvrir". A ce jour, le programme ne fait état que de l'intitulé de 3 "séminaires" sans davantage de contenu ni d'intervenants (un sur les "réseaux d'experts" - tiens, tiens ... - un autre sur les rapports de l'encyclopédie avec le monde de l'enseignement, et un troisième sur l'épineuse question de la validation). A suivre donc ...

Côté identité/identifiants/traçabilité numérique :

  • Après les 3 lois de la robotique, les 7 lois de l'identité numérique. (Via InternetActu)
  • Un billet intéressant sur la gestion des avatars.
  • Naturellement en la matière, la clé résidera dans l'attitude, l'orientation et la marge qu'autoriseront les moteurs sur ces questions. Les habitués d'affordance retrouveront aisément sur ce blog quelques billets concernant la politique de Google en la matière, et durant cet été, Ask a annoncé son service AskEraser permettant aux utilisateurs de ne voir aucune donnée conservée durant leurs recherches. A l'inverse, le moteur Spock entend ficher les individus sur la base des informations collectées par les moteurs. Après un rapide test, il s'avère - heureusement - assez inintéressant (sauf si vous voulez connaître l'âge et le nom des épouses de différents présidents de la république de tel ou tel pays). Un million de personnes seraient ainsi "indexées" dans ce "people specific search engine". En revanche, nul doute que demain, l'un des moteurs majeurs proposera à son tour ce type de recherche.

Côté Outils :

Côté lectures / visionnages :

  • Un numéro du Journal of Computer-Mediated Communication avec notamment une section spéciale de 5 articles concernant les blogs, et quelques autres papiers intéressants autour des réseaux sociaux.
  • Le billet du gourou Nielsen qui a fait couler beaucoup d'encre blogosphérique au début de l'été : "Ecrivez des articles, pas des billets."En (très) gros, Nielsen plaide pour une expertise affirmée, au-delà de la surabondance instantannée d'information qui surgit dans la blogosphère à propos de tout ou de n'importe quoi. L'idée est que - selon Nielsen - si vous voulez affirmer votre expertise et éventuellement la monnayer au prix fort, vous devez écrire des billets longs, privilégier l' "in-depth content". Sébastien Billard résume très bien le tout.
  • « L’impact d’Internet sur l’économie de la presse : quel chemin vers la profitabilité ? » (.pdf) La thèse toute fraîche de Danielle Attias.
  • Et puis pour la bonne bouche, un petit film d'anticipation sur l'avenir du livre, lequel livre, peut-être selon un phénomène de contamination du support, devient de plus en plus "rich"-media.

Côté université :

  • Un très bon numéro spécial (.pdf) du magazine Horizons de l'AIU (Association Internationale des Universités), publié par l'Unesco, et consacré à la thématique du classement, des indicateurs et autres palmarès en vigueur (ou non) dans nos universités. Je vous recommande tout particulièrement la lecture de l'introduction de Jamil Salmi et Alenoush Saroyan, intitulée : "Les classements des universités comme instruments politiques : usages constructifs pour l'enseignement supérieur".
  • Sur le site lautrecampagne.org, une série de 5 entretiens avec des gens concernés et impliqués sur le projet de réforme des universités du gouvernement. Tous les sujets qui fâchent y sont abordés : recrutement, financement, échec en premier cycle, autonomie, etc.

Bonne rentrée à tous et toutes :-)

(Via : l'harassant dépouillement de mon agrégateur ...)

La marque de la pertinence

Dans un article à paraître (enfin j'espère ...), mes 2 co-auteurs et moi-même écrivons à propos de la notion de "pertinence" des résultats d'un moteur de recherche :

  • "les moteurs de recherche n’offrent qu’un seul type de « preuve »  ou de mise à l’épreuve : celui de leur pertinence. Une notion ambiguë parce que non uniformément circonscrite. Si l’indicateur scientométrique vaut pour l’ensemble de la communauté qui s’y réfère ou l’utilise, chacun jugera de la « pertinence » d’un résultat à l’aune de sa seule subjectivité et du contexte de tâche dans lequel s’inscrit sa recherche."

Analyse que vient corroborer une étude (.pdf) relevée par Sébastien Billard, étude démontrant que pour des résultats strictement identiques, les utilisateurs jugent lesdits résultats plus ou moins pertinents selon qu'ils sont présentés avec l'habillage de tel ou tel moteur (avec un écart de 25%, ce qui n'est pas anecdotique), la palme de la confiance dans la marque revenant en l'occurence à Yahoo!
Remarque :
ce dernier résultat (échelle de confiance) contredit en revanche d'autres études d'adhésion à une marque d'où Google sortait nettement gagnant ... mais je n'ai plus les références desdites études :-(.

Moteurs bibliographiques

Google, Google Scholar, Citeseer, ScienceDIrect, IEEE explore, ACM DL, CSB, PuMeb, IngentaConnect, Netbib, ISI Web of knowledge, ArXiv et quelques autres : au total une bonne douzaine de moteurs de recherche bibliographiques passés au crible selon 5 critères :

  1. domaines couverts
  2. champs et opérateurs de recherche acceptés
  3. possibilité d'export en différents formats bibliographiques
  4. possibilité d'obtenir une copie électronique
  5. modèle gratuit ou payant.

Aucune prétention "scientifique" dans cette étude très empirique, mais un bon indicateur de l'état de l'art en la matière.

(Via Academic Productivity)

Visibilité de la science et rente à vie des formateurs à la recherche documentaire.

Le corrolaire actuel de l'immémorial "publish or perish" ** est que la "vie" des publications scientifiques est conditionnée à la possibilité et aux modalités de leur accès. Maintenant que les éditeurs scientifiques - avec notamment leurs offres de bouquet numériques - ne sont plus seuls sur ce marché, rejoints :

  • par les moteurs de recherche, Google Scholar en tête,
  • et par l'explosion des archives ouvertes et institutionnelles

maintenant donc, la visibilité et l'accessibilité (hors les offres propriétaires des éditeurs) à tout ou partie desdites publications sont les facteurs d'impact clés de l'économie scientifique et de son marché de la citation.
A ce titre la récente annonce du lancement en Juillet 2007 du moteur Scitopia.org est intéressante. Il s'agit de regrouper derrière ce moteur des sociétés savantes (13 pour l'instant) donnant accès à leurs publications avec consultation gratuite du résumé et accès au texte intégral soumis soit à un abonnement à la revue, soit à un paiement à l'acte (3 millions d'articles sont annoncés sur une période de 150 ans).
Ce lancement soulève (au moins) une question et une réflexion :

  • QUESTION : le contenu (à tout le moins les résumés) restera-t-il propriétaire et ne va-t-il pas se trouver rapidement "aspiré" dans Google Scholar ?
  • REFLEXION : cette diversification de l'offre (archives ouvertes, moteurs grand public, initiatives étatiques - persee.fr - , bouquets numériques propriétaires fermés ou semi-ouverts - cairn.info -) contribue à rendre visible une part chaque jour plus significative d'un web jadis invisible. Elle risque également d'occasionner pas mal de doublons (moindre mal). Elle risque enfin de garantir une rente à vie aux formateurs en recherche documentaire ;-)

Dans la même veine, on consultera avec intérêt le mémoire de l'Enssib (Avril 2007) : "Les accès internationaux aux travaux de recherche français. Synthèse bibliographique." (.pdf)

**Just for fun, une devinette carambar scientifique (entendue lors d'un colloque) :
Question : Vous savez pourquoi Jésus n'est jamais entré au CNRS ?
Réponse : Il n'a qu'une seule publi, et elle n'est même pas en anglais.

(Via PintiniBlog)

Bibliothèques, données et moissonnage 2.0

Très vite une petite revue de liens :

  • un Wiki sur le futur des bibliothèques, des catalogues et des (méta)données.
  • la biblioblogosphère française s'organise via 2 "méta"agrégateurs : ici (génèse du projet ici) et
  • Visualiser sous forme de nuage de tag les différents éléments du format MARC (âmes bibliothéconomiques sensibles s'abstenir)
  • l'Open Content Index : une tentative de ré-étalonnage bibliographique d'une masse d'informations de plus en plus intéressante mais aussi de plus en plus dispersée.
  • une tentative d'organisation à laquelle contribue également Revues.org via leur dépôt OAI :
    • Reprise du message publié sur Biblio-fr : "Ce dépôt vous propose, à ce jour, les métadonnées de 19359 articles issus de 59 revues de sciences humaines et sociales publiées en ligne sur notre portail. Ces métadonnées sont  structurées en Dublin Core simple. Dans le futur, elles seront enrichies afin d'offrir plus de précision et de granularité
      dans la description des articles et des collections  (Dublin Core qualifié et METS).
      La liste des publications concernées est accessible à l'adresse suivante : http://oai.revues.org/archives.php
      "

Blogs rééditorialisés et redocumentarisés.

EBSCO est l'une des deux plus grandes agences d'abonnement mondiales (fourniture de bases de données et de périodiques). Et EBSCO vient d'annoncer dans son offre, la mise à disposition de "full-text blog content from premier Weblogs with historical archives in a wide variety of categories including art, career, economics, environment, finance, food, health, law, marketing, medical, technology, and many more will be made available in online aggregated databases for the first time."
Même si le communiqué donne encore un peu dans le mélange des genres (mentionnant que seul seront retenus les "influential bloggers" là où un "authoritative bloggers" eût été à mon sens plus judicieux), c'est là à n'en pas douter une avancée significative dans la reconnaissance de la valeur ajoutée de la blogosphère, une blogosphère ici en quelque sorte "rééditorialisée" par un éditeur de contenus au sein d'une offre numérique :

  • "value of such content is significantly increased due to the high quality control standards Newstex follows in their effort to gather and disseminate blog content."
  • "Newstex automatically tags each blog post with company names, stock tickers, key executives and government officials, and detailed topical categories."

Ce qui ressemble fort à un modèle émergent de redocumentarisation. La liste des blogs repris dans cette nouvelle offre commerciale est accessible ici et consultable par grandes rubriques. A noter que la rubrique Information Science est ... désespérément vide ... S'ils proposent un bon modèle de rétribution aux bloggers, je suis prêt à leur proposer mes services ;-) Au-delà du clin d'oeil, je n'ai trouvé aucune information mentionnant le modèle économique utilisé. Or en naviguant dans la liste des blogs sélectionnés, cela m'étonnerait que tous mettent leur contenu sous une licence creative autorisant l'exploitation dans un cadre commercial. Si vous avez des infos là-dessus ...
(Via David Rothman).

Pédagogie booléenne

De l'intérêt des opérateurs booléens ...
De l'intérêt de la compréhension des techniques avancées de requêtage ...
Et de l'intérêt d'une approche pédagogique adaptée (Mérieu dirait "différenciée") sur l'usage des moteurs de recherche.
J'avais eu la personne Frédéric un étudiant (très) doué, et je le retrouve - sans surprise - avisé et fin pédagogue. Hop, je lui pique son exemple pour mes prochains cours :-)

Update de longtemps après : Francis Pisani revient sur cette astuce (visiblement très datée à l'échelle du net). Lire aussi les commentaires (légèrement trollés) de son billet.

Yahoo! les bons tuyaux

Huggy_1 Titres alternatifs de ce billet :

  • "Ceci n'est pas une pipe."
  • "Une petite pipe pour Yahoo!, un grand pas pour la recherche d'information ?" (pardon, je n'ai pas pu résister ... et puis c'est vendredi)

Redevenons sérieux ...

Yahoo! vient de lancer un nouveau service baptisé Yahoo!Pipes. Traduisez : "Yahoo!Tuyaux." L'idée est de mettre à disposition de tous une interface graphique simplissime asez simple permettant de faire de la programmation, un peu sur le modèle des "Pipes Unix"

  • "Un "pipe" (tuyau) est un canal de communication entre deux programmes, reliant la sortie de l'un à l'entrée de l'autre. L'idée (à la base de la philosophie Unix) est de réaliser des tâches complexes en chaînant plein de programmes simples ensembles." Grand merci Nicolas pour cette lumineuse explication :-)

Donc par exemple, on prend des sources d'information, on les couple, on leur pose une question (un mot-clé), on applique diverses instructions (tri, dédoublonnage, affichages divers), et au final on offre à l'usager un tuyau par un bout duquel il entre un terme et à l'autre bout duquel il ressort  ... de l'information. Voilà pour une "pipe", un "tuyau" orienté recherche d'information. Mais il existe quantité d'autres usages et d'autres applications :

  • illustrer automatiquement tous les articles du New-York Times à l'aide de photos du service FlickR
  • construire automatiquement un seul fil RSS pour récupérer les résultats de Yahoo! + Google + MSN + Technorati + qui vous voudrez.
  • etc ...
  • <Update>voir d'autres précieux exemples d'usages</Update>
  • <Update encore>Encore une application très intéressante pour récupérer directement des flux RSS automatiquement traduits. </Update encore>

Bref des possibilités quasi-infinies de mettre en place diverses actions relevant de la recherche d'information, sur n'importe quelle(s) source(s), originelle(s) ou composite(s). Et le tout, "relativement" facilement pour un internaute moyen (mais les geeks iront quand même beaucoup plus vite que les autres ...).

Tout cela s'inscrit dans une dynamique de plus en plus nette d'atomisation, de fragmentation, de segmentation du monde de la recherche d'information. Ou plus exactement "des" mondes de la recherche d'information.
Premier monde : Google. 1 moteur. 1 affichage sous forme de liste (ne changeons pas ce qui marche depuis des millénaires)
Deuxième monde : en voici une rapide approche historico-descriptive ...

  • Premier temps : Communautarisation. la vague des signets partagés (l'usager construit, agrège ses sources et le fait partager à une communauté). Les moteurs lui emboîtent le pas et rachètent/proposent leurs propres communautés
  • Deuxième temps : Fragmentation. Celle permise par l'explosion du RSS, qui offre aux chercheurs d'information de tous poils l'accès à une granularité quantitative et qualitative jusqu'ici impossible à atteindre. Les moteurs lui emboîtent le pas et proposent la plupart de leurs "résultats" au format RSS (notamment les "news")
  • Troisième temps : Mixage. C'est l'ère des Mashups. Celui du couplage. Mixage entre services et/ou mixage entre (un) moteur et (un/des)) service(s).
  • Quatrième temps : Personnalisation. Chacun fabrique "son" propre moteur (Google Co-op), choisit "ses" sources, met en place ses "macros" (LiveSearch) ... avec le risque qui se profile des autarcithécaires ...
  • Et cinquième temps donc ... la plomberie, les tuyaux, l'usager-plombier. L'avenir dira si c'est pour le meilleur (automonie, valeur ajoutée, etc.) ou pour le pire (plombier-polonais de la recherche d'information ??). Un cinquième temps qui marque de manière encore plus radicale la rupture entre, non pas simplement contenant et contenu, mais entre contenant, contenu et procédures.

Ces vagues successives sont révélatrices d'une évolution : 

  • des besoins (plus granulaires, plus spécifiques, plus orientés vers des requêtes de proximité - une pizzeria près de chez moi -  ou transactionnelles - le billet d'avion le moins cher - ,
  • des pratiques (nomadisme informationnel, micro-terminaux)
  • des usages (social search)
  • des modèles économiques (segmentation du marché, marchés "de niche")
  • des sources et des autorités constituées, aussi bien dans le monde universitaire (cf les harassants/vivifiants débats sur Wikipédia) que dans le monde marchand (la meilleure agence de voyage du monde, ou en tout cas la plus visitée "n'est que" un moteur qui compile et trie des sources, idem pour la meilleure agence immobilière, etc...) 

L'usager technophile et "early-adopter" (qui s'il peut apparaître aujourd'hui minoritaire, sera clairement majoritaire demain), est donc aujourd'hui convié à évoluer dans une sphère socio-technique dont "on" lui offre de maîtriser les outils, les environnements, les procédures, les techniques. Les données, ainsi soumises ou souscrites, tournent à leur plein rendement pour produire de l'information, ce qui est dans la nature des choses (au moins pour les théoriciens de l'information et de la communication).

(Rappelons au passage l'importance de la transformation du web en base de données dans cette évolution)
Update : Read/WriteWeb est d'accord avec moi sur ce point - ce qui fait plaisir :-) - et développe une approche plus "techniciste"/"procédurale" que la mienne en indiquant que le développement de Yahoo!Pipes est "l'application de l'ancienne sagesse des bases de données relationnelles au monde du web")

Il reste encore à inventer et à déterminer de quelle manière ces phénomènes (mixages, communautarisation, fragmentation, personnalisation, etc.) et les contours du nouvel environnement informationnel qu'ils dessinent (fractal ET rhizomatique), laisseront place à de la "connaissance". Ou comment la(les) connaissance(s) s'y invitera(ont). Question sans réponse pour l'instant, même si je suis convaincu que les bibliothèques et les folksonomistes, s'ils ne les laissent pas filer, ont en main quelques cartes maîtresses.
En tout état de cause, il semble qu'avec ce nouveau service de plomberie, Yahoo! offre à la recherche d'information le chaînon manquant d'une triple hybridation entre usagers, sources et procédures, de la même manière qu'il y a peu, Amazon avec Amapedia, offrit le sien à l'hybridation nécessaire des modes d'indexation.

Pour approfondir  ...

  • et se faire une idée du débat blogosphérique anglo-saxon sur cette nouveauté : voir les liens sortants du billet de SearchEngineLand.
  • Voir également le billet de Read/WriteWeb qui souligne justement que l'avenir est au mixage des fils (RSS).
  • Même Google trouve ça génial !
  • Update : l'info chez Outils Froids & chez Influx
  • Update encore : explication très pédagogique et "pas à pas" chez Toile Filante
  • Update toujours : Robin Good profite de cette plomberie 2.0 pour annoncer la naissance d'une nouvelle pratique : le Newssmastering, déjfinie comme suit : "The opportunity for sustainable filtering and aggregation of online content into niche websites and dedicated information channels." (Via Martin Lessard)

Docupôle

Très bonne ressource pédagogique en ligne pour une initiation à la Recherche documentaire.
L'accès se fait par ici. On vous demandera en login ("docupole") et un mot de passe ("docupole")
(Via EchoDoc)

PubMed innove

Après PubMed 2.0 (HubMed), après PubMed tout en curseurs, voici PubMed Informer, un service de veille par mots-clés déclinable en alertes mails ou fils RSS mais aussi sur votre PDA ou votre mobile via un SMS. Et puis aussi le tout nouveau UK PubMedCentral, une archive ouverte de journaux des sciences du vivant (cf communiqué de presse).

(Via VTech & l'Inist)

Google recherche des brevets.

Et un nouveau service "search" pour Google. La recherche de brevets. A priori il s'agit de la simple reprise de la base Uspto. 7 millions de brevets accessibles et visualisables dans la toute nouvelle mouture de Google Books. L'internaute lambda ou le curieux passionné va pouvoir dénicher de petits trésors. Pour les chercheurs avisés ou les adeptes de la veille, il vaut mieux (pour l'instant) s'en tenir à l'interface de recherche avançée de l'Uspto.
(Update de 5 minutes plus tard, Merci Jean-Marie)
: le billet du maître en son nouveau royaume pointe de lourdes insuffisances du service Google comparé à celui de l'Uspto.
(Via l'annonce sur le blog officiel)

Netchercheur : le retour

Netchercheur, le magazine professionnel lancé en 2004 par Emmanuel Chanial, après avoir cessé temporairement sa parution, est de retour et c'est tant mieux. Nouveau look, nouvelle maquette, nouvelles rubriques. Au total 32 pages de chroniques de professionnels et la veille et de la recherche d'information (Christophe Asselin, Frédéric Martinet, votre serviteur ...), et un remarquable travail de couverture journalistique assuré par Emmanuel Chanial : des brèves, des annonces, des entrevues, des compte-rendus de congrès, etc. Bref, un INCONTOURNABLE pour toutes celles et ceux qui s'intéressent à la veille, à la recherche d'information et aux technologies et outils associés.
Le site web n'est pas encore mis à jour mais vous pouvez soutenir cette publication NECESSAIRE en vous abonnant auprès de "Netchercheur, EC                 PRESSES – 5 rue de DOUA