Ma Photo

Qui suis-je ?

Syndication


Botte de foin


Qui êtes-vous ?



  • Track referers to your site with referer.org free referrer feed.


Qu'en faire et comment ?


  • Ce que vous voudrez à condition :


    • de citer vos sources
    • de ne pas vous enrichir
    • de ne rediffuser l'info que sous une licence identique à celle-ci







    Le crédo d'Affordance ;-)
    I am a hard bloggin' scientist. Read the Manifesto.



    Le coin des bonnes causes :


    Support The Commons
    Become A Commoner


    Le PageRank d'Affordance :
    PageRank for this page
    Son "autorité" (sic) selon Technorati :
    "L'autorité" selon Technorati

Powered by TypePad

Les évolutions de l’information : le web collaboratif et la gestion de l’identité numérique.

Article "de commande" pour la prochaine parution de la brochure "Repère" de l'ENSSIB (qui dispose également d'un site web)

  • Le web 2.0 : partage et collaboration

Le web 2.0 désigne, pour les outils d’accès, de production et de recherche d’information, la part de plus en plus grande qui est laissée à l’utilisateur. Les blogs (plateformes éditoriales « clé en main » ), les wikis  (sites collaboratifs dont chacun peut modifier le contenu), les fils RSS (permettant de suivre les dernières nouveautés publiées sur un site), mais également ces gigantesques réservoirs de contenus que sont FLickR (pour les photos), DailyMotion ou YouTube (pour les vidéos) sont autant de sites et de technologies emblématiques de ce web 2.0. Auparavant, les contenus étaient le fait d’une communauté relativement réduite (enseignants, universitaires, entreprises, institutions …), et ils étaient mis à disposition sans ouvrir beaucoup de possibilité d’interaction et de partage. Le point commun des sites et des technologies « 2.0 » est de permettre aux internautes de partager, de participer, de « remixer », de noter, de diffuser et d’accéder à des contenus qu’ils produisent majoritairement. Le passage au web 2.0 se caractérise donc par une frontière de plus en plus floue et perméable entre les producteurs et les utilisateurs de contenus. Ce dernier point est aussi le plus controversé : l’abolition des filtres éditoriaux habituels, la prédominance de contenus « amateurs » font du monde numérique un terrain d’observation privilégié de la démocratie directe dans ce qu’elle a de meilleur (partage, réciprocité, interaction, collaboration) mais également de pire (dictature de la masse, notoriété l’emportant sur l’expertise, logiques quantitatives plutôt que qualitatives).

  • La gestion de l’identité numérique.

Contexte : En lien avec l’avènement du web 2.0, l’usager est aujourd’hui au cœur, non seulement des contenus circulant sur le Net, mais également des préoccupations des grands acteurs propriétaires de ces sites, qui, pour rentabiliser leur modèle économique et continuer d’offrir un accès le plus souvent gratuit à ces services, ont besoin de connaître le plus finement possible leurs utilisateurs, afin de leur proposer des publicités contextuelles parfaitement ciblées. L’une des grandes nouveautés du web actuel est qu’un très petit nombre de sociétés collectent (via les services qu’elles offrent) et ont la possibilité de recouper un très grand nombre d’informations sur chacun d’entre nous : ces informations relèvent aussi bien de notre sphère publique (notre métier par exemple), de notre sphère privée (nos relations, nos amis), que de notre sphère intime (nos préférences politiques, sexuelles ou religieuses).
Ne pas confondre identité et identifiants :
La question de l’identité numérique doit être distinguée de celle des identifiants que nous utilisons pour accéder à différents services. Sur ce dernier point, différents projets existent pour tenter de proposer un standard d’identification unique qui via un seul login et mot de passe, permettrait de s’enregistrer sur toute une gamme d’applications et de pouvoir les utiliser (OpenID …)
Qu’est-ce que l’identité numérique ? Une collection de traces.
L’identité numérique peut être définie comme la collection des traces (écrits, contenus audio ou vidéo, messages sur des forums, identifiants de connexion …) que nous laissons derrière nous, consciemment ou inconsciemment, au fil de nos navigations sur le réseau. Cet ensemble de traces, une fois qu’il apparaît « remixé » par les moteurs de recherche, peut parfois produire des résultats gênants (et ce malgré le recours assez fréquent à des pseudonymes d’identification). Ainsi, la pratique consistant à taper le nom de quelqu’un dans un moteur de recherche pour voir quels sont les premiers résultats qui ressortent est devenue de plus en plus courante, notamment dans le cadre d’un recrutement. La question est d’autant plus importante que l’on parle aujourd’hui de « natifs numériques » (digital natives), c’est à dire d’une génération qui utilise différents services web dès sa prime enfance.
Que faire après coup ?
Si vous souhaitez voir disparaître certains contenus vous concernant, vous avez la possibilité de vous adresser d’abord aux gestionnaires des sites qui disposent desdits contenus. Cela peut concerner la suppression d’une vidéo ou de photos, mais également de messages sur différents forums de discussion. La deuxième étape est de s’adresser directement aux moteurs de recherche : ceux-ci conservent en effet souvent dans leur « cache » une version des contenus précédemment supprimés. Il faut alors leur demander la suppression de ces contenus.
Comment rester maître de son identité numérique ?
L’idéal pour maîtriser son image numérique consiste à en devenir l’acteur principal. Ainsi, si vous tenez un blog sous votre nom, si vous achetez « votre » nom de domaine pour votre site web, si vous y déposez votre CV, ce sont ces éléments d’information qui devraient apparaître en premier dans les moteurs de recherche. Mais on ne peut pas demander à des adolescents alimentant leur skyblog ou leur MySpace aujourd’hui de penser à l’image que cela renverra d’eux dans 10 ou 15 ans. Les règles du bon sens demandent donc de conserver les identifiants utilisés lors de la création d’un contenu ou d’un service, pour pouvoir, le moment venu, supprimer ce contenu ou ce service. Eviter également de déposer des messages ou des contenus qui pourraient s’avérer nuisibles à notre image quelque soit le service utilisé et son niveau de « confidentialité » affiché. Enfin, avoir présent à l’esprit cette idée qu’une réputation numérique se construit de la même manière qu’une réputation « non-numérique » - c’est à dire patiemment et sur la durée - est encore le meilleur moyen d’agir en conséquence.

Olivier Ertzscheid. Maître de conférences en Sciences de l’information et de la communication.
Université de Nantes.
25 Mars 2008.

Welcome to the World Life Web.

In 1994, in the wake of Tim Berners Lee’s work, the World Wide Web was officially born. A global web, wide in its dimensions as in its contents. Over the years, these contents have literally exploded, imposing to all of us the use of search engines to try and sort out this fertile chaos on the basis of the principle of a classification ‘by relevance’. The main issue, when initially managing the web, was developing the addressing of documents. To find them, and to find them again, the documents needed a physical address on the network. The answer was given in particular thanks to the  "http protocol" (hypertext transfer protocol) as well as via the naming system which enables to identify and classify web sites on the basis of their domain name (DNS). This addressing system is still somewhat problematic nowadays and must face the constant evolution of its contents, hence the appearance of new extensions (‘mobi’ for sites dedicated to mobile telephony, ‘museum’ for museum web sites, etc) and the open question of widening this protocol to all languages of the planet. This was the first documentary age of the web.
Then came the World Live Web, i.e. an instantaneous web, a web giving the latest published information in real time. Google News service was, as such, one of the pioneers of this second documentary age, but it also enables to refer to what is called micro contents, e.g. comments on blogs. Indeed, the relevance criterion used by search engines remains crucial, but there is also another important criterion, i.e. the capacity to account for the evolution of documents published on the web whatever they are. Where the mainstream search engines only indexed pages, the world of blogs search engines have started indexing blogs as snippets of documentary as soon as they are published, indexed and accessible.
For some time now we have entered a third documentary age, the World Life Web, in particular with the extraordinary boom of social networks (Facebook, MySpace) and of virtual worlds  (Second Life). After the addressing of documents, after their level of granularity (increasingly thinner), the main issues of this new age are the sociability and the indexable and remixable nature of our digital identity as well as its traces on the network. In these digital worlds and networks, everyone can provide the information he/she wishes and this information can equally fall within our public sphere (e.g. our occupation), our private sphere (our relations, our friends) and above all our intimate sphere (our political, religious and sexual preferences). An increasing number of social networks enable the huge catalogue of human individualities, which compose them, to be indexed by search engines. This necessarily poses the question of the relevance of human profiles. A question which is still in its beginning stages, but whose scale of problems raised can rightly make one shudder. Effectively, it is an established fact that each user of these systems, far from having at their disposal a unique profile freely granted and containing only information of a public nature  (a bit like our identity cards) have several different profiles on different sites in different public or private spheres. And that many users enter these social networks through nicknames (which mask their real identity) or avatars, also making up identities which are sometimes entertaining, sometimes reconstructed, sometimes deceptive, and often idealised, but always sketchy. The confidentiality policy of the websites gathering the generally freely granted information has already been the subject of many criticisms, mobilizing institutions and associations on the niche of the defence of a right to erase in the digital world. If it is possible to make people aware of a logic of industrialization of the private sphere which underlies these  worlds, if it is possible to appeal to their vigilance and their responsibility, it remains impossible to control what will become of the remixing of all the traces, once displayed for instance on a search engine. The questions which must be considered today are the indexable nature of the human being, the question of whether Man is or is not a document as any others, the question of  being equipped with a comprehensive and uncontrollled digital identity. This identity will be defined and has already largely been via my journey on the net, my purchases, the (controlled or not) expressions of my identity display as well as by the reflection of the whole such as it will appear remixed in the search engines, the social networks or the virtual worlds. The urgency of this question calls for another one: why ? Documents and key-words have gained a trading place. They are sold and bought on the market place of the Internet which largely regulates Google search engine. Will our digital identity traces also be mere commodities in future ? Welcome to the World Life Web.
=======================
Traduction du texte original publié ici même et repris sur Ecrans.fr
Merci à Fabienne Portier (McF Anglais) pour la traduction, et merci également aux étudiants de l'IUT qui , sous sa responsabilité, ont durement planché sur la traduction de ce texte.

Le dernier Clay Shirky bientôt dans les bacs.

Clay Shirky est l'un de ces tech-gurus que seuls les américains semblant en capacité de produire en masse. Mais il n'est pas loin s'en faut, le moins intéressant de tous. Il a notamment beaucoup écrit sur les blogs, la notion de collaboration en ligne, le crowdsourcing, les tags et les ontologies (ses autres articles sont notamment consultables sur son site). Son dernier livre à paraître fin février s'intitule : "Here Comes Everybody: The Power of Organizing Without Organizations". Selon un procédé éditorial désormais éprouvé, le bouquin se trouve assorti avant même sa parution d'un blog destiné à alimenter le buzz et à en livrer quelques extraits choisis. A noter que des traductions dudit ouvrage sont déjà prévues pour 2009 en Hollande, au Portugal et au Brésil, en Chine et en Corée. Si un éditeur français souhaitait se mettre sur les rangs ...

Technologies de la relation.

Je viens de visionner la conférence (?) de Joel de Rosnay qui parle des 4 âges du web comme suit :

  • "Internet 1.0 = Internet descendant.
  • Internet 2.0 = les contenus générés par l’utilisateur.
  • Internet 3.0 = Internet intuitif, sémantique
  • Internet 4.0 = web symbiotique, pervasif"
Cela me rappelle mes propres réflexions sur les trois âges documentaires du web, réflexions détaillées dans ce billet. Le "quatrième âge" non traité dans mon billet étant celui de la redocumentarisation du monde, laquelle correspond parfaitement au web pervasif et symbiotique décrit par De Rosnay.
L'autre expression employée et qui m'a paru très stimulante est celle des "technologies de la relation", juste une expression de plus pour un homme qui dispose d'un très pédagogique sens de la formule et de la métaphore (pourvu qu'il n'ouvre pas son blog, il serait capable de me chiper ma place de ouinneur), mais une expression qui décrit bien la réalité de nombre de services du web 2.0 préparant l'avènement du web 3.0.
J'aurai un seul (léger) désaccord avec Joël de Rosnay (ainsi qu'avec nombre des analystes et prospectivistes du web) : je suis absolument convaincu que le web 4.0 précèdera le web 3.0, c'est à dire que l'internet des objets, un internet "pervasif", ubiquitaire, immersif, précèdera l'avènement du web sémantique.

(Via Savoirs en réseau)

Interruption ambiante

On connaissant déjà les concepts permettant de désigner la place de plus en plus grande qu'occupent les terminaux (connectés ou non) dans nos vies publques et privées : informatique "ambiante", "pervasive", "nomade", "ubiquitaire" (ubiquitous computing), etc ...
David Armano propose sur son blog un nouveau (?) concept intéressant et complémentaire de ceux décrits ci-dessus. C'est celui de "l'interruption ambiante".

Ambient_2

Traduction rapide et résumée de son billet :

  • "Nous traversons une période d'interruption ambiante. Fini le temps où nous passions d'une chaîne de télé à l'autre quand les publicités venaient interrompre un programme. (...) une nouvelle forme d'interruption est née, qui vient maintenant directement de nos proches ("peers"). Elle est pervasive, subtile et ambiante ; elle est partout autour de nous et se manifeste sous diverses formes au travers des différentes technologies et de divers terminaux. (...) Regardez-vous en train de travailler sur votre ordinateur ou d'utiliser votre smartphone. Nous avons donné à nos amis et à nos marques favorites la permission de nous "interrompre" au travers d'emails, de texte, de messagerie instantannée, de réseaux sociaux. (...) C'est ce que j'appelle l'interruption ambiante : nous pouvons lui prêter attention ou l'ignorer. L'ignorer ? Pas vraiment. Que se passe-t-il en effet quand nous atteignons la limite d'interruptions ambiantes que nous pouvons supporter ? Le résultat est différent pour chacun de nous. Nous les esquivons de différentes manières et utilisons différentes techniques de filtrage. (...) Peut être trouverons nous un jour une manière cynique de gérer ces interruptions ambiantes, comme nous l'avons trouvée pour les interruptions publicitaires télévisuelles."

Si cette approche me semble intéressante c'est parce qu'au-delà de la réalité des usages qu'elle parvient à traduire (le "poke" de Facebook semble ici parfaitement emblématique), elle entre en résonance avec la notion d'une économie de l'attention et plus précisément avec ce qu'en dit Jean-Michel Salaun dans quelques-uns de ses billets, par exemple celui-ci :

  • "Il existe une économie de l'attention tirée par la logique de la diffusion, tout comme une économie de l'attention tirée par celle de l'accès. L'une et l'autre s'adressent aux mêmes clients (les annonceurs, les agences, les régies), mais s'appliquent sur des activités différentes. Il y a donc concurrence, et même antagonisme."

Soit une équation dont les nombreuses inconnues se résolvent peu à peu :

  • Conditions d'une économie de l'attention optimale = Informatique ambiante, pervasive et ubiquitaire + logiques (spécifiques ou héritées) de diffusion et d'accès + interruption ambiante (cette dernière notion pouvant faire office de variable d'ajustement).

Où l'on reparle de réseaux sociaux, et où l'on continue d'en apprendre de bonnes.

Qu'aprend-on ?

  • Qu'un site de "réseau social" n'est pas un site de "réseautage social" : eh oui, tout est affaire de sémantique : "social network sites", "social networking sites" et récemment "social networking technologies" ... Danah Boyd préfère le premier au second car la notion de "Networking" est trop large et peut être étendue à tout type de site proposant simplement la mise en relation avec des inconnus, et incluant les babillards et autres chatrooms ou sites de rencontre, l'ensemble desquels n'entrent pas dans "sa" définition d'un site de réseau social. Une définition récemment remise à jour dans sa dernière publication scientifique sur le sujet, publication qui donne la définition suivante : "We define social network sites as web-based services that allow individuals to (1) construct a public or semi-public profile within a bounded system, (2) articulate a list of other users with whom they share a connection, and (3) view and traverse their list of connections and those made by others within the system. The nature and nomenclature of these connections may vary from site to site." Dans son billet relatant cette actuelle querelle sémantique, Danah Boyd pointe encore la confusion de l'horizon lexical employé pour désigner la réalité d'un seul phénomène : "social network sites, social software, social media, collaborative software, or anything that enables any interaction with another human being." Pour dissiper les confusions, le mieux est encore de s'en tenir au cadre défini par Danah Boyd et Nicole Ellison dans leur article fondateur :
  • Qu'il va falloir réinjecter un peu de l'analyse théorique des communautés de pratique (et autres communautés d'intérêt) dans l'analyse des réseaux sociaux. C'est en tout cas ce qui m'est apparu comme un évidence en visionnant ce diaporama sur "l'impact des outils sociaux en terme d'utilisabilité", plus précisément, les diapositives 20 à 23, et surtout la diapo 31 (ci-dessous). Les diapos 36 à 39 sont également très parlantes sur les différents niveaux d'interaction qui viennent s'agréger autour des sites de réseaux sociaux. Du coup je m'en vais relire Etienne Wenger, qui propose un cadre théorique limpide pour l'analyse des communautés de pratique. L'une des notions qui me semble pouvoir être appliquée avec pertinence à l'analyse des réseaux sociaux, est celle d'une "légitimation de la participation périphérique". Pour en savoir plus, le bouquin de référence sur la question, et en attendant de le lire, un petit mais très intéressant rappel des enjeux de cette notion par une commentatrice de passage sur Affordance.
  • Rezosocio
  • Que les réseaux sociaux, sont pleins de rituels tribaux : à lire sur InternetActu.
  • Que nous disposerons bientôt de nouveaux outils méthodologiques pour l'analyse des réseaux sociaux. Une méthodologie pour des études longitudinales de grande ampleur à propos de l'usage par les jeunes des médias numériques est en train d'être élaborée. Les deux chercheurs se lançant dans l'aventure soulignent à raison que nous disposons d'une foule d'études traitant de tel ou tel aspect de la question mais que ces études présentent deux faiblesses : elles ne traitent qu'une partie ou qu'un aspect de la question, et elles ne portent pas sur des échantillons suffisamment représentatifs. Les chercheurs se donnent donc un an pour réaliser un état de l'art complet des études existantes, et pour mettre au point une méthodologie d'analyse. "The result will be a white paper on how best to track digital media use to serve the research community." J'ai hâte de voir le résultat ...
  • Que le graphe social (souvenez vous du GGG - Giant Global Graph) va bientôt s'enrichir de cercles sociaux. Cet article d'USAToday nous apprend qu'il sera possible dans quelques temps, sur Facebook puis sur MySpace, de placer ses amis (friends) dans des cercles de proximité plus ou moins distants, lesquels cercles détermineront eux-même le niveau de partage et la visibilité des informations qui seront accordés aux mêmes amis, selon qu'ils sont - au sens propre comme au sens figurés - des amis "proches" ou plus "lointains". Il s'agit d'endiguer l'inexorable dérive des continents documentaires et la "disparition des frontières entre nos vies publiques et privées". Blurring L'article d'USAToday prend comme exemple celui du professeur inscrit sur Facebook et qui est dans "l'obligation" de partager la même "intimité sociale" avec ses amis d'enfance, ses collègues de bureau et ... ses étudiants. Cette hiérarchisation de la proximité sociale, sera sans conteste le prochain pas important effectué par les sites de réseaux sociaux. De mémoire il me semble par ailleurs que cette possibilité existait depuis longtemps sur les réseaux sociaux professionnels de type LinkedIn (merci de confirmer ou d'informer en commentaire ...). Rendant compte de cet article sur son blog (d'où est extraite l'illustration ci-dessus), Alex Halavais propose cette jolie conclusion : "After a long period of “metropolizing” technologies, social networking is reintroducing the importance of networked villages, and making transparent the process by which our connections to others shapes who we are." Ce qui est intéressant dans cette affaire, c'est le rapprochement qui peut être fait entre l'essor des réseaux sociaux aujourd'hui et celui des moteurs de recherche hier. Pour les uns comme pour les autres, aujourd'hui comme hier, il s'agit d'abord de "tout embrasser", d'indexer et de rendre accessible, visible, un maximum d'informations. Dans un deuxième temps, étant entendu que "qui trop embrasse mal étreint", il s'agit de remettre de l'ordre dans ce chaos informationnel / relationnel. Les moteurs de recherche se mettent donc à offrir des accès différents aux images, aux actualités, il classent et regroupent les informations selon leur thème (catégorisation) ou selon leur nature (= les différents onglets de recherche). Les réseaux sociaux, en réfléchissant à une hiérarchie paramétrable des proximités sociales, s'inscrivent dans la même dynamique. Peut-être pour mieux, demain, une fois que ces hiérarchies seront établies et entrées dans l'usage, remixer l'ensemble en une seule interface mais en s'étant dans l'intervalle rendus capables de mieux indexer et à des niveaux de granularité de plus en plus fins, les contenus dont ils disposent. C'est à dire précisément ce que font actuellement les moteurs de recherche avec leur stratégie dite de "recherche universelle". Là encore, s'il faut recourir à des cadres théoriques existants pour comprendre les enjeux de ces proximités sociales et des comportements induits ou acquis, c'est vers Edward T. Hall et la notion de proxémie qu'il faut chercher.

Les réseaux/médias sociaux se ramassent à la pelle

Je ne vais pas sacrifier au billet compilation/revue de presse sur Facebook, d'autres le font bien mieux que moi. Juste attirer votre attention sur quelques faits - à mon avis - marquants ou simplement intéressants

  • une enquête réalisée par un laboratoire en sciences de l'information et de la communication de Lille 3. Elle ne nécessite que quelques minutes pour y répondre.
  • un petit rappel en image des dates de lancement des principaux réseaux sociaux (récupérée sur le blog "image" de Loïc Hay, qui recèle plein d'autres pépites - pas nécessairement en rapport avec les réseaux sociaux).
  • un catalogue planétaire (WorldCat) qui s'invite dans un autre catalogue (des individualités humaines - Facebook) : c'est désormais possible. (Via Gerry Mc Kiernann) Et c'est une nouvelle fois ce que j'appelais un peu (beaucoup ...) caricaturalement la logique "concentrationnaire" de Facebook, c'est à dire sa capacité à encapsuler des univers informationnels totalement différents.
  • une enquête IFOP repérée par Christophe Asselin qui confirme, chiffres à l'appui, ce que tout le monde observait déjà : MySpace reste plus fréquenté que Facebook, la fréquentation des sites de réseaux sociaux en général est un constante augmentation, le premier public de ces sites ce sont les "jeunes".
  • plus largement, la pratique des "médias sociaux" est elle aussi en constante augmentation chez les jeunes.
  • l'opinion de Tim Berners-Lee à propos des réseaux sociaux (lors d'une conférence donnée début décembre 2007 à la Annenberg School for Communication) : "These social networking sites are starting to develop new ways of actually determining how you trust friends, and friends of friends have a different status than friends or friends of friends of friends.... One of the things they're doing is creating new forms of democracy. Or new forms of meritocracy.... It kind of works, but maybe we can improve on it. And maybe, out there in the Web, we will end up producing a new social mechanism, which will improve on the existing democratic systems we've got today, and we'll be able to run the country better. How about that? Run the world better. Don't aim low! OK?" Pour ma part, et tel que je l'observe au travers des développements des actuels réseaux sociaux, la valeur (potentielle) de des environnements relève davantage d'une forme d'adhocratie que de "démocratie" ou de "méritocratie".
  • côté médias sociaux numériques, (via InternetActu), ne manquez pas : "Youth, Identity and Digital Media" (La jeunesse, l’identité et les médias numériques) dirigé par David Buckingham. L'ensemble des articles de ce numéro est disponible intégralement et gratuitement. Les trois études de cas (dont celle de Danah Boyd - .pdf) sont particulièrement stimulantes.
  • A lire en fin sur la question de la génération connectée, l'un des rares billets qui en plus des chiffres, propose une lecture analytique du phénomène : celui de Jean-Michel Salaun.

Crawling, Mining, Scraping

Au commencement était le "crawling". L'exploration. La recherche d'informations. Celle menée par les "crawlers" des moteurs de recherche. Une errance exploratoire, navigationnelle, stochastique, de lien en lien, afin de bâtir des index à leur tour naviguables, interrogeables.
Ensuite vînt le "mining". La fouille. La fouille de données (Data mining). Systématique. Analytique. Celle menée de plus en plus fréquemment par les mêmes moteurs de recherche, mais le plus souvent dans des environnements informationnels "fermés", des silos d'information comme on en trouve dans les bases de données et qu'il faut être capable non pas simplement de crawler (c'est à dire d'explorer pour ensuite les rapatrier dans le cadre d'un index - ou fichier inverse) mais bien davantage de "forer" pour, à l'issu d'un processus de raffinage parfois complexe, pouvoir pleinement les exploiter. Ce forage, cette fouille, quand elle gagna le web, le fît de trois manières différentes, sur trois terrains d'application inextricablement liés mais opérationnellement distincts : ses usages (hyper-liens), ses contenus (hyper-textes), sa structure (hyper-graphe).
- - - - - - - - - - - -
Il faudrait ici également citer pour être complet, le "moissonnage", la "récolte" (to harvest), qui permet aux moteurs de recherche, ou à des sites bâtis pour cela, d'être interopérables, inter-interrogeables (par exemple les sites d'archives ouvertes utilisant le protocole PMH - Protocol Metadata Harvesting)
- - - - - - - - - - - -
Aujourd'hui, Francis Pisani attire notre attention sur ce qui pourrait constituer une troisième étape, celle du  "scraping". Scraping comme "racler". Ce terme désigne la technique utilisée par les sites de réseaux sociaux (notamment Facebook et son "Friend Finder") pour aller littéralement "racler" des données personnelles sur des sites tiers (importation de toutes vos adresses gmail par exemple) ou dans leur propre enceinte (cf la très récente affaire très bien décrite dans le billet de Francis Pisani, concernant l'importateur de données de la société Plaxo, utilisé par Robert Scoble sur Facebook pour "en sortir les noms, prénoms, dates de naissance et adresses courriel de ses 5.000 “amis”".)

Du scraping au "raping" (viol) il n'y a pas loin. A cette différence près que cette double violation (de l'intime d'une part, et des condition d'utilisation des sites tiers concernés d'autre part), est librement, aveuglément, naïvement consentie par ses "victimes", au nom du principe d'efficacité ("c'est pratique, ça va vite"). Comme le souligne également très justement Francis Pisani, ce "scraping" est la cause et la conséquence de l'inflation et de la montée en charge des sites de réseaux sociaux, au même titre que le crawling est la condition nécessaire à la construction d'index et donc, in fine, à la capacité pour chacun d'entre nous de naviguer sur le net via lesdits index.

Cette trilogie technologique (Crawling => Mining => Scraping) doit pour être bien comprise, être mise en relation avec les trois "temps" de ma petite théorie de la dérive des continents documentaires (voir ce billet pour le petit schéma explicatif). Après avoir exploré (crawling) les 4 plaques tectoniques constituant notre environnement informationnel quotidien (web public, privé, intime, personnel), après s'être mis en capacité de fouiller (mining) tant la structure que le contenu des informations et des données y transitant, le temps est désormais venu de racler (scraping) les fonds de tiroir. Le tort serait de croire que lesdits fonds de tiroir sont assimilables à de l'accessoire. Ils sont tout au contraire essentiels : la perte d'un texte ou du contenu d'un (ou plusieurs) courriel n'est rien à côté de la perte de l'ensemble d'un carnet d'adresse et de la "mine" d'informations qu'il contient.

<Update du soir>Les choses vont décidemment trop vite, heureusement, les commentateurs de ce blog suivent l'actualité en temps réel - merci Candide :-) Donc Plaxo (le "scraper"), Facebook, mais aussi ... Google, viennent de rejoindre le Dataportability Group, un groupement d'intérêt dont le credo est "we need a DHCP for Identity" (pour les non geeks, le protocole DHCP permet d'attribuer une adresse IP automatique à votre ordinateur, pour approfondir, Wikipedia explique ça très bien). Et donc ? Donc que Google et Plaxo s'intéressent aux protocoles permettant de faciliter la gestion des traces numériques dans le cadre d'un standard interopérable, cela n'est pas une surprise (cf pour Google, l'initiative OpenSocial). En revanche, côté Facebook, c'est ce que l'on appelle un changement de bord (qui était par ailleurs prévisible). Car l'enjeu est d'importance comme le souligne Techcrunch il s'agit de permettre aux utilisateurs "to access their friends and media across all the applications, social networking sites and widgets that implement the design into their systems." (sur ce même sujet voir le dernier billet de ReadWriteWeb ainsi que celui de FredCavazza) Et donc ? Donc en quelques heures le scraping est redevenu le "degré zéro" du crawling, et nos chers moteurs pourront probablement très prochainement s'appuyer sur un protocole rendant interopérable les diverses données contenues dans les différents sites de réseaux sociaux et leurs applications tierces. Soit une bien belle transition de percolation en perspective ... </Update>

Fini les vacances, c'est la rentrée ...

Côté moteurs/wikipédia/knol :

  • On a donc pas mal parlé avant et pendant les vacances du projet de Google concernant son "encyclopédie" Knol : dans Ecrans, Florence Devouard s'inquiète à raison en rappelant que 50 % du traffic vient directement de Google. Google Blogoscoped y revient également en soulignant l'argument selon lequel Google ne pouvait plus accepter de voir partir tout ce traffic "non-monétisé" vers un site (wikipedia) indiquant qu'il refuserait toujours la publicité.
  • Voir aussi la rapide analyse comparative de ReadWriteWeb entre Knol, Wikia, Wikipedia et Mahalo autour des trois mamelles de l'argent, de l'attention (comme vecteur de monétisation) et de l'altruisme (comme contribution à la somme des connaissances disponibles).

Côté réseaux sociaux, moteurs de recherche et scientométrie :

  • Medline nous avait déjà habitués à son goût des interfaces innovantes. En voici une nouvelle baptisée GoPubMed qui permet, sur la base d'une recherche de faire émerger des "réseaux sociaux" à partir des noms d'auteurs d'articles et de leurs adresses de courier électronique (Via Cismef). En fait, plutôt qu'un réseau social (ce qui est l'argumentaire marketing du lancement de ce nouveau service), c'est bien de scientométrie qu'il s'agit, c'est à dire de la capacité, via un moteur sémantique, de repérer des collaboratoires, des "collèges invisibles", et de cerner en un instant sur un thème donné, l'état des publications en la matière et les chercheurs les plus en vue. Exemple : en entrant le terme "stuttering" (bégaiement) et en cliquant (à gauche dans la rubrique "What") sur "Hot topics", vous visualisez :
    • un "top 20" des auteurs ayant le plus publié sur le sujet
    • un "top 20" des publications classées par pays
    • un "top 20" des journaux dans lesquels on trouve le plus de publications en rapport avec le bégaiement
    • une courbe temporelle vous permettant de visualiser la progression (ou le recul) du nombre de publications par an sur ce sujet
    • une visualisation sous forme de graphe des réseaux de collaboration entre auteurs (répondant à la question "qui publie avec qui ?")
  • c'est à tomber par terre. Et on se prend à rêver d'un tel outil dans le cadre d'un moteur généraliste majeur à vocation scientifique (maiiiis non, pas forcément celui-là, il y a aussi celui-là). Pour mieux comprendre la puissance d'un tel outil : allez le tester, et lisez le communiqué de presse (.pdf).

Côté moteurs tout court :

  • le 7 janvier 2007, il y a donc de cela exactement un an, Jimmy Wales annonçait le lancement de Wikia, le moteur de recherche dont les résultats seraient validés par des humains. Et bien exactement un an plus tard, on nous annonce le lancement de Wikia (en version béta) pour demain, le 7 Janvier 2008 donc. A ce sujet, voir la revue de presse de Christophe Asselin. Le site de la "communauté" wikia est ici, et comme on peut le lire dans le wiki du projet, Wikia compte s'appuyer sur tout l'éventail des technologies de recherche à valeur ajoutée, à savoir la sémantique (= catégorisation), le "réseau social", l'indice de "réputation", et une infrastructure "distribuée". Lancement demain donc, et affaire à suivre de près pour ce nouveau "moteur de recherche open-source collaboratif".

Côté Bibliothèque "2.0" (ou pas ...)

  • Une conférence qui s'est tenue début Novembre à Berkeley sur le sujet des bibliothèques "2.0" avec les supports de présentation accessibles en ligne (supports présentés parfois sous forme classique - un bon vieux powerpoint - parfois sous forme "2.0" - un wiki). Pas de grande nouveauté mais cela vaut le coup de visionner la conférence inaugurale de Meridith Frakas qui embrasse bien la situation (.ppt)
  • l'un des derniers rapports du Pew Internet nous apprend (via 01.net) qu'outre-atlantique, la première raison de fréquentation des bibliothèques est ... le fait d'y trouver une connexion Internet. De quoi largement réalimenter de vieux démons débats, tant sur le taux d'équipement desdites bibliothèques dans notre bel hexagone, que sur la place des technologies d'accès dans ces enceintes et le taux de formation et d'encadrement qui est dévolu à leurs personnels.

Côté Folksonomies & Indexation sociale

Côté néologismes :

  • Saluons l'arrivée de la Zemblanité, exact opposé de la sérendipité et qui désigne "la faculté de faire de façon systématique des découvertes malheureuses, malchanceuses, attendues et n'apportant rien de nouveau." La génèse du concept et sa présentation détaillée sont disponibles sur Urfist-Infos.
  • Saluons (Via Francis Pisani) l'arrivée  de la "mobiquité" : mobilité + ubiquité. Un néologisme qui traduit bien la place de plus en plus importante qu'occupe dans notre société et dans nos comportements informationnels, l'informatique nomade et/ou ambiante.
  • Reste à savoir si ces deux néologismes entreront au panthéon linguistique aux côtés de la blingocratie.

Côté copyright, Fair-Use et autres creative commons

  • Un rapport intitulé : "Recut, Reframe, Recycle: Quoting Copyrighted Material in User-Generated Video" (.pdf). La question posée est de savoir si dans le cadre des sites de médias participatifs donnant lieu à divers remixages (exemple : YouTube), les détournements, parodies, et autres mashups de diverses oeuvres de fiction relèvent - ou non - du cadre du Fair Use (= usage équitable) et échappent donc à la législation du copyright. La réponse du rapport est claire : Oui. Il y a dans ces "oeuvres" de nouveaux éléments (détournement, transformation, remixage) qui les inscrivent dans le cadre de la constitution d'une culture populaire. "Video remix culture does not violate copyright." Les auteurs du rapport rappellent également qu'il est important de sensibiliser aussi bien les "auteurs" que les "remixeurs-amateurs" à la notion de propriété intellectuelle et d'usage équitable, pour que les premiers soient conscients de la richesse que ces remixages peuvent (parfois) apporter à leurs oeuvres, et pour que les seconds travaillent et s'amusent dans le respect de l'oeuvre des premiers. A noter : le site de présentation de l'étude est très bien fait, puisqu'en sus du téléchargement de l'étude proprement dite, il propose également une courte vidéo en rappelant les principales problématiques et conclusions, et propose également de télécharger un fichier excel du corpus de vidéos utilisées. Il propose enfin, pour chaque type de remixage (détournement, critique, débat, illustration, etc ...) les 5 vidéos les plus parlantes. Certaines d'entre elles sont réellement ... parlantes.
  • Et puis vraissemblablement à ne pas rater (je ne l'ai encore pas visionné en entier, mais il est plein d'interviews avec Yochai Benkler et ne peut donc pas être mauvais :-) un documentaire sobrement intitulé "Steal this Film" qui décrypte les enjeux liés à la notion de propriété intellectuelle et plus largement de "diffusion" dans le contexte actuel. Pour les plus pressés, plein d'extraits sur Google Vidéo, pour les autres téléchargement dans plein de formats possibles directement sur le site du documentaire. Il y en a même qui se sont déjà attelés au sous-titrage en français.

Côté traces documentaires identitaires (ou identité numérique si vous préférez) :

  • nos comportements informationnels laissent de plus en plus de place à l'égotisme forcené. Au service de cet égotisme on compte d'ailleurs de plus en plus d'outils tendant à l'illustrer (les divers outils de classement façon "top 50 de quelque chose"), à le renforcer (économie de la réputation), à en faire naître le besoin (via des interfaces navigo-ludiques dont vous êtes le centre et la circonférence), ou à en faire l'alpha et l'oméga d'un modèle économico-sociétal (facebook). C'est l'éternelle histoire de la poule et de l'oeuf.
  • Got dans ses petites cases, nous gratifie d'un éclairant billet sur FOAF (Friend Of A Friend) dont on aimerait effectivement penser que le modèle réellement ouvert qu'il incarne soit l'avenir des protocoles tournant derrière la plupart des réseaux sociaux. Mais je ne peux hélas pas m'empêcher de penser qu'il y a encore bien du chemin à parcourir ... l'heure étant plutôt pour les grosses cylindrées à la centralisation des profils propriétaires ... ce qui doit nous inciter encore davantage a faire plus de place aux initiatives alternatives et technologiquement éprouvées (dont FOAF).

Côté ressources pédagogiques :

Côté voeux, bonnes résolutions et oracles divers :

  • il y a ceux qui ne croient plus aux blogs sous leur forme actuelle (Jean-Michel Salaun et Jean Véronis) ... mais qui continuent heureusement de blogguer :-) De mon coté je reste sur le créneau de l'enthousiasme (peut-être un peu candide), même si - à l'instar des deux précédemment cités - je constate ici et là une raréfaction des pépites blogguesques, nombre de trouvailles ayant visiblement du mal à tenir sur la longueur, ce qu'on aurait du mal à leur reprocher tant il est vrai qu'en dehors d'un projet affirmé de publication (journal, auto-fiction, carnet de recherche, formation à distance), l'exercice du blog est une gymnastique chronophage, et que "le temps de blogguer" n'est pas nécessairement la chose la mieux partagée du monde. Il n'en demeure pas moins qu'en repensant à ce qu'était la pêche informationnelle d'avant et d'après le temps du blog, ce "format éditorial" a tout de même été l'occasion d'entendre de bien belles voix, et de découvrir de fort pertinentes analyses. L'avenir dira ce la forme blog deviendra, mais les potentialités, l'univers de discours offert par une petite quantité de ces "nanopublications" reste pour l'instant et de mon point de vue, essentiel.
  • il y a ceux qui comme Fred Cavazza, se livrent à leur petit exercice de prospective du nouvel an, et ceux qui comme Francis Pisani, font une revue de presse des principaux exercices du genre.

Et mes prédictions à moi ?

  • A l'instar de ce que décrit Christian Fauré à propos du service Twine, je crois que l'ensemble des acteurs majeurs de la recherche d'information (Google, Yahoo! Microsoft) et quelques-uns de leurs challengers (Exalead, Facebook) vont prendre de plus en plus nettement le grand virage de l'hybridation. Une hybridation entre :
    • des espaces et des services collaboratifs,
    • des technologies sémantiques ou sémantisées de représentation et d'agrégation des connaissances,
    • et des algorithmies de recherche "pures" (ou recherche universelle).
  • Je crois que la diversité des contenus va (enfin) atteindre un équilibre longtemps espéré entre le "texte seul" et la vidéo et l'image.
  • Je crois enfin que l'une des grandes questions en terme de recherche (notamment pour les sciences de l'information et de la communication) sera la mise au jour des nouvelles autorités cognitives qui s'articulent aujourd'hui de manière encore un peu floue derrière la monétisation (ou la non-monétsation) des services à base de connaissance (Knol, Wikipedia).
  • De mon côté je retiens comme éléments et tendances majeures de l'année écoulée : les deux nouvelles étapes de la dérives des continents documentaires que sont :
    • d'une part, la synchronisation transparente entre nos activités informationnelles connectées (on-line) et déconnectées (off-line),
    • et d'autre part, la sphère croissante d'indexabilité (notion de "graphe social" pour faire simple) de l'humain au travers de ses innombrables traces documentaires éparses sur le(s) réseau(x).
  • Ce qui me semble frappant au-delà de tout c'est l'avénement imminent et probable d'une nouvelle génération d'algorithmes ayant capacité à représenter sur un même plan des documents toujours plus fragmentaires, des traces identitaires toujours plus documentées, et à transformer toutes ces traces d'attention en vecteurs d'intentions, pour le plus grand bonheur des grandes industries culturelles et des quelques acteurs qui dominent actuellement le marché (et ce au-delà du discours geignard et misérabiliste que s'obstinent à tenir les mêmes industries culturelles). En un mot comme en cent : la redocumentarisation du monde. Il est certain qu'il va falloir être très très très attentif aux Network sciences, car elles seront le creuset plus que probable de cette nouvelle génération d'algorithmes et de modes de représentation, et qu'à mon sens, elles seules ont aujourd'hui la capacité à réunir en un même cadre d'analyse les fronts de recherche les plus innovants, les techniques d'indexation et de représentation du vivant au sens large.
  • Voilà pour le côté vivifiant et optimiste de la chose. Côté pessimiste (mon éternel côté cassandre :-); je crains que nous ne soyons confrontés à une échéance majeure, celle de la médecine personnalisée et/ou médecine "2.0" et/ou médecine désintermédiée. La montée en puissance et la position désormais établie de ces nouveaux prescripteurs planétaires que sont les moteurs de recherche d'une part, la mise à la portée du grand public des technologies de génomique (notamment à des fins d'auto-diagnostic) d'autre part, les rapprochements entre les premiers (moteurs de recherche) et les secondes (sociétés de génomique), et enfin l'engouement de plus en plus explicite chez tous les grands acteurs de l'industrie médicale (et notamment pharmaceutique) pour des modèles de diffusion et d'accès reposant sur du gratuit financé par la publicité va nécessiter, pour le moins, de grands chantiers didactiques si l'on veut éviter d'aller à coup sûr ... droit dans le mur. Va falloir se trouver dare dare un José Bové de la santé comme bien commun de l'humanité. Sinon ...

Bonne année à vous tous :-)

Séminaire Réseaux Sociaux : suite et fin.

Après l'annonce officielle et les deux teasings (ici et ), mon diaporama est comme promis disponible et téléchargeable sur Slideshare. (en téléchargeant le fichier vous récupérerez les commentaires sous certaines diapos un peu délicates à expliquer sans le son :-)

Les autres powerpoints des autres intervenants devraient être bientôt mis en ligne sur le site du Gdr-Tics.
La journée fut (de mon point de vue) une vraie réussite :

  • il y avait un public nombreux (une bonne centaine de personnes - étudiants, enseignnts, chercheurs, mais aussi plein de gens du "monde de l'entreprise"), ce qui change un peu des colloques affichés "internationaux" avec pour seule assistance les amis et la famille de l'intervenant
  • les conférenciers avaient tous bossé leurs transparents et leur problématique (ce qui change un peu des colloques où l'on vous assène la lecture d'un article sans envisager un seul instant que si c'est pour lire un article ... ben on peut le faire tranquillement chez soi)
  • les interventions se complétaient et formaient une belle harmonie de problématiques et d'approches (des communications relativement théoriques, d'autres plus illustratives, la démonstration d'outils, des exemples fournis et choisis, un questionnement diachronique pour articuler les problématiques actuelles autour des réseaux sociaux ...)
  • de réelles synergies entre les thématiques et les approches présentées (identité numérique, redocumentarisation du monde, industries culturelles, théorie des graphes). C'était tellement bien qu'on avait envie de prolonger la discussion et de bâtir des projets et des programmes de recherche tout en vidant des verres de bière. Ce qui change des colloques où on est très content ... de rentrer chez soi.

Chapeau donc a Evelyne Broudoux (aka "grande rêtresse de l'autoritativité") et à Ghislaine Chartron pour l'organisation de cette journée et le travail mené dans le cadre du groupe "Acteurs et production numérique éditoriale".

Teasing n°2 ... Lundi 17 Décembre ... Réseaux sociaux au CNAM

c'est donc demain au CNAM.
A la question : "L'Homme est-il un document comme les autres ?" (titre de mon intervention), je répondrai : OUI. A cause du complexe de l'antilope :
Diapositive17

Bienvenue dans le World Life Web.

// Petit texte à vocation pédagogique reprenant ce qui est trop brièvement annoncé ici et qui sera complété sous un autre angle //
En 1994, suite aux travaux de Tim Berners Lee est officiellement né le World Wide Web. Une toile, mondiale, « large » dans sa dimension au moins autant que dans ses contenus. Avec le temps, ces derniers ont littéralement explosés, imposant à tous l’usage des moteurs de recherche pour mettre un semblant d’ordre dans ce chaos fertile et fécond, sur la base d’un principe de classement « par pertinence ».  Le principal problème qu’eut à gérer le web dans sa phase initiale de déploiement fut celui de l’adressage des documents. Pour les trouver, pour les retrouver, il fallait que ceux-ci disposent d’une adresse physique sur le réseau. La réponse fut apportée grâce notamment au protocole « http » (hypertext transfer protocol) ainsi que via le système de nommage qui permet d’identifier et de classer les sites sur la base du nom de domaine qu’ils ont choisi. Ce processus d’adressage pose encore aujourd’hui quelques problèmes et doit notamment faire face à l’explosion constante des contenus, d’où l’apparition de nouvelles extensions (« .mobi » pour les sites dédiés à la téléphonie mobile,  « .museum » pour les sites de musées, etc.) et la question ouverte d’élargir ce protocole à l’ensemble des langues de la planète. Ce fut là le premier âge documentaire du web.
Puis vint le World Live Web. Un web instantané, un web donnant en temps réel l’état des dernières informations publiées. Le service Google News fut à ce titre l’un des pionniers de ce deuxième âge documentaire, mais celui-ci permet également de désigner ce que l’on appelle des micro-contenus (billets de blogs par exemple). Le critère de pertinence utilisé par les moteurs reste naturellement essentiel, mais un second critère tout aussi important vient s’y ajouter, celui de la capacité à rendre compte en temps réel de l’évolution des documents publiés sur le web, et ce quelle que soit leur « granularité ». Là où les moteurs de recherche classiques n’indexaient que des « pages », le moteurs de recherche de la blogosphère se mettent à indexer des « billets », comme autant de fragments documentaires sitôt publiés, sitôt indexés, sitôt accessibles.
Nous sommes depuis quelques temps, notamment avec l’essor extraordinaire des « réseaux sociaux » (Facebook, MySpace) et celui des mondes virtuels (Second Life), entrés dans un troisième âge documentaire : celui du World Life Web. Après l’adressage des documents, après leur niveau de granularité (de plus en plus fin), la principale question que pose ce nouvel âge est celle de la sociabilité et du caractère indexable, remixable de notre identité numérique et des traces qu’elle laisse sur le réseau. Dans ces mondes et ces réseaux virtuels, chacun peut donner les informations qu’il souhaite. Et ces informations peuvent indistinctement relever de notre sphère publique (notre métier par exemple), de notre sphère privée (nos relations, nos amis), enfin et surtout de notre sphère intime (nos préférences politiques, sexuelles ou religieuses).
De plus en plus de sites de réseaux sociaux « ouvrent » l’immense catalogue des individualités humaines qui les composent à l’indexation par les moteurs de recherche. Ce qui pose nécessairement la question de la pertinence des profils humains. Une question qui n’en est encore qu’à ses balbutiements mais dont l’étendue des problèmes posés peut à juste titre faire frémir. Il est en effet établi que chacun des utilisateurs de ces systèmes, loin de disposer d’un profil unique librement consenti et ne contenant que des informations à caractère public (un peu à la manière de nos « cartes d’identités »), dispose de plusieurs profils différents, sur différents sites, dans différentes sphères (publiques, privées ou intimes). Que beaucoup d’utilisateurs "entrent" dans ces réseaux sociaux sous la forme de pseudonymats (pseudonymes masquant l’identité réelle) ou d’avatars, s’inventant ainsi des identités parfois ludiques, parfois recomposées, parfois mensongères, souvent idéalisées, toujours fragmentaires. La politique de confidentialité des sites récoltant ces informations, généralement de manière librement consentie, a déjà fait l’objet de nombreuses critiques, mobilisant institutions et associations sur le créneau de la défense d’un droit à l’oubli numérique. Or s’il est possible de sensibiliser les gens à la logique d’industrialisation de l’intime qui sous-tend ces univers, s’il est possible d’en appeler à leur vigilance et à leur responsabilité, il demeure impossible de contrôler ce que deviendra le remixage de l’ensemble de ces traces, une fois affiché, par exemple, dans un moteur de recherche.
La question qui se pose donc aujourd’hui est celle du caractère indexable de l’être humain. Celle de savoir si l’Homme est, ou non, un document comme les autres. La question enfin, pour chacun d’entre nous, de se voir doté d’une identité numérique globale et non maîtrisée. Cette identité sera définie (elle l’est déjà pour une large part) via mes parcours sur le net, mes actes d’achat, les expressions (maîtrisées ou non) de mon affichage identitaire, ainsi que par le reflet de l’ensemble tel qu’il apparaîtra « remixé » dans les moteurs de recherche, les réseaux sociaux ou les mondes virtuels. L’urgence de cette question en appelle une autre : celle du pourquoi ? Les documents, les mots-clés ont acquis une dimension marchande. Ils se vendent et s’achètent sur la grande place de marché d’Internet, que régule pour une large part le seul moteur Google. Nos traces identitaires numériques seront-elles demain également marchandisables ? Bienvenue dans le World Life Web.

Graphe, Web, Net

Dans sont dernier billet, Tim Berners Lee revient sur une notion au coeur de bien des débats ces derniers temps, celle du graphe social.
Partant de l'analogie fréquemment et un peu abusivement employée qui fait que quand on parle de graphe, on fait immédiatement référence à Internet, à l'image du réseau, Tim Berners Lee commence par rappeler que le Net et le Web ne sont pas la même chose, mais que tous deux sont effectivement des graphes (d'ordinateurs pour le premier et de contenus/documents pour le second). Il se lance ensuite dans un plaidoyer pour la notion de graphe, regrettant même avec humour de n'avoir pas appelé le www (world wide web) le GGG (giant global graph).
Mais le passage le plus intéressant est celui qui clôt son billet :

  • "The less inviting side of sharing is losing some control. Indeed, at each layer --- Net, Web, or Graph --- we have ceded some control for greater benefits." Et plus loin :  "Letting your data connect to other people's data (...) is still not about giving to people data which they don't have a right to. It is about letting it be connected to data from peer sites. It is about letting it be joined to data from other applications. It is about getting excited about connections, rather than nervous."

Tim Berners Lee dans ce court paragraphe nous montre clairement la voie : cesser d'être "nerveux" et "s'enthousiasmer" pour les possibilités offertes par une interconnexion globale des hommes, après celle des ordinateurs et des documents. Mais Tim Berners Lee dans son argumentaire plaide également pour une architecture standardisée et normée afin d'opérer ces connexions, sur le modèle de FOAF.
La question est donc de savoir si dans la situation actuelle, ceux qui nous rendent nerveux (Facebook) et les autres (OpenSocial) sont prêts à se rabattre, et leur immense vivier d'utilisateurs avec eux, vers des descriptions standardisées du type de FOAF. Le web, le net et le "graphe" auraient naturellement tout à y gagner, en accélérant ainsi par exemple la progression du web sémantique (ou sémantisé).

<Update> Voir aussi le billet de Francis Pisani </Update>

World Life Web

World Life Web : le troisième âge documentaire.

(vit'fait) World Wide Web. World Live Web. World Life Web.

  • World Wide Web : problématique de l'adressage. Où sont les documents ?
    • réponse : protocolaire ("http" et les autres), connue, mais pas pour autant définitivement résolue (problème de l'explosion du volume des URL, URI et URN et de l'évolution des protocoles de nommage) :-)
  • World Live Web : problématique de la granularité. Que sont les documents ?
    • réponse : des fragments documentaires redocumentarisables
  • World Life Web : problématique de la sociabilité. En quoi suis-je un document ?
    • réponse : Je suis indexable. J'ai une "identité documentaire" documentée, fragmentaire, et redocumentarisée (redocumentarisable) hors de mon strict et seul contrôle. Pose également le problème de la pertinence de ces traces identitaires documentées puis redocumentarisées. Avec derrière l'idée que le classique "Qui suis-je ? Où vais-je" pourrait trouver sur le net des réponses inédites : ceux qui sauront le mieux "qui je suis" sont ceux qui savent le mieux "où je vais" (= moteurs). Dit autrement il pourrait y avoir une sorte de cénesthésie numérique consubstantielle (affordantielle ?) à mes parcours, à mes actions, à l'expression maîtrisée de mon identité, et au reflet de l'ensemble tel qu'il apparaît remixé (redocumentarisé) dans les moteurs de recherche et/ou les réseaux sociaux.

(Jean-Michel Salaun évoque déjà le thème de la redocumentarisation du monde, des objets et des hommes, quant à moi je vous en reparle bientôt ...)

Kindle Surprise

Donc voilà. Le Kindle (e-reader liseuse) d'Amazon sera lancé officiellement lundi prochain. Ce qui, à la différence du titre de ce billet, n'est pas vraiment une surprise. Le blog Engadget fut le premier à le chroniquer le 11 Septembre 2006. Un an plus tard, le marché du livre et ses circuits de distribution ont connu de sérieux bouleversements, et les usages de lecture numérique ont mûri en même temps que les technologies les accompagnant. Comme mes collèges bloggueurs ont déjà fait le boulot - et autant vous le dire tout de suite, ils sont loin d'être enthousiastes - je vais tout simplement me contenter de piller leurs billets pour vous indiquer que le Kindle :

  • sera cher : 400 $. Cette barrière à l'entrée constitue à mon sens un sérieux frein au déploiement réellement grand public de ce que Jeff Bezos n'hésite pas à désigner comme le "livre 2.0". En l'état, on en est encore au lecteur électronique à deux zéros à la fin du chèque.
  • que le Kindle permettra d'accéder d'entrée à un catalogue entre 88 000 et 90 000 ouvrages. Sur la nature desdits ouvrages (livres "utilitaires" - cuisine, bricolage - livres "fonctionnels" - manuels scolaires et universitaires - livres "tout court" ...) je n'ai en revanche rien trouvé.
  • qu'il en coûtera 9,99 $ pour télécharger un livre. Ce qui fait dire à certains qu'Amazon vient de fixer le prix maximum (unique ?) du livre électronique, comme Apple l'avait fait en son temps pour les morceaux de musique avec l'IPod.
  • qu'il utilisera une technologie d'accès pour l'instant payante (mais annoncée comme bientôt gratuite) via Whispernet, un réseau à haut débit lié à Sprint, permettant de se connecter et de télécharger directement les livres sur le site d'Amazon, sans passer nécessairement par des spots Wifi et assurant au Kindle une couverture plus large (cf plus bas)
  • que le Kindle ne permettra pas seulement d'acheter des livres, mais aussi de télécharger et de lire directement la presse (NYTimes, Le Monde, WSJournal) ainsi que différents blogs, moyennant finance. Une réintermédiation à la hussarde qui risque de déclencher quelques couinements.
  • que le Kindle est très bien positionné en terme de "service". Qu'en revanche, côté design et ergonomie, il semble dépassé avant même sa sortie, même si l'essentiel technologique est là (e-ink <Update> finalement il y aurait bien innovation de ce côté là </Update>, autonomie, capacité de stockage)
  • que le Kindle est plein de DRM et qu'il est centré sur le format Mobipocket (firme rachetée par Amazon) et qu'il ne reconnaît même pas le .pdf
  • que dixit Jeff Bezos "Les livres sont archivés sur le serveur d’Amazon; si vous les perdez vous pouvez les télécharger gratuitement." Tiens, ne serait-on pas en train de nous refaire le coup de la "location" déguisée en "acte d'achat" ...
  • que dixit le même : "Au lieu de faire des achats depuis votre PC, vous le faites depuis l’appareil. Le contenu est délivré très simplement. Nous avons décidé d’utiliser EVDO au lieu de Wi-Fi qui nécessite des Hotspots. Nous avons créé Amazon WhisperNet qui permettra d’utiliser le réseau EVDO sans aucun engagement ni paiement.Le jour où notre disque dur aura disparu se rapproche ... comme disait l'autre.
  • que le Kindle est lié à une place de marché (LE coeur d'activité d'Amazon) et que les utilisateurs du Kindle pourront gentiment envoyer leurs documents Word et