Billet où il sera notamment question de données personnelles, de la bibliothèque du Congrès, de la guerre des graphes, de la société de la requête, de millions de méga-octets, de thesaurus et de webmail ...
Ca y est c'est fait. Sur mon compte Facebook, dans l'onglet "Account" > "Account settings", j'ai vu apparaître le petit lien magique que j'attendais tant : "Download your information"
J'allais enfin pouvoir télécharger toutes mes données personnelles. Après avoir indiqué que "oui, oui, je suis sûr de bien vouloir les télécharger", et une heure plus tard, j'ai reçu dans ma boîte mail un message de Facebook avec un lien d'activation pour accéder au précieux fichier.
Mais il m'a d'abord fallu doublement montrer patte blanche : une première fois en redonnant mon mot de passe (ok, précaution élémentaire), et une deuxième fois en jouant au jeu des photos de mes amis.
Je traduis : "Pour vérifier que vous êtes bien le propriétaire de ce compte, merci de reconnaître les personnes tagguées sur ces photos suivantes." Il faut reconnaître 5 amis et on l'on n'a droit qu'à 3 erreurs ("I'm not sure"), soit 8 questions en tout. Le problème c'est que les photos affichées ne sont pas des portraits de vos amis, mais des photos prises au hasard dans le photostream de tous vos contacts Facebook, c'est à dire toutes les photos déposées par tous vos amis.
Et là première angoisse : je suis ami avec plein de gens, mais surtout j'ai plein "d'amis d'amis" et encore davantage "d'amis étudiant(e)s". Et autant vous dire que je ne passe pas mon temps à regarder toutes les photos postées sur Facebook par tous mes "amis". Et donc ça ne loupe pas, on me demande de reconnaître quel est l'ami qui se cache derrière ces photos :
Voilà voilà voilà ... Donc ben du coup je n'ai plus droit qu'à 2 erreurs en espérant que les autres photos seront plus ... explicites. Quelques reconnaissances plus tard, c'est gagné :
Une fois le téléchargement effectué, je me retrouve avec çà :
Le dossier avec :
- mes photos de profil (album-Profile Pictures.html)
- la liste alphabétique de tous mes amis (friends.html)
- les événements auxquels j'ai été convié (events.html)
- mes courriers reçus sur facebook (messages.html)
- tout ce que j'ai posté sur mon "mur" (profile.html), soit - en ce qui me concerne - l'équivalent de 150 pages Word, et ce qui m'a permis de retrouver la date précise de mon arrivée sur Facebook : c'était le 11 Juillet 2007 à 13h40 et mon premier statut disait : "At home". Largement de quoi imprimer un aussi épais que futile "egobook".
Le dossier avec :
- toutes mes photos (c'est à dire en ce qui me concerne, uniquement 2 pauvres photos de profil)
Soit un dossier complet d'1,3 Méga-octets.
Remarque : ce dossier et les fichiers qu'il contient est un "à plat". Ainsi, dans le fichier "profile.html' on retrouve bien - et on peut activer - les liens hypertextes postés sur mon mur ou dans mes "statuts", mais on ne retrouve naturellement pas le graphe relationnel/navigationnel qui constitue le vrai trésor de guerre de Facebook, notamment - depuis l'activation de la fonctionnalité - les personnes qui ont "aimé" (= le fameux bouton "like") tel ou tel statut.
Et maintenant un peu de maths.
Question : Sachant qu'un individu (moi en l'occurence) peut être considéré comme un utilisateur type du réseau social Facebook, et sachant qu'il y a au moins 500 millions d'utilisateurs sur Facebook, quel est le poids des données personnelles détenues par Facebook ?
Solution : 500 millions multiplié par 1,3 méga-octets = 650 millions de mégaoctets.
Ce qui nous donne : 650 Téra-octets de données personnelles disponibles sur Facebook.
65 fois la bibliothèque du Congrès, rien qu'avec les données personnelles.
Sachant que "10 téraoctets pourraient contenir toute la collection des ouvrages imprimés de la bibliothèque du Congrès" (source), on peut donc supposer que Facebook détient au moins l'équivalent de 65 bibliothèques du Congrès uniquement composées de données personnelles. Celle-ci comptant plus de 33 millions d'ouvrages, cela fait donc l'équivalent de (33 x 65) : 2145 millions de livres de données profilaires. Et encore, je dis bien "au moins" car dans les profils Facebook ce sont les photos qui prennent le plus de place, que je n'en ai que deux (photos) dans le mien et qu'en moyenne mes amis sont plus proches d'une bonne cinquantaine (de photos toujours), et je ne vous parle même pas de mes "amis-étudiants" (il n'est pas rare de voir plus de 300 photos dans certains profils). Mais bon on va pas chipoter, l'ordre de grandeur me semble déjà suffisamment parlant ...
Mon mur, ma bataille. L'équivalent de 150 pages word pour moi en 3 ans, et pour 499 999 999 autres, 2145 millions de livres de données profilaires dont probablement plusieurs centaines de millions également et uniquement remplis de ces traces profilaires, conversationnelles, le reste étant occupé par la documentation iconographique rétrospective des 500 millions d'habitants de cette communauté. Vertigineux.
Facebook en grand ordonnateur du nouvel ordre documentaire mondial ? Facebook est, par le nombre, la première communauté humaine de la planète numérique. Si l'homme est un document comme les autres, et si l'ordre documentaire du 21ème siècle sera celui d'un pan-catalogue des individualités humaines, Facebook est en bonne place pour remporter la mise ou pour en devenir à tout le moins le grand ordonnateur, le grand sachem de ce qui est "su".
De la thesaurisation des profils au trésor de guerre.
Au-delà des chiffres et des questions de "vie privée", il faut relire ce billet de Tim Berners Lee, une nouvelle fois visionnaire, dans lequel il évoque le Giant Global Graph.
- Le net est un graphe d'ordinateurs connectés.
- Le web est un graphe de contenus connectés, dont Google est, pour l'instant, l'outil qui permet le mieux d'en sonder les profondeurs, d'en donner l'image la plus "complète" possible.
- Les réseaux sociaux sont un graphe d'individus connectés, dont Facebook est, pour l'instant, l'outil qui permet le mieux d'en sonder les profondeurs, d'en donner l'image la plus "complète possible".
L'enjeu est désormais de savoir qui sera le premier à pouvoir réunir la puissance des 2 graphes
La guerre des graphes a désormais officiellement commencée. Et comme toutes les guerres :
- elle fut d'abord larvée, chacun essayant de circonscrire au mieux ses frontières naturelles (les contenus pour Google, les profils pour Facebook)
- elle fut ensuite une série de petites offensives permettant de jauger les forces et faiblesses de l'adversaire en envoyant une petite armée le combattre sur son terrain : ce que tenta de faire Google en lançant "son" réseau social (Orkut), ce que tenta de faire Facebook en nouant alliance avec Microsoft pour s'installer - mais en restant dans ses frontières - sur le marché du "search"
Et puis un jour, à l'occasion d'une escarmouche, on sort l'artillerie lourde et on engage "officiellement" le début des hostilités. C'est désormais chose faite entre Google et Facebook.
L'escarmouche ce fut ce "cheval de troie" qui permettait à un nouvel arrivant sur Facebook d'importer rapidement l'ensemble de ses contacts Gmail pour densifier rapidement son réseau d'amis. Jusqu'à ce que Google exige une contrepartie, c'est à dire que les utilisateurs de Gmail puissent récupérer et importer - par exemple - leurs contacts Facebook. Un blocage par ailleurs rapidement contourné par Facebook.
Et l'on apprend (sur Techcrunch) que Facebook lancerait (demain lundi ?) son webmail, nom de code "projet Titan" (sic) :
- "Le réseau social proposerait ainsi à ses utilisateurs, qui sont plus de 500 millions dans le monde, une adresse email personnelle @facebook.com, permettant d'envoyer des mails à tous les internautes, qu’ils aient une messagerie Hotmail, Yahoo ou Gmail. Aujourd’hui, les membres de Facebook ne peuvent envoyer de messages qu’aux autres membres du site." (Source)
Le courriel et les webmails sont, pour ces deux acteurs, un cheval de troie idéal et hautement stratégique permettant d'assiéger la place-forte de nos pratiques connectées :
- d'abord parce que les mails rassemblent, parce qu'ils "synthétisent" notre réseau relationnel (nos "contacts"),
- ensuite parce qu'ils sont le point d'entrée le plus aisé vers le cloud computing, le stockage "dans les nuages" ou plus exactement sur les serveurs de ces grandes compagnies de pans entiers de nos vies sociales (pièces jointes, documents de travail, photos, etc ...)
- parce qu'ils contiennent également ce que nous avons à raconter de plus "intime", de plus "personnel" et qu'ils permettent donc d'affiner encore l'affichage de publicités "contextuelles" en scannant le contenu desdits mails,
- enfin parce que les webmails peuvent, au sein d'un écosystème semi-fermé (comme Facebook) ou semi-ouvert (comme Google et sa galaxie de services), constituer un point pivot autour duquel hiérarchiser l'ensemble des autres données affiliées à notre profil, à notre "empreinte numérique".
Techcrunch souligne ainsi que "Facebook aurait les moyens à la fois de hiérarchiser les courriels et de les intégrer à ses autres fonctions (partage de photos, calendrier etc.) d'une façon très convaincante." (source)
Thesaurus : From society of query to society of contact. Google est depuis longtemps emblématique de ce que Geert Lovink appelle une "Société de la requête". Facebook représente lui, les promesses d'une société des contacts étendus, ou distendus. Or requêtes comme contacts représentent la conquête et l'apprentissage d'un langage commun à l'humanité tout entière ; plus précisément un thesaurus, c'est à dire :
- "un type de langage documentaire qui consiste en une liste de termes sur un domaine de connaissances, reliés entre eux par des relations synonymiques, hiérarchiques et associatives."
En l'occurence, de l'approche commune de Google et Facebook on pourrait dire qu'elle vise à faire émerger et à circonscrire un type de langage documentaire qui consiste :
- en une liste de requêtes (déposées sur le moteur ou sur chacun de nos "murs"),
- liste de requêtes portant sur l'ensemble des domaines de connaissance existants (des plus fondamentaux aux plus futiles),
Lesquelles requêtes sont reliées entre elles :
- par des relations lexicales (ingénierie linguistique)
- et associatives "amicales" ou "contactuelles" (ingénierie de la recommandation reposant sur des graphes relationnels)
- permettant de hiérarchiser l'ensemble des requêtes et des profils en fonction du contexte de la requête et/ou du profil du requêtant.
Moralité. L'étymologie du mot thesaurus désigne, en latin, le "trésor".
De ce trésor là nous n'avons pas encore fini de mesurer la valeur.
De ce trésor là nous connaissons déjà ceux qui veulent en être les grands avaleurs.
Ça y est, j'ai déchargé mon compte et je n'ai pas eu droit (heureusement) au test photos. Ils ont dû se rendre compte de l'absurdité du truc.
Rédigé par : Michel Roland-Guill | 15 nov 2010 à 08:44
Qui se cache derrière les 3 photos ? J'ai trouvé ! Facile !
Rédigé par : pierre Frustier | 15 nov 2010 à 11:28
Facebook n'a plus du tout tes données dans le cas où tu décharges ton compte? ou tu récupère simplement une copie?
Rédigé par : Cindy | 15 nov 2010 à 15:15
Cindy> je ne fais que récupérer une copie. Tout est encore sur Facebook. Si je ne veux plus que cela y soit, il faut alors que je supprime mon compte.
Rédigé par : olivier ertzscheid | 15 nov 2010 à 15:38
sur le FaceBook français cette option apparait aussi? Je ne la trouve pas!
Article intéressant!
Rédigé par : Titi | 15 nov 2010 à 16:10
Il faut se mettre en anglais US et ça marche !!!
Rédigé par : cindy | 15 nov 2010 à 17:55
ha oui, parfait.
Merci beaucoup Cindy et Olivier!
Rédigé par : Titi | 16 nov 2010 à 08:28
merci pour l'article, et donc l'info.
en passant, je suis également "né" le 11 juillet 2007 sur fb, ce qui n'est pas le cas.
il semblerait que fb n'a tout simplement pas les enregistrements initiaux ;-)
Rédigé par : julienb | 17 nov 2010 à 02:20
@olivier ertzscheid
il n'est pas possible de supprimer un compte FB,
seulement le désactiver.
Les données sont conservées, et tu peux réactiver ton compte n'importe quant, il reprendra là où tu l'as laissé. (à moins que je n'ai loupé une nouvelle info)
Rédigé par : eddie | 18 nov 2010 à 16:20
Hello,
Disclaimer : je travaille chez FB mais ce que je dis n'engage que moi :)
@eddie : ce n'est pas exact, vous avez (si je me souviens bien) 2 semaines pour réactiver un compte supprimé, après c'est volatilisé pour de bon !
@olivier : article intéressant.. mais vous êtes (très très) loin du compte avec les 650To :) FB a des dizaines/centaines de To de nouvelles données chaque *jour*.
Voici quelques exemples d'infos publiques là dessus :
http://blog.facebook.com/blog.php?post=2406207130
(160To rien que de photos en 2007, avec juste quelques dizaines de millions d'utilisateurs)
http://www.scribd.com/doc/22847003/Facebook%E2%80%99s-Petabyte-Scale-Data-Warehouse-Using-Hive-and-Hadoop
Autre point de comparaison : Twitter, qui est beaucoup, beaucoup plus petit que FB, stocke 4Po (4096 To) de tweets par an, sans photos ni vidéos !
http://www.neowin.net/news/storing-tweets-requires-four-petabytes-of-data-a-year
Rédigé par : reno | 18 nov 2010 à 17:13
@Reno> merci pour ces précisions et ces liens qui m'avaient échappé. Je me doutais bien (et je le précisais dans le billet) que j'étais bien en dessous de la réalité :-)
J'essaierai de faire une mise à jour du billet quand j'aurai exploré les liens.
Rédigé par : olivier ertzscheid | 18 nov 2010 à 17:19
@reno
alors c'est nouveau ?
j'avais laissé un compte désactivé pendant plusieurs moi et avais été surpris de le retrouver en l'état lors de ma re-connexion...
Rédigé par : eddie | 18 nov 2010 à 18:09
@reno voilà d'ailleurs le message de l'équipe facebook suite à une désactivation
"Vous avez désactivé votre compte Facebook. Vous pouvez réactiver votre compte à tout moment en vous connectant à Facebook avec votre ancien identifiant et le mot de passe correspondant. Vous pourrez à nouveau utiliser le site comme vous en avez l'habitude."
Rédigé par : eddie | 18 nov 2010 à 18:15
un lien pour une méthode pour détruire de manière définitive son compte:
http://consumerist.com/2010/04/delete-your-facebook-account-forever.html
cela dit, une fois qu'on a détruit son compte, ne veut pas forcément dire que ces informations n'existent plus chez FB. je ne connais pas la réponse...
pour revenir à l'article, j'ai trouvé ça construction excellente! on se demande quand l'un avalera l'autre, et qui ce sera...
Rédigé par : iGor | 18 nov 2010 à 20:51
@eddie : le message concerne une demande de désactivation, pas de suppression, c'est pour ça.
@iGor : je répète, une fois la suppression demandée les infos n'existent plus chez FB au bout de quelques jours/semaines.
Rédigé par : reno | 13 déc 2010 à 13:21