J'ai été interviewé l'autre jour par Roland Lloyd Parry de l'AFP, suite à un article paru dans le Monde. L'objet de l'interview portait sur la fonctionalité d'auto-complétion de Google (= requêtes suggérées en cours de frappe). La dépêche AFP est consultable ici. Elle a été partiellement reprise en français ici. Pour archivage personnel, je reproduis ci-dessous les passages me citant et j'en profite pour reprendre des points de la discussion qui n'ont pas été repris dans ladite dépêche.
"The auto-completion technology used by Google could in theory reveal the mentality of the country where these propositions originate," said Olivier Ertzscheid, an Internet specialist at Nantes University. "It is not by chance if the word 'Jewish' appears linked to more search queries in France than elsewhere. It goes back to something in the history of the country in question," he told AFP.
C'est l'idée selon laquelle l'algorithmie des moteurs (le "pagerank") a ceci d'intéressant que pour certains cas, elle rend nécessairement compte de l'inconscient colectif d'un pays, d'une collectivité linguistique. L'exemple le plus frappant que je cite régulièrement à mes étudiants, est celui des résultats comparés de la requête "nazi" sur Google.com et sur Google.de. La base linguistique anglophone renvoie, tout de suite après les incontournables résultats de Wikipédia, le site du parti nazi américain comme premier lien. Alors dans dans Google allemagne, après les mêmes résultats de Wikipédia, on trouve - hélas - davantage de sites en provenance de la base "news", mais les premiers résultats organiques renvoient majoritairement sur des sites militants anti-nazi ou sur des sites historiques.
"The search queries that you see as part of Autocomplete are a reflection of the search activity of all web users," Google France spokeswoman Anne-Gabrielle Dauba-Pantanacce explained in an email to AFP. "While we always strive to neutrally and objectively reflect the diversity of content on the web -- some good, some objectionable -- we also apply a narrow set of removal policies for pornography, violence, and hate speech," she wrote. In Ertzscheid's view, "what complicates things is that we know that Google corrects certain results, but we do not know which ones. "It is possible that on Google.com there is more cleaning-up done to delete offensive keywords" than on the other language versions, he suggested.
Comme le pointait encore Jean-Michel Salaün à propos de l'affaire JC Penney révélée par le New-York Times, et comme je le dis ici depuis très longtemps, la question de la neutralité ou de l'objectivité des résultats des moteurs de recherche est d'abord un argumentaire marketing dès lors que l'on entre dans des logiques marchandes, mais également - hélas - de plus en plus souvent pour des requêtes sociétales ou politiques (du Google Bombing jusqu'aux suppressions manuelles de certaines suggestions sur certaines personnalités politiques en passant par les achats de mots-clés "sensibles").
A la différence des guerres d'édition dans Wikipédia, cette "ré-écriture" ou plus exactement cette "désinscription", cette "dé-scription", n'offre aux analystes, chercheurs, sociologues ou spécialistes de l'information aucune transparence quant aux logiques processuelles qui l'ont engendrée. Nous sommes contraints d'en faire simplement le constat. Mais un constat qui en dit déjà suffisamment long sur les enjeux "politiques" qui sous-tendent aujourd'hui les résultats des moteurs de recherche. Dans un vieil article (Juin 2004), mon collègue Gabriel Gallezot et moi-même mettions en garde :
"Quand nous consultons une page de résultat de Google ou de tout autre moteur utilisant un algorithme semblable, nous ne disposons pas simplement du résultat d'un croisement combinatoire binaire entre des pages répondant à la requête et d'autres n'y répondant pas ou moins (matching). Nous disposons d'une vue sur le monde (watching) dont la neutralité est clairement absente. Derrière la liste de ces résultats se donnent à lire des principes de classification du savoir et d'autres encore plus implicites d'organisation des connaissances. C'est ce rapport particulier entre la (re-)quête d'un individu et la (re-)présentation d'une connaissance qui était présente dans les bibliothèques de la Haute-Egypte, pour en être évacuée avec l'arrivée des principes de classement alphabétiques."
D'un point de vue beaucoup plus large, et à la lumière des évolutions actuelles liées à l'organisation des résultats de recherche, il semble que nous arrivions aujourd'hui à un point de transition où des "agencements collectifs d'énonciation" (modèle autoritatif, transparent, émergent, bottom-up), sont en lutte avec les "agencements algorithmiques informationnels" (modèle top-down, autoritaire, discrétionnaire).
Savoir qui des deux l'emportera, qui dominera l'autre et comment, quelles collaborations sont ou non possibles entre les deux et selon quelles modalités, constitue probablement l'un des enjeux majeurs de l'écologie de l'information du 21ème siècle.
Commentaires