Préambule. Le poète, l'informaticien et le moteur. Le poète Léopold Sedar Senghor écrivait : "L'encre du scribe est sans mémoire". L'informaticien Apostolos Gerasoulis (le papa du moteur de recherche Ask Jeeves) s'interrogeait en regardant défiler les 10 millions de requêtes quotidiennes d'Ask Jeeves : "Je me dis parfois que je peux sentir les sentiments du monde, ce qui peut aussi être un fardeau. Qu'arrivera-t-il si nous répondons mal à des requêtes comme "amour" ou "ouragan" ?"
Le 8 septembre 2010, Google lance officiellement la fonction "Google instant search", en français dans le texte : "recherche instantanée" (nota-bene : pour un guide complet de Google Instant, voir le billet de SearchEngine Land). La nouveauté de ladite fonction tient en une ligne : les résultats de recherche s'affichent en cours de saisie de votre requête. Cela va vite, très vite, c'est - de mon point de vue - assez déroutant au premier abord mais - de mon point de vue toujours - on en prend assez vite l'habitude sans pour autant en devenir accroc (quoi qu'il soit encore un peu tôt pour savoir s'il s'agit d'un coup de poker ...).
Le scribe, la suggestion et l'auto-complétion : suggérer n'est pas prédire mais peut fortement y ressembler. Au commencement était le verbe Google Suggest, fonctionnalité reposant elle-même sur un moteur de complétion, c'est à dire un programme informatique issu - en gros hein ... - de la linguistique de corpus et permettant non pas de "prédire" quelles seront les prochaines lettres/mots que vous saisirez mais - la nuance est de taille - de vous suggérer par voie d'affichage les lettres/mots les plus fréquemment saisis sur la base de la combinaison initialement entrée. Dans le cas de Google, il s'agit de l'ensemble des requêtes de la planète, réparties, stockées et synchronisées entre les différents centres-serveurs de la firme. Autant dire que d'un strict point de vue statistique, vous avez effectivement pas mal de chances que la supposée "prédiction" tombe juste.
Et puis voilà que débarque des laboratoires de Google, Google Scribe, qui n'est "que" le déploiement sous forme d'API de la fonction Google Suggest (ce qui par exemple permet de faire tourner l'instant search sur Wikipedia ou sur YouTube, et dans plein d'autres endroits)
Pourquoi Google Instant Search ? A chaque nouveau rachat, nouveau produit ou nouvelle fonctionnalité, tout ce que la planète compte d'experts es-googologie - et il y en a beaucoup - se fendent de leur analyse pour tenter de trouver les "vraies" raisons de l'affaire. Permettez que j'y ajoute la mienne :-) L'argumentaire de Google se limite - comme souvent - au minimum syndical :
- "on a lancé ce truc là pour améliorer l'expérience utilisateur et parce que les gens aiment bien accéder le plus vite possible aux résultats (de leurs recherche), c'est le web en temps réel."
Je voie au moins 3 raisons de fond au lancement de Google Instant Search, qui s'inscrivent toutes dans la stratégie habituelle de la firme et qui correspondent également à la transformation du marché de la recherche d'information ("search market" comme disent nos amis anglo-saxons).
Primo. La téléphonie mobile. Toutes les études le montrent, les smartphones et autres tablettes et cellulaires seront, demain, le premier moyen d'accès à Internet à l'échelle de la planète. Et si vous avez déjà essayé de taper des requêtes un peu longues sur lesdits smartphones, avec vos doigts gourds et que ces derniers (les smartphones pas vos doigts) soient équipés de touches ou d'écrans tactiles, vous avez mesuré tout l'intérêt que présente une fonction permettant de vous éviter une saisie souvent délicate. De fait, la fonction "instant search", qui ne tourne pour l'instant que sur des ordinateurs, sera disponible plus tard cet automne pour les téléphones cellulaires.
Deuxio. L'achat de mots-clés. Eeeeet oui. Le nerf de la guerre. LE modèle économique - pour l'instant - indépassable de Google, l'achat de mots-clés sous forme de liens sponsorisés. Et là, si les résultats s'affichent en cours de frappe, sans que l'on ait le temps de saisir certains des mots-clés précisément achetés par telle ou telle entreprise ... là ... tout change. Ainsi, les entreprises dont le nom est suggéré en premier à la seule saisie de l'une des 26 lettres de l'alphabet (exemple en anglais ou en français), ces entreprises là jubilent. Les autres ... toutes les autres ... un peu moins.
Tertio : le moteur de divination. Lors de sa Keynote pour le lancement de Google Instant, Eric Schmidt nous a refait le coup du moteur de divination, d'un moteur qui serait capable d'en connaître suffisamment sur nous ("avec notre accord bien sûr"
juge-t-il aussitôt utile de préciser ...) avec un moteur qui en saurait
tellement sur nous qu'il serait capable de nous fournir des
informations avant même que nous ne lui ayons adressé la moindre
question, et de devenir lyrique en annonçant que le "cloud computing and the pervasiveness of the internet is creating new
opportunities to build new platforms and create new products, and to
take search closer to the area of artificial intelligence."
... Bullshit. Habillage cosmétique et belles formules évasives (et non
pervasives) avec comme objectif avoué de faire fantasmer le chaland
grâce au maronnier du marketing de la recherche, j'ai nommée
l'intelligence artificielle. En revanche, en revanche, on peut - me
semble-t-il - trouver la clé de Google Instant dans une conférence en ligne donnée à Stanford par Dan Russell
(de chez Google) dans le cadre d'un séminaire sur les IHM (Interfaces
Homme-Machine), conférence que je vous avais déjà narrée dans un précédent billet et où l'on apprenait entre autres ceci :
- "l'un des outils méthodologiques les plus surveillés par l'équipe IHM ("Usability labs") de chez Google est la fonction "refine search" qui (...) est un remarquable indicateur permettant d'établir des corrélations entre ce que les gens tapent et ce qu'ils cherchent "en fait" parmi la liste proposée. Entre les deux se construit une échelle d'intentionalité qui semble observée de très près par Dan Russel."
Les SEO se ramassent à la SERPe. (nota-bene : SEO = search engine optimisation, désigne à la fois l'optimisation des résultats de telle ou telle page dans les moteurs de recherche et les gens dont c'est le métier. En France on appelle ça des référenceurs, mais c'est moins trendy que SEO // SERP : Search Engine Result Page ; les webmasters et/ou référenceurs font du SERP tracking - ils surveillent les pages de résultat - pour pouvoir ensuite améliorer leur SEO). Et donc, disais-je :
Les SEO se ramassent à la SERPe. Donc pour le dire différemment, l'arrivée de la recherche "instantanée" risque de sérieusement redistribuer les cartes du référencement naturel ainsi que celles du positionnement payant. D'autant que Google en a profité - le 12 septembre soit 4 jours après le lancement d'Instant Search - pour également et subitement changer les règles jusqu'ici en vigueur pour l'achat de mots-clés "concurrentiels", permettant ainsi à n'importe quelle entreprise d'acheter le nom d'une entreprise concurrente (ce qui était jusqu'ici rigoureusement interdit). Bref, même si ce n'est pas l'objet principal de ce billet, tout porte à croire que ça va saigner ...
L'auto-complétion ou l'angoisse de l'incomplétude. Il est un point commun à l'ensemble des systèmes d'informations offrant des fonctionnalités de recherche (moteurs, bases de données, etc.) C'est l'angoisse de l'incomplétude.
- "Peut-être vos archives sont-elles incomplètes ?" se risquait à demander Obi-Wan Kenobi à la bibliothécaire Jocasta Nu dans la (nouvelle) trilogie Star Wars, ce à quoi il lui était répondu : "Nos archives sont complètes et parfaitement sécurisées jeune Jedi. Si cet enregistrement n'est pas présent dans nos archives, c'est qu'il n'existe pas."
Black Hat Trick. Pour y faire face (à cette angoisse), Google a déployé - au moins - trois stratégies :
- son coeur d'algorithmie (principe du Pagerank et des innombrables variables attenantes),
- son marketing (le bouton "feeling lucky")
- et son moteur de complétion.
Comme je l'avais longuement analysé dans ce billet, les ingénieries de la sérendipité se développent aujourd'hui considérablement, et sur plusieurs axes qui vont de celui des usages (web "social") à celui des outils (algorithmies affinitaires). Le coup de dès que semble proposer la fonction "instant search" ne vient ici abolir aucun hasard. Du point de vue de l'internaute il augmente statistiquement les chances de s'orienter vers autre chose que sa requête initiale mais pas celle que le "quelque chose" en question l'intéresse effectivement. Ce n'est donc qu'une "demi-sérendipité".
On ne prête qu'aux riches. Mainstream mon ami. Nombre de billets et d'articles ont déjà remarquablement dénoncé les "dangers" que représente la fonction "instant search" pour la représentation de la diversité :
- une recherche moins diversifiée
- la multiplication des stéréotypes
- la mort de la longue traîne des recherches
De la responsabilité du scribe : les paroles s'envolent, les écrits restent, et les moteurs tournent. Le nom de Google Scribe est mal choisi. Il n'offre en effet aucun parallèle avec le travail des scribes de la haute-antiquité. En revanche, l'homonymie est intéressante. Pour plusieurs raisons. Google n'est certes pas un scribe copiant et recopiant à l'infini les mêmes textes dans le seul souci de leur conservation. Quoi que. Quoi que ...
- La responsabilité de Google comme société d'engrammation, de mise en mémoire est de nature judiciaire. Elle affecte des questions comme le droit à l'oubli.
- La responsabilité de Google comme société de pro-grammation, de mise à disposition intentionnelle d'une certaine représentation d'une mémoire collective, cette responsabilité là est d'ordre moral.
La polémique Véronienne (véronistique ?) autour des stéréotypes racistes - à laquelle on pourrait ajouter celle des requêtes trop "sexy" - véhiculés par l'auto-complétion ("les noirs puent" et autres joyeusetés) soulève d'importantes questions :
- éthiques (faut-il se faire l'écho d'une pensée raciste même si cette pensée raciste est la plus répandue ?)
- philosophiques (selon quels "critères", au nom de quel(s) principe(s) et avec quelle part de responsabilité un algorithme peut-il donner à lire des valeurs "morales" ou "amorales" ?)
- économiques (pourquoi sur la lettre A auto-compléter avec Apple et non avec Adobe ?)
- géo-politiques (pourquoi les noirs puent-ils sur Google.fr et pas sur google.com ? imaginez l'auto-complétion dans les territoires occupés sur des mots comme "les israëliens ..." ou "les palestiniens...").
Des questions qui attestent s'il en était encore besoin de l'importance de la langue et du mot comme véhicule de tout pouvoir, de toute politique, de toute économie. De tout ce qui nous permet de "faire société". Se contenter d'attendre de Google qu'il nettoie mieux sa base de suggestion me semble bien loin de la réalité des enjeux soulevés.
Les technologies de complétion, appliquées à l'échelle d'une entreprise comme Google dont l'empreinte sociologique est au moins aussi importante que son emprise financière sur le secteur qu'elle domine, ces technologies ne sont pas neutres : elles interrogent directement le réagencement perpétuel des discours et des agencements d'énonciation complexes qui les produisent.
"L'encre du scribe est sans mémoire" écrivait le poète. La mémoire de Google Scribe est sans encre. Le scribe est un individu oeuvrant, sur ordre, dans une dynamique collective de perpétuation du savoir. Il n'est qu'un passeur de traces dont seul le collectif pourra ensuite "faire mémoire". Le scribe de Google est une technologie agissante, un acteur qui en le donnant à lire, choisit ce qui de nous, fera ou non mémoire, pour un temps ou pour tout le temps.
A bien y regarder, les résultats stéréotypiques de Google (au moins ceux sur les juifs et les noirs) proviennent non pas de dérapages de ses utilisateurs, pas davantage qu'ils ne trahissent un imaginaire collectif qui ferait de l'immensité d'entre nous des racistes en puissance : menées à leur terme les requêtes "les noirs puent" ou "les juifs sont radins" affichent essentiellement des messages de forums déjà bien référencés et effectivement racistes (dont ceux de l'hélas incontournable Doctissimo) et, pour le reste, des sites de "blagues" plus ou moins drôle mais dont le stéréotype constitue le principal - et souvent - le seul - ressort "comique.
Par ailleurs, et à l'appui de mon argumentaire précédent, le ratio entre les résultats "stéréotypiques" et les résultats "génériques" est, me semble-t-il suffisamment éloquent :
- requête "les juifs" 1 900 000 résultats ; requête "les juifs sont radins" : 14 000 résultats
- requête "les noirs" 5 140 000 résultats ; requête "les noirs puent" (avec guillements = expression exacte), 8880 résultats : requête "les noirs puent" sans guillements, 1 760 000 résultats. Soit dans ce dernier cas, en poussant l'illogisme à son terme, 1 français sur 5 qui exprimerait des opinions racistes. Sauf que. Sauf que un site n'est pas un français. Et que nombre des pages listées sur ce genre de requêtes contiennent aussi - et heureusement - des contre-argumentaires qui démontrent l'inanité de ce genre de préjugé raciste.
Ce n'est pas une réponse puisque je n'ai pas de question. La manière dont les gens utilisent les moteurs est un domaine de recherche à part entière, qui comporte de nombreuses variables, mais l'une des pratiques dominantes n'est pas celle qui consiste à poser des questions. De fait même le grand Google s'y est cassé les dents, en fermant son site Google Answers. La pratique courante pour les requêtes informationnelles (hors les requêtes navigationnelles et transactionnelles) est plutôt celle qui consiste à combiner 2 ou trois mots pour vérifier une assertion. Et si l'efficacité de Google Instant peut probablement être démontrée pour les requêtes transactionnelles (taper "acheter billet" pour vous en convaincre), elle est en revanche beaucoup plus délicate pour les requêtes informationnelles ou assertionnelles. Lesquelles requêtes représentaient tout de même, en 2006**, et de l'aveu même de Google, plus de 63% de l'ensemble.
**Si quelqu'un a des chiffres plus récents, je prends, mais là j'ai eu la flemme de chercher :-(
Perpetuum mobile. Quelques jours après le début de la rédaction de ce billet, Google a modifié les résultats de certaines de requêtes incriminées, pour les rendre plus compatibles avec la FAQ du service en question, dans laquelle on peut lire : "Enfin, la saisie semi-automatique exclut les termes relatifs à la pornographie, la violence et l'incitation à la haine."
Réponses responsables ou neutralité des réponses : that is the question. Le danger est que la responsabilité du scribe ne sera jamais compatible, de quelque manière que ce soit, avec la neutralité du moteur. Dans la place hégémonique qu'ils occupent aujourd'hui dans nos usages connectés, les noeuds hyperconnectés que sont les moteurs doivent trouver le moyen de choisir, dans certains cas, entre les deux. Toute réponse est d'abord l'exercice d'une responsabilité. N'en donner à voir que certaines, impose le risque de s'en trouver, un jour, responsable.
D'autant que la neutralité ne semble d'ailleurs plus aujourd'hui d'actualité dans l'univers de discours qui structure la présence et l'image de la firme. Et ce changement de positionnement est éclairant. Ainsi dans un récent entretien au NYTimes, Eric Schmidt déclare (c'est moi qui souligne) :
- "Google does not promise that it will treat all Web sites neutrally, he said. “What we promise is the best answer that we can come up with, as judged by the end user.” Sometimes that is a Google site and sometimes it is not, he said. “There is not a deliberate favoritism from a business perspective. There is a favoritism from what end users prefer, and we have ways to measure that.”
Faut-il ainsi croire que les réponses racistes stéréotypiques sont celles que l'utilisateur final préfère ? C'est, à tout le moins envisageable. L'économie de Google est une économie de média. Un média qui s'inscrit lui-même dans une économie de l'attention.
Google Ins ... tants de cerveaux disponibles.
- "Les internautes vous paient avec le temps qu'ils passent sur vos contenus, ils vous paient avec leur attention. C'est cette attention que les annonceurs veulent."
Voilà ce que déclarait David Eun, responsable des partenariats chez Google (sur la diapo 27). Bernard Stiegler a bien démontré en quoi ces médias de l'attention se reposaient sur du pulsionnel comme principal vecteur de leur stratégie de captation. Les "noirs qui puent" et autres "juifs radins" de Google Instant relèvent du même processus avoué. La réponse pulsionnelle, la réponse de l'instant, celle de Google Instant, c'est le verbe "puer" accolé à l'expression "les noirs". 8880 résultats. Alors que "les noirs et l'esclavage" en donne 128 000. La réponse qui capte l'attention n'est hélas jamais très loin de celle qui fonde et flatte nos - mauvaises - intentions, nos plus viles pulsions. A l'inverse il serait pourtant facile d'imaginer caler les réponses de Google instant sur les pages renvoyant aux expressions les plus "statistiquement" significatives, et de contribuer, ce faisant, à la neutralité du moteur. Ainsi :
- "les noirs et l'esclavage" (128 000 résultats contre 20 000 pour "les noirs puent") ou bien encore
- "les juifs et la shoah" (616 000 résultats, contre 14 000 pour "les juifs sont radins")
Au lieu de cela, le moteur propose actuellement des résultats qui sentent le sauvetage en catastrophe et qui transpirent le politiquement correct : ainsi la requête sur les juifs propose "les juifs ... dans le coran ... en france ... d'algérie" et celle sur les noirs : "les noirs ... en couleur (sic) ... en france ... au japon ... en équipe de france"
Le poids des mots. Car telle est la réelle pulsation de la sémantique universelle après sa digestion dans le ventre de l'ogre motorisé : le pulsionnel est présent, mais il l'est à la marge ; il est "contenu". Le rationnel est - pour l'instant mais pas dans l'instant - dominant. Encore faut-il que l'ingénierie linguistique du favoritisme pulsionnel lui donne la chance de pouvoir être représenté à hauteur de ses occurrences réelles. En cela comme en d'autres sujets, les machineries de l'instant ne semblent pas être les plus appropriées.
On observe aujourd'hui la structuration et la pregnance de plus en plus fortes d'ingénieries relationnelles (principes de recommandation) en parallèle et parfois en remplacement des premières ingénieries occurentielles (principe du matching). On a déjà observé et démontré le danger que constitue une ingénierie qui se présente comme une vue objective alors qu'elle est par nature nécessairement subjectivée. Le risque est aujourd'hui celui de l'émergence d'ingénieries intentionnelles, qui nous "porteraient à croire" ou nous "prêteraient à penser" sans que nous ayons, de quelque manière que ce soit, manifesté l'un ou l'autre de ces deux désirs ...
Au vu de la fin du billet, le nom «Google Suggest» était mieux trouvé... ou peut-être trop clair quant à l’existence d’une part de suggestion dans l’instantanéité.
Coupage de cheveux en quatre : "les noirs puent", c’est 8800 ou 20000 résultats ? Les deux sont mentionnés dans le billet.
Rédigé par : Karkaf | 20 sep 2010 à 10:18
Ce que permet Google Instant, c'est également, du côté de l'utilisateur, un arrêt sur images de sa propre recherche. Il ne s'agit plus de formuler une demande et d'y avoir aussitôt accès, sans visualiser les intermédiaires de sa demande, mais bien de se regarder chercher en temps réel, d'avoir accès aux différents états de ses tâtonnements, de dresser une frise chronologique des évolutions d'une même recherche et, à terme, les cognitions ou la carte mentale de recherche de millions d'utilisateurs.
Rédigé par : So(cial)BookOnline | 20 sep 2010 à 21:29
SOCRATE : Vois maintenant tout ce que cet embarras va lui faire découvrir en cherchant avec moi, sans que je lui enseigne rien, sans que je fasse autre chose que de l'interroger.
Google contre Socrate
Rédigé par : nsaury | 22 sep 2010 à 12:02
Très intéressant. Pour information nous construisons un moteur personnalisé et décentralisé dans lequel les utilisateurs gardent le contrôle de leur historique de recherche, et le partage : http://www.seeks-project.info/
Beaucoup de nos interrogations rejoignent les problèmes que vous évoquez. Notamment, la statistique à partir de données de tous les utilisateurs s'oppose à une personnalisation des résultats de recherche effectuée chez l'utilisateur, par sa machine, sous son contrôle, à partir de ses données, sans divulgation.
Rédigé par : beniz | 28 sep 2010 à 16:47