Il y a quelques jours, j'intervenais dans le cadre du Club des Veilleurs de Lille, à l'invitation de son promotteur, Jérome Bondu (
http://www.inter-ligere.fr). Sans surprise, j'y ai parlé de recherche et de mise en scène de l'information. J'ai toutefois été interrogé sur l'évolution de Google et de sa politique en matière de recherche d'information, et de l'impact que cela pouvait avoir sur nos activités de veilleurs et de spécialistes en intelligence économique.
En tant qu'utilisateur, et observateur, du moteur de recherche Google, j'ai comme tout le monde constaté des changements dans la politique de Google. Il est loin le temps du slogan "
don't be evil" et ce n'est pas un scoop, on distingue trois grandes périodes:
- au début, Google promettait de nous donner les meilleurs documents, sur une base plutôt objective, les contenus et les méta-données
- vint ensuite la période où Google s'est mis à exploiter les comportements des internautes et s'est dit que la popularité d'un document, d'une page devait être un gage de qualité; Google a donc commencé à insufler quelque subjectivité dans ses résultats et à favoriser les documents les plus populaires
- à ce jour, Google essaie de coller de plus en plus au profil de chaque internaute, sur base des innombrables informations qu'il collecte à propos de nous; les résultats sont donc influencés à partir de nos habitudes personnelles, de notre géolocalisation, éventuellement aussi des habitudes de nos réseaux
Cette évolution vers toujours plus d'individualisation des résultats, est la marque de pivots importants dans le modèle d'affaires de Google. De moteur de recherche, il est devenu régie publicitaire et le focus n'est plus mis sur la performance technique, mais sur la quantité et le taux de clics. Dont acte.
Il n'en reste pas moins que le fonctionnement des moteurs de recherche est stable et repose sur deux étapes:
- la fonction recherche, qui sélectionne dans la base de documents ceux qui répondent au mieux à la requête de l'utilisateur
- la fonction ranking, qui a pour but de donner un ordre aux (très nombreux) résultats de la "hits list"
En d'autres termes, l'évolution de Google porte surtout sur la deuxième étape, l'ordonnancement des résultats, et quasi pas sur la fonction de recherche, si ce n'est dans certaines démarches d'extension de le requête, par exemple en ajoutant des synonymes plus ou moins pertinents.
Dans le cadre de mon exposé, je rappelais le "slogan" suivant, qui guide mes sessions de recherche d'information et les stratégies appliquées: "
Question simple, requête complexe - Question complexe, requête simple". Dans cette perspective, les évolutions de Google n'ont que peu d'impact sur mon travail et ses résultats. En effet:
- quand je dois répondre à une question simple, dont la réponse s'exprime par un concept bien déterminé et en quelques mots, je construit une requête complexe qui donne peu de résultats; en conséquence, les algorithmes de ranking de Google n'ont que peu de prises et d'impact et les informations intéressantes sont inévitablement en tête de listes de résultats
- quand je dois répondre à une question complexe, et qu'il faut construire la réponse, la requête va être simple et toute l'intelligence de l'exercice va se reporter sur le dépouillement de la liste de résultats en s'attachant à reconnaître, à collecter et à exploiter toutes les informations intéressantes; dans ce cas-ci, peu importe l'ordre dans lequel les résultats sont présentés puisqu'on est dans une démarche d'exploration profonde de la hits list (parfois au-delà du 500ème résultat),