Alors que je prépare un atelier sur la recherche sur le Web, ou plutôt sur l'art de trouver des informations pour répondre aux questions que l'on se pose, en utilisant (partiellement) le Web, je tombe sur un article d'un éminent confrère qui promeut la maîtrise des syntaxes de Google (et donc aussi des autres moteurs de recherches). Remonte ainsi à la surface la sempiternelle question de savoir si, en matière de recherche d'information, il vaut mieux être à l'aise avec les syntaxes des outils ou avoir une bonne compréhension du fonctionnement de ces outils.
Savoir utiliser les opérateurs de Google, ou sa page de recherche avancée, n'est assurément pas un désavantage (https://tinyurl.com/y48lkbjz). Que du contraire, cela facilite l'accès à de l'information qui pourrait nous intéresser. Par contre, je pense que cette compétence n'est pas clé pour les internautes, au contraire d'une bonne connaissance des principes de fonctionnement des moteurs et autres outils de recherches.
Pour faire court, parce qu'ici je n'ai ni la place ni le temps de m'étendre, les éléments de base de cette compréhension sont:
- la matière première principale des moteurs de recherche sont les textes, les mots, exploités en mode "plein-texte" (c'est-à-dire que tous les mots sont pris en compte, indépendamment de leur sens); les méta-données des documents (titres, descriptions, mots-clés...) ne sont que des éléments secondaires
- la fonction première des moteurs de recherche est de trouver parmi les documents dans leur index (documents connus) ceux qui contiennent plus ou moins exactement les mots choisis par les utilisateurs (recherche floue), dans la séquence la plus proche possible (phrase)
- dans une deuxième étape, le moteur va évaluer la pertinence de chaque document sélectionné lors de la première étape pour construire une liste de résultats par ordre de pertinence décroissante
- la pertinence est évaluée par un algorithme de ranking qui exploite le contenu des documents (objectif), la popularité des documents (comportement des internautes), l'historique de l'internaute (le comportement individuel)
Ce qu'il faut aussi comprendre, et prendre en compte, c'est le comportement des utilisateurs, ceux qui rédigent et publient les documents qui seront indexés par les moteurs de recherche:
- le vocabulaire utilisé (langue, jargon...) et le niveau de langage
- l'exploitation des meta-données des documents (combien associent encore des titres, descriptions, mots-clés... aux documents qu'ils publient?)
- le format des documents (html, doc, xls, ppt...)
Cela bien compris, les meilleures requêtes ne seront pas construites à grand renfort de syntaxes, équations booléennes plus ou moins complexes, mais bien par un choix judicieux des phrases et des mots qui devraient être dans les documents espérés:
- des phrases exactes (citations, titres de documents... mais aussi façon de s'exprimer - les auteurs ont plutôt tendance à s'exprimer par l'affirmative alors que les chercheurs sont plus souvent dans l'interrogation)
- des mots discriminants (pas forcément des mots clés, plutôt des mots typiquement liées au sujet d'intérêt)
- une indication du format de fichier (éventuellement au moyen de la syntaxe filetype: mais ce n'est pas obligatoire
En conclusion, je pense qu'il est préférable et plus efficace de comprendre l'éco-système dans lequel on cherche que d'en maîtriser les outils. Gardons donc en tête que pour trouver l'information que l'on cherche il est plus efficace de mettre Google sur la piste de la réponse que l'on souhaite, plutôt que de lui poser une question.
Envie de progresser en ce sens, n'hésitez pas à me contacter...