Pour illustrer les différents points traités dans les chapitres précédents, quelques exemples s’imposent. Qu’il s’agisse de sémantique mal interprétée par l’outil de recherche, de données référencées dont il ne peut valider le sens ou d’utilisations détournées, les cas particuliers sont nombreux.
Principale source de revenu des moteurs de recherche,
les liens commerciaux sont affichés de façon plus où moins discrète.
Sur l’exemple suivant, copie d’une page de résultats de recherche Google,
des liens commerciaux sont placés au centre, mais sur fond jaune,
ce qui les rend particulièrement identifiables, alors que d’autres
se situent sur la droite sans distinction particulière.
Des publicités plus ou moins faciles à discerner
(dans le cadre jaune et sur la partie droite de la page)
Les moteurs de recherche ne connaissent que les termes de la requête qui leur est donnée.
Hors contexte, certains sens peuvent être ambigus : « enceinte » comme « une enceinte »,
synonyme d’un haut parleur, ou « être enceinte ». On peut voir que pour cet exemple,
la page de réponse Google est un peu perdue : les résultats principaux correspondent
au second sens alors que les liens commerciaux se réfèrent au premier !
Des réponses à propos de femmes enceintes,
des publicités pour des haut-parleurs
Parmi les contenus multimédia, nouvel Eldorado des moteurs de recherche,
les images font depuis quelques années parti des documents que ces outils se
ventent de pouvoir indexer. Malheureusement, les capacités de ces derniers à
déterminer le contenu d’une image sont extrêmement limitées. En général,
pour palier à ce défaut, ils se basent principalement sur le contexte dans
lequel elle se trouve. L’exemple suivant, découvert par hasard lors d’une
recherche pictographique, est particulièrement clair : les « twin towers »,
ex-tours jumelles de Manhattan, mais pas seulement :
La première réponse n'a pas grand chose à voir
avec les ex-édifices
De nombreuses utilisations dérivées des moteurs ont vu le jour. Les concours de référencements sont aussi nombreux que leur principe est trivial : tenter de voir son site le mieux « classé » par un maximum de moteurs différents pour un mot clé ou une expression donnée. On peut citer par exemple le mot « zurtouij » ou encore « Spationaute Troglodyte ».
Les « Google fights », « combats Google » dans la langue de Molière, sont également des utilisations détournées du moteur de recherche Google. Il s’agit de duels entre expressions, la vainqueur étant celle à laquelle sont associées le plus de pages de réponses. Par exemple, « Paul Kittel » l’emporte largement sur « Eddie Smigiel », 2670 pages contre seulement 319.