5/5

Comment Google a amélioré son algorithme pour mieux comprendre vos recherches ?

HUMMINGBIRD GOOGLE

Vous l’aviez probablement remarqué, sans pour autant y faire plus attention : l’aisance avec laquelle Google s’est mis à comprendre, voire à anticiper l’objet de vos requêtes quotidiennes.

Presque du jour au lendemain, le moteur de recherche a commencé à taper dans le mille en un seul clic. En effet, il affiche en temps réel le cours des élections présidentielles des USA à la simple évocation du nom des candidats.

Ou bien il vous montre la courbe des températures et le risque de précipitations dans votre ville, rien qu’avec le mot “météo”. Ou bien encore, il propose directement les recettes les mieux notées, photos à l’appui, s’il vous prend de formuler le voeu de “camembert pané”.

Comment Google parvient-il à discerner les idées derrière les mots ? Cette vivacité et cette exactitude sont dues à son dernier algorithme, connu sous le nom symbolique de “Colibri”, ou “Hummingbird” en anglais. 

L’algorithme Google Hummingbird, c’est quoi ?

Au lieu de devoir adapter votre langage à un robot, en ne sélectionnant que des mots-clefs, c’est lui qui se change en un interlocuteur capable de saisir des idées derrière une formulation plus naturelle. Mais voyons cela plus en détails :

La dernière mise à jour de Google

C’est en septembre 2013 que l’intégration d’Hummingbird au célèbre moteur de recherche a été annoncée officiellement par Amit Singhal, vice-président de Google. En effet, le nouvel algorithme au nom d’oiseau est venu soutenir, et non remplacer, ses prédécesseurs, respectivement baptisés Panda et Pingouin. En réalité, chacun d’eux est spécialisé dans un rôle :

  • Panda est né en février 2011, et il a pour tâche de déterminer la qualité éditoriale d’un contenu. Par exemple, il se méfiera des articles de longueur inférieure à 300 mots. Il sera intransigeant avec les sites qui traitent de tout et de rien dans l’unique but de caser des pages publicitaires.

 

  • Les fautes d’orthographes dans les textes constitueront un autre critère disqualifiant. Enfin, tel un professeur implacable, Panda sanctionne sans vergogne les contenus dupliqués.

Penguin, quant à lui, a débarqué en avril 2012. Sa vocation première est de détecter en temps réel les abus de référencement. Quand un webmaster essaye de valoriser son site par une surabondance de liens, l’algorithme risque fort de pénaliser la page concernée.

Si ce qu’on appelle “le maillage” n’est pas jugé pertinent (cohérence entre les pages qu’on met en relation par un lien), la page sera mal positionnée.

De même, mieux vaut éviter le mauvais ancrage (les ancres sont les mots cliquables qui conduisent vers une autre page).

En effet, s’il n’est pas bien optimisé, (avec des termes vagues, comme “ cliquez ici ”) l’utilisateur risque d’atterrir sur une interface qui ne lui est pas utile, et le Pingouin se montrera intraitable.

Et voici maintenant en quoi consiste le travail de Google Colibri…

Pour des contenus toujours plus pertinents sur le Web

Google est le moteur de recherche qui a quasiment écrasé toute la concurrence. Pour rester premier, son objectif est de fournir aux internautes exactement ce qu’ils recherchent (voire davantage)… et ce sans perdre une seconde !

Pour cela, Hummingbird est conçu pour comprendre avec précision la requête de l’usager, afin de trouver directement la bonne page après validation de la recherche.

Du fond des contenus à la forme des requêtes

Avec une analyse plus profonde des contenus, il parvient, à travers des réseaux sémantiques, à trouver la meilleure réponse à des questions formulées très vaguement.

De manière indirecte, il pousse les créateurs à privilégier la qualité structurelle et informationnelle de leur contenu.

En d’autres termes, plus le fond est bon, plus la forme risque de coïncider avec les préférences du Colibri. Mais allons plus avant…

Comment procède le Colibri de Google pour traiter l’information ?

Google hummingbird

Bien entendu, l’algorithme n’est pas muni d’un véritable cerveau humain. Son apparente sagacité repose en partie sur du data mining (exploration de données). En observant sur la toile les occurrences répétées d’un même terme dans un contexte donné, il parvient à déduire l’intention la plus probable de l’internaute…

Du simple mot au champ sémantique

Les experts en référencement utilisent des mots-clés pour apparaître en haut des SERP (“Searching Engine Results Page”). Depuis 2013, ils ont dû se concentrer sur ceux “de longue traîne”, composés de plusieurs termes (de trois à huit mots). Au lieu de vouloir arriver premiers sur la recherche “restaurant” (trop vaste), les sites concernés se placent sur des requêtes plus spécifiques, tels que “ restaurant végétarien Dijon centre-ville ”.

Ensuite, Hummingbird va s’intéresser non strictement aux mots, mais aux thèmes auxquels ils renvoient. Il va jusqu’à singer les connotations de l’esprit humain : en tapant “manga”, le moteur de recherche pense directement “Japon”.

De cette manière une question formulée comme à l’oral, même si elle est imprécise, a des chances d’être bien comprise par l’algorithme. C’est très pratique en ce qui concerne la recherche vocale : on peut faire comme si l’on s’adressait directement à une personne. 

Bien comprendre l’intention des internautes

C’est véritablement sur ce point que Hummingbird innove, en améliorant l’écoute de la machine au service des attentes humaines. Voici la méthode employée par Google Colibri : quand l’algorithme Hummingbird traite une recherche, il procède en deux phases préliminaires, à savoir la reformulation de la requête suivie d’une interprétation.

Il s’en dégage un sens général qui permet à Google d’appréhender dans un second temps les meilleurs résultats possibles. 

L’analyse sémantique

Petit cas d’école : tapons “endroit manger sans viande”. Colibri interprète “endroit” comme hyperonyme de “pays” ou de “restaurant”. Avec “manger sans viande”, il vous prendra pour un végétarien. Vous saurez donc dans quels pays se régalent les végétariens, mais aussi où déguster un plat végé dans votre ville.

 

En outre, s’il identifie un intrus dans votre réseau lexical, “endroit manger sans viande existentialisme” par exemple, Colibri estimera “existentialisme” comme étant sans intérêt pour votre recherche. Il apparaîtra barré en-dessous des résultats, relégué au rang des “termes manquants”.

Interprétation des intentions

En fait, il existe trois grandes catégories qui motivent la recherche d’un internaute, répertoriées en types d’intentions :

  • s’informer, que ce soit sur une personnalité, un concept, une définition etc. Vous tomberez alors sur des tutos, des recettes, des pages wiki, et tout ce qui peut augmenter votre savoir encyclopédique,
  • naviguer, à savoir trouver le site officiel d’une organisation ou d’une institution, comme l’éducation nationale, l’ONU ou la Fédération Française de Football,
  • effectuer une transaction : cela concerne tous les sites de e-commerce, mais également des renseignements sur les lieux où vous trouverez des biens marchands,

Cette petite grille de lecture permet à Colibri de mieux cerner les besoins de l’utilisateur, afin d’y répondre au mieux.

Quel est l’impact de Google Hummingbird sur le référencement web ?

Évidemment, bien que cette mise à jour date des années 2010, il n’est pas toujours aisé d’apprivoiser l’oiseau agile. Voici néanmoins quelques pistes pour mieux vous référencer sur Google.

Comment Google Colibri analyse-t-il l’information des contenus ?

Pour vous démarquer de la concurrence, il faut répondre à trois critères centrés sur les besoins de l’utilisateur. En effet, il s’agit d’être compréhensible, crédible et accessible. Revenons sur ces trois points en détails :

  • vous êtes compréhensible lorsque l’algorithme parvient à identifier qui vous êtes, ce que vous proposez et quel est votre public cible. Si la page que vous voulez mettre en avant est complète bien contextualisée, vous marquez des points. Ici, le rôle de Colibri est de comprendre les thèmes abordés grâce aux champs lexicaux.
  • vous êtes crédible lorsque la page est régulièrement cité(e), lorsque son auteur fait autorité dans son domaine, et surtout lorsque le contenu est considéré comme pertinent. Colibri examine en profondeur ce qui figure sur votre page, afin d’en évaluer la substantifique moelle. 
  • vous êtes accessible lorsque la bonne page tombe directement sous le nez de l’utilisateur, plutôt qu’il ne doive naviguer sur tout le site pour y parvenir.
  • Si Colibri estime que le contenu d’une page apportera entière satisfaction à l’internaute, il la fera ressurgir en premier. Le plus efficace reste quand le contenu peut s’afficher directement sur le SERP.

SEO avec Google Colibri : comment améliorer son positionnement ?

Les bonnes pratiques rédactionnelles

  • Proposer un contenu riche en terme de fond
  • Employer un champ lexical varié
  • Chercher limpidité et concision
  • Structurer le contenu
  • Revenir à la question notamment dans les titre de niveau h2 et h3
  • Penser aux requêtes formulées à l’oral et adapter votre écriture
  • Procéder à des mises à jour régulières
  • Ne jamais dupliquer du contenu

Autres stratégies du webmaster :

  • Soigner son profil Google+ et gagner en visibilité au moyen de Google+ Local 
  • Proposer un maillage cohérent et pertinent afin de bien circonscrire le thème du site
  • Pratiquer la co-citation pour apparaître aux côtés de ses concurrents dans un même secteur d’acitivté
  • Multiplier les médias utilisés en les optimisant (images, profils, vidéos etc.)

Note aux développeurs

  • Privilégier des balises HTML
  • Utiliser Robots.txt pour mettre en avant votre meilleur contenu
  • Placer une redirection si, pour une raison ou pour une autre, votre page ne s’affiche pas (erreur 404), et décidez si elle sera temporaire (code 302) ou définitive (code 301, à privilégier).

Google Hummingbird, un outil au service de l’information

L’algorithme Google Colibri témoigne de la synergie qui peut exister entre informatique et linguistique. C’est une avancée prometteuse qui met la communication avec la machine à portée de la parole spontanée.

En outre, Colibri aide ses coéquipiers Panda et Pingouin à faire le tri dans les contenus que vous trouverez sur internet.

En effet, si Hummingbird s’intéresse aux occurrences langagières pour remonter à la sphère des idées, cela nous oblige à écrire bien.

Et il se trouve qu’apprendre à mieux dire les choses contribue à ce que la pensée se structure et s’affine. Qu’importe le domaine, ce sera toujours pour le bien de ceux à qui on veut la transmettre.

FAQ
Comment Google Colibri analyse-t-il l’information des contenus ?
Pour vous démarquer de la concurrence, il faut répondre à trois critères centrés sur les besoins de l’utilisateur.
L’algorithme Google Hummingbird, c’est quoi ?
Au lieu de devoir adapter votre langage à un robot, en ne sélectionnant que des mots-clefs, c’est lui qui se change en un interlocuteur capable de saisir des idées derrière une formulation plus naturelle. Mais voyons cela plus en détails :