1min30 > Dictionnaire du Web (Définitions) > Analyse Sémantique Latente (SEO)
2014
10/Oct

Analyse Sémantique Latente (SEO)

L’analyse sémantique latente (ASL ou LSA) n’est pas un concept spécifique au web. Elle est en revanche à la base des techniques actuelles d’indexation et d’évaluation des contenus par les moteurs de recherche : la comprendre permet notamment d’optimiser son site web pour le référencement naturel (voir les applications SEO au bas de cette page). D’une certaine manière, son utilisation a favorisé l’émergence du marketing de contenu.

Définition

L’analyse sémantique latente a pour but, à partir d’un ensemble de documents, par exemple des pages web, d’établir automatiquement des relations entre les termes contenus dans ces documents, les documents eux-mêmes et des “concepts” associés aux termes. Elle est notamment utilisée pour :

  • Établir des similitudes entre des termes (recherche des synonymes).
  • Associer des documents à des “concepts” à partir de l’analyse de leurs termes et donc établir une éventuelle proximité sémantique entre eux.
  • Associer un concept à une requête de recherche en analysant ses termes.

Principe (simplifié) de l’ASL

L’analyse sémantique latente se base sur une matrice mathématique à deux dimensions. Dit plus simplement, elle utilise un tableau avec des lignes contenant les termes utilisés dans les différents documents (une colonne par document). Les cellules du tableau contiennent les occurrences des différents termes dans chaque document.Ce tableau (ou matrice en langage mathématique, profitez-en pour passer pour des intellectuels auprès de vos collègues et amis), pourrait ressembler à ça :

TermesPage web 1Page web 2Page web 3
web 5 0 2
définition 1 0 0
dictionnaire 6 8 0
 site 0 0 10

Ce tableau est ensuite utilisé pour réaliser des associations entre les documents et des concepts (à partir des termes), et donc de relier les documents entre eux sur le plan sémantique (une forme de proximité thématique). On réalise pour cela des opérations mathématiques sur la matrice, dans l’ordre suivant :

  1. Extraction des termes les plus informatifs : grosso modo, on pondère la répétition des termes et on élimine les mots qui contiennent peu d’informations mais sont “seulement” constitutifs du langage, comme “faire”, “autre”, “trois”, etc. Les plus perspicaces d’entre vous commencent à comprendre pourquoi il ne sert plus à rien de répéter 50 fois un mot clef dans une page pour être mieux référencé…
  2. Réduction (au sens matriciel) du tableau en utilisant uniquement les valeurs singulières (celles qui caractérisent les documents).
  3. Calcul de la proximité sémantique entre les documents, à partir des similarités entre les mots.

Applications de l’ASL en référencement naturel

Analyse des backlinks et des liens internes

On parle souvent de l’importance de la qualité des backlinks au détriment de leur nombre. C’est précisément l’un des buts de l’utilisation de l’analyse sémantique latente : établir une proximité thématique entre deux pages, et donc juger de la pertinence d’un lien retour. Il s’agit bien sûr d’un facteur parmi d’autres pour l’évaluation qualitative d’un backlink.La même analyse peut s’appliquer aux liens internes entre les pages d’un même site web, dont l’importance est également déterminante.

Analyse sémantique des pages

L’ASL va permettre d’analyser le contenu d’une page sur le plan du langage. Non seulement elle pourra renforcer la catégorisation d’un document en regroupant les synonymes pour définir les concepts associés à la page, mais elle donnera aussi des indicateurs sur le caractère “naturel” ou non d’un texte (est-il rédigé pour des humains ou pour faire plaisir aux moteurs de recherche).

Suggestions de pages et de requêtes associées

L’analyse sémantique latente est également utile pour suggérer automatiquement des pages similaires (ou des produits dans le cas d’un site e-commerce) pertinentes en fonction des requêtes des internautes ou de leur comportement.Les moteurs de recherche comme Google l’utilisent également pour associer des requêtes à d’autres en bas des pages de résultat :

Analyse sémantique latente

Analyse sémantique latente requêtes associées dans Google.

Pour aller plus loin

Pour nos lecteurs matheux (ou courageux), vous pouvez consulter ici un document particulièrement intéressant sur l’ASL, avec de belles matrices, des sommes et des vecteurs. Niveau Math Sup exigé. Mais n’oubliez pas : il n’est pas nécessaire de tout comprendre pour tout utiliser.

Gabriel Dabi-Schwebel

Posté par

Ingénieur de formation, j'ai accompagné notamment pour Alcatel, TF1, SFR et Lagardère Active le lanc





Commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

Abonnez-vous à notre excellente newsletter

Hey ne partez pas si vite !

Contactez-nous
Do NOT follow this link or you will be banned from the site!