NLP SEO - Qu'est-ce que c'est et comment il peut booster votre site
Publié: 2022-09-08
Oui, nous savons tous que Google est un moteur de recherche sémantique.
Ce que cela signifie est…
Google tente de comprendre la signification de votre contenu plutôt que de simplement rechercher des correspondances littérales de mots clés.
La raison en est que Google tente d'améliorer l'expérience utilisateur en essayant d'apporter des résultats qui satisfont plus précisément l'intention du chercheur.
Pour ce faire, Google dispose d'algorithmes de traitement du langage naturel (NLP) qui lisent votre contenu.
Dans ce post, je vais tenter de répondre :
- Qu'est-ce que le traitement automatique du langage naturel ?
- Comment fonctionne le traitement du langage naturel ?
- Comment utiliser le traitement automatique du langage naturel en SEO ?
Pour ce faire, je vais me concentrer sur les connaissances théoriques tout en enfilant ma casquette de scientifique et en faisant un peu d'expérimentation. (Oui, j'adore bricoler.)
Mon objectif pour cette expérience est d'avoir une meilleure compréhension de la façon de créer un référencement sur la page pour le NLP.
Mais d'abord, au cas où vous vous demanderiez ce qu'est le NLP de Google…
Qu'est-ce que le NLP (Natural Language Processing) ?
Le TAL ou traitement du langage naturel est un domaine de l'intelligence artificielle qui permet à une machine de comprendre le langage humain, qu'il soit écrit ou parlé. C'est un domaine qui combine la linguistique et l'informatique permettant aux ordinateurs d'analyser et de «comprendre» le langage afin d'extraire le sens du texte et de la parole.
Maintenant, vous vous demandez peut-être…
À quoi sert le traitement du langage naturel de Google ?
Le traitement du langage naturel permet aux moteurs de recherche d'apporter des réponses étonnamment précises aux requêtes des utilisateurs et apporte des réponses rapides aux questions sous la forme de fonctionnalités SERP. Il aide également les utilisateurs à affiner leurs recherches lorsque la question est large ou vague.
En d'autres termes, pensez-y…
Avez-vous remarqué que lorsque vous tapez une requête dans Google, vous obtenez une réponse étonnamment précise et pertinente ?
Comment Google procède-t-il ?
En réalité, Google résout deux problèmes en même temps.
Tout d'abord, Google doit comprendre la requête.
Pensez-y.
Comment formulez-vous votre requête pour qu'elle vous apporte les résultats que vous recherchez réellement ? Pour la plupart, vous utilisez le langage naturel.
En revanche, repensez à la façon dont vous avez formulé votre requête en 2018 avant le déploiement de l'algorithme BERT de Google. D'après ce dont je me souviens, vous construisiez une requête basée sur des phrases courtes. Si vous ne trouviez pas ce que vous cherchiez, vous essaieriez quelques variantes jusqu'à ce que Google présente les informations que vous recherchiez.
Mais, maintenant, vous tapez une requête en langage naturel. Cela signifie que Google doit comprendre votre requête.
Deuxièmement, une fois que Google a compris votre requête, il doit déterminer le contenu à apporter pour répondre à la question. Cela signifie apporter une liste classée d'URL ainsi que des fonctionnalités SERP.
Pour comprendre quel contenu vous apporter, Google doit comprendre la signification du contenu qu'il a dans son index.
Cela signifie que les techniques de traitement du langage naturel analysent à la fois la requête et le contenu de son index.
Le meilleur exemple de cela se trouve dans le contenu inclus dans les Featured Snippets. Lorsque les Featured Snippets étaient nouveaux, ils présentaient souvent des salades de mots incompréhensibles.
La raison en est que les Featured Snippets apportent souvent du contenu à partir de paragraphes non structurés. Cela signifie que pour fournir une réponse simple et précise à la requête d'un utilisateur, Google doit effectuer quelques modifications.
Maintenant que la compréhension du langage par Google s'est considérablement améliorée au cours des dernières années, le texte de l'extrait en vedette est devenu clair, utile et facile à comprendre.
L'époque des salades de mots incompréhensibles est révolue depuis longtemps, comme vous pouvez le voir dans l'extrait plutôt ironique ci-dessous.

Comment fonctionne le traitement automatique du langage naturel ?
Bien que ce soit un gros sujet, voici un aperçu de 30 000 pieds.
Les algorithmes de traitement du langage naturel de Google fonctionnent en divisant les phrases en différents termes, en décomposant les phrases en parties du discours et en établissant la relation entre les mots en fonction des règles de grammaire.
Vous pouvez facilement le voir par vous-même en analysant votre texte avec la démo de l'API Natural Language de Google.

Ensuite, Google identifie les sujets et les objets comme des entités, puis les affecte à des types d'entités tels que personne, lieu, organisation, etc. Les algorithmes identifient également des entités connues, c'est-à-dire des entités qui existent déjà dans son graphe de connaissances.
(En passant, pour vraiment comprendre ce billet de blog, vous avez besoin d'une compréhension claire de ce que sont les entités et les graphes de connaissances. Donc, au cas où vous vous poseriez la question, j'ai inclus des liens ci-dessus vers d'autres billets de blog conçus pour rendre ces concepts cristallins. dégager.)

Démo de l'API Natural Language de Google montrant comment le NLP de Google décompose les phrases en entités.
Google analyse également le sentiment, c'est-à-dire l'attitude que l'auteur a envers les entités mentionnées dans le texte.

Démo de l'API Natural Language de Google montrant l'analyse des sentiments NLP de Google.
Google tente également de comprendre la catégorie de contenu. Comme vous pouvez le voir dans la capture d'écran ci-dessous, la catégorie du texte analysé est Internet & Telecom.

Bon, maintenant que vous avez eu un aperçu de la façon dont Google comprend le contenu, il devient évident que le NLP et le SEO vont de pair.
Alors, testons comment Google comprend le langage et voyons si nous pouvons glaner des informations sur le référencement.
Quatre exemples de NLP basés sur quatre requêtes similaires
Pour démontrer le fonctionnement des algorithmes NLP de Google, j'ai créé un petit test pour voir comment Google comprend les requêtes sémantiquement similaires. Il en est résulté quelques excellents exemples de PNL.
Dans cette expérience, mon objectif est de comprendre si Google comprend la différence entre les requêtes. Pour ce faire, je vais examiner:
- Comment Google répond à chaque requête
- La sémantique basée sur ma propre compréhension humaine
- La sémantique basée sur l'outil de démonstration NLP de Google
Au cours de cette expérience, j'ai spécifiquement recherché des requêtes qui apportent des résultats d'extraits en vedette. J'ai choisi les Featured Snippets car, comme je l'ai mentionné plus haut, pour en créer un, Google rassemble souvent divers éléments tels que du texte et des images. Comment Google fait cela montre comment Google interprète chaque élément.
Et, puisque Google apporte le Featured Snippet comme réponse à la requête, les Featured Snippets montrent également comment Google comprend la requête.
En d'autres termes, je voulais voir comment Google organise le contenu, ce qui nécessite plus de sophistication que de simplement apporter une liste de liens bleus. Parce que plus le résultat est détaillé, moins il est probable que Google ait fait une supposition folle.
J'ai recherché ces quatre requêtes:
- Quel est le symbole du dragon chinois
- Symbole du dragon chinois
- Quel est le symbole chinois du dragon
- Que représente le symbole du dragon chinois
Maintenant, à première vue, vous pourriez penser que ces requêtes ont la même intention ou au moins une intention similaire.
Et, si tel est le cas, ils devraient tous apporter les mêmes résultats.
Donc, pour tester cela, j'ai recherché chacun sur Google.
Et, comme je suis sûr que vous l'imaginez, chaque résultat était différent. De plus, ils n'apportaient même pas les mêmes URL, textes ou images.
Examinons donc chacun pour essayer de comprendre ce que Google voit et essayons de comprendre pourquoi.
1. Exemple #1 'Quel est le symbole du dragon chinois'
La première requête, "quel est le symbole du dragon chinois", est grammaticalement correcte. Si vous tapez une requête comme celle-ci dans Google, vous devriez en théorie obtenir les meilleurs résultats.

Comme vous pouvez le voir dans l'extrait présenté ci-dessus, Google apporte une citation du billet de blog de Chineasy.com intitulé "La signification du symbole du dragon dans la culture chinoise".
Maintenant avant d'aborder les outils, voici mon analyse sémantique basée sur ma propre compréhension humaine. (Oui, mon cerveau est mon outil SEO préféré.)
La requête est formulée pour comprendre ce qu'est le symbole du dragon chinois. Cela signifie que l'entité principale est le symbole du dragon qui vient de Chine.
Google répond parfaitement à cette question. Par exemple, la balise de titre indique que l'article expliquera la signification du symbole du dragon dans la culture chinoise. C'est exactement ce que cherchait le chercheur.

En regardant le texte du Featured Snippet, vous remarquerez que Google explique ce que les dragons symbolisent dans la culture chinoise.

Encore une fois, c'est une très bonne expérience utilisateur si vous me demandez. Le Featured Snippet donne à l'utilisateur un assez bon aperçu du sujet.
Passons maintenant à la démonstration de l'API Natural Language de Google pour voir comment Google comprend la requête.

En regardant la capture d'écran ci-dessus, Google semble comprendre qu'il y a deux entités dans la requête.
Tout d'abord, le mot « chinois » fait référence à l'emplacement de la Chine. Vous pouvez le voir par le fait que la démo de l'API l'identifie comme "emplacement". En outre, l'outil comporte un lien vers un article de Wikipedia sur la Chine. Un article Wikipédia apparaît lorsque Google reconnaît une entité qui se trouve dans son Knowledge Graph.
En d'autres termes, Google reconnaît une entité inconnue appelée "symbole du dragon" et elle est liée à l'emplacement "Chine".
De mon point de vue, cela correspond à ma compréhension humaine des entités de la requête et le résultat est le plus susceptible de satisfaire la requête de l'utilisateur.
Examinons maintenant la requête suivante.
2. Exemple #2 - 'Chinois symbole Dragon'
La requête suivante est "symbole du dragon chinois".
Même si cette requête n'est pas grammaticalement correcte, en tant qu'être humain, je taperais généralement une requête comme celle-ci comme raccourci pour "Quel est le symbole du dragon chinois ?"
Pour moi, le "Qu'est-ce que le..." manquant est sous-entendu et les deux requêtes signifient la même chose. Mon cerveau comble les lacunes.
Mais, pour Google, les différences sémantiques exigent une réponse entièrement différente.
Lorsque je l'ai tapé dans Google, voici ce que j'ai vu :

Comme vous pouvez le voir dans la capture d'écran ci-dessus, Google présente des informations de Wikipedia.com. Qu'est-il arrivé à l'URL Chineasy.com que nous avons vue ci-dessus ?
Si nous nous basons uniquement sur la balise de titre, il semble que Google apporte le contenu d'un article général sur les dragons chinois plutôt que d'un article spécifique qui explique ce que signifie le dragon chinois dans la culture chinoise que nous avons vu en regardant la requête précédente.

De plus, le contenu de l'extrait en vedette est un peu gênant.

Bien que la réponse soit similaire à celle que nous avons vue lorsque nous avons regardé la requête précédente, ici la première phrase commence par "Le symbole du dragon est aussi…". Le mot « aussi » ici semble étrange.
Les grandes questions sont donc les suivantes : pourquoi l'URL est-elle différente et pourquoi le texte est-il maladroit ?
La réponse est peut-être qu'il manque à la requête les mots de contexte « Quel est le… ».
Et, par expérience, lorsque quelqu'un tape un terme large dans la barre de recherche, Google donne une réponse large qui pourrait satisfaire un certain nombre d'intentions de l'utilisateur.
Je suppose juste ici, mais cela pourrait expliquer pourquoi Google apporte l'article de Wikipedia au lieu de l'article de Chineasy.com.
L'article de Wikipédia est plus générique et ne se concentre pas sur le symbolisme du dragon chinois mais couvre le sujet plus largement.
Il explique d'abord ce qu'est le dragon chinois en général et ne mentionne que ce qu'il symbolise dans la quatrième ligne.

Et si vous regardez la capture d'écran ci-dessus, vous comprendrez pourquoi le mot "également" est mentionné dans l'extrait en vedette.
En d'autres termes, par l'utilisateur excluant les mots 'Qu'est-ce que…', Google apporte une URL plus générique.
Examinons maintenant la requête dans la démo de l'API de Google.

Ici, nous voyons que Google (selon cet outil) comprend la requête comme une seule entité. La Chine n'est pas considérée comme un lieu comme nous l'avons vu dans la requête précédente.
Maintenant, par pure curiosité, j'ai changé l'ordre des mots en "symbole du dragon chinois" pour voir si j'obtenais le même résultat. Dans la capture d'écran ci-dessous, vous verrez que lorsque je change l'ordre des mots, le mot "chinois" n'est pas du tout considéré comme une entité.

Au lieu de cela, Google le considère comme un adjectif.

Le plat à emporter ici consiste simplement à changer l'ordre des mots, change la façon dont le moteur de recherche comprend la requête.
Cela dit, le résultat est quelque peu satisfaisant mais mon sentiment est que le résultat précédent est bien meilleur.
Examinons la troisième requête.
3. Exemple #3 - 'Quel est le symbole du dragon chinois'
La requête « quel est le symbole du dragon chinois » est une combinaison des deux requêtes précédentes.
Du point de vue de l'utilisateur, j'imagine que Google lit cette requête de la même manière qu'il lit la précédente. Je veux dire qu'en tant qu'être humain, je lis "symbole du dragon chinois" comme une manière abrégée d'écrire la phrase "Qu'est-ce que le symbole du dragon chinois".
Mais, si vous regardez le Featured Snippet, vous remarquerez que Google n'est pas d'accord.

Comme vous pouvez le voir sur la capture d'écran ci-dessus, Google présente l'URL du site Chineasy.com dans le Featured Snippet alors que la requête précédente apportait une URL de Wikipedia.
Ceci est presque identique au Featured Snippet que nous avons vu dans la première requête, ce qui m'amène à croire que le changement d'URL dans la deuxième requête n'était pas le résultat du changement d'ordre des mots, mais le résultat des mots de contexte manquants 'Qu'est-ce que la…'.
Si nous examinons la requête à l'aide de l'analyseur NLP de Google, nous voyons que Google suppose que l'entité principale est le "symbole chinois".

Examinons maintenant la requête « Que représente le dragon chinois ? »
4. Exemple #4 - 'Que représente le dragon chinois'
Encore une fois, lorsque vous regardez l'extrait en vedette, vous remarquerez que Google vous propose une URL complètement différente. Cette fois, Google vous propose depts.washington.edu.

Essayons maintenant de comprendre pourquoi Google a apporté une URL différente cette fois-ci. Si nous la comparons à la première requête "Quel est le symbole du dragon chinois", il y a une différence fondamentale.
La première requête posait une question vague. Lorsque vous posez une question commençant par « Qu'est-ce que… ? » vous ne nuancez en rien votre question. Mais, quand vous posez la question 'Que représente x ?' vous posez une question plus précise. Plus la question est précise, plus la réponse est précise.
Maintenant, avec cela à l'esprit, regardons le texte de l'extrait en vedette.

Comme vous pouvez le voir, le texte comprend les mots "le symbole du dragon représente ".
Google a peut-être utilisé cette URL parce que la requête incluait le mot "représenter" (que représente le symbole du dragon chinois ?)
D'accord, nous avons couvert certaines théories de la PNL et également quelques exemples de PNL en action.
Regardons maintenant la PNL pour le référencement.
Comment pouvez-vous implémenter le NLP dans votre référencement ?
Après ma petite démonstration, vous avez vu comment Google et les autres moteurs de recherche utilisent les techniques NLP pour comprendre votre contenu. Donc, en tant que SEO, la grande question est, comment pouvez-vous utiliser le NLP pour améliorer votre SEO ?
Vous trouverez ci-dessous une courte liste conçue pour vous aider à améliorer votre SEO NLP.
Inclure l'intention de recherche dans votre recherche de mots-clés
Comme je l'ai mentionné ci-dessus, Google analyse vos requêtes de recherche. Lorsque Google fait cela, il essaie de comprendre l'intention de recherche derrière la requête afin de pouvoir apporter des résultats pertinents qui répondent de manière adéquate à la question.
Cela signifie qu'il est crucial de comprendre comment Google interprète l'intention de recherche. La façon la plus simple de le faire est d'analyser les SERP.
La raison en est qu'en effectuant une analyse SERP, vous pouvez facilement voir quelles ressources Google apporte pour répondre à la requête. En voyant cela, vous pouvez comprendre comment Google comprend l'intention de recherche.
Écrivez simplement et clairement
Comme vous l'avez vu dans les exemples de NLP ci-dessus, Google analyse les sujets et les objets des phrases de votre contenu pour identifier les entités. De plus, apporter de petits changements à la structure de votre phrase peut modifier la structure sémantique d'une phrase d'une manière que vous, en tant que personne, pourriez ne pas détecter. N'oubliez pas que Google n'est pas humain et ne comprend pas votre contenu comme vous.
Donc, pour y faire face, écrivez toujours des phrases simples et essayez d'exprimer une idée par phrase.
Identifiez et incluez des entités dans votre contenu
Étant donné que Google identifie non seulement les entités de votre contenu, mais relie également les entités de votre contenu à des entités connues dans son graphe de connaissances, vous devez essayer d'identifier toutes les entités que Google s'attend à voir dans le contenu qui répond à la requête de recherche.
Vous pouvez facilement le faire en analysant le meilleur contenu de Google à l'aide de la démonstration de l'API de Google ou en important des données d'entité à l'aide de Python.
L'analyse du contenu de votre concurrent avec la démo de l'API de Google est un excellent point de départ. Déposez simplement leur contenu dans la démo et cliquez sur analyser.

Une fois que vous avez fait cela, parcourez le rapport Entités. Partout où l'outil apporte une URL (généralement de Wikipédia), vous avez trouvé une entité connue.
À l'aide de cet outil, vous pouvez consulter tout le contenu principal et rechercher des entités communes à inclure dans votre contenu.
Une autre option consiste à utiliser Python pour rechercher des données d'entité. Si vous voulez voir comment procéder, consultez le billet de blog de Marco Giordano sur l'utilisation de Python pour le NLP et le référencement sémantique.
Associez les réponses aux questions
Dans un article que j'ai vu sur le site de Bill Slawski, un brevet de Google stipule que votre contenu est plus susceptible d'être sélectionné pour les réponses de People Also Ask s'il est présenté sous forme de question et de réponse.
En d'autres termes, pour que votre contenu soit présenté dans la fonctionnalité Les gens demandent aussi, incluez la question dans votre contenu, puis répondez-y. J'ajouterais que pour que Google comprenne facilement que vous répondez à la question, répondez-y immédiatement après la question.
Maintenant, si écrire la question et y répondre immédiatement dans votre contenu aide Google à inclure votre contenu dans les boîtes PAA, il va de soi que pour que Google comprenne votre contenu, vous devriez généralement viser à structurer votre contenu de cette façon, même si vous ne ciblez pas les boîtiers PAA.
Utilisez une structure claire
Afin de comprendre les entités, Google peut extraire des informations à partir d'informations structurées et semi-structurées. Cela signifie que Google comprend le balisage HTML simple tel que les titres (H1, H2, etc.).
De plus, d'après ce que j'ai vu, il est plus facile pour Google de comprendre les données structurées et semi-structurées que pour Google de comprendre les données non structurées.
En comprenant cela, vous devez créer une structure claire pour votre contenu en utilisant des en-têtes logiques (H1, H2, etc.).
(Pour plus de clarté à ce sujet, consultez mon article sur le Knowledge Graph de Google.)
Ce que la PNL de Google signifie pour vous
La recherche sémantique est là et d'après ce que je vois, elle est là pour rester.
Et ce que je vois, c'est que la recherche sémantique change la donne pour le référencement. Nous ne le voyons peut-être pas maintenant, mais comme Google double ses algorithmes comme Bert et MUM, la capacité de Google à travailler avec le langage humain s'améliore de façon exponentielle.
Cela implique pour moi que nous devons commencer à optimiser notre contenu pour ces algorithmes. Et oui, je comprends que cette branche du référencement en soit à ses balbutiements, mais comme nous l'avons fait dans le passé, avec quelques essais et erreurs, vous pouvez comprendre comment améliorer votre trafic et votre visibilité.
Et c'était le but de ma petite expérience. J'essaie de comprendre concrètement comment les algorithmes de recherche sémantique affectent les résultats de recherche afin de comprendre comment vous pouvez mieux optimiser votre contenu.
