Que sont les codes d'état HTTP ?
Publié: 2021-08-23Si vous avez déjà cliqué sur un lien dans l'espoir d'acheter ce produit incroyable qui figurait au deuxième rang d'une liste des "meilleurs produits" et que vos espoirs ont été anéantis en atterrissant sur une page 404, vous avez fait l'expérience directe des codes d'état HTTP. Lorsque tout va bien, vous ne verrez pas ces codes affichés, mais ils sont générés à chaque fois que votre navigateur interagit avec un serveur. Comprendre les codes d'état HTTP peut vous aider à diagnostiquer les problèmes de votre site Web qui pourraient frustrer vos visiteurs et avoir un impact négatif sur votre classement SEO.
Bien que cela puisse sembler intimidant et technique, comprendre les codes d'état HTTP est assez simple, et c'est un outil important pour comprendre vos résultats SEO. Il est important de surveiller et de résoudre tous les codes d'état d'erreur sur votre site Web, car Google les utilise comme indicateur pour évaluer votre site. Une fois que vous comprenez ce qu'ils signifient, vous pouvez utiliser Google Search Console pour rechercher et réparer les codes d'état d'erreur sur votre site Web.
Comment les codes d'état de réponse HTTP sont classés et ce qu'ils signifient

Les codes d'état HTTP sont des nombres à trois chiffres classés en cinq groupes en fonction du type de réponse renvoyée par le serveur. Certains courants incluent:
- 100-199 : Ce sont des réponses d'information qui indiquent que la demande a été reçue et se poursuit.
- 200-299 : Il s'agit de codes de réponse réussis qui vous permettent de savoir que votre demande a été traitée avec succès.
- 300-399 : Ces codes indiquent qu'une action supplémentaire est nécessaire pour compléter la demande, généralement une redirection.
- 400-499 : Ce sont des codes d'erreur qui indiquent que le problème est causé par le client.
- 500-599 : Ce sont des codes d'erreur qui indiquent que le problème est causé par le serveur.
Les codes d'état HTTP les plus courants
Il existe de nombreux codes de statut différents qui signifient tous quelque chose de différent dans la catégorie représentée par le premier chiffre. Il y a même un code, 418, qui a été créé comme une blague du poisson d'avril. Cela signifie « Je suis une théière » et c'est la réponse du serveur lorsque vous demandez à une théière de préparer du café. Le code 451 fait référence au roman dystopique Fahrenheit 451 et signifie que la demande n'est pas disponible pour des raisons légales, comme l'interdiction par un gouvernement.
Cependant, ce sont des codes inhabituels que vous ne verrez probablement pas très souvent. Les codes d'état HTTP les plus courants auxquels vous devrez faire face incluent :
- 200 : Ceci n'est pas un code d'erreur. Cela signifie que tout s'est bien passé et que la demande a été traitée avec succès.
- 301 : Ce code indique que les données que vous demandez ont été définitivement déplacées. Cela se produit lorsque les données que vous demandez ont été définitivement remplacées par autre chose. Vous ne verrez pas de message d'erreur avec cette demande car l'URL sera automatiquement modifiée.
- 302 : Cela vous permet de savoir que ce que vous recherchez a été temporairement déplacé. L'URL d'origine est toujours valide, mais elle est temporairement redirigée ailleurs. Comme avec le code 301, vous ne verrez pas de message d'erreur avec celui-ci. La redirection se fera automatiquement.
- 403 : Il s'agit d'un code d'erreur "interdit" qui se produit lorsque vous n'avez pas accès à ce que vous demandez. Cela peut se produire lorsque vous essayez d'accéder à un site protégé par mot de passe sans vous connecter.
- 404 : Il s'agit du redoutable message "introuvable" qui apparaît chaque fois que la page que vous recherchez n'y figure pas. Il peut avoir été retiré du site Web ou déplacé sans être redirigé. Cela peut également signifier que vous avez mal saisi l'URL.
- 500 : vous obtiendrez ce code en cas d'erreur interne du serveur.
- 503 : Il s'agit d'une autre erreur de serveur qui se produit lorsque le serveur est surchargé.
Comment les codes de statut HTTP affectent-ils votre classement SEO ?
Googlebot est le logiciel que Google utilise pour classer les sites Web, et cela affectera votre référencement. C'est ce qu'on appelle une araignée parce qu'elle « rampe » sur votre site Web. Il suit les liens, rassemble les données et les indexe. Cet index est ensuite utilisé pour générer les résultats des moteurs de recherche. Plus il est facile pour l'araignée de parcourir votre site, plus votre classement dans les moteurs de recherche sera élevé, toutes choses étant égales par ailleurs. Un classement aussi élevé que possible sur Google est un élément important de l'optimisation des moteurs de recherche.
Les liens sont une partie importante de la façon dont Googlebot collecte des données, car il fonctionne en allant de lien en lien via votre site Web. Pour chaque lien qu'il suit, il vérifie le code d'état. Lorsqu'il rencontre un code d'état d'erreur, ce code peut interférer avec l'exploration. Si votre site Web ne peut pas être exploré, il ne peut pas être indexé et il ne peut pas apparaître dans les résultats des moteurs de recherche.
Utilisation de Google Search Console pour surveiller les codes d'état HTTP de votre site Web
Bien que vous puissiez vérifier le code d'état de n'importe quelle page en saisissant l'URL dans un outil tel que Web Sniffer, Google Search Console est un moyen plus rapide et plus simple de surveiller les codes d'état problématiques sur l'ensemble de votre site Web. Google Search Console fournit des outils qui vous aident à optimiser votre site Web pour les résultats de recherche Google. Mieux encore, il est entièrement gratuit et fonctionne quelle que soit la plate-forme que vous utilisez.
Avant de pouvoir démarrer avec Google Search Console, vous devez vérifier que vous êtes propriétaire de votre site. Google Search Console vous fournit de nombreuses informations sensibles sur votre site auxquelles vous ne voulez pas que n'importe qui puisse accéder. Il existe plusieurs façons de vérifier votre site, et celle qui vous convient le mieux dépend de la plate-forme que vous utilisez. Choisissez l'une des méthodes répertoriées dans l'aide de la Search Console pour y accéder.

La connexion de votre site Web à Google Search Console peut être un peu fastidieuse et fastidieuse lors de votre première tentative. Cependant, c'est un outil tellement précieux pour surveiller tant d'aspects du référencement de votre site Web que vous constaterez que cela en vaut la peine.
Une fois votre site vérifié, vous pouvez utiliser le rapport de couverture de l'index pour savoir quelles pages de votre site sont indexées par Google. Il vous indique également quelles pages contiennent des erreurs qui empêchent l'indexation de vos pages. Lorsque vous cliquez sur le rapport, vous verrez quatre onglets en haut de la page :
- Erreur : Ces pages n'ont pas pu être indexées en raison d'une erreur. Faites défiler vers le bas pour voir quelles erreurs ont été trouvées et combien de pages ont été affectées.
- Valide avec avertissement : ces pages ont peut-être été indexées, mais présentent des problèmes que vous devrez peut-être résoudre.
- Valide : ces pages ont été indexées.
- Exclus : ces pages n'appartiennent pas à l'index pour une raison quelconque, comme des URL en double, ou des robots bloqués.
Faites défiler vers le bas pour voir exactement quelles erreurs ont été trouvées et combien de pages sont affectées. Les codes d'état qui causent des problèmes avec l'indexation Google s'afficheront sous les sections Erreur, Valide avec avertissement ou Exclu. Ces codes seront dans les 300, 400 ou 500, mais le code exact peut ne pas être donné.

Pour trouver le problème spécifique à l'origine des problèmes, placez l'URL de la page avec une erreur dans l'outil d'inspection d'URL. Vous pourrez en savoir plus sur l'erreur qui cause des problèmes et la corriger.
Réparation des erreurs de code d'état HTTP trouvées dans Google Search Console
Une fois que Google Search Console vous a montré les erreurs qui doivent être corrigées, vous voudrez comprendre de quel type il s'agit pour savoir comment les corriger. Les erreurs qui s'affichent dans Google Search Console seront regroupées dans les catégories suivantes :
URL soumise introuvable (404)
Cela signifie que la page n'a pas pu être trouvée par Google. Vérifiez-le en mettant l'URL dans votre navigateur. Si la page n'existe pas, vous avez deux options. Si vous ne voulez pas qu'il soit indexé, laissez-le simplement et il sera éventuellement supprimé. Cela se produit fréquemment lorsque le contenu est supprimé des sites Web.
Si vous souhaitez que l'URL redirige vers une autre page, vous pouvez la rediriger. Votre plate-forme de site Web peut avoir des commandes de redirection intégrées. Assurez-vous simplement de le rediriger avec un code de statut 301 s'il s'agit d'une redirection permanente. Cela donnera à vos liens le même poids que l'URL d'origine et est meilleur pour le référencement.
Erreur de serveur (5xx)
Cela indique que Google n'a pas pu accéder au site car le serveur était en panne ou surchargé. Il peut s'agir d'un problème temporaire, mais vous devriez l'étudier plus avant s'il ne se résout pas. Les erreurs de serveur peuvent être causées par des erreurs de l'utilisateur ou des problèmes avec votre serveur.
Erreur de redirection
Si vous voyez cette erreur, cela vous indique que l'URL d'origine a été redirigée, mais que le lien redirigé ne fonctionne pas. Cela peut être dû au fait que la chaîne de redirection était trop longue, qu'il y avait une boucle de redirection ou que l'URL était mauvaise. Vous devrez trouver la redirection sur votre plateforme et corriger l'erreur.
L'URL soumise semble être un soft 404
Un soft 404 se produit lorsqu'une page Web indique à l'utilisateur qu'elle n'existe pas mais renvoie un code d'état HTTP 200, indiquant qu'elle a été trouvée avec succès. Cela peut arriver pour plusieurs raisons. Si la page n'existe plus, elle a besoin d'un code 404 ou d'un code de redirection 301, ou vous pouvez simplement la supprimer de votre sitemap.
Il y a des moments où un soft 404 est attendu, et vous n'aurez rien à faire pour le réparer. Si vous avez une page sur votre site qui n'est accessible qu'après qu'un visiteur a terminé une action, elle renverra un soft 404 lorsque vous essayez d'y accéder directement.
URL soumise marquée 'noindex'
La balise 'noindex' indique aux moteurs de recherche de ne pas indexer votre page. Cette erreur se produit si vous avez une page que votre sitemap soumet pour indexation, mais qu'elle a une commande 'noindex'. Parfois, il y a des pages que vous ne voulez pas indexer, ce qui est bien. Vérifiez simplement que les pages que vous avez marquées "noindex" sont des pages que vous ne voulez vraiment pas indexer et supprimez-les de votre sitemap.
Si cette erreur se produit sur une page que vous souhaitez que Google indexe, supprimez simplement la balise "noindex".
URL soumise bloquée par robots.txt
Un fichier robots.txt empêche les bots d'accéder à la page. Cela inclut les araignées comme Googlebot. Ceci est généralement fait pour gérer le trafic des robots d'exploration sur votre site, peut-être pour empêcher les robots d'exploration d'accéder à des pages sans importance. Cependant, ce n'est pas une méthode fiable pour garder une page hors des résultats de recherche Google, alors utilisez "noindex" si vous voulez le faire.
Comme pour les erreurs "noindex", vérifiez simplement que vous souhaitez que les pages répertoriées bloquent les bots. Sinon, supprimez-les du fichier robots.txt.
L'URL soumise renvoie une demande non autorisée (401)
Vous obtiendrez cette erreur si vous avez une page protégée par mot de passe mais qu'elle a été soumise pour indexation via votre sitemap. Si vous souhaitez que cette page reste protégée par un mot de passe, ajoutez une directive "noindex" et supprimez-la de votre sitemap. Si vous souhaitez qu'il soit indexé, supprimez la protection par mot de passe.
L'URL soumise a renvoyé 403
Ceci est similaire à une erreur 401 mais se produit généralement parce que l'URL nécessite un accès autorisé, tel que des privilèges d'administrateur. Le correctif est le même que pour une erreur 401.
URL soumise bloquée en raison d'un autre problème 4xx
Ce code d'erreur signifie que l'URL a renvoyé un code d'état HTTP de niveau 400 autre que 401, 403 ou 404. Vous pouvez rechercher la cause de manière plus approfondie à l'aide de l'outil d'inspection d'URL ou vous pouvez supprimer la page de votre sitemap.
Comment corriger les avertissements dans Google Search Console
Bien qu'ils ne soient pas aussi graves qu'une erreur, vous devez toujours vérifier vos avertissements et les résoudre pour optimiser votre site. Les avertissements possibles incluent :
Indexé, bien que bloqué par robots.txt
Les pages avec cet avertissement ont été indexées même si elles ont été bloquées par robots.txt. Si vous ne voulez pas que cette page soit indexée par Google, utilisez l'attribut 'noindex'. Si vous voulez qu'il soit indexé, supprimez-le de robots.txt.
Page indexée sans contenu
Cette page a été indexée, mais Google n'a pas pu reconnaître le contenu. Cela peut être dû au fait qu'il se trouve dans un format que Google ne reconnaît pas ou qu'il est masqué. Utilisez l'outil d'inspection d'URL pour obtenir plus de détails sur la cause de cet avertissement.
Vous pouvez utiliser des codes de statut HTTP pour optimiser votre site
Maintenant que vous comprenez ce que sont les codes d'état HTTP, comment ils sont utilisés et comment les trouver sur votre site Web, intégrez la surveillance et la réparation des erreurs de code d'état à la maintenance de votre site Web. Créez un compte dans Google Search Console et configurez une routine pour vérifier votre rapport de couverture de l'index. Corrigez toutes les erreurs de codes d'état involontaires pour améliorer la santé et la valeur de votre site Web aux yeux du classement des moteurs de recherche de Google.
En comprenant comment fonctionne le référencement et quels facteurs l'affectent, vous contrôlerez mieux votre trafic organique. En plus de créer un excellent contenu, d'optimiser votre recherche de mots clés et de maximiser les backlinks, la surveillance de vos erreurs de code de statut peut vous aider à tirer le meilleur parti de votre stratégie de marketing SEO.
