Accueil / Blog / soft 404

Comprendre les soft 404

Peu connue du grand public, l’erreur dite soft 404 doit son nom à la célèbre erreur 404, synonyme de page introuvable. Pourtant, elle peut dans les faits être comparée à différents types d’erreur fréquemment rencontrés sur le web, dans des cas proches mais tout aussi distincts : page introuvable, disparue ou redirigée. Google n’aimant pas perdre son temps sur des pages dénuées de sens, il décourage logiquement la présence d’erreurs soft 404 sur un site web. Définition, détection, impact sur le SEO et correction, nous vous donnons toutes les informations utiles.

 

Qu’est-ce qu’une erreur soft 404 ?

Pour y voir un peu plus clair, rappelons brièvement le fonctionnement d’une requête Internet. Lorsqu’un navigateur ou un robot de moteur de recherche souhaite accéder au contenu d’une url, il interroge tout d’abord le serveur, qui va lui retourner, entre autres, un code contenu dans l’en-tête http et l’informant sur l’état de la page. On retrouve ainsi différents codes d’état :

  • 1xx : information.
  • 2xx : succès.
  • 3xx : redirection.
  • 4xx : erreur du client web.
  • 5xx : erreur du serveur ou serveur d’application.

 

Dans le cas d’une erreur soft 404, le navigateur ou le robot tente comme à son habitude d’accéder à une page Internet via son URL. Seulement voilà, il reçoit un code de niveau 2xx (réussite) alors que la page ne semble pas proposer de contenu. La plupart du temps, il reçoit d’ailleurs même un code 200, validant le succès de la requête.

 

Un problème pour Google, et donc le SEO

A priori, Google n’applique pas de pénalité aux sites dont certaines pages sont identifiées comme soft 404. Le risque de voir son site dégringoler sur la SERP (Search engine result page pour page de résultats des moteurs de recherche) n’est donc pas critique. En revanche, la réception de ce code de niveau 2xx entraîne d’autres problèmes.

 

Considérant que la page existe et possède du contenu, le robot considère en effet qu’il vaut la peine de la crawler. Or, les robots n’ont qu’un temps limité à consacrer aux sites qu’ils visitent, c’est ce qu’on appelle dans le jargon SEO le « budget crawl ». Si tout ce qu’ils trouvent en passant sur le vôtre est une page vide ou presque, ils référenceront votre site en fonction de leur constat, c’est-à-dire pas à sa juste valeur.

 

Conséquence directe, ces pages peu représentatives et, osons-le, peu intéressantes, sont également potentiellement celles que vont trouver vos potentiels visiteurs sur les moteurs de recherche. S’en suit une expérience utilisateur pauvre, un taux de clic conséquemment bas et/ou un taux de rebond très haut. Dans tous les cas, vos statistiques en pâtissent, tout comme votre référencement naturel.

 

Détecter les soft 404 sur un site Internet

Google peut considérer des pages de votre site comme soft 404 pour différents types de raisons. Ce peut notamment être le cas pour :

  • une page vide : l’url existe, mais aucun contenu n’est présent.
  • une page avec peu de contenu : une page « produit indisponible » répétée quasiment à l’identique dans une boutique en ligne par exemple, ou des pages « disponible prochainement » liées à certaines entrées d’un menu.
  • des pages aux contenus très différents pointant toutes vers une autre page commune. Attention particulièrement aux redirections massives vers la page d’accueil : des contenus trop différents pointant vers la même page peuvent être considérés comme non-pertinents par Google Pinguin.

 

Bien que toujours très mystérieux quant à ses algorithmes, Google ne se prive pas pour autant de proposer une multitude d’outils aux développeurs web. La Search Console propose ainsi un outil d’inspection d’URL (URL inspection en version originale) qui permet d’afficher l’état d’indexation d’une URL donnée. Il est ainsi possible de constater si le code d’état renvoyé est le bon. Attention toutefois, le résultat retourné correspond à la dernière version indexée de la page et ne tient donc pas forcément en compte des dernières modifications. Il existe pour cela une option de test en direct, permettant ainsi de constater le résultat de vos récentes actions.

 

Des outils externes existent également afin d’avoir un aperçu plus général, tout comme la partie « Couverture » de la Google Search Console qui regroupe et détaille l’ensemble des erreurs trouvées sur votre site.

 

Comment réparer les pages en soft 404 de son site

Une fois identifiées, il ne reste qu’à corriger les erreurs soft 404 de votre site Internet. Selon le type de page concerné, différentes actions peuvent s’imposer.

 

Page plus disponible

Il convient dans ce cas d’indiquer distinctement aux moteurs de recherche que la page n’est plus disponible. Utilisez alors le code 404 pour une page introuvable (pas de page à l’adresse demandée) ou le code 410 pour une page disparue (plus disponible et pas remplacée par une autre page). Officiellement, Google indique ne pas agir différemment pace à ces deux codes (généralement en supprimant la page de son index). Il semblerait pourtant que les codes d’erreur 410 soient traités plus rapidement, sans conséquences sérieuses pour le développeur néanmoins.

 

Page déplacée

Si une page en soft 404 a été déplacée ou remplacée, le code faisant le plus de sens est alors 301, indiquant une page déplacée de façon permanente. Comme signalé plus haut, cette technique est cependant à manipuler avec précaution afin d’éviter ce cher Penguin qui pourrait douter du bien-fondé de redirections jugées inappropriées.

 

« Fausse » erreur soft 404

Il se peut enfin que Google considère à tort une page comme soft 404 alors qu’elle contient du contenu. C’est principalement le cas lorsque ce contenu ne charge pas ou trop lentement. Là encore, l’outil d’inspection d’URL est un allié de choix puisqu’il permet de voir comment s’affiche ladite page en ligne, et donc diagnostiquer plus rapidement le problème.

Il paraît qu'on ne mord pas... 😉