trimardeau
Digital Strategy

Qu’est une page orpheline en référencement naturel ?

Lorsque l’on s’intéresse au référencement naturel et plus particulièrement à l’analyse de log SEO, on entend souvent parler des pages orphelines. Ce terme de paraître barbare pour les non initiés mais est relativement simple à comprendre. Dans cet article, nous verrons qu’est ce qu’une page orpheline et comment les traiter lorsque l’on met en place une stratégie d’optimisation pour les moteurs de recherche.

Qu’est ce qu’une page orpheline ?

Commençons par voir ce qu’est une page orpheline en SEO. Il s’agit d’une page qui est présente sur le site, qui est régulièrement crawlé et/ou indexé par Google mais qui n’est liée à aucune autre page dans le maillage interne de votre site.

Lors de migration ou de la réorganisation de l’arborescence d’un site internet, il arrive que l’on modifie les liens internes, soit pour améliorer son positionnement dans Google ou bien pour améliorer l’expérience utilisateur. Lors de ces migrations, les anciennes pages ne sont pas toujours supprimées. Il arrive aussi que le CMS que vous utilisez génère des pages automatiquement et que vous oubliez de les supprimer.

En résumé : une page orpheline est une page disponible sur le site mais qui n’est accessible via aucun lien depuis depuis site.

Pourquoi traiter les pages orphelines ?

La présence de pages orphelines à un fort impact sur le budget de crawl que vous attribue Google. Pour résumé, le budget crawl est une quantité de ressource qu’attribue Google à votre site, plus vous possédez de budget crawl, plus les robots de Google viendront sur votre site et parcourent vos pages.

Le problème avec les pages orphelines est que bien que celle-ci n’ait pas de fort potentiel de ranking, Google viendra régulièrement crawler la page afin de vérifier si celle-ci a été mise à jour. Le temps passé sur cette page à faible potentielle est du temps que les robots des moteurs de recherche ne passeront sur vos pages à forte valeur ajoutées.

Comment trouver les pages orphelines de votre site ?

Nous allons voir la méthode la plus simple afin détecter les pages orphelines. Pour cela, vous allez avoir besoin d’analyser les logs de votre site internet et de lancer un crawler.

  • Lancer un crawler sur l’ensemble des pages de votre site exporter le fichier obtenu sur excel ou sur le tableau de votre choix.
  • Récupérer via une analyse de log l’ensemble des pages de votre site internet ayant répondu avec un code 200.
  • Vous disposez désormais de deux fichiers : le fichier de crawl vous permettant de détecter l’ensemble des pages présentent dans l’arborescence de votre site internet un fichier d’analyse de log vous indiquant l’ensemble des pages ayant été visitées, soit pas des visiteurs soit par des robots.
  • Il ne vous reste plus qu'à faire la différence entre ces deux listes afin de détecter les pages présentent dans les logs et qui ne le sont pas dans votre arborescence. Vous obtenez ainsi la liste de vos pages orphelines.

Prenons rendez-vous
dès aujourd'hui.

Nicolas TRIMARDEAU

Consultant en Stratégie Digitale
Nice, Sophia Antipolis, Provence Alpes Côte-d'Azur
Email : contact@trimardeau.com
Téléphone : +336 88 68 97 81
Partenaire Google spécialisé dans la Publicité sur le Réseau de Recherche.
Veuillez indiquer vos nom et prénom
Le format de l'email est incorrect
Veuillez indiquer votre numéro de téléphone
Veuillez indiquer votre site internet
Parlez moi de votre projet