Fichier Robots.txt ou balises Méta ?

 

En général, le fichier robots.txt constitue une solution efficace pour contrôler l’ensemble des pages d’un site. Les balises Méta permettent quant à elles de définir des règles d’accès spécifiques pour chacune des pages de ce site. Elles sont particulièrement utiles si vous êtes autorisé à modifier des fichiers distincts du site mais pas l’intégralité de ce dernier. Elles vous permettent également de spécifier des règles de contrôle d’accès complexes distinctes pour chacune des pages de votre site.

Parfois, l’une ou l’autre de ces solutions peut vous permettre de régler le même problème.

Que dois-je faire pour m’assurer que le texte d’une page est indexé, mais pas les images qu’elle contient ?

Vous pouvez bloquer l’accès aux images de cette page en spécifiant leur extension dans le fichier robots.txt. La présence des lignes suivantes dans un fichier robots.txt indique à Google de ne pas indexer les fichiers ayant pour extension *.jpg ou *.jpeg :

User-agent: Googlebot
Disallow: /*.jpg$
Disallow: /*.jpeg$

 

Si votre système de gestion de contenu stocke les images dans un répertoire distinct, vous pouvez également exclure du processus d’indexation la totalité de ce répertoire. Si vos images sont stockées dans un répertoire dénommé “images”, vous pouvez exclure ce répertoire du processus d’indexation de tous les moteurs de recherche en spécifiant les lignes suivantes :

User-agent: *
Disallow: /images/

 

Vous pouvez aussi ajouter la balise Méta NOINDEX à chaque fichier comportant une image. Toutes ces solutions vous permettent d’empêcher que vos images ne soient indexées. L’utilisation de l’une ou l’autre dépend de la quantité d’images et des images que vous souhaitez exclure du processus d’indexation.