Google peut-il indexer votre site ?

 

De temps à autre, les administrateurs de sites Web s’aperçoivent que leurs sites n’apparaissent pas dans nos résultats de recherche. Il peut s’agir d’un problème d’”indexabilité”. Ce terme désigne la possibilité pour les robots Googlebot de faire ou non une copie des pages Web en question afin de l’inclure dans nos résultats de recherche.

Structure et Contenu

L’impossibilité d’inclure des pages Web dans nos résultats de recherche est souvent due à leur structure et leur contenu. Par exemple, une page Web sur laquelle les utilisateurs doivent renseigner les champs d’un formulaire peut ne pas être indexable par Google.

De même, les moteurs de recherche peuvent avoir des difficultés à indexer une page contenant des données dynamiques (Flash, JavaScript, cadres et adresses URL générées dynamiquement). Pour vous assurer que votre site ne connaît pas ce problème, essayez de l’afficher à l’aide d’un navigateur texte tel que Lynx, ou de tout autre navigateur après avoir désactivé l’option permettant d’afficher les images, les contenus Javascript et Flash. Vous verrez alors si tout le contenu de votre site est effectivement accessible.

Si votre site contient un grand nombre d’images, assurez-vous que le texte ou les légendes y faisant référence décrivent de manière précise leur contenu. Cela permet non seulement aux moteurs de recherche d’indexer correctement vos images, mais aussi de les rendre accessibles aux internautes malvoyants. Vous pouvez également utiliser la fonction “alt text” pour vos images et attribuer à leur fichier des noms descriptifs comme dans l’exemple ci-dessous (il s’agit d’une image correspondant au logo d’une société dénommée La cuisine de Véronique) :

<img src="cuisineveronique.jpg" alt="Bienvenue sur le site consacrée à la cuisine de Véronique !">

Les adresses URL

Un autre obstacle à l’indexation de votre site peut être son adresse URL. Si l’adresse URL de votre site contient plusieurs paramètres ou comprend des identifiants de session ou si cette adresse renvoie automatiquement à plusieurs autres adresses successives, Google peut ne pas être mesure de l’indexer.

Serveur et réseau

Des problèmes de serveur ou de réseau peuvent également nous empêcher d’accéder à certaines pages de votre site. Grâce aux outils du Centre pour les webmasters développés par Google, les éditeurs de sites Web peuvent désormais voir une liste des pages Web auxquelles les robots Googlebot ne peuvent pas accéder. Pour en savoir plus sur les outils du Centre pour les webmasters.

Protocole d’exclusion des robots

Il peut arriver que certaines pages soient bloquées par le protocole d’exclusion des robots. Il s’agit d’une norme technique qui permet aux éditeurs Web d’indiquer aux moteurs de recherche de ne pas indexer le contenu de leur site (voir ci-dessous). Si votre site Web n’apparaît pas dans les résultats de recherche Google, assurez-vous que les données du fichier robots.txt ou qu’une balise Méta ne bloquent pas l’accès de votre contenu à nos robots d’exploration.