Foire aux questions

 

Pourquoi ne puis-je pas bénéficier d’une assistance personnelle pour mon site Web ?

Selon certaines estimations, il y a 100 millions de sites sur le Web. Chacun de ces sites est important à nos yeux car sans eux, quelle que soit leur taille ou leur importance, notre index serait moins complet et donc au final moins utile à nos utilisateurs.

Webmaster Central offre une assistance précieuse pour tous les types de sites Web. Nous publions les questions des éditeurs et y répondons de sorte que tout le monde puisse bénéficier des informations échangées. Webmaster Central, c’est aussi une communauté conviviale d’administrateurs Web prêts à partager leurs astuces et conseils et à vous aider à résoudre vos éventuels problèmes.

Les annonces que vous affichez influencent-elles vos classements ? Les annonces que vous affichez et les résultats de recherche sont-ils totalement distincts ?

Les annonces et les résultats de recherche sont absolument indépendants les uns des autres. En fait, des équipes distinctes travaillent sur chacun de ces secteurs afin d’éviter toutes interférences. Nous sommes convaincus que nos résultats de recherche doivent être absolument impartiaux et objectifs afin de garantir aux utilisateurs des services la meilleure qualité qui soit.

Comment dois-je procéder pour que mon site soit référencé dans l’index de recherche de Google ?

Le référencement des sites dans les résultats de recherche Google est gratuit et se fait automatiquement (vous n’avez pas besoin de les soumettre manuellement à Google). Google est un moteur de recherche entièrement automatisé qui explore le Web de manière régulière afin d’y détecter les sites non encore référencés et les ajouter à notre index. En fait, la grande majorité des sites répertoriés dans nos résultats ne sont pas soumis manuellement, mais trouvés et ajoutés automatiquement par nos robots qui explorent le Web.

En outre, les outils de Google disponibles sur Webmaster Central offrent aux administrateurs de sites Web un moyen simple de soumettre à l’index de Google un plan de leur site ou une liste de leurs adresses URL et d’obtenir des rapports détaillés sur la visibilité de leurs pages sur Google. Grâce à ces outils, les propriétaires de sites peuvent automatiquement tenir Google informé des toutes les pages dont se compose leur site et de toutes les mises à jour apportées à ces pages.

En moyenne, combien de temps faut-il à Google pour repérer un nouveau site sur le Web et à quelle fréquence Google explore-t-il le Web de manière général ?

Il n’y a pas de durée standard pour qu’un site soit référencé. Les robots Googlebot explorent régulièrement le Web afin de mettre à jour notre index. Grâce à Webmaster Central, les administrateurs de sites Web peuvent voir à quelle fréquence leur site est exploré par les robots Googlebot et indiquer s’ils souhaitent que leur site soit exploré plus ou moins souvent.

Que se passe-t-il si je souhaite que mon site Web figure dans les résultats de recherche Web, mais pas dans les résultats de services distincts tels que Google News ou Google Image ?

Google donne toujours la possibilité aux éditeurs Web de ne pas figurer sur certains de ses services. Pour ce faire, il leur suffit de contacter la ou les équipes d’assistance en charge du ou des services concernés.

Ainsi que mentionné précédemment dans le présent guide, le protocole d’exclusion des robots peut être utilisé afin de bloquer l’indexation de certaines images et pages Web. À cette fin, vous pouvez également utiliser la fonctionnalité de suppression d’adresses URL disponible sur Webmaster Central, prenant en charge la recherche Web et la recherche Google Image.

En outre, le groupe d’ordinateurs Googlebot utilisant différents robots, vous pouvez définir avec précision les pages dont vous souhaitez bloquer l’accès :

  • Robots Googlebot : explorent les pages pour notre index Web et notre index référençant les pages consacrées à l’actualité
  • Robots Googlebot-Mobile : explorent les pages pour notre index référençant les contenus destinées aux appareils mobiles
  • Robots Googlebot-Image : explorent les pages pour notre index référençant les images
  • Robots Mediapartners-Google : explorent les pages afin d’identifier le contenu AdSense. Nous utilisons uniquement ces robots pour explorer les sites contenant des annonces AdSense.
  • Robots Adsbot-Google : explorent les pages Web afin d’évaluer la qualité des pages de renvoi AdWords. Nous utilisons uniquement ces robots lorsque vous faites appel à Google AdWords pour promouvoir votre site.

Si vous souhaitez, par exemple, bloquer l’accès de l’intégralité des robots Googlebot à vos pages, vous pouvez utiliser la syntaxe suivante :

User-agent: Googlebot
Disallow: /

 

Est-ce que je peux choisir le texte de l’extrait qui apparaît dans les résultats de recherche ?

Non. En effet, une telle possibilité ne serait pas une bonne idée, ni du point de vue des internautes, ni du point de vue des créateurs de contenu. Nous choisissons un extrait issu du site qui comporte la requête de l’internaute dans son contexte et qui permet donc d’attester de la pertinence du résultat.

Les études démontrent que les internautes se rendront plus sûrement sur un site Web si les résultats de recherche contiennent un extrait de texte. Grâce à ces extraits, les internautes peuvent plus facilement évaluer la pertinence des résultats par rapport à leur requête. Lorsque les internautes ne peuvent pas évaluer rapidement la pertinence d’un résultat, ils passent généralement au résultat suivant.

Lorsqu’il nous est impossible de générer à l’aide d’algorithmes des extraits de texte exploitables et satisfaisants à partir du contenu de leurs pages Web, les éditeurs Web peuvent y ajouter la balise Méta suivante afin de nous fournir des informations supplémentaires. Cette balise doit être ajoutée dans la section des pages concernées comme dans l’exemple suivant :

<meta name="description" content="Pourquoi Anne n’aime-t-elle pas les lapins ? Nous allons bientot le savoir.">

 

Si vous ne souhaitez pas qu’un extrait de texte soit généré à partir du contenu de vos pages, il vous suffit d’ajouter la balise Méta NOSNIPPET comme suit :

<meta name="robots" content="nosnippet">

 

Enfin, nous utilisons parfois les descriptions de site contenues dans le répertoire ODP (Open Directory Project) pour les extraits de texte que nous affichons dans les résultats. Si vous ne souhaitez pas que nous utilisions cette description, il vous suffit d’ajouter la balise Méta suivante :

<meta name="robots" content="noodp">

 

Sur mon site, les articles consacrés aux dernières nouvelles s’affichent pendant quelques heures avant d’être mis à jour, puis sont déplacés vers la section des articles standard. Je souhaite que tous les articles de mon site soient référencés dans l’index de Google sauf les articles consacrés aux dernières nouvelles.

Pour ce faire, vous pouvez placer tous les articles consacrés aux dernières nouvelles dans un même répertoire, puis empêcher l’accès de ce dernier aux robots Googlebot à l’aide du fichier robots.txt.

Vous pouvez également, à cette fin, ajouter la balise Méta NOFOLLOW dans la section <HEAD> de la page HTML consacrée aux dernières nouvelles. Cette balise indique aux robots Googlebot qu’ils ne doivent suivre aucun des liens trouvés sur cette page. N’oubliez pas cependant, que cette balise empêche uniquement les robots Googlebot de suivre les liens allant d’une page à une autre. Si une autre page Web renvoie à ces articles, Google pourra les trouver et donc les indexer.

Si je dispose de plusieurs noms de domaine et si je diffuse le même contenu à partir de ces noms différents, mes sites courent-ils le risque d’être exclus de vos résultats de recherche ?

Bien que certains éditeurs Web tentent parfois d’utiliser le clonage de site et les sites miroirs pour induire en erreur les moteurs de recherche, il y a des cas où le clonage de contenu est tout à fait justifié et légitime. Nous ne souhaitons pas pénaliser les sites se trouvant dans ce cas. Par exemple, nous ne considérons pas que le même contenu exprimé dans deux langues différentes (par exemple, une version anglaise et une version française) est du contenu cloné.

Diffuser le même contenu sur plusieurs sites Web différents, notamment dans le cadre d’une syndication d’articles, ne signifie pas nécessairement que l’un ou plusieurs de ces sites seront entièrement supprimés des résultats de recherche. Toutefois, n’oubliez pas que les articles apparaissant sur plusieurs sites sont moins bien classés que les articles ne figurant que sur un seul, car les premiers bénéficient uniquement d’une fraction des liens entrants dont les articles publiés en un seul exemplaire bénéficient. En principe, un article publié sur un seul site sera mieux classé qu’un article publié sur plusieurs. Il sera donc consulté par un plus grand nombre d’internautes.

En outre, afin de garantir la qualité de nos résultats de recherche, nous n’y faisons pas figurer plusieurs exemplaires d’une même page. Nous préférons généralement y afficher une seule version de cette page. Les administrateurs de sites Web peuvent néanmoins nous indiquer à l’aide du fichier robots.txt quelle version de la page ils souhaitent que nous affichions dans nos résultats ou bloquer à l’aide des balises Méta appropriées l’affichage de toutes versions non désirées.

Pourquoi l’accès de mon site à l’index Google est-il bloqué ?

Tout d’abord, il se peut que l’indexation de votre site ne soit pas bloquée. De nombreuses autres raisons peuvent en effet expliquer pourquoi votre site n’apparaît pas dans nos résultats de recherche.

Si aucun obstacle n’empêche le repérage ou l’indexation de votre site, alors il se peut effectivement que son accès à l’index soit bloqué. Cette situation se produit notamment lorsque les sites concernés ne respectent pas les normes de qualité définies par les directives que nous avons rédigées à l’attention des administrateurs de sites Web (disponibles sur le Centre pour les webmasters).

Il s’agit le plus souvent de sites Web qui utilisent des méthodes déloyales pour obtenir un classement plus élevé dans nos résultats de recherche. Ces infractions à nos directives incluent notamment la dissimulation (cloaking, en anglais) qui consiste à rédiger du texte de sorte qu’il soit visible par les moteurs de recherche mais pas par les utilisateurs) ainsi que la configuration de pages et / ou de liens dans le seul but d’induire en erreur les moteur de recherche et de manipuler les résultats de recherche.

Lorsqu’un administrateur de sites Web pense que l’un de ses sites est en infraction avec nos directives en matière de qualité, il peut modifier ce site afin qu’il s’y conforme, puis cliquer sur le lien “Request re-inclusion” (Demander une réindexation) accessible à partir de l’interface des outils du Centre pour les webmasters afin que nous procédions à une réévaluation du site.