Glossaire

 

Adresse URL (Uniform Resource Locator)

Adresse d’un site Web sur Internet qui se compose des éléments suivants : http (protocole d’accès), nom de domaine (www.google.fr) et dans certains cas de l’emplacement d’un autre fichier (www.google.fr/webmaster).

Balises Méta

Balises dans le code HTML permettant de décrire le contenu d’une page Web. Les balises Méta peuvent être utilisées afin de définir des modalités d’indexation spécifiques pour chacune des pages d’un site.

Contenu dynamique

Contenu tel que des images, des animations ou des vidéos qui utilisent le langage Flash ou Javascript, des cadres ou des adresses URL générées dynamiquement.

Dissimulation (Cloaking)

Technique qui consiste à montrer aux moteurs de recherche un contenu différent de celui visible par les utilisateurs.

Exploration (Crawling)

Processus utilisé par les moteurs de recherche pour collecter des pages sur le Web.

Extension de fichier

Nom attribué aux fichiers informatiques (.doc, .txt, .pdf, etc.) indiquant généralement la nature des données contenues dans le fichier.

HTML (Hypertext Markup Language)

Langage de marquage utilisé sur le Web afin de structurer le texte.

Indexer

Processus consistant à référencer le contenu d’un site dans un moteur de recherche.

Lien “En cache”

Image d’une page Web capturée par les robots Googlebot lors de leur dernière visite. Une copie en cache permet aux utilisateurs d’afficher une page même lorsque sa version en ligne n’est pas disponible. Le contenu de cette copie peut toutefois varier légèrement de la version en ligne. Pour afficher la copie en cache d’une page, cliquez sur le lien “En cache” affiché sous le résultat de la recherche.

Mot clé

Terme saisi dans la zone de recherche d’un moteur de recherche, lequel lance une recherche afin de trouver des pages contenant ces termes.

Protocole d’exclusion des robots

Norme technique indiquant aux moteurs de recherche quels sites ou parties de site doivent être ou non référencés dans les résultats de recherche.

PageRank

Fonctionnalité proposée par Google contribuant à déterminer le classement d’un site dans nos résultats de recherche. Ce classement est établi en respectant le caractère profondément démocratique du Web, puisqu’il utilise son organisation sous forme de liens pour déterminer la valeur individuelle de chaque page. Le score PageRank des sites importants et de grande qualité est plus élevé. Cet élément est pris en compte par Google lors des recherches. Google associe ce classement à des techniques élaborées de recherche de texte correspondant aux critères saisis afin de trouver des pages pertinentes et importantes par rapport aux requêtes des internautes.

Répertoire racine

Répertoire principal dans un système de fichiers informatiques.

Robot d’exploration (Crawler)

Logiciel utilisé pour repérer, puis indexer les adresses URL du Web ou d’un réseau intranet.

Robots.txt

Fichier texte permettant aux éditeurs Web de contrôler l’accès de leur site à plusieurs niveaux : intégralité du site, répertoires individuels, pages d’un type particulier ou même pages individuelles. Ce fichier signale aux robots d’exploration quels répertoires peuvent être ou non explorés.

Système de gestion de contenu

Logiciel qui permet de gérer différents types de contenus : fichiers informatiques, images, fichiers audio, contenus Web, etc.

Site miroir

Version clonée d’un site Web, parfois utilisée pour induire en erreur les moteurs de recherche et ainsi optimiser l’indexation et le classement d’un site Web donné.