Le référencement





Le référencement est tout d'abord le travail qui consiste à optimiser le classement d'un site internet dans les moteurs de recherche ou les annuaires afin d'augmenter le nombre de visiteurs.

Pour cela, plusieurs techniques sont possibles. Certaines sont payantes, d'autres gratuites mais dans tous les cas, le référencement d'un site est long (plusieurs semaines voir plusieurs mois). Il est vrai que de passer par des professionnels favorise un référencement rapide, mais est-ce vraiment rentable pour un particulier ?

Les annuaires:

L'inscription de votre site dans les annuaires est longue. En effet, pour chaque demande d'inscription, il faut remplir un formulaire (nom du site, URL, E-mail, description, etc...). Pour gagner du temps, pensez à noter dans un fichier texte tous les renseignements nécessaires, il vous suffira de faire des copier/coller. L'inscription est néanmoins rapide (<15 jours).
Certains annuaires vous demande d'inscrire un lien retour sur une page partenaire, d'autres non.
Pour trouver les annuaires ? Prenez votre moteur de recherche préféré (Exalead, MSN, Google, etc....) et saisissez les termes suivants: annuaire referencement. Vous devriez avoir l'embarras du choix.

Si vous trouvez ça trop long, vous pouvez faire appel aux logiciels spécialisés...


Les logiciels spécialisés:

Ces logiciels font exactement le même travail que précédemment, mais sur plusieurs milliers d'annuaires. Ils sont généralement payants. A vous de voir selon votre budget.


Les moteurs de recherches:


Inutile de vous les présenter: Exalead, Google, Yahoo, MSN, Exite, Lycos, AOL, Altavista, Francité, Alltheweb, etc...
Il est possible d'inscrire son site sur les principaux moteurs de recherche de façon totalement gratuite ou payante. L'inscription payante est (vous vous en doutez !) beaucoup plus rapide et garantie !!
Pour vous inscrire, trouvez le lien (Proposez votre site, Submit your site, etc....), remplissez les formulaires et surtout .... de la patience !!. Une attente de plusieurs semaines n'est pas rare.
Inutile également de s'inscrire sur tous les moteurs: le moteur d'AOL est celui d'Exalead, le moteur d'Altavista est celui de Yahoo, etc...


Les échanges de liens:

Pour ma part, la meilleure façon de se faire référencer c'est l'échange de liens. En effet, le but est d'avoir le maximum de liens qui "pointent" vers votre site. Google par exemple, définit la popularité d'un site en fonction du nombre de "backlinks" dirigés vers ce site. Cette popularité est appelé "Pagerank", et bien sûr, plus le site est populaire (pagerank elevé), mieux il sera présenté lors des recherches.

Il faut donc que vous trouviez des "sites amis" avec lesquels vous allez échanger des liens, d'où l'utilité d'une page "partenaire" quand vous contruisez un site (pensez-y !!).

Mais pourquoi mettre des liens ?  Tout simplement à cause des robots (crawlers ou spiders). Chaque moteur de recherche possède des spiders qui parcourent le web mondial pour indéxer de nouvelles pages ou simplement les mettre à jour. Quand un spider va passer sur un site ami (qui a donc inséré un lien pointant vers votre site) il va se diriger vers votre site et indexer vos pages dans sa base de données. C'est de cette façon que l'on se retrouve dans la bases de données des moteurs de recherche. Simple non ?

En visualisant les logs de votre site, on voit régulièrement (plusieurs fois par semaine) les spiders.
Chaque moteur de recherche a son propre spider:
  • Yahoo: slurp
  • Google: googlebot
  • MSN: msnbot
  • Exalead: exabot
  • ......

Pour effectuer un référencement correct de votre site, il faudra penser à aider les spiders à parcourir l'ensemble de vos pages en intégrant des balises méta et un fichier "robots.txt".

Les balises méta:

Les balises méta doivent être renseignées dans l'en-tête de votre page web entre les balises <head> et </head> (après la balise </title>.
Les principales sont les balises content-type, description, keywords et robots.

 - La balise méta content-type indique le jeu de caractères utilisé. Elle permet au moteur de recherche de bien interpréter les caractères spéciaux (accents).
Exemple: <meta http-equiv="content-type" content="text/html; charset=iso-8859-1">

 - La balise méta description permet de proposer un résumé du contenu de votre page.
Exemple: <meta name="description" content="Site sur le référencement de votre site internet.>

 - La balise méta keywords sert à fournir une liste de mots-clés nécessaires aux spiders.
Exemple:  <meta name="keywords" content="referencement, site, internet, web, balise, meta">

 - La balise méta robots permet d'indiquer aux spiders comment référencer vos pages. Il y a plusieurs attributs possibles:
  • all: le spider indexe tout.
  • none: le spider indexe rien (votre page ne sera jamais indexée). 
  • index: votre page est indexée.
  • noindex: le spider n'indexera pas votre page mais suivra les liens (href=...)
  • follow: le spider suivra les liens pour les référencer plus tard.
  • nofollow: le spider ne suivra pas les liens.
Exemple: <meta name="robots" content="all">
Il est possible de cumuler les fonctions: "content=noindex, nofollow" est parfaitement valide.


Le fichier robots.txt:

Attention: c'est bien robots.txt (au pluriel et en minuscule) et non pas robot.txt !

Quand un spider va arriver sur votre site, il va se mettre à "crawler" toutes vos pages. Il va d'abord vérifier la présence (ou non) du fichier robots.txt à la racine de votre site web.
Ce fichier va simplement donner l'ordre aux spider de ne pas indéxer telle ou telle page pour plusieures raisons (copyright, en cours de construction, page confidentielle, etc...). Si ce fichier n'existe pas, il va crawler toutes les pages.
La structure de ce fichier est la suivante:

User-Agent: *
Disallow: /repertoire

User-Agent: * signifie que l'accès à tous les spiders est accordé.
Disallow: /repertoire signifie que le spider n'ira pas crawler le répertoire repertoire

Exemples: User-Agent: msnbot autorisera l'accès qu'au spider de MSN.

Le fichier le plus couramment utilisé est le suivant:
User-agent : * ce qui veut dire: indexe tout quelque soit ton nom !!!

Essayez cette URL : http://www.fairesonsite.fr/robots.txt


Les erreurs à ne pas faire:

Les crawlers ne peuvent pas interpréter du javascript, du flash, des applets java. Ils ne comprennent pas les frames.
Faites donc vos pages principales en HTML simple et si le coeur vous en dit, faites quelques pages annexes en Javascript, Flash, etc..., mais pas tout le site en Javascript ou en Flash !!
Ne mettez pas de texte de la même couleur que le fond: les spiders récents détecte ce principe et vous risquez d'être blacklisté !!
Ce système est utilisé pour cacher des mots-clés sur les sites.
Si cela vous arrive d'être blacklisté, il vous reste plus qu'à adresser un message au moteur de recherche, en espérant qu'il vous réintègre dans sa base de donnée. Bon courage.....

Evitez de proposer aux moteurs de recherche un site en construction.
Evitez de soumettre un site "creux", en d'autres termes: donnez à manger aux spiders (il faut du contenu dans vos pages, pas 3 mots qui se battent en duel !!).
Ne mettez pas des balises méta en contradiction avec le fichier robots.txt.
Ne négligez pas la balise <title> ! Mettez bien les mots-clés dans cette balise, c'est très important.