 |
Le
référencement
|
|
Le
référencement est tout d'abord le travail qui
consiste
à optimiser le classement d'un site internet dans les
moteurs de
recherche ou les annuaires afin d'augmenter le nombre de visiteurs.
Pour
cela, plusieurs techniques sont possibles. Certaines sont payantes,
d'autres gratuites mais dans tous les cas, le
référencement d'un site est long (plusieurs
semaines voir
plusieurs mois). Il est vrai que de passer par des professionnels
favorise un référencement rapide, mais est-ce
vraiment
rentable pour un particulier ?
Les annuaires:
L'inscription
de votre site dans les annuaires est longue. En effet, pour chaque
demande d'inscription, il faut remplir un formulaire (nom du site, URL,
E-mail, description, etc...). Pour gagner du temps, pensez à
noter dans un fichier texte tous les renseignements
nécessaires,
il vous suffira de faire des copier/coller. L'inscription est
néanmoins rapide (<15 jours).
Certains
annuaires vous demande d'inscrire un lien retour sur une page
partenaire, d'autres non.
Pour
trouver les annuaires ? Prenez votre moteur de recherche
préféré (Exalead, MSN, Google,
etc....) et
saisissez les termes suivants: annuaire
referencement. Vous devriez avoir l'embarras du choix.
Si
vous trouvez ça trop long, vous pouvez faire appel aux
logiciels spécialisés...
Les logiciels
spécialisés:
Ces
logiciels font exactement le même travail que
précédemment, mais sur plusieurs milliers
d'annuaires.
Ils sont généralement payants. A vous de voir
selon votre
budget.
Les moteurs de recherches:
Inutile
de vous les présenter: Exalead,
Google, Yahoo, MSN,
Exite, Lycos, AOL,
Altavista, Francité, Alltheweb, etc...
Il
est possible d'inscrire son site sur les principaux moteurs de
recherche de façon totalement gratuite ou payante.
L'inscription
payante est (vous vous en doutez !) beaucoup plus rapide et garantie !!
Pour
vous inscrire, trouvez le lien (Proposez
votre site, Submit
your site, etc....), remplissez les formulaires et surtout
.... de la patience !!. Une attente de plusieurs semaines n'est pas
rare.
Inutile
également de s'inscrire sur tous les moteurs: le moteur
d'AOL
est celui d'Exalead, le moteur d'Altavista est celui de Yahoo,
etc...
Les
échanges de liens:
Pour
ma part, la meilleure façon de se faire
référencer
c'est l'échange de liens. En effet, le but
est d'avoir le maximum de liens qui "pointent" vers votre site. Google
par exemple, définit la popularité d'un site en
fonction
du nombre de "backlinks" dirigés vers ce site.
Cette
popularité est appelé "Pagerank", et bien
sûr, plus
le site est populaire (pagerank elevé), mieux il sera
présenté lors des
recherches.
Il
faut donc que vous trouviez des "sites amis" avec lesquels vous allez
échanger des liens, d'où l'utilité
d'une page
"partenaire" quand vous contruisez un site (pensez-y !!).
Mais pourquoi mettre des
liens ?
Tout simplement à cause des robots (crawlers ou
spiders). Chaque
moteur de recherche possède des spiders qui
parcourent le web
mondial pour indéxer de nouvelles pages ou simplement les
mettre
à jour. Quand un spider va passer sur un site ami
(qui a donc
inséré un lien pointant vers votre site) il va se
diriger
vers votre site et indexer vos pages dans sa base de
données. C'est de cette façon que l'on se
retrouve dans
la bases de données des moteurs de recherche. Simple non ?
En
visualisant les logs de votre site, on voit
régulièrement (plusieurs fois par semaine) les
spiders.
Chaque moteur de recherche a son
propre spider:
- Yahoo: slurp
- Google:
googlebot
- MSN: msnbot
- Exalead:
exabot
- ......
Pour
effectuer un référencement correct de votre site,
il faudra penser à aider
les spiders à parcourir l'ensemble de vos
pages en
intégrant des balises méta et un fichier
"robots.txt".
Les
balises méta:
Les balises
méta doivent être renseignées dans
l'en-tête de votre page web entre les balises
<head> et </head> (après la
balise </title>.
Les principales sont
les balises content-type, description,
keywords et robots.
-
La balise méta content-type
indique le jeu de caractères utilisé.
Elle permet au moteur de recherche de bien interpréter les
caractères spéciaux (accents).
Exemple: <meta
http-equiv="content-type" content="text/html;
charset=iso-8859-1">
-
La
balise méta description
permet de proposer
un résumé du contenu de votre page.
Exemple: <meta
name="description" content="Site sur le
référencement de votre site internet.>
-
La balise méta keywords
sert à fournir une liste de
mots-clés nécessaires aux spiders.
Exemple: <meta
name="keywords" content="referencement, site, internet, web, balise,
meta">
- La balise
méta robots
permet d'indiquer aux spiders comment
référencer vos pages. Il y a plusieurs attributs
possibles:
- all: le
spider
indexe tout.
- none:
le spider indexe rien (votre page ne sera jamais
indexée).
- index: votre
page
est indexée.
- noindex:
le spider
n'indexera pas votre page mais suivra les liens (href=...)
- follow:
le spider
suivra les liens pour les référencer plus tard.
- nofollow:
le spider ne suivra pas les liens.
Exemple: <meta
name="robots" content="all">
Il est
possible de cumuler les fonctions: "content=noindex,
nofollow" est parfaitement valide.
Le fichier robots.txt:
Attention:
c'est bien robots.txt (au pluriel et en minuscule) et non pas robot.txt !
Quand
un spider va arriver sur votre site, il va se mettre à
"crawler" toutes vos pages. Il va d'abord vérifier la
présence (ou non) du fichier robots.txt
à la racine
de votre site web.
Ce fichier va simplement donner l'ordre aux
spider de ne pas indéxer telle ou telle page pour plusieures
raisons (copyright, en cours de construction, page confidentielle,
etc...). Si ce fichier n'existe pas, il va crawler toutes les pages.
La
structure de ce fichier est la suivante:
User-Agent:
*
Disallow:
/repertoire
User-Agent: *
signifie que l'accès à tous les spiders est
accordé.
Disallow:
/repertoire signifie que le spider n'ira pas crawler le
répertoire repertoire
Exemples: User-Agent:
msnbot autorisera l'accès qu'au spider de MSN.
Le
fichier le plus couramment utilisé est le suivant:
User-agent : * ce
qui veut dire: indexe tout quelque soit ton nom
!!!
Essayez
cette URL : http://www.fairesonsite.fr/robots.txt
Les erreurs à ne pas
faire:
Les
crawlers ne peuvent pas interpréter du javascript,
du flash, des applets java. Ils ne comprennent pas les frames.
Faites
donc vos pages principales en HTML
simple et si le coeur vous en dit, faites quelques pages
annexes en Javascript, Flash, etc..., mais
pas tout le site en
Javascript ou en Flash !!
Ne
mettez pas de texte de la même couleur que le fond: les
spiders récents détecte ce principe et vous
risquez d'être blacklisté
!!
Ce système est utilisé pour cacher
des mots-clés sur les sites.
Si cela vous arrive
d'être blacklisté, il vous reste plus
qu'à adresser un message au moteur de recherche, en
espérant qu'il vous réintègre dans sa
base de donnée. Bon courage.....
Evitez
de proposer aux moteurs de recherche un site en construction.
Evitez
de soumettre un site "creux", en d'autres termes: donnez à manger aux
spiders (il faut du contenu dans vos pages, pas 3 mots qui
se battent en duel !!).
Ne mettez pas des balises
méta en contradiction avec le fichier robots.txt.
Ne
négligez pas la balise <title> ! Mettez bien
les
mots-clés dans cette balise, c'est très important.
|