Configurer sitemap, robots.txt et htaccess pour son rfrencement

Configurer le fichier sitemap, robots.txt et htaccess pour son rfrencement

Quest ce quun fichier sitemap ?

Un fichier sitemap (nomdusitemap.xml) est utilis pour indiquer Google les ressources de notre site (page, images, vidos, actualits) que vous souhaitez faire apparatre sur google. Cest un fichier destin Google pour lui indiquer les ressources crawler, et ainsi indexer. Lorsque vous indiquez une ressource dans le sitemap, Google va lanalyser et, si tout se passe bien, lindexer.

Un fichier sitemap permet dacclrer lindexation de vos pages sur Google mais namliore pas vos positions.

 

Configurer un fichier sitemap pour son rfrencement

Un fichier sitemap peut contenir jusque 50 000 URL. Si vous avez besoin de plus dURL, il est possible de crer une arborescence de sitemaps. Vous devez crire les URL compltes (avec http(s)://) et lencodage du fichier doit tre en UTF-8.

Il existe des sites gratuits qui soccuperont de gnrer votre sitemap en indiquant lURL de votre site. Ces sites sont souvent limits 500 URLS. Vous pouvez galement crer votre sitemap vous mme.

Placez votre fichier nomdusitemap.xml la racine de votre sous-domaine. Une fois cela fait, dclarez votre sitemap dans votre compte Google Search Console pour prvenir Google que vous avez actualis votre sitemap !

 

Quest quun fichier robots.txt ?

Le fichier robots.txt avertit les robots des moteurs de recherche du contenu indexer ou ne pas indexer. Cest le premier fichier que le robot explore quand il se rend sur votre site web, pour savoir en premier lieu ce quil peut ou ne peut pas indexer. Le fichier robots.txt est inclure la racine de votre site et le nom ne peut pas tre modifi.

 

Configurer un fichier robots.txt pour son rfrencement

Un fichier robots.txt se construit selon 4 commandes : user-agent, allow, disallow, sitemap.

En premier lieu, prcisez la commande User-agent : *
Ltoile permet de cibler le robot dun moteur de recherche. Utilisez * pour signer tous. Si vous souhaitez donner diffrentes directives suivant les moteurs de recherche, sachez que tout ce que vous crirez entre deux user-agent: sera li au user-agent prcdant les directives. Sautez des lignes entre chaque directive.

Ensuite, dclarez les ressources que vous souhaitez autoriser (Allow) ou bloquer (Disallow). Commencer par crire Disallow: /. Grce cela, vous dites que vous ne bloquez rien.

Les prochaines instructions sont suivant ce que vous dsirez bloquer ou non. Sur un site wordpress, vous souhaiterez probablement refuser laccs ladministration. Pour cela, utilisez la commande Disallow: /wp-admin/. Ajoutez galement la commande Allow: /wp-admin/admin-ajax.php, car elle permet de laisser actif les plugins qui passent par ce fichier.

A noter que normalement, vous ne devriez pas avoir utiliser le robots.txt pour dsindexer des pages spcifiques telles que les pages catgories ou les pages portfolio. Cela doit se faire depuis les paramtres de votre site.

A la fin de votre robots.txt, vous pouvez galement indiquer votre sitemap en plus de lavoir indiqu dans votre compte Google Search Console sous la forme :
Sitemap: https://www.votresite.com/nomdusitemap.xml

 

Quest quun fichier htaccess ?

.htaccess est le nom d’un fichier de configuration du serveur web le plus rpandu sur Internet, prsent dans le rpertoire principal de votre site. Ses fonctions sont multiples, car le .htaccess agit sur les paramtres du serveur web et ainsi sur votre site entier.

 

Configurer un fichier htaccess pour son rfrencement

Redirections

Cela marche pour ceux tant sur CMS ou ceux sans. En effet, mme si de nombreux plugins de redirection existent sur CMS, il faut quand mme rentrer la main chaque redirection et cela peut tre trs long si vous changez, par exemple, le nom dune catgorie de blog.

Vous pouvez crire ces redirections directement via le htaccess en utilisant la ligne :
Redirect NUMBER https://urldedpart https://urldarrivee. Indiquez le numro de redirection que vous souhaitez faire la place de NUMBER. Gnralement, on applique une redirection permanente 301, mais il est aussi possible dutiliser une redirection temporaire 302. Pour tre plus rapide, nous vous conseillons dadopter la technique suivante :
Utilisez excel et remplissez redirect 301 dans la premire colonne
La deuxime colonne sera pour lURL rediriger (possibilit de mettre sans le nom de domaine)
La troisime colonne sera pour lURL darrive (obligation de mettre lURL entire)
Copiez collez le tout dans votre fichier htaccess, cela sautera automatique des lignes

 

Rcriture dURL

Il est possible de rcrire des URL, ce qui est dfinitivement indispensable pour vos URL exotiques existantes sur certains CMS. Il faut savoir que cest lURL darrive, qui remplacera votre URL exotique, qui sera ds lors prise en compte dans votre rfrencement. Vous pourrez ainsi insrer des mots cls dans vos URL pour amliorer votre rfrencement naturel. Cest galement un critre scuritaire pour ne pas voir comment sont forms les attributs de votre site par des gens extrieurs.

Une URL exotique est par exemple de la forme : http://monsite.fr/articles/article.php?id=15
Le serveur demande laccs larticle ayant lidentifiant 15. Vous pouvez, grce la technique dURL Rewritingvia le fichier .htaccess, transformer cette criture en une URL optimise pour le rfrencement.

 

Dure de cache

La vitesse de chargement dune page est un critre pour le rfrencement naturel qui est en train de prendre de plus en plus dimportance, que ce soit sur votre site en version web ou en version mobile. Cest pourquoi il est fortement recommand dutiliser la mise en cache, cest dire de stocker localement sur le cache de lordinateur de vos visiteurs les donnes de votre site qui ne sont pas amenes tre mises jour quotidiennement. Quand les utilisateurs reviendront sur votre site, ils nauront ainsi pas besoin de recharger toutes ces donnes.

Grce au .htaccess, vous pouvez demander la compression de vos fichiers, mais aussi le temps de mise en cache de chaque type de contenu que vous avez sur vos pages (images, videos, css, ).

 

Scurisation

Les menaces concernant les vols de site ou les vols de contenus de site sont prendre au srieux pour diverses raisons ; votre rfrencement peut srieusement en ptir pour cause de duplication de contenus si exactement le mme contenu que votre site se trouve autre part, des sites similaires au vtre peuvent nuire votre rputation sils ont des images ayant comme adresse de stockage votre site, etc. Grce au htaccess, vous pouvez scuriser votre site et vos dossiers administrateurs comme vos dossiers de contenu.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *