Introducció
El fitxer robots.txt
és un arxiu de text senzill que es col·loca a la carpeta arrel del teu lloc web. Aquest fitxer proporciona instruccions als motors de cerca sobre quines pàgines o seccions del teu lloc web poden rastrejar i indexar. És una eina essencial per controlar l'accés dels robots de cerca i optimitzar el SEO tècnic del teu lloc web.
Objectius del fitxer Robots.txt
- Controlar l'accés dels robots de cerca: Permet especificar quines parts del lloc web poden ser rastrejades.
- Evitar la sobrecàrrega del servidor: Limita el nombre de pàgines que els robots poden rastrejar, reduint la càrrega del servidor.
- Protegir informació sensible: Impedeix que els motors de cerca accedeixin a pàgines que contenen informació confidencial o no rellevant.
Estructura del fitxer Robots.txt
El fitxer robots.txt
segueix una estructura senzilla basada en directives. Les directives més comunes són User-agent
i Disallow
.
Directives Principals
- User-agent: Indica a quin robot de cerca s'apliquen les regles següents.
- Disallow: Especifica les URL que no es permeten rastrejar.
Exemple Bàsic
En aquest exemple:
User-agent: *
indica que les regles s'apliquen a tots els robots de cerca.Disallow: /admin/
iDisallow: /private/
impedeixen que els robots rastregin les carpetes/admin/
i/private/
.
Directives Addicionals
- Allow: Permet l'accés a una URL específica dins d'una carpeta desautoritzada.
- Sitemap: Indica la ubicació del fitxer sitemap XML.
Exemple Avançat
User-agent: Googlebot Disallow: /no-google/ User-agent: * Disallow: /private/ Allow: /private/public-page.html Sitemap: https://www.example.com/sitemap.xml
En aquest exemple:
User-agent: Googlebot
aplica les regles només al robot de Google.Disallow: /no-google/
impedeix que Googlebot rastregi la carpeta/no-google/
.User-agent: *
aplica les regles a tots els robots de cerca.Disallow: /private/
impedeix que tots els robots rastregin la carpeta/private/
.Allow: /private/public-page.html
permet l'accés a una pàgina específica dins de la carpeta desautoritzada.Sitemap: https://www.example.com/sitemap.xml
indica la ubicació del fitxer sitemap XML.
Bones Pràctiques
- Ubicació correcta: Col·loca el fitxer
robots.txt
a la carpeta arrel del teu lloc web (per exemple,https://www.example.com/robots.txt
). - Revisió regular: Actualitza el fitxer
robots.txt
regularment per assegurar-te que reflecteix els canvis en l'estructura del teu lloc web. - Evitar errors: Assegura't que les directives no bloquegin pàgines importants per al SEO.
- Utilitzar eines de validació: Utilitza eines com Google Search Console per verificar que el fitxer
robots.txt
funciona correctament.
Exercici Pràctic
Tasca
Crea un fitxer robots.txt
per a un lloc web fictici amb les següents especificacions:
- Bloqueja l'accés a la carpeta
/admin/
per a tots els robots. - Permet l'accés a la pàgina
/admin/public-info.html
dins de la carpeta bloquejada. - Bloqueja l'accés a la carpeta
/temp/
només per al robot de Bing. - Inclou la ubicació del fitxer sitemap XML a
https://www.fictici.com/sitemap.xml
.
Solució
User-agent: * Disallow: /admin/ Allow: /admin/public-info.html User-agent: Bingbot Disallow: /temp/ Sitemap: https://www.fictici.com/sitemap.xml
Conclusió
El fitxer robots.txt
és una eina poderosa per controlar com els motors de cerca interactuen amb el teu lloc web. Una configuració adequada pot ajudar a optimitzar el rendiment del teu lloc web i protegir informació sensible. Assegura't de seguir les bones pràctiques i revisar regularment el teu fitxer robots.txt
per mantenir-lo actualitzat i efectiu.
Curs de SEO (Optimització per a Motors de Cerca)
Mòdul 1: Introducció al SEO
- Què és el SEO?
- Per què és important el SEO
- Com funcionen els motors de cerca
- Terminologia bàsica del SEO
Mòdul 2: Recerca de Paraules Clau
- Introducció a la recerca de paraules clau
- Eines per a la recerca de paraules clau
- Trobar les paraules clau adequades
- Analitzar la competència de paraules clau
Mòdul 3: SEO On-Page
- Etiquetes de títol i descripcions meta
- Etiquetes de capçalera i estructura de contingut
- URLs amigables per al SEO
- Enllaços interns
- Optimització d'imatges
Mòdul 4: SEO Tècnic
- Optimització de la velocitat del lloc web
- Optimització per a mòbils
- Sitemaps XML
- Robots.txt
- Dades estructurades i marcatge de l'esquema
Mòdul 5: SEO Off-Page
- Estratègies de construcció d'enllaços
- Blogging com a convidat
- Xarxes socials i SEO
- Gestió de la reputació en línia
Mòdul 6: SEO Local
Mòdul 7: Analítica i Informes de SEO
- Google Analytics per al SEO
- Google Search Console
- Mètriques i KPIs del SEO
- Creació d'informes de SEO
Mòdul 8: Estratègies Avançades de SEO
- Tècniques avançades de recerca de paraules clau
- Màrqueting de continguts i SEO
- Optimització per a la cerca per veu
- SEO internacional
- SEO per a comerç electrònic