Il file robots.txt: questo sconosciuto!

Oggi scopriamo come compilare correttamente il file robots.txt per essere letto dagli spider dei motori di ricerca.

Fondamentale per istruire i motori

Il file robots.txt è il primo elemento che viene cercato dai motori di ricerca all’interno di un sito perchè li istruisce su come devono comportarsi durante la cosiddetta operazione di crawling, ovverosia di scansione del sito alla ricerca di contenuti da indicizzare.

È un normalissimo file di testo, con estensione, appunto “txt”, tutto scritto in minuscolo e con una sintassi particolare.

Indicazioni su “fare” e “non fare”

Essenzialmente, tutti i comandi che si usano all’interno del file robots.txt consentono di spiegare al motore di ricerca che ci sono delle cose che deve fare e altre che deve non fare. Per esempio, il comando Disallow impedisce una operazione.

Tutti i comandi sono preceduti dalla direttiva User-Agent che specifica a quale motore di ricerca è diretto un particolare comando che segue.

Escludere directory “tecniche”

L’esclusione di directory fa si che, anche se il motore di ricerca viene informato dell’esistenza di un particolare percorso, non vi entri con lo scopo di indicizzare i file.

È una cosa diversa dalla protezione di una directory con password lato server, perchè comunque quello darebbe la possibilità al motore di indicizzare la singola cartella (pur non potendo indicizzare quanto vi è all’interno).

Indicare la presenza della sitemap

Mediante la direttiva Sitemap indichiamo al motore di ricerca la presenza di un file XML (compresso o meno) da utilizzare per sapere quali sono le pagine che vanno indicizzate in un particolare ambiente. È sempre bene che sia prevista.

File robots.txt e CMS

CMS tradizionali come ad esempio WordPress, creano virtualmente questo file, la cui visualizzazione è gestita tramite il controller delle pagine e non c’è un file fisicamente presente nel filesystem. Crearne uno è profondamente sbagliato, perchè comunque non si aggancerebbe alle modifiche dinamiche che fa il CMS stesso.

Deve sempre essere presente

Prevedere l’inserimento di un file robots in qualsiasi situazione è sempre una pratica corretta, perchè ci consente di essere sicuri che qualsiasi motore di ricerca effettui una operazione di crawling del nostro sito, riesca a sapere da subito tutte le informazioni di cui ha bisogno.

Esempi pratici

Per permettere l’accesso a tutto il sito web, non indicare niente nella direttiva Disallow:

User-agent: *
Disallow:

Per bloccare un intero sito, si utilizza uno “slash”:

User-agent: *
Disallow: /

Per bloccare una directory e il relativo contenuto, fai seguire il nome della cartella o directory da una barra:

User-agent: *
Disallow: /mia-directory/

Per bloccare una pagina, va indicata la pagina in questione:

User-agent: *
Disallow: pagina-che-vogliamo-bloccare.html

Se vuoi maggiori informazioni o una consulenza riguardo il file robots.txt, contattami tramite il form qui sotto o tramite la pagina contatti del sito.

Giacomo Mazzoni

Mi chiamo Giacomo Mazzoni e sono un Consulente SEO e Web Marketing freelance di Lucca. Sono anche fondatore del network di liberi professionisti Omada. Offro consulenze sulla SEO e sulle basi del Web Marketing, anche nel settore del turismo e realizzo siti web SEO oriented, soprattutto in WordPress, ma anche siti personalizzati in html e css.

Prossimo Sottodomini e server: come gestirli e perchè »

Precendente « Sitemap: come scriverla o generarla

Lascia un commento

Pubblicato da

Giacomo Mazzoni

7 anni fa

Articoli recenti

Fare SEO: perché è fondamentale se hai un’attività locale

In questo articolo parleremo dell'importanza della SEO per le attività locali. Ottimizzare il proprio sito…

9 mesi fa

Max Del Rosso: “La Mia esperienza come SEO Specialist ha dato forma a Quantum SEO”

Max Del Rosso è un esperto SEO di lunga esperienza, con una solida reputazione nel…

11 mesi fa

Hardware e Software

Come risolvere il problema “Logitech Cordless Device” driver not installed!

Quando ho collegato il ricevitore USB Unify di Logitech al mio portatile, Windows non è…

1 anno fa

Copywriting

Come iniziare a fare il copywriter: Guida pratica per entrare nel mondo della scrittura persuasiva

Il copywriting è l’arte di scrivere testi pubblicitari con l’obiettivo di persuadere un pubblico a…

2 anni fa

Quanto costa una consulenza SEO? Scopri il valore dei servizi di ottimizzazione per i motori di ricerca!

Quanto costa la consulenza SEO? Scopri il valore dei servizi di ottimizzazione per i motori…

2 anni fa

Consigli di base

Come usare Facebook in modo intelligente

Sei pronto a sfruttare al meglio il potenziale di Facebook? Questo social network può essere…

2 anni fa

Questo sito utilizza cookie per migliorare la tua esperienza di navigazione. Navigando in questo sito accetti l'uso di cookie.

Il file robots.txt: questo sconosciuto!

Fondamentale per istruire i motori

Indicazioni su “fare” e “non fare”

Escludere directory “tecniche”

Indicare la presenza della sitemap

File robots.txt e CMS

Deve sempre essere presente

Esempi pratici

Se vuoi maggiori informazioni o una consulenza riguardo il file robots.txt, contattami tramite il form qui sotto o tramite la pagina contatti del sito.

Articoli correlati

Articoli recenti

Fare SEO: perché è fondamentale se hai un’attività locale

Max Del Rosso: “La Mia esperienza come SEO Specialist ha dato forma a Quantum SEO”

Come risolvere il problema “Logitech Cordless Device” driver not installed!

Come iniziare a fare il copywriter: Guida pratica per entrare nel mondo della scrittura persuasiva

Quanto costa una consulenza SEO? Scopri il valore dei servizi di ottimizzazione per i motori di ricerca!

Come usare Facebook in modo intelligente