Errori HTTP 404 e 410
Errori HTTP 404 e 410

Ci sono due tipi di errori che un web server potrebbe restituire ad un browser oppure al crawler di Google: l’errore 404 e l’errore 410.

Nel suo ultimo video Matt Cutts, capo della Search Spam di Google, ne spiega la differenza e il modo in cui Google gestisce le due diverse tipologie.

La domanda che viene posta a Cutts è semplice e diretta:
“Google si comporta in modo diverso quando incontra un 404 piuttosto che un 410?”

Sono entrambi errori restituiti quando una pagina non è disponibile, sia che venga richiesta da un browser, sia da Googlebot.
Rispetto all’errore 404, il 410 è un errore di stato che indica la rimozione completa di una pagina: ovvero non si tratta di un problema temporaneo, ma definitivo.

Cutts dice che Google gestisce in modo leggermente diverso i due stati di errore: quando il suo crawler incontra un errore 404 oppure anche altri stati (es. 401 e 403), Google mette la pagina in uno stato di quarantena per le successive 24 ore.

L’errore 404 infatti può verificarsi anche per periodi brevi e può essere dovuto a diverse cause: tra queste Cutts elenca le rimozioni involontarie, una configurazione sbagliata del robots.txt, un server in stato di stallo perchè attaccato oppure semplicemente in manutenzione.
La quarantena di 24 ore permette quindi al crawler di tornare in un secondo momento, per verificare se lo stato di errore sia stato risolto oppure no. Nel primo caso l’errore viene cancellato, mentre nel secondo la pagina con l’errore ancora attivo viene rimossa dall’indice.

Se invece Googlebot incontra un messaggio con l’errore 410, la pagina viene subito segnalata con l’errore.
Anche in questo caso, però Cutts ammette che vengono fatti controlli successivi per verificare che l’errore segnalato sia corretto ed evitare un falso positivo: ugualmente possono verificarsi bug o problemi sul web server, che poi vengono risolti e le pagine apparentemente rimosse in modo definitivo riprendono vita.

In ogni modo Cutts invita tutti i webmaster a non preoccuparsi troppo per questo genere di errori: se si tratta di problemi solo temporanei, Google dà a tutti il tempo necessario per porvi rimedio. L’errore 404 infatti potrebbe essere l’anticamera per la sostituzione di una pagina con un’altra (mediante redirect 301).

Va un po’ meno in questa direzione l’errore 410, ma se implementato è utile per dare un chiaro segnale al crawler, che provvederà in tempi più brevi a rimuovere la pagina dall’indice di Google.

Ecco il video integrale di Matt Cutts:

Comments are closed.