Sitemap o Feed?
Sitemap o Feed?

Nelle ultime settimane, i percorsi di Googlebot (crawler di Google) sono stati oggetto di diverse attenzioni da parte della comunità SEO: se il tuo sito non è accessibile per questo “agente speciale”, ci sono pochissime speranze – infatti – di entrare nell’indice e poi nei risultati di una query.

Per quanto sia “intelligente”, Googlebot non assume mai da solo l’iniziativa per cominciare a rovistare tra i contenuti di un sito appena sfornato e con un DNS da primo tagliando.

Inoltre se il sito nuovo non riceve nemmeno un link dall’esterno, le speranze si riducono con una tendenza a zero…

Anche oggi, come sedici anni fa, Google permette la segnalazione di URL in forma singola: ma basta soffermarsi sulle prime righe del disclaimer per capire che non si tratta del trampolino di lancio ideale per buttarsi nell’oceano di BigG (“non tutti gli URL segnalatici vengono aggiunti all’indice”) e poi è tristemente accostato allo strumento di rimozione.

Quali sono le migliori pratiche per segnalare i tuoi contenuti al crawler di Google?

Prima di tutto evitare la segnalazione di singoli URL: la pratica migliore, più o meno da quando esistono le Google Webmaster Tools, è quella di confezionare mappe di URLs, appunto sitemap in formato XML, con l’elenco di tutti gli URLs del tuo sito (o per lo meno di tutte le pagine che ti interessa monitorare).

Qual’è il formato migliore per una sitemap?

La risposta è comparsa, proprio ieri sulle colonne del blog di Google Webmaster Central e pone fine ad un dubbio amletico nel campo SEO: meglio una XML Sitemap oppure i feed nei formati RSS o Atom?

Sono, in realtà tutti e tre formati XML: condividono la logica di una struttura, dove ogni elemento (URL) può essere descritto da diverse qualità (es. ultima modifica, data di pubblicazione, etc.), ma hanno specifiche e scopi diversi. Per la descrizione delle specifiche tecniche dei formati ti rimando al post di Google.

“Per ottimizzare l’azione di crawling, scrive Alkis Evlogimenos (Google Feeds Team), raccomandiamo di utilizzare sia le XML Sitemap, sia i feed RSS/Atom. Le XML Sitemaps daranno a Google informazioni su tutte le pagine del tuo sito. I feed RSS/Atom forniranno tutti gli aggiornamenti del tuo sito, aiutando Google a mantenere aggiornato il tuo contenuto nel suo indice”.

L’ingresso dei feed nella toplist del crawler non è una sorpresa, ma in questo post Google ammette per la prima volta che attribuisce una rilevanza certa alla proprietà XML che segnala la data di pubblicazione: XML sitemap utilizza il <lastmod> RSS usa invece <pubDate>, mentre Atom il tag <updated>.

Segue il solito disclaimer: “nota bene che sottoscrivere sitemaps o feeds non garantisce l’indicizzazione di quegli URLs”.

Comments are closed.