Bologna 40125, Italy
+39 347 517 719
info@htware.it

Che fine hanno fatto i dati strutturati? Tutti i brevetti di Google sulle SERP (2)

Tutti i brevetti di Google sui dati strutturati
Tutti i brevetti di Google sui dati strutturati (2)

Tutti i brevetti di Google sui dati strutturati (2)

[Torna alla prima parte]

Che valore hanno le entità semantiche presenti in un documento web?

Soprattutto: che valore hanno per Google, come le misura oppure come ha intenzione di misurarle?

Ecco la seconda parte delle considerazioni di Barbara Starr (Search Engine Land) sui brevetti di Google a proposito di misurazione (e unità di misura correlate) delle entità semantiche.

1) Metrica di parentela

La metrica di parentela osserva le co-occorrenze di un’entità e della sua tipologia (type) nei documenti web.

Il “tipo” è generalmente una categorizzazione oppure la definizione delle caratteristiche di un’entità. Ad esempio Al Pacino (entità) e attore (tipo di entità).

Questo invece l’esempio riportato nella descrizione del brevetto di Google.

Se la query di ricerca contiene l’entità “Empire State Building”, che appartiene al tipo di entità “grattacielo”, possono essere rilevanti tutte le co-occorrenze rilevate nelle pagine web tra i testi “empire state building” e “grattacielo”.

In altre parole, dice Starr, quando tu digiti una query di ricerca, Google potrebbe determinare quale pagina è più o meno rilevante in funzione delle parole (entità) correlate incluse nella pagina.

2) Metrica delle entità notevoli

Questa metrica, scrive Starr, è riferita a una particolare occorrenza: quando un’entità può essere categorizzata sotto diversi tipi di entità, rileva solo il tipo più notevole rispetto ad altri. Ad esempio, Barack Obama potrebbe essere categorizzato come autore, politico, oratore e celebrità, ma è più noto al mondo come Presidente degli USA.

Questa metrica prende in considerazione anche l’ipotesi che entità multiple potrebbero essere ricondotte alla stessa entità, per esempio quella più rilevante per chi ha effettuato la ricerca.

“In alcune implementazioni, cita testuale la descrizione del brevetto, il valore della metrica notable entity type è quello di una metrica di popolarità globale diviso per la classificazione di un’entità notevole. La classificazione indica la posizione di un tipo di entità all’interno di una lista di tipi notevoli.”.

[Vai alla terza parte]