Bologna 40125, Italy
+39 347 517 719
info@htware.it

Cosa non può “vedere” un motore di ricerca su una pagina web ?

Cosa vede e cosa non vede un motore di ricerca
Cosa vede e cosa non vede un motore di ricerca

Cosa vede e cosa non vede un motore di ricerca

A chiusura del nostro esame oculare sui motori di ricerca, è bene scoprire anche cosa non può vedere un motore di ricerca.

Per esempio, benché i motori di ricerca siano in grado di rilevare immagini su una pagina web, hanno solo una piccola idea del soggetto dell’immagine, fatta eccezione per le informazioni testuali che sono state fornite come tag ALT. Possono rilevare il colore dei pixel e, in molti casi, determinare se un’immagine abbia contenuto pornografico dalla quantità di toni color carne in un’immagine JPEG, ma non possono affermare che un’immagine sia la fotografia di una donna, piuttosto che di un uomo.
In aggiunta i motori di ricerca non riconoscono il testo renderizzato in un’immagine. Su questo ci sono alcuni esperimenti in corso per applicare le tecnologie OCR (riconoscimento ottico dei caratteri) per l’estrazione del testo dalle immagini, ma sono ancora in fase beta.

Anche i file audio e video non sono di facile lettura per un motore di ricerca: come per le immagini, anche questi dati non sono facili da scorrere. Ci sono solo un paio di eccezioni dove i motori di ricerca possono estrarre qualche dato limitato: i tag ID3 nei file MP3 oppure i podcast in formato AAC arricchiti con note testuali.

Inoltre i motori di ricerca non possono leggere i contenuti di un programma. I motori di ricerca cercano solo il testo che sia leggibile da occhi umani, estrapolandolo dal codice sorgente di una pagina web. Un esempio di una tecnologia che è capace di presentare contenuti importanti e leggibili, ma che i motori di ricerca non possono invece leggere, è AJAX.

AJAX è un metodo, basato su Javascript per rendere, in modo dinamico, il contenuto di una pagina web dopo averlo recuperato da un database, ma senza dover aggiornare l’intera pagina.
Viene utilizzato spesso in web tools dove un visitatore, fornendo alcuni input ottiene all’istante (senza caricare una nuova pagina) il contenuto richiesto. Il contenuto viene restituito da uno script eseguito sul computer locale (pc dell’utente) e solo dopo aver ricevuto una richiesta dall’utente: quindi, fino a che non viene richiesto non può essere presente nell’HTML della pagina e quindi i motori di ricerca non possono vederlo.

Anche il contenuto di FRAME e IFRAME può presentate alcuni problemi rispetto ai motori di ricerca: quando vengono usati per recuperare il contenuto di altre pagine all’interno del sito web (FRAMESET) o di altri siti esterni (IFRAMES), i motori di ricerca ignorano il loro contenuto perché perde la caratteristica di unicità. In altre parole il contenuto preso da un altro sito non è considerato come parte del contenuto unico della pagina web.