Come trovare il Web invisibile

Non tutte le pagine Web sono rintracciabili dagli spider dei motori di ricerca; anche quando una pagina può essere raggiunta, tuttavia, non sempre può essere analizzata e inserita nell’indice. Esiste un “Web invisibile”…

The Invisible Web: Uncovering Information Sources Search Engines Can't See.
Titolo “The Invisible Web: Uncovering Information Sources Search Engines Can’t See.”
Autori Chris Sherman, Gary Price
Editore Information Today
Pagine 439
Anno 2001
Prezzo 29,95 $


Non tutte le pagine Web sono rintracciabili dagli spider dei motori di ricerca; anche quando una pagina può essere raggiunta, tuttavia, non sempre può essere analizzata e inserita nell’indice. Esiste un “Web invisibile” o “deep Web” costituito da file inaccessibili. I motori di oggi riescono a leggere i file in Pdf di Adobe, e possono catalogare le immagini usando le parole contenute nelle pagine che le agganciano, ma per le pagine dinamiche, costruite al volo, o per le animazioni in Flash, o ancora per i file audio e video e quelli in formato compresso l’indicizzazione è più difficile. In particolare, restano fuori dai motori le informazioni contenute nei data base, gli archivi di dati, spesso protetti anche da meccanismi di iscrizione.

Il libro di Sherman e Price, due professionisti dell’information retrieval, dopo avere ripercorso storia e caratteristiche dei principali strumenti per la ricerca in Internet, spiega quali risorse sono invisibili, perché, quando sono utili e quali strategie servono per individuarle, con degli esempi molto chiari, per esempio sui brevetti o sulle serie storiche di quotazioni di borsa. Quasi 250 pagine sono dedicate a elenchi di directory e motori specializzati, suddivisi per argomento e affiancati da un buon indice analitico; gran parte di questo lavoro, ancora interessante pur essendo poco recente, si ritrova nel sito dedicato al libro, all’indirizzo http://www.invisible-web.net.

In ciò che è Web invisibile cercano diversi motori o directory specializzati. Profusion di Intelliseek , per esempio, sulle ricerche di medicina o relative a mappe e geografia propone delle indicazioni con categorie in cui sono stati inseriti anche archivi e altre risorse di solito non presenti in altri indici. L’invisible Web è anche in parte l’obiettivo della directory dei “Reference” realizzata da Lycos.
Per il Web invisibile italiano è da tenere presente la directory “Guida alle banche dati italiane”, molto ben curata.

(Fabio Metitieri)