Web per gli storici Tirocinio del Corso di Laurea Magistrale in Scienze Storiche
29 maggio 2009
Web per gli storici Tirocinio del Corso di Laurea Magistrale in Scienze Storiche
29 maggio 2009
Imparare a valutare le informazioni che il Web ci fornisce
Prendere contatto con alcuni dei siti Web utili per l’approfondimento degli studi storici
Il programma di oggi
Tipologia delle fonti informative nel web-1
Versione elettroniche di periodici, libri e altri testi a stampa fornite dagli editori
Testi pubblicati solo in versione digitale da parte dell’editore
Biblioteche digitali: testi digitali messi a disposizione da enti non editoriali. Possono essere copie di testi cartacei esenti da copyright oppure opere nate in formato elettronico
Editoria personale: democratica e senza filtri tra autore e lettore
Tipologia delle fonti informative nel web-2
Software, immagini, filmati, suoni. Free o a pagamento
Legislazione
Banche dati commerciali
Siti web aziendali e di enti pubblici
Pubblicità
Persone: contattabili tramite home page personale,
e-mail etc.
Strumenti per la ricerca di informazioni nel Web
Motori di ricerca
Indici Web per argomento
Virtual Reference Desk
Indici Web specializzati
Meta-indici Web
Portali
Altre tipologie
I motori di ricerca I motori di ricerca sono strumenti che ci consentono, grazie ad appositi programmi chiamati spider o robot di “spazzolare” la rete alla ricerca di informazioni, che possono includere oltre che pagine web, video, immagini, news, etc. Di solito i risultati ottenuti non sono tutti pertinenti (rumore). Data la consistenza delle pagine web che vengono introdotte ogni giorno, è impossibile l’intervento umano per individuare il contenuto semantico delle informazioni.
Esempi di motori di ricerca
Alcuni esempi :
Google http://www.google.it/
Yahoo http://it.yahoo.com/?p=us
Windows Live search MSN search http://it.msn.com/
Ask http://it.ask.com/
… e il nuovo Wolfram Alpha( motore di ricerca intelligente!?) http://www.wolframalpha.com/
I motori di ricerca
Nei motori come nelle banche dati e negli opac valgono le regole dell’information retrieval: insieme di tecniche per recuperare l’informazione elettronica
operatori booleani,
operatori relazionali
operatori di prossimità
Criteri usati dai motori
Il criterio maggiormente utilizzato è la rilevanza (relevance ranking) che cela un mix sconosciuto di criteri statistici con cui si ottengono i risultati
I motori per effettuare la ricerca prendono in considerazione i metadati (etichette) che vengono applicate quando si crea una pagina web
I criteri del relevance ranking-1
Frequenza: numero delle volte in cui la parola digitata nella ricerca compare nella pagina web
Densità: rapporto tra la frequenza e il totale delle parole contenute nella pagina
Rarità: rapporto inverso fra il numero di occorrenze del termine usato per la ricerca nel database del motore e il totale delle parole contenute nello stesso database
Compresenza: presenza nella pagina di uno o più dei termini richiesti o tutti. Spesso l’operatore di default è AND e la ricerca privilegia la frase esatta
Prossimità: Presenza di uno o più termini ricercati nella medesima frase o nelle vicinanze
I criteri del relevance ranking-2
Posizione: presenza dei termini in particolari sezioni delle pagina: vengono considerati maggiormente i tag Title, Keyword, Description
Priorità: ordine in cui sono stati digitati i termini di ricerca
Provenienza: pagine provenienti dallo stesso sito sono presentate di seguito, anche l’IP del Computer che si sta usando può influnzare il ranking
età e aggiornamento: a parità di requisiti si privilegiano le pagine più aggiornate e che mantengono da più tempo lo stesso indirizzo URL
Popolarità: numero dei link in entrata da altre pagine e numero delle selezioni di quella pagina effettuate dagli utenti
Tariffazione: Posizione di rilievo a pagamento?
I metadati
I più diffusi sono:
Autore: indica l’autore della pagina, Webmaster
Copyright
Generator: indica il software usato per crearla
Robot: indica ai software di ricerca dei motori se e come tener conto della pagina
Title: il più importante, tra soggetto e titolo uniforme, include le parole più significative per trovare la pagina
Description: breve descrizione dell’abstract della pagina
Keyword: parole chiavi ulteriori ritenute significative per l’autore
INDICI WEB PER ARGOMENTO o Directory
Sono costruite dall’uomo, che seleziona le pagine web, le divide per argomenti ed effettua talvolta una valutazione.
Effetti positivi: diminuisce il rumore, più qualità nei risultati
Effetti negativi: non viene sondato l’intero web, si potrebbero perdere delle informazioni
Indici Web per ArgomentoItaliani
Google directory (Italia)
http://directory.google.it/
Open directory Project http://www.dmoz.org/World/Italiano/
Il Trovatore
http://categorie.iltrovatore.it/
Indici Web per argomento Internazionali
Google directory http://directory.google.com/
Open directory project http://www.dmoz.org/
Yahoo! Directory http://dir.yahoo.com/
Google e i suoi progetti
GOOGLE BOOK SEARCH:
http://books.google.com/
Progetto iniziato nel 2004 con la collaborazione di alcune tra le più importanti biblioteche statunitensi e britanniche per procedere alla digitalizzazione di diversi dei loro testi. Collabora con le Università di Harvard, del Michigan, Stanford, Oxford e la New York Public library
Google Scholar
http://scholar.google.it/
Motore dedicato alla ricerca del materiale accademico e scientifico, sia quello disponibile full text in rete che quello consultabile in una biblioteca o da distributori. Estrae da Google i lavori da lui considerati pertinenti. Non si conoscono i criteri utilizzati, nè la dimensione complessiva della base dati su cui opera.
Virtual Reference desk
Ha molteplici nomi . Sono siti che raccolgono, ordinano e possono anche valutare le risorse disponibili in rete
Possono essere :
Specializzati: vertono su un argomento particolare
generali
Possono avere anche guide che aiutano ad effettuare la ricerca sul web
Esempi di virtual reference desk
BUBL link http://bubl.ac.uk
Internet per gli Umanisti http://biblio.lett.unitn.it/
VRD specializzati
http://www.aib.it/aib/lis/vrd.htm
Indici web specializzati (Lase)
Limited area search engines
Sono a metà tra i motori di ricerca e le directories, applicano la ricerca per parola solo a dei siti dedicati ad una disciplina e raccolti da personale specializzato
Es. Google Book search
Comments