Internet e Navigazione

Lezione 8 - I motori di ricerca

World Wide Web è la risorsa Internet probabilmente più nota, e i suoi ritmi di espansione sono esponenziali. Le pagine informative immesse in rete riguardano gli argomenti più vari, e provengono da fornitori di informazione di natura assai eterogenea: dalle università alle industrie private (grandi e piccole), dai centri di ricerca ai negozi, dalle imprese editoriali ai partiti politici. Vi sono poi le numerosissime 'home page' personali del popolo di Internet.

Ci sono tuttavia alcuni siti che molti navigatori in rete, e soprattutto quelli alle prime armi, sembrano considerare un punto di partenza privilegiato. Si tratta dei cosidetti portali (il corrispondente termine inglese è portal o web portal). Come suggerisce il termine un portale è innanzitutto una sorta di “porta di accesso”: un sito che, più che riguardare un argomento specifico e determinato, offre una rassegna di notizie, collegamenti e rimandi, 'appetibile' per una vasta gamma di utenti e frequentemente aggiornata. Il portale, insomma, fornisce dei suggerimenti all'utente appena collegato: mentre la pagina bianca del browser sembra chiederci "dove vuoi andare oggi?" senza fornire alcun suggerimento al riguardo, il portale pone la stessa domanda ma fornisce alcune indicazioni: "ecco, queste sono le novità che oggi ho selezionato per te, c'è qualcosa che ti può interessare?"

Di solito, un portale si caratterizza dunque per il fatto di offrire una sorta di 'copertina' quotidiana (che magari può essere personalizzata da parte dell'utente) alla sterminata raccolta delle pagine di World Wide Web. Inoltre, un portale offre quasi sempre anche strumenti di ricerca: il navigatore che non volesse soffermarsi sui link suggeriti dal portale può così 'trovare' le proprie destinazioni attraverso una ricerca per termini o all'interno di un elenco di categorie (vedi oltre). Non a caso, moltissimi tra i portali più visitati coincidono con alcuni fra i più importanti motori di ricerca.

Infine, molti portali offrono servizi aggiuntivi, come la possibilità di creare e gestire account gratuiti di posta elettronica, spazio web gratuito, invio SMS ecc.

Ma perché i gestori di un portale dovrebbero darsi la briga di creare pagine così complesse, che richiedono evidentemente notevoli risorse e un aggiornamento continuo? La risposta è semplice: chi riesce a fare del proprio sito un punto di partenza adottato da molti navigatori potrà vendere a caro prezzo la pubblicità ospitata (difficilmente troverete un portale privo di 'affissioni' pubblicitarie, i piccoli annunci rettangolari ormai universalmente chiamati con il termine inglese 'banner'); inoltre garantirà una larga audience alle notizie e alle informazioni selezionate attraverso le proprie pagine.

Internet è dunque un mondo di informazioni così vasto e ricco che cercare qualcosa di specifico può diventare un problema. Chi svolge una ricerca in rete si trova davanti un duplice problema: reperire l'informazione cercata e valutare la sua correttezza, completezza, imparzialità.

Quanto al primo problema, quello di scoprire le pagine esistenti che si occupano di un determinato argomento, una buona base di partenza è in genere rappresentata dai motori di ricerca, enormi banche dati nelle quali sono archiviati, per il loro contenuto, i siti web che popolano la rete.

Vi sono due tipi di risorse che è bene conoscere: i motori di ricerca per termini e gli indici sistematici (directory).

I motori di ricerca per termini permettono di ricercare parole o combinazioni di parole. La ricerca attraverso un indice per termini è molto comoda nel caso di nomi propri, o nel caso in cui le informazioni che vogliamo trovare si lascino caratterizzare attraverso termini molto specifici. Occorre tuttavia tenere presente che si tratta di una ricerca meccanica: il programma utilizzato non farà altro che cercare i termini da noi forniti all'interno di un immenso indice alfabetico in suo possesso (indice tenuto aggiornato da un 'demone' software che si muove continuamente lungo la rete, seguendo ogni link incontrato e indicizzando tutte le pagine percorse) e fornirci le corrispondenze trovate. L'intelligenza della ricerca dipende dunque in gran parte dalla scelta delle parole usate come parametri, anche se quasi tutti i motori di ricerca hanno la capacità di 'pesare' i risultati in base a elementi quali il numero di occorrenze della parola, l'occorrenza in zone significative del documento come i titoli o i link, e così via. Ciò significa che se abbiamo scelto bene i nostri termini di ricerca, riceveremo un elenco di pagine che avrà alte possibilità di iniziare da quelle per noi più significative.

Al contrario della ricerca alfabetica, la ricerca sistematica (o ricerca per directory) avviene su cataloghi ragionati di risorse: in genere la base dati è più ristretta (non saremo sicuri di trovare direttamente tutte, o anche solo la maggioranza delle pagine che ci interessano), ma la valutazione della pertinenza o meno di una determinata informazione non sarà più meccanica, bensì risultato di una decisione umana.

Un catalogo ragionato di questo tipo si basa su una sorta di 'albero delle scienze', da percorrere partendo da categorizzazioni più generali per arrivare via via a categorizzazioni più specifiche. Ed è importante che questo percorso di 'discesa al particolare' avvenga attraverso percorsi intuitivi e coerenti - compito naturalmente tutt'altro che facile.

Quindi se non si sta cercando qualcosa di specifico, ma si vogliono approfondire determinati  argomenti, come la cucina, il cinema e così via, risulta più opportuno utilizzare una ricerca per directory. Se infatti si digitassero questi termini in un indice questo ci darebbe come risultato milioni di pagine con all’interno la parola “cucina”, per es., magari presente su siti in cui si parla di tutt’altro.

D’altro canto quando si sta cercando qualcosa di molto specifico, questo difficilmente potrebbe essere scovato aprendo tutti i siti catalogati in una directory. Non bisogna dimenticare, inoltre, che proprio quello che costituisce uno dei punti di forza delle directory, ne costituisce anche un elemento di debolezza: il fatto che queste siano gestite da persone in carne ed ossa fa sì che il numero dei siti recensiti sia limitato rispetto a quanto è in grado di fare uno spider automatico. Insomma: un indice contiene molte più pagine di quelle presenti su una directory, anche se in modo non ordinato né organizzato.


Scarica allegati

Scarica Lezione8.pdf

Lezione8.pdf

Documento PDF (429.5 Kb)

LOGIN

Se sei iscritto, effettua l'accesso al sito:

› Non sei ancora iscritto?

› Hai dimenticato la password?

PER I CANDIDATI
per i candidati
PER LE AZIENDE
per le aziende