« Trouts of War step1 | Homepage | WYSWYG HTML Editor per i vostri siti web »
20/03/2006
Motori di Ricerca

Oggi voglio iniziare a parlare di motori di ricerca e per farlo ho pensato bene di introdurre l'argomento parlando di Google.
Tutti noi usiamo google quotidianamente ma forse pochi si sono chiesti come funziona.
Google è il risultato di anni di ricerca di Sergey Brin e Larry Page che presentarono questo progetto come argomento di tesi alla Università di Stanford in California. Fondamentalemente il motore di ricerca, attraverso dei crawler, naviga tra i vari link e immagazzina tutte le pagine HTML (e non) che incontra. Dalle pagine sono estratte le singole parole utilizzate poi come indice in fase di ricerca. Se un utente digita un parola è probabile che ci siano milioni di documenti che contengono quella parola, per cui va definita una priorità. Questa priorità viene detta page rank. In pratica, la priorità di una pagina è funzione della priorità delle pagine che la linkano e quelle da essa linkate. Quindi più una pagina è popolare più ha probabilità di comparire nelle prime posizioni.
Per nostra fortuna su Internet esiste ancora un documento dei due ricercatori sul funzionamento di Google. Leggetelo è un'ottima base di partenza.
L'algoritmo basato sulla popolarità, però, non fu un'idea dei due ricercatori, bensì' di Massimo Marchiori.
Furono gli stessi padri di Google a dirlo quando il loro lavoro fu lanciato nel 1998.
Da questo documento estraggo alcune sue affermazioni:
"Larry Page e Sergey Brin hanno preso l'idea iniziale di Hypersearch, hanno considerato la variante "popolare" che io avevo valutato come meno efficace e hanno effettuato in maniera elegante le giuste semplificazioni per renderla usabile su larga scala da un motore di ricerca veloce. E infatti mi hanno citato, correttamente, quando hanno lanciato Google nel 1998".
"I motori di ricerca del futuro dialogheranno con gli utenti guidandoli nei vari passi della ricerca. Le idee per fare un motore di terza generazione le ho da tempo, anche se al momento preferisco tenerle per me. Il problema sta soprattutto nelle risorse: per dimostrare la bonta' di un motore occorre poi farlo funzionare su scala mondiale, non basta pubblicare l'idea in un articolo. Per esempio, Hypersearch, a mio giudizio, e' superiore a Pagerank, eppure quasi nessuno lo conosce, per il semplice motivo che non c'e' un motore di ricerca che mostri la bonta' dell'idea su larga scala. Per competere con Google non bastano solo idee innovative, occorrono mezzi e risorse, e certamente, avendo un po' di risorse, sarebbe una sfida stimolante".
Attualmente Massimo Marchiori è ricercatore all'università di Venezia e lavora al MIT nel World Wide Web Consortium al fianco dell'inventore del web Tim Berners-Lee.
PS
Metto a disposizione le pagine del blog e del wiki di Open Community per chiunque voglia pubblicare articoli sui motori di ricerca oppure piccoli esempi relativi a Hypersearch (di cui sicuramente ci occuperemo in futuro).
10:35 Scritto in Vari | Link permanente | Commenti (1) | Manda | Tag: Informatica e telefonia
Commenti
Grazie, una semplice spiegazione per una misteriosa domanda ricorrente che mi ero sempre posto ! 8-))
Scritto da : ilsolito | 15/04/2006

