03 Maggio 2005 ore 09:00

Google News premierà la 'qualità'

Secondo un articolo di New Scientist, Google potrebbe modificare l'algoritmo che gestisce il suo sito di news. Più peso dato all'importanza delle fonti.

Lo scoop è di New Scientist. Un articolo apparso sul sito della prestigiosa rivista, rivela l'esistenza del brevetto WO 2005/029368 presentato da alcuni ricercatori di Google. Si tratta di un sistema per ordinare la presentazione delle notizie in home page e i risultati delle ricerche svolte su Google News in base alla qualità della fonte e non più soltanto in base alla data o alla rilevanza rispetto ai termini usati nella ricerca. Nell'articolo si afferma che il meccanismo potrebbe essere applicato anche ad altri tipi di ricerca.

Per capire la portata di questa svolta è necessario ricordare come funziona Google News. Si tratta di un aggregatore che senza alcun intervento umano scandaglia migliaia di siti di news estrapolandone link, titoli e sommari che vengono poi riproposti sulla home page e sulle pagine interne del sito. È l'algoritmo su cui si fonda a decidere quali notizie meritano il passaggio sulla pagina principale e quali no. È lo stesso algoritmo a stabilire poi la gerarchia tra le fonti, con un criterio quanto meno discutibile, per cui ha maggiore rilievo l'ultima notizia pubblicata su uno specifico argomento. Questo meccanismo è stato da molti criticato proprio per l'assenza di un filtro umano ed è incorso, come quello che è alla base del motore di ricerca, in numerosi tentativi, spesso riusciti, di sfruttarne il funzionamento per attirare traffico su un sito a fronte di contenuti non proprio originali.

A Mountain View devono aver capito che alla lunga questa modalità di presentare le news avrebbe potuto minare la credibilità del servizio. Se e quando il nuovo sistema sarà implementato, ad avere più peso sarà la 'qualità' delle fonti giornalistiche. Ma chi misurerà questa 'qualita'? La filosofia di fondo di Google News non cambierà. Ad operare le scelte sarà sempre un algoritmo, ma questa volta opportunamente programmato per valutare l'importanza dei siti. Secondo New Scientist, il cuore del sistema dovrebbe essere un database costantemente aggiornato con dati come il numero di articoli e news prodotti da ciascuna fonte, la lunghezza media dei pezzi, le risorse umane impiegate dall'azienda, il volume di traffico dei siti internet, il numero di nazioni da cui arrivano contatti ai siti stessi, etc. Dalla valutazione incrociata di questi dati dovrebbe scaturire un numero indice in base al quale posizionare news e risultati di ricerche. Un meccanismo in grado di premiare, come si diceva, la qualità e la credibilità.

Non è difficile intuire l'esito di questa rivoluzione. Organizzazioni come BBC, CNN, New York Times, Reuters, e da noi, quindi, quelle legate ai principali quotidiani, alle agenzie e alle reti televisive, potrebbero avere un indubbio vantaggio. Se il precedente sistema aveva operato una sorta di livellamento, questo riproporrà in rete gerarchie consolidate fuori dalla rete stessa.

E qui tocchiamo un punto delicato, un argomento che sta già ora suscitando reazioni non del tutto favorevoli alla mossa di Google. Si tratta per lo più di speculazioni, dal momento che si esprimono valutazioni in base al solo contenuto dell'articolo di New Scientist, senza avere quindi una controprova. Il ragionamento di molti, intanto, è che credibilità, qualità o fiducia non possono essere misurate con complicate operazioni matematiche. È solo il giudizio di una mente pensante che può valutarle. I criteri scelti per la misurazione, poi, rischiano di portare a risultati non meno controversi di quelli attuali. Potrebbe per esempio accadere che un articolo di recensione su una nuova macchina fotografica digitale pubblicato da Reuters o CNN abbia più rilievo di uno sullo stesso modello uscito su DP Review, che è riconosciuto da tutti come il sito di riferimento sull'argomento.

Ripetiamo: si tratta solo di speculazioni, nessuno può davvero dire come opererà il nuovo algoritmo. L'unica certezza sembra essere che il tema della 'fiducia', della credibilità, è ai primi posti nell'agenda di manager e ricercatori di Google. È dei giorni scorsi un'altra notizia secondo cui la società fondata da Page e Brin avrebbe chiesto e ottenuto la registrazione del marchio TrustRank. Di cosa si tratta? Una versione rivista e aggiornata del PageRank? Forse. Chi vuole farsi un'idea di tutte le possibili illazioni può dare un'occhiata a questo lunghissimo thread su Slashdot. Uno spiraglio sul significato dell'espressione e sulle implicazioni possibili per Google e per gli altri motori di ricerca potrebbe venire dalla lettura di un paper pubblicato da due ricercatori dell'università di Stanford insieme a Jan Pedersen di Yahoo!. Nell'articolo gli autori presentano una tecnica in grado di distinguere le pagine attinenti da quelle create esclusivamente per ottenere un alto ranking nei risultati delle ricerche. Forse per gli spammer dei motori si avvicinano tempi duri. Speriamo.

Dì la tua: commenta la notizia

Tags: google (1086), news (19), algoritmo (8)

Commenti

  • Pagine

Totali - Visualizzati -

  • Pagine

Inserisci il tuo commento

Dal blog

David Drummond, 1.7 mln di consolazione

David Drummond, Senior Vice President, Corporate Development and Chief Legal Officer di Google. Un documento della SEC attesta per lui un bonus annuale da 1.7 milioni di euro (in aggiunta ai 450000...