QR code per la pagina originale

Google News premierà la ‘qualità’

Secondo un articolo di New Scientist, Google potrebbe modificare l'algoritmo che gestisce il suo sito di news. Più peso dato all'importanza delle fonti.

,

Lo scoop è di New Scientist. Un articolo
apparso sul sito della prestigiosa rivista, rivela l’esistenza del brevetto WO
2005/029368
presentato da alcuni ricercatori di Google. Si tratta di
un sistema per ordinare la presentazione delle notizie in home page e i risultati
delle ricerche svolte su Google News in base alla qualità della fonte e
non più soltanto in base alla data o alla rilevanza rispetto ai termini
usati nella ricerca. Nell’articolo si afferma che il meccanismo potrebbe essere
applicato anche ad altri tipi di ricerca.

Per capire la portata di questa svolta è necessario ricordare come funziona
Google News. Si tratta di un aggregatore che senza alcun intervento umano scandaglia
migliaia di siti di news estrapolandone link, titoli e sommari che vengono poi
riproposti sulla home page e sulle pagine interne del sito. È l’algoritmo
su cui si fonda a decidere quali notizie meritano il passaggio sulla pagina principale
e quali no. È lo stesso algoritmo a stabilire poi la gerarchia tra le fonti,
con un criterio quanto meno discutibile, per cui ha maggiore rilievo l’ultima
notizia pubblicata su uno specifico argomento. Questo meccanismo è stato
da molti criticato proprio per l’assenza di un filtro umano ed è incorso,
come quello che è alla base del motore di ricerca, in numerosi tentativi,
spesso riusciti, di sfruttarne il funzionamento per attirare traffico su un sito
a fronte di contenuti non proprio originali.

A Mountain View devono aver capito che alla lunga questa modalità di
presentare le news avrebbe potuto minare la credibilità del servizio. Se
e quando il nuovo sistema sarà implementato, ad avere più peso sarà
la ‘qualità’ delle fonti giornalistiche. Ma chi misurerà questa
‘qualita’? La filosofia di fondo di Google News non cambierà. Ad operare
le scelte sarà sempre un algoritmo, ma questa volta opportunamente programmato
per valutare l’importanza dei siti. Secondo New Scientist, il cuore del sistema
dovrebbe essere un database costantemente aggiornato con dati come il numero di
articoli e news prodotti da ciascuna fonte, la lunghezza media dei pezzi, le risorse
umane impiegate dall’azienda, il volume di traffico dei siti internet, il numero
di nazioni da cui arrivano contatti ai siti stessi, etc. Dalla valutazione incrociata
di questi dati dovrebbe scaturire un numero indice in base al quale posizionare
news e risultati di ricerche. Un meccanismo in grado di premiare, come si diceva,
la qualità e la credibilità.

Non è difficile intuire l’esito di questa rivoluzione. Organizzazioni
come BBC, CNN, New York Times, Reuters, e da noi, quindi, quelle legate ai principali
quotidiani, alle agenzie e alle reti televisive, potrebbero avere un indubbio
vantaggio. Se il precedente sistema aveva operato una sorta di livellamento, questo
riproporrà in rete gerarchie consolidate fuori dalla rete stessa.

E qui tocchiamo un punto delicato, un argomento che sta già ora suscitando
reazioni
non del tutto favorevoli alla mossa di Google. Si tratta per lo più di
speculazioni, dal momento che si esprimono valutazioni in base al solo contenuto
dell’articolo di New Scientist, senza avere quindi una controprova. Il ragionamento
di molti, intanto, è che credibilità, qualità o fiducia non
possono essere misurate con complicate operazioni matematiche. È solo il
giudizio di una mente pensante che può valutarle. I criteri scelti per
la misurazione, poi, rischiano di portare a risultati non meno controversi di
quelli attuali. Potrebbe per esempio accadere che un articolo di recensione su
una nuova macchina fotografica digitale pubblicato da Reuters o CNN abbia più
rilievo di uno sullo stesso modello uscito su DP
Review
, che è riconosciuto da tutti come il sito di riferimento sull’argomento.

Ripetiamo: si tratta solo di speculazioni, nessuno può davvero dire
come opererà il nuovo algoritmo. L’unica certezza sembra essere che il
tema della ‘fiducia’, della credibilità, è ai primi posti nell’agenda
di manager e ricercatori di Google. È dei giorni scorsi un’altra notizia
secondo cui la società fondata da Page e Brin avrebbe chiesto e ottenuto
la registrazione del marchio TrustRank. Di cosa si tratta? Una versione
rivista e aggiornata del PageRank? Forse. Chi vuole farsi un’idea di tutte le
possibili illazioni può dare un’occhiata a questo lunghissimo thread su
Slashdot.
Uno spiraglio sul significato dell’espressione e sulle implicazioni possibili
per Google e per gli altri motori di ricerca potrebbe venire dalla lettura di
un paper
pubblicato da due ricercatori dell’università di Stanford insieme a Jan
Pedersen di Yahoo!. Nell’articolo gli autori presentano una tecnica in grado di
distinguere le pagine attinenti da quelle create esclusivamente per ottenere un
alto ranking nei risultati delle ricerche. Forse per gli spammer dei motori si
avvicinano tempi duri. Speriamo.