Quanto pesa una community?

In Italia le community online si raggruppano prevalentemente attorno ad alcuni poli ben specifici di contenuto, argomentazioni che risultano aggregative e che hanno nel tempo dato vita a nuclei molto popolati e partecipati di utenti. E anche online una verità sembra essere assodata: l’Italia è una repubblica fondata sul lavoro.

Il grassetto sul “sembra” non è casuale.

La ricerca è stata portata avanti dal prof. Marco Pellegrini per l’istituto di Informatica e Telematica del Cnr di Pisa. L’obiettivo posto dai ricercatori è stato quello di individuare quelle che sono le community più importanti sul web italiano (convenzionalmente quello identificato dal ominio .it), commisurandone le dimensioni ed evidenziando in seguito le argomentazioni di maggiore impatto sull’utenza. In tutto risultano essere state vagliate 31 milioni di pagine web (anno di riferimento 2004) e 1.150 milioni di link. Per completare l’indagine, il metodo è stato altresì applicato al dominio .uk.

Il risultato grezzo vede HTML.it tra i maggiori nomi del web italiano ed al fianco di Hardware Upgrade tra le maggiori community informatiche (i due poli coprono però due orizzonti differenti dello stesso ambiente). Ma se alcune di queste community sono riconosciute ed importanti, altre sembrano invece dare alla classifica una scarsa credibilità (fermo restando il fatto che giunge a fine 2007 con dati del 2004):

  1. Wonder.it (22.533.670)
  2. Libero.it (2.723.364)
  3. Hotlinks.it (2.283.521)
  4. Tiscali.it (1.898.809)
  5. Outseek.it (1.735.121)
  6. Kataweb (1.491.147)
  7. Hwupgrade (1.195.380)
  8. Virgilio.it (1.188.850)
  9. eBay.it (864.662)
  10. Eco-rete (706.308)
  11. Comuni pugliesi (709.290)
  12. Excite.it (690.306)
  13. Cremonaweb (540.540)
  14. HTML.it (486.992)
  15. Apriti Sesamo (479.169)

Lycos in 23esima posizione, Jumpy in 24esima, Rai in 26esima e Splinder in 27esima. Il numero tra parentesi è il dato quantitativo adoperato per creare il ranking proposto (per quanto approssimativa ed opinabile: «la valutazione della dimensione di una comunità tramite il conteggio del numero di link ci dà una importante misura quantitativa oltre alla discriminante qualitativa […] è naturale che chi possiede un insieme di pagine sulla stessa macchina favorisca la navigazione collegandole con dei link. Tuttavia questi link testimoniano solo dell’interesse di un’unica persona. Molto più importanti sono i link che collegano pagine di domini (macchine) diversi, che e quindi presumibilmente sono indice di una importanza oggettiva e non soggettiva delle pagine coinvolte»).

Tra le dinamiche di maggior rilievo identificate dalla ricerca emergono una maggiore generalità dei contenuti rispetto ad esempio al Regno Unito (dove i portali generalisti godono di molto minor pregio) ed una forte esistenza dell’associazionismo e del mondo non-profit. Inoltre, spiega Pellegrini, «nel Web italiano la classifica delle aree di interesse vede al primo posto i siti dedicati al mercato del lavoro, seguiti dai portali generici e, in terza posizione, dalle pagine Web di enti locali e associazioni di categoria. Gli anglosassoni, di converso, premiano lo shopping, seguito da telefonia e turismo. Proprio il gap sull’offerta turistica – ampio e significativo: in Italia appena al 14esimo posto – fa pensare che da noi manchi ancora un’adeguata presenza di operatori, nonostante il turismo sia da sempre considerato uno dei settori trainanti dell’economia italiana»: notizia particolarmente tetra, questa, in un paese che proprio in queste ore vede affossarsi colpo su colpo il fantasmagorico progetto di Italia.it legato proprio all’offerta turistica nazionale.

Il metodo utilizzato per portare a compimento la ricerca si basa sui concetti di “tifosi” e di “centro“: «se una pagina ha molti link in uscita è etichettata come tifoso, in quanto esprime interesse per il contenuto di altre pagine. Se una pagina è visitata da molti link, allora è detta “centro” in quanto rappresenta un centro di interesse per molti tifosi. Un gruppo di tifosi che abbiano molti centri in comune rappresentano una comunità». Questo tipo di sintesi permette di identificare le comunità maggiori (con più di 10 “tifosi”) ed il peso (in link) che hanno nei confronti del contenuto di interesse. Un’estrazione delle parole chiave adoperate, infine, permette di suddicidere le varie community in categorie di interesse, potendo così avere un quadro generale sufficientemente approssimativo relativamente ai fenomeni aggregativi della rete.

Risulta quantomeno semplice andare a proporre opinioni divergenti rispetto al modello operativo programmato dal prof. Pellegrini. Il modus operandi, in effetti, non fa che avvicinarsi al modello proposto già dai motori di ricerca, i quali identificano in ogni singola keyword un nucleo di interesse e valutano quantitativamente e qualitativamente un ranking specifico per restituire risultati compiuti ad ogni query proposta (pur se con strumenti molto più sofisticati). L’analisi di una community, però, meriterebbe considerazioni ulteriori. Se il link è infatti un mezzo attraverso cui avvicinarsi ad un “luogo”, la permanenza nel “luogo” stesso non può essere misurata in accessi dall’esterno. Nè giudicata con egual parametro. Ed in questo aspetto l’intera risultanza finale risulta minata alla base.

Forse è proprio il termine “community” a non reggere. Forse si è creata una base minimale per una sorta di alter-PageRank in grado di analizzare macro-dinamiche del web. Forse l’idea non chiara è in quello che i numeri ottenuti restituiscono. Forse è l’unità di misura a non essere omogenea, e confrontare chili, euro e km è un’impresa poco plausibile. O forse semplicemente non si è considerato il fatto che la community è prima di tutto un luogo di interazione e che il tempo passato su una pagina è in certi casi più utile del numero di volte con cui vi si arriva dall’esterno. Se poi si aggiunge l’esplosione dei blog (e di cose dal 2004 ad oggi ne sono successe parecchie), la ricerca perde proprio di significato. Ma forse non tutto è perduto: una importante base di partenza è un buon modo per iniziare a erigere qualcosa di importante. E la capacità di analizzare milioni di pagine e miliardi di link è sempre e comunque una buona base di partenza. Non buttiamo via tutto per l’ennesima volta. Ma ascolti il consiglio, prof. Pellegrini, non si fermi qui: perchè la verità è ancora lontana.

Update:
Il blog di Hardware Upgrade, e Tagliaerbe nello specifico, la vede a quanto pare allo stesso modo

Ti consigliamo anche

Link copiato negli appunti