QR code per la pagina originale

Trash Traffic: il valore dell’errore 404

Chi ha il diritto di gestire il traffico generato dagli url inesistenti, il Trash Traffic? Verisign fermato, Microsoft perpetra l'AutoSearch e Paxfire spera. Il bottino vale milioni di dollari.

,

In gergo è denominato ‘Trash Traffic’, traffico spazzatura. Tecnicamente prende forma ogni qualvolta viene cercato un indirizzo o una pagina inesistenti ed il browser restituisce (o almeno questo prevedono gli standard) il famoso errore 404. Dati precisi circa la quantità degli url cercati senza successo non sono disponibili, ma l’interesse che in molti hanno già riservato a questo lato della Rete lascia presupporre che le dimensioni del fenomeno siano di considerevole importanza.

I tentativi di sfruttare l’errore 404 sono già stati infatti numerosi e tali da coinvolgere la filiera del DNS nelle varie sue parti. Tra i vari casi vanno segnalati a titolo esemplare i seguenti:

Verisign
L’azienda che ha ottenuto in affidamento dall’ICANN i domini .net e .com ha scatenato un autentico vespaio il giorno in cui ha messo a punto il famoso SiteFinder: ad ogni url inesistente richiamato da un utente, invece di restituire un messaggio di errore veniva restituito il sito di un motore di ricerca messo a punto da Verisign. Ufficialmente l’azienda ha a suo tempo motivato tale scelta con la volontà di “aiutare” l’utente smarrito, ma è chiaro il tentativo di sfruttare il trash traffic a fini di lucro.

Internet Explorer
Ad oggi è la Microsoft a sfruttare la pagina 404 a proprio vantaggio: il messaggio di errore viene infatti interpretato da Internet Explorer con la stessa "bontà d’animo" dimostrata da Verisign e, per "aiutare" l’utente smarritosi con l’indirizzo sbagliato, da Redmond si suggerisce di provare con MSN Search. Ogni errore diventa dunque un goloso messaggio promozionale per il motore Microsoft. Va segnalato comunque come il predefinito sistema AutoSearch sia facilmente disattivabile modificando le impostazioni avanzate del browser.

Paxfire
La proposta PaxFire è solo l’ultima delle trovate nel settore e consiste in una sorta di normazione dell’errore 404. Il gruppo ha infatti ideato un sistema grazie al quale il trash traffic verrebbe smistato in modo da mettere a disposizione dei vari Internet Service Provider la possibilità di personalizzare il messaggio di errore (gestendo così la propria utenza secondo le modalità preferite): la pagina potrebbe contenere messaggi promozionali ed ogni click costituirebbe un introito sia per Paxfire che per l’ISP convenzionato. Un tentativo di questo genere è stato sperimentalmente portato avanti in partnership con la NeuStar Inc. sui domini .biz e .us solo 5 mesi dopo l’affair Verisign, ma le pressioni dell’ICANN hanno immediatamente fatto desistere dal continuare l’ennesimo esperimento in tal senso.

Ad oggi sono già molti i siti che, personalizzando la pagina 404, evitano all’utente un anonimo messaggio di errore che potrebbe incoraggiare alla chiusura del browser ed all’abbandono del sito. La maggior parte delle pagine non trovate deriva però da errori di digitazione dell’indirizzo principale, dunque tale massa (essendo relativa a siti inesistenti) è esclusivamente modificabile da ISP o browser.

Interessante è il punto di vista secondo il quale Internet sia solo una delle forme possibili sulla Rete. Se Internet gode di una precisa regolamentazione posta in essere da chi ha dato la luce al network, anche la non-Internet (la Internet che sarà, forse, e che comunque ancora non c’è) deve avere le proprie regole e le proprie limitazioni. Come una sorta di anti-materia, anche il trash traffic è parte della realtà ed in quanto tale deve essere sottoposto a regole e vigilanza. Attualmente la IETF (organo deputato a promulgare le regole del mondo web) stabilisce come questa non-Internet debba semplicemente celarsi in toto dietro il numero 404 ed il messaggio "not found".

In occasione del caso SiteFinder, l’ICANN e la IAB diedero il "la" ad un sonoro coro di protesta (seguito dalla replica dell’ISP per vie legali) e Verisign fu costretta a desistere nei propri intenti. Ad oggi si gestisce il redirezionamento del trash traffic solo a livello di browser, e l’affidamento di tale aspetto agli ISP (come predicato da Paxfire) è teoria al momento respinta.

Parallelamente al canonico trash traffic, inoltre, v’è una sorta di mondo ibrido costituito da url assolutamente esistenti e legali, ma volutamente (e astutamente) a metà tra l’indirizzo esistente e quello inesistente. Questo particolare ambito è quello contenente tutti gli indirizzi registrati al fine di simulare un errore nella digitazione di un indirizzo pre-esistente (e normalmente molto famoso). Se il sito www.esempio.it fosse molto noto e godesse di molti accessi, è possibile che una piccola percentuale di utenti possa digitare wwwesempio.it dimenticando il punto dopo il “www”. Una piccola percentuale applicata a grandi numeri da come risultato un modesto introito, e dunque ecco scaturire l’interesse per questi indirizzi particolari. L’entità dell’interesse è poi il lato più oscuro della vicenda: i siti registrati per raccogliere legalmente quello che a tutti gli effetti sarebbe un trash traffic sono spesso architettati per raccogliere denaro in ogni modo. Questo angolo della Rete diventa così una sinfonia di dialer e banner, una suite di link e servizi vari, un cocktail di “Gratis” e “Clicca qui”. Secondo i dati raccolti dal NIC, in Italia i siti registrati con radice ambigua sono circa 2000 (1894 sono i domini che iniziano per “www”: wwwnome.it, wwwwnome.it, www-nome.it e via dicendo).

Il problema è a questo punto più complesso: fino a che punto un espediente è legale nello sfruttamento del trash traffic (e dunque degli errori dei navigatori)? Chi e come dovrebbe tutelare il navigatore di fronte ad eventuali “aguzzini” del 404? Chi ha il diritto di gestire gli url errati ed il relativo lucro conseguente? Secondo Mark Lewyn, portavoce Paxfire, gli url errati potrebbero assommare una percentuale addirittura del 10-20% del totale e già nel lontano 2001 Microsoft valutava in 14 milioni gli url sbagliati ogni giorno: milioni e milioni di errori che valgono milioni e milioni di dollari. Soldi, soldi, soldi. Normale, dunque, cotanta attenzione al problema.