MAMA, spiegaci come è fatto il Web

Opera ha pubblicato i primi risultati ottenuti attraverso l’utilizzo di MAMA, motore di ricerca per la struttura delle pagine Web realizzato internamente dalla società. Lo strumento sarà reso pubblico nei prossimi mesi

Si chiama MAMA, acronimo di Metadata Analysis and Mining Application, e rappresenta un motore di ricerca di nuova concezione realizzato internamente da Opera Software. A differenziarlo dai numerosi motori di ricerca presenti sul Web è la sua capacità di analizzare la struttura delle pagine, anziché semplicemente il testo in esse contenuto, permettendo così di ottenere interessanti informazioni sulle tecnologie più utilizzate all’interno della grande rete e sulla loro implementazione. Al momento Opera si è limitata a fornire alcuni risultati delle sue ricerche interne, ma lo strumento dovrebbe essere reso pubblico entro pochi mesi.

Si apprende così che i tag HTML più popolari sono i vari HEAD, TITLE, HTML, BODY, A, META, IMG e TABLE, mentre i meno utilizzati in assoluto sono VAR, DEL e BDO. Adobe Flash risulta presente nel 35% delle pagine analizzate da MAMA (circa 3 milioni e mezzo), con picchi di utilizzo in Cina (ove è presente nel 67% delle pagine). Fanalino di coda la Danimarca, ove Flash è presente solamente nel 25% pelle pagine. Il componente XMLHttpRequest, elemento fondamentale della tecnica di sviluppo web conosciuta come Ajax, viene utilizzato nel 3,2% dei siti Web indicizzati e risulta particolarmente popolare in Norvegia, ove la percentuale sale al 10%. Sorprendentemente popolare l’utilizzo dei fogli di stile a cascata (CSS), scovati da MAMA all’interno dell’80% dei siti analizzati; le proprietà più popolari sono apparse essere “color” e “font”. Molto utilizzato anche il codice JavaScript, presente nel 75% dei siti indicizzati.

MAMA è in grado di controllare anche l’aderenza delle pagine agli standard del Web; si scopre così che solo il 4,13% degli URL analizzati passa correttamente la validazione W3C. Opera ha quindi deciso di analizzare i meta tag presenti nelle pagine per capire se esiste una correlazione tra i programmi utilizzati per creare le pagine Web e la loro correttezza. A sorpresa, è iWeb di Apple ad apparire correlato alla maggior parte delle pagine valide (81%), mentre sono stati creati con Adobe Dreamweaver solamente il 3,4% dei siti ritenuti aderenti agli standard.

MAMA è stato realizzato con l’intento di offrire agli sviluppatori uno strumento semplice e veloce per analizzare la struttura delle pagine Web ed è mirato a studiare la popolarità di alcune tecnologie all’interno della grande rete e a scoprire esattamente cosa accade online. «Il Web è frammentato, complesso e in costante evoluzione», ha dichiarato Snorre M. Grimsby, vice presidente per la qualità ad Opera. «Il vasto database di MAMA ci offre informazioni dettagliate sulle tecnologie Web utilizzate. […] Faremo tutto ciò che è necessario per testare il nostro prodotto e assicurare qualità, stabilità e performance, e vogliamo condividerlo con i nostri colleghi, in modo che anche essi possano beneficiarne».

Ti potrebbe interessare