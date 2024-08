Apple ha offerto milioni di dollari agli editori per il diritto di effettuare il cosiddetto scraping dei loro siti, ovvero il processo tramite il quale si estraggono i dati, si elaborano le informazioni e le si organizzano in un database per addestrare la propria intelligenza artificiale. Google, al contrario ritiene che tutti i dati debbano essere liberamente disponibili, non c’è divieto che tenga in tal senso. Molti siti però stanno adottando una contromisura contro lo scraping, e per Apple Intelligence questo può diventare un problema.

Il blocco dello scraping è molto semplice: si tratta di un semplice file di testo denominato robots.txt. Secondo Wired , molti importanti editori americani stanno scegliendo di utilizzarlo per bloccare l’addestramento dell’intelligenza artificiale di Apple. Attenzione, il blocco non ha valore legale, ne è efficace al 100%, si può bypassare senza troppi problemi. Nonostante ciò molti siti di notizie l’hanno implementato per bloccare l’addestramento di Apple Intelligence. Tra quelli più importanti ci sono:

The New York Times

Facebook

Instagram

Craigslist

Timblr

Financial Times

The Atlantic

USA Today

Conde Nast

Wired afferma che due studi principali svolti la scorsa settimana hanno dimostrato che circa il 6-7% dei siti web ad alto traffico bloccano lo strumento di ricerca di Apple, denominato Applebot-Extended. Quindi un ulteriore studio di Ben Welsh, anch’esso condotto la scorsa settimana, afferma che poco più del 25% dei siti controllati blocca Applebot-Extended.

Il motivo, secondo Wired, della bassa percentuale di siti che adottano il blocco dello scraping risiede nel fatto che in pochi conoscono Applebot-Extended. E questo è molto strano visto che Applebot-Extended è “figlio” di un bot online dal 2015, AppleBot, usato da Siri e Spotlight.

E’ più realistico pensare che il tasso di blocchi sia basso per eventuali accordi commerciali di utilizzo dei dati alla fonte, come quello multimilionario stipulato la scorsa primavera dalla casa di Cupertino con Shutterstock. Si parla quindi di milioni di immagini a completa disposizione di Apple.

Se c’è chi ha fatto un’accordo, c’è anche chi ha fatto causa. New York Times ha infatti citato in giudizio OpenAI per violazione del copyright Charlie Stadtlander del quotidiano ha affermato che: come chiariscono la legge e i termini di servizio del Times, è vietato copiare o utilizzare i nostri contenuti per scopi commerciali senza la nostra previa autorizzazione scritta. E’ importante sottolineare che la legge sul copyright è ancora valida indipendentemente dal fatto che siano in atto o meno misure di blocco tecnico.