Microsoft sotto accusa: IA addestrata con libri pirata

#image_title
Un gruppo di celebri autori, tra cui Kai Bird, Jia Tolentino e Daniel Okrent, ha intentato una causa contro Microsoft, accusando l’azienda di aver utilizzato circa 200.000 libri digitali piratati per addestrare un sistema di intelligenza artificiale chiamato Megatron.
La denuncia, depositata presso un tribunale federale di New York, rappresenta l’ennesimo episodio di una lunga e sempre più accesa battaglia legale tra creatori di contenuti e giganti della tecnologia.
Secondo quanto affermato nella causa, Microsoft avrebbe sfruttato senza autorizzazione una vasta collezione di opere protette da copyright per alimentare l’addestramento del suo modello di IA, che genera testi su richiesta degli utenti.
Gli autori chiedono al tribunale di emettere un’ordinanza per fermare la presunta violazione e un risarcimento fino a 150.000 dollari per ciascun libro utilizzato impropriamente.
Il modello Megatron, secondo la denuncia, è stato progettato non solo per apprendere dalla creatività altrui, ma per replicare attivamente stile, sintassi, voce e temi dei testi originari.
La portata dell’accusa è significativa. Se confermata, solleverebbe interrogativi profondi sull’origine dei dati impiegati per costruire modelli di IA generativa e sui limiti legali dell’uso del materiale protetto da copyright.
Al momento, Microsoft non ha rilasciato dichiarazioni ufficiali, mentre gli avvocati dei querelanti si sono limitati a un “no comment”.
Il contesto legale è complesso e in continua evoluzione. Solo un giorno prima della denuncia contro Microsoft, un giudice federale della California ha emesso una sentenza nella causa contro Anthropic, stabilendo che l’uso di opere protette per addestrare IA può, in certi casi, rientrare nel cosiddetto “fair use” previsto dalla legge americana sul copyright.
Tuttavia, Anthropic potrebbe comunque essere ritenuta responsabile per il possesso e l’utilizzo di materiale piratato.
E non è finita qui. Nello stesso periodo, un’altra corte si è pronunciata a favore di Meta in una causa simile, anche se ha riconosciuto che la decisione era dovuta principalmente alla debolezza delle argomentazioni dei querelanti, più che alla forza della difesa della compagnia.
Nel frattempo, le vertenze legali si moltiplicano. Il New York Times ha avviato un’azione legale contro OpenAI, sostenendo che il suo archivio è stato utilizzato impropriamente per addestrare ChatGPT.
Dow Jones ha intrapreso un percorso simile contro Perplexity AI. Anche l’industria musicale e quella cinematografica hanno iniziato a difendersi legalmente: le major discografiche hanno fatto causa a società che producono IA musicali, mentre Disney e NBC Universal hanno recentemente denunciato Midjourney per l’uso illecito dei loro iconici personaggi.
Le aziende tecnologiche difendono il proprio operato sostenendo che l’uso del materiale protetto da copyright è “trasformativo” e rientra nel fair use.
Sam Altman, CEO di OpenAI, ha dichiarato che strumenti come ChatGPT “non sarebbero mai potuti esistere” senza l’accesso a tali contenuti.
La posta in gioco è altissima: in gioco non c’è solo il futuro della creatività digitale, ma anche l’equilibrio tra diritti degli autori e innovazione tecnologica.