Intelligenza artificiale nel giornalismo e le battaglie giudiziarie sul copyright

06/02/2025

immagine realizzata con IA Midjourney

"LA RILEVANZA"

REPORT 2025
Approfondimenti tematici

Intelligenza artificiale nel giornalismo e le battaglie giudiziarie sul copyright

Deborah Bianchi
Avvocato in diritto dell’internet

INTRODUZIONE

L’intelligenza artificiale non sarà una miniera d’oro per gli editori^[1]: gli introiti milionari derivanti dalla licenza di utilizzo concessa per ChatGPT, frutto dell’accordo con OpenAI, rappresentano solo l’1% delle entrate totali delle case editrici licenzianti come Axel Springer o Dotdash Meredith.

“Secondo le previsioni di Nielsen – si legge – è improbabile che nel prossimo futuro la maggioranza degli editori possa trarre entrate significative dalla concessione in licenza di contenuti alle aziende tecnologiche. Puntare in maniera sostanziale a questi accordi potrebbe rivelarsi una strategia rischiosa e limitante. Questo approccio “miope” rischia di non essere sostenibile nel lungo termine”.

Gli accordi tra gli Editori e le GenAI companies principalmente stabiliscono che – dietro compensi milionari – le piattaforme come Search GPT possano addestrarsi sui “contenuti nobili” degli editori e per ogni out-put riferito a una notizia si sono obbligate a inserire il link di collegamento al relativo giornale. Tuttavia, è improbabile che ciò possa costruire un traffico di referall significativo. È invece quasi certo che l’utente, una volta ottenuta la notizia, si senta appagato senza ulteriormente peregrinare per il web cliccando sull’url della fonte. Ecco fatto: il Search GPT del momento ha asfaltato i giornali-partners.

Allora la ragione va agli editori che hanno imboccato la via giudiziaria sul copyright?

Al momento non conosciamo nei dettagli i super blindati accordi di OpenAI con gli editori ma possiamo assistere alla nascita dei protocolli congiunti imposti dai giudici nelle cause di copyright. Si tratta di atti derivanti dalla collaborazione forzata (dal tribunale) di tutti o quasi tutti gli stakeholders (editori, autori, GenAI companies) attivatisi secondo il processo iterativo dettato dal giudice. A cosa porteranno nella pratica?

A nuovi frameworks di coesistenza, a nuovi tipi di licenze ad hoc tra autori e GenAI companies oppure tra editori, autori e GenAI companies.

Che differenza c’è con gli attuali accordi blindati? Una licenza di settore è un atto conoscibile da tutti e proprio per questo accessibile al dibattito pubblico capace di introdurre adeguati guardrails sia nell’in-put che nell’out-put del modello alla ricerca di una qualche credibilità (fiducia?) presso i cittadini.

Un’infosfera in cui macchine leggono macchine

Il giornale è un’opera che riguarda tutti parimenti i GenAI interrelati con il mondo dell’informazione devono essere “partecipati” da tutti. Un’illusione?

Se i modelli intelligenti non verranno abitati dagli interessati finiremo per avere un’infosfera in cui macchine leggono macchine. Piacerebbe un mondo dell’informazione siffatto agli inserzionisti? Questi investono per raggiungere gli umani … le macchine non hanno il portafoglio.

Una panoramica globale

Conosciamole dunque queste cause sul copyright che dovrebbero dare vita a nuovi frameworks partecipati da tutti.

Nella relazione che segue, si parte da una panoramica globale sul tema copyright e GenAI applicata ai vari contenziosi nel mondo che incorona gli Stati Uniti quale osservatorio giudiziale di elezione. Non solo perchè ospita ben 38 cause dedicate ma anche perchè presenta fasi processuali più avanzate. Si tratta infatti di processi attivati molto prima di quelli allocati negli altri Paesi. In particolare, gli Stati Uniti si distinguono come osservatorio di elezione grazie alle cause cosiddette “Newspaper Cases” (NYT+DailyNews+CenterInvestigativeReporting contro OpenAI) dove si assiste alla costruzione forzosa di protocolli congiunti di breve periodo che potrebbero sfociare in modelli di convivenza tra i vari stakeholders nel lungo termine. Un nuovo tipo di licenza ad hoc potrebbe nascere sulla spinta forzosa della class action della Gilda degli autori americani contro Open Ai e Microsoft. Una capitolazione a sorpresa di OpenAI si registra in India nella causa di ANI (Asian News International). In Germania il contenzioso si accende sulla questione tutta europea del TDM (Text and Data Mining) confrontato con il fair use americano. Ci soffermeremo anche sul contenzioso in Canada, Inghilterra e Cina.

Le Newspaper Cases: nuovi framework di convivenza?

Lungi dal pensare alle “Newspaper Cases” quali giudizi concentrati sul passato ed ormai superati dagli accordi conclusi dai vari gruppi editoriali con le GenAI Tech Companies, dobbiamo invece tenerle d’occhio. Da campi di battaglia muro contro muro, anche grazie al “polso” del giudice, si stanno trasformando “obtorto collo” in fucine di nuovi frameworks di convivenza tra il mondo del Giornalismo e quello dei GenAI.

Il giudice Wang nelle cause “Newspaper Cases” impone alle parti protocolli congiunti di discovery (ricerca delle prove) da realizzarsi secondo linee guida impartite forzosamente per assicurare una discovery bilanciata tra editori e OpenAI nelle sandbox messe a disposizione da quest’ultima. Linee guida molto interessanti anche per dirimere altri contenziosi. Si raccomanda di cessare di farsi la guerra e intraprendere insieme un processo iterativo; di verificare insieme le criticità privacy nonché per altri diritti e proporre ipotesi bilanciate; di lavorare nelle sandbox favorendo il dialogo degli esperti delle parti in piena buona fede vicendevole. Intendiamoci bene: queste linee guida non sono il prodotto di una meditazione zen ma la conseguenza di una fase preliminare sulla discovery (ricerca delle prove) segnata da schermaglie continue produttrici di esiti assolutamente fallimentari che hanno costretto il giudice ad imporsi.

Un prototipo di accordo tra editori e GenAI companies potrebbe individuarsi nel primo di questo genere realizzatosi nella causa Concord Music Group+21/Anthropic. Due questioni preliminari erano sul tavolo:

cessare l’uso dei testi e delle composizioni musicali sotto copyright per addestrare Claude;
mantenere e migliorare “i guardrail già implementati” da Anthropic affinchè questi guardrail rendano “improbabile che qualsiasi futuro utente possa spingere Claude a produrre parti materiali delle opere in causa“.

Il giudice Lee è riuscito a far addivenire le parti ad una transazione sulla questione n.2 secondo termini molti interessanti che si potranno leggere integralmente nel prosieguo.

Un’ipotesi di un nuovo tipo di licenza sui GenAI è l’obiettivo della class action The Authors Guild+49/OpenAI e Microsoft ovvero la Gilda degli autori americani in cui spiccano i nomi di John Grisham, Douglas Preston, David Baldacci, Elin Hilderbrand, Michael Connelly e molti altri. Una licenza, indipendente da quelle esistenti, dedicata unicamente alla concessione dei diritti di utilizzo per l’addestramento dei GenAI e per i casi in cui i contenuti protetti rigurgitino negli out-put degli utenti.

La prima volta della resa incondizionata di Open AI sul data scraping si registra in India nella causa ANI Media PVT LTD/OpenAI Inc.&ANR e non sarà un evento isolato da salutare con la bandierina. I contenziosi servono non solo per sperperare risorse ma soprattutto per aprire strade nuove, strade che nessuno vorrebbe edificare proprio perchè costringono “ad incontrarsi”.

Nessuno ha interesse a ridurre l’infosfera a macchine che leggono macchine.

Facciamo tesoro di questi osservatori sul contenzioso GenAI e copyright, sebbene ancora in fieri, per sperimentare prototipi di modelli aperti, partecipati da tutti gli stakeholders e dal pubblico, orientati verso la realizzazione di un giornalismo identitario. Prototipi così trasparenti da non provare pudore a rivelare che quell’articolo è stato eseguito con GenAI (ex art. 19 Codice Deontologico Giornalisti approvato 11.12.24.

Ancora un altro fronte si apre nel rapporto tra diritti di autore e modelli generativi ovvero quello dell’attribuzione della paternità su un’opera creata implementando un GenAI. L’Ufficio Copyright americano alle prese da tempo con questo problema ha promesso l’uscita della Parte 3 del suo rapporto specificamente concentrata sulla questione entro il primo quadrimestre 2025. Dunque, alla prossima …

Cause su GenAI e copyright nel mondo. Una panoramica.

Stati Uniti, Europa, Cina, India vedono le loro Corti alle prese con le prove di forza tra le GenAI Tech Companies e le Gilde degli Autori. Le Corti statunitensi sono lo scenario di riferimento per tutti i sistemi basati sulla dicotomia “copyright/fair use” mentre in Europa muovono i primi passi i tribunali tedeschi, osservatori di prima istanza per dirimere la questione “eccezione TDM/riserva di utilizzo”. In Cina si condanna per violazione del copyright però, al tempo stesso, si intima l’adozione di una GenAI governance equilibrata. In India si registra per la prima volta la “spontanea” cessazione dal data scraping di OpenAI. Anche l’Inghilterra e il Canada registrano le prime cause in materia.

Gli istituti giuridici coinvolti dal tema “copyright e GenAI” spaziano dal diritto d’autore, alla gestione dei diritti di riproduzione (es. DMCA), alla dicotomia americana “copyright/fair use”, a quella indiana “copyright/fair dealing”, a quella europea “TDM/riserva di utilizzo”.

Scarica la tabella delle principali cause in corso o concluse negli USA su IA e copyright

Negli Stati Uniti ad oggi su 38 cause in “Copyright e GenAI” se ne contano 6 unicamente per il settore del giornalismo:

The New York Times Co. v. Microsoft Corp., OpenAI.
Daily News v. Microsoft.
The Center for Investigative Reporting, Inc. v. OpenAI.
Intercept Media Inc. v. OpenAI, Microsoft;
Raw Story Media, Inc. v. OpenAI.
Basbanes v. Microsoft Corp., OpenAI riunita nella class action di The Authors Guild/OpenAI. 01.24

La causa-madre del The New York Times attivata il 27 dicembre 2023 è stata di ispirazione per quella del Center for Investigative Reporting (12.08.24) e quella del Daily News (27.08.24). Tant’è vero che il Southern District of New York ha provveduto a riunirle con capofila appunto quella del New York Times. Il giudice assegnatario Wang ha denominato queste tre cause “Newspaper Cases”.

Il 28 febbraio 2024 sono state iscritte le due cause fondate sul Digital Millennium Copyright Act (DMCA) ovvero quella di Intercept Media e quella di Raw Story Media^[2].

Quella di Basbanes, iscritta il 5 gennaio 2024, è la causa di due giornalisti e non di una testata editoriale come le altre. Tuttavia è degna di nota in quanto riunita con la class action della Gilda degli autori americani del 19 settembre 2023.

Queste cause, con migliaia di mozioni, decine di ordini giudiziari, decine di incontri tra le parti, offrono un ricco vissuto giudiziario. Negli altri Paesi del mondo si registrano dei casi interessanti ma in fasi assolutamente iniziali rispetto ai casi statunitensi che proprio per questo meritano una riflessione appositamente dedicata ospitata più avanti in questo scritto.

In Canada si sta assistendo a quanto già visto con la causa statunitense del New York Times. Le principali testate e media su piattaforma hanno fatto causa a OpenAI per violazione del copyright. Il giudizio è stato attivato da The Toronto Star, The Vancouver Province, The Calgary Sun, The Calgary Herald, The Daily Herald, The Edmonton Journal, The Edmonton Sun, The London Free Press, The National Post, The Ottawa Citizen, The Ottawa Sun, The Daily Observer, The Daily Press, The Winnipeg Sun, The Globe and Mail, The Canadian Press e CBC.

La coalizione giudiziaria delle testate giornalistiche sostiene che OpenAI a causa dell’illecito web scraping abbia integrato le seguenti condotte illegali:

violazione del copyright sui contenuti “raschiati” dai siti web degli attori;
violazione delle misure tecniche antipirateria adottate per evitare accessi e download non autorizzati;
la violazione dei termini e condizioni dei siti web degli attori;
ingiusto arricchimento ottenuto dallo sfruttamento indebito della proprietà intellettuale degli attori.

(Toronto Star Newspaper+16/OpenAI, Case No CV-24-00732231-00CL, Superior Court of Justice Ontario, 28.11.24

In Inghilterra, Getty Image il primo dicembre 2023 ha attivato una causa contro Stability AI, sostenendo che avrebbe raschiato illegalmente circa 12 milioni delle sue immagini per addestrare il proprio GenAI text-to-image denominato Stable Diffusion. Chiaramente la società convenuta si oppone. Anche in questo caso, come avviene negli Stati Uniti, la questione propedeutica fondamentale per stabilire la responsabilità è costituita dalle modalità della disclosure. Attualmente le parti sono molto lontane dall’accordo sul Protocollo di Ispezione sebbene l’inizio della fase processuale di merito sia abbastanza vicina (9 giugno 2025).

In Germania, GEMA (una sorta di SIAE tedesca) ha attivato una causa contro OpenAI sostenendo che – per addestrare i suoi GenAI a comporre canzoni – abbia violato sistematicamente i propri repertori e quindi il copyright di tutti gli autori musicali per cui GEMA raccoglie i diritti. La causa è stata iscritta il 13 novembre 2024 presso il Tribunale di Monaco. Precedentemente in Germania era stato il Tribunale di Amburgo per primo ad emettere una sentenza in materia che decretava l’ammissibilità del data scraping sulla scorta dell’eccezione del Text e Data Mining (eccezione TDM). Ad avviso dei soccombenti, il giudice avrebbe male applicato questa eccezione e per questo la sentenza è stata appellata ed è attualmente in corso.

La disciplina tedesca sul diritto di autore ha recepito l’art.4 della Direttiva Copyright del 2019 disposto dal legislatore europeo per favorire la ricerca scientifica. Allora, sebbene già esistesse l’IA, non si pensava certo all’avvento dei GenAI alimentati dal data scraping on line. Fortunatamente l’art.4 della Direttiva aveva posto un’eccezione all’eccezione stabilendo che era vietato praticare il TDM ove il titolare del patrimonio informativo digitale avesse espresso anticipatamente un veto opponendo una riserva di utilizzo leggibile dalla macchina estrattiva. I risultati della ricerca scientifica eseguita mediante TDM non entrano in concorrenza con i prodotti o i servizi del titolare del terreno estrattivo e inoltre si tratta di enti di natura non commerciale. Nel caso dei GenAI il titolare della macchina estrattiva è una società commerciale che agisce per produrre dei contenuti in diretta concorrenza con quelli del titolare del patrimonio informativo “raschiato”. Questa situazione non è sussumibile nel disposto dell’art.4 Direttiva Copyright. Diversamente argomentando ci troveremmo nell’ipotesi assurda in cui il titolare dei contenuti “raschiati” non solo subisce un depauperamento ma addirittura subisce pure la concorrenza diretta di contenuti generati sfruttando il patrimonio informativo e intellettivo costruito in una vita di lavoro.

A livello tecnico come si costruisce la riserva di utilizzo leggibile dalla macchina estrattiva? A questo ha pensato l’AI Act che, nell’art. 53, cpv. 1, lett. C), ha imposto alle GenAI Tech Companies l’obbligo di realizzare macchine in grado di leggere queste riserve d’uso.

Alla luce del quadro giuridico appena ricordato, sarà difficile assistere a una ulteriore sentenza vittoriosa per i titolari di GenAI. Attualmente la causa è appena iniziata e qualsiasi pronostico sarebbe prematuro. Una cosa è certa: i riflettori di tutti gli osservatori europei sono puntati sul Tribunale di Monaco, teatro delle prove di forza tra le GenAI Tech Companies e il framework giuridico eurounitario. Chiaramente qualsiasi pronunzia esca dal foro tedesco, sarà destinata a giungere fino alla discussione in Corte di Giustizia UE stante il potenziale coinvolgimento di tutti gli stakeholders unionali. Parallelamente la GEMA sta lavorando a un protocollo di licenza per concedere dei diritti di utilizzo ai GenAI senza sacrificare gli autori. Lo stesso tipo di reattività alla questione si registra con The Authors Guild americana che tutela i suoi iscritti sia mediante la battaglia giudiziaria (class action) sia mediante la costruzione di licenze ad hoc.

In Cina, la sentenza della Corte Internet di Guangzhou ha dimostrato la volontà di obbligare le Big Tech a implementare una GenAI governance improntata alla trasparenza e alla possibilità di segnalare le lesioni del copyright grazie a sistemi di NOTICE and take down (Caso Ultraman, Sentenza 8.02.2024 Guangzhou Internet Court).

In India la prima causa in materia ha portato una novità mondiale: OpenAI “spontaneamente” ha cessato di accedere al dominio della ricorrente. Il 19 novembre 2024 è stata iscritta presso l’Alta Corte di Nuova Delhi la prima causa indiana contro OpenAI. Si tratta di ANI Media PVT LTD/OpenAI Inc.&ANR. ANI è l’acronimo di Asian News International, una delle principali agenzie di stampa del Paese che pubblica una parte di contenuti gratuitamente e la maggioranza in abbonamento. Pertanto – argomenta ANI – il fatto di mettere a disposizione del pubblico alcuni nostri prodotti non significa che possano essere utilizzati da terzi per fini commerciali. Inoltre, stigmatizza certi out-put di ChatGpT che le hanno attribuito delle notizie false nuocendo gravemente alla buona reputazione dell’agenzia. Ad esempio, un’intervista a Rahul Gandhi mai avvenuta. Quella di ANI è una vicenda giudiziaria molto interessante perché tocca sia l’in-put che l’out-put dei GenAI e che solleva questioni chiave che il giudice Amit Bansal sintetizza così:

Se l’archiviazione da parte dei resistenti dei dati della ricorrente (che hanno natura di notizie e si sostiene siano protetti ai sensi del Copyright Act del 1957) per l’addestramento (in-put) del suo software, vale a dire ChatGPT, costituirebbe una violazione del copyright della ricorrente;
Se l’uso da parte dei resistenti dei dati protetti da copyright della ricorrente al fine di generare risposte (out-put) per i suoi utenti, equivarrebbe a violazione del copyright della ricorrente;
Se l’uso da parte dei resistenti dei dati protetti da copyright della ricorrente possa essere considerato “fair use” ai sensi della Sezione 52 del Copyright Act del 1957 o più precisamente “fair dealing” (variante indiana più ristretta del “fair use” americano);
Se i tribunali in India abbiano giurisdizione per esaminare la presente causa considerando che i server degli imputati si trovano negli Stati Uniti d’America^[3].

Questa causa inoltre, come preannunciato, presenta una novità assoluta: avere ottenuto una tutela immediata in via cautelare perché OpenAI per la prima volta ha cessato “spontaneamente” il data scraping verso i contenuti di ANI. È’ stato infatti messo a verbale che dall’ottobre 2024 l’indirizzo del dominio di ANI è stato posto in black-list:

“Without prejudice to the rights and contentions of the defendants, Mr. Sibal submits that the defendants have already blocklisted the plaintiff’s domain ‘www.aninews.in’ in October 2024. As a result, the said domain will be excluded from the future training of the defendants’ software”. [Fatti salvi i diritti e le rivendicazioni dei resistenti, il Sig. Sibal (per OpenAI) sostiene che i resistenti hanno già inserito nella lista nera il dominio del ricorrente “www.aninews.in” nell’ottobre 2024. Di conseguenza, detto dominio sarà escluso dalla futura formazione del software dei resistenti].

Le Corti statunitensi spingono per protocolli di ispezione concordati secondo un processo iterativo

L’evoluzione giudiziaria nelle fasi preliminari e nelle pratiche di discovery (ricerca delle prove) pare indirizzata verso la ricerca di soluzioni concordate. Il muro contro muro delle parti ha inutilmente rallentato i processi. I magistrati hanno invitato alla collaborazione, intimando – da un lato – ai ricorrenti di non sottoporre 500 quesiti alla volta sui dataset e di rivolgere solo quesiti ben ponderati e -dall’altro lato – alle GenAI Tech Companies di aiutare fattivamente gli esperti avversari nelle ispezioni. Si è precisato che non è sufficiente mettere a disposizione delle sandbox e delle macchine virtuali affinché si eseguano le verifiche. Occorre anche insegnare agli esperti avversari l’uso degli strumenti forniti.

Ancora meglio, secondo i magistrati, sarebbe che le parti si incontrassero varie volte per addivenire a un protocollo di verifica e ispezione concordato da sottoporre al placet del giudice.

Nella class action Authors Guild+49/OpenAI e Microsoft, Case No. 1:23-cv-08292, (S.D.N.Y.) il giudice, dopo l’ennesima schermaglia tra gli avversari, osserva quanto segue:

“La Corte osserva che molte delle “questioni” presentate nella conferenza del 22 gennaio erano premature e, in molti casi, le parti non si erano pienamente impegnate nel processo di incontro e conferimento. L’apparente rifiuto delle parti di lavorare insieme per risolvere quelle che dovrebbero essere piccole questioni di routine in questi casi ha rallentato significativamente il ritmo delle indagini e ostacola la capacità della Corte di portare avanti i casi in modo efficiente. In futuro, qualsiasi “controversia” in cui le parti non abbiano pienamente tentato di incontrarsi e conferire in buona fede e, dopo essersi incontrate e conferite, abbiano deciso congiuntamente che deve essere presentata un’istanza alla Corte per giungere a una risoluzione, comprese le controversie di cui sopra che la Corte ha negato come premature, non dovrebbe essere inclusa nella tabella delle controversie congiunte delle parti. Qualsiasi mozione presentata in relazione a tali “controversie” può anche essere respinta a titolo definitivo”.

Nella causa-madre The New York Times /OpenAI e Microsoft, Case No. 1:23-cv-11195, (S.D.N.Y.) il giudice Wang detta alle parti i criteri-guida da rispettare nella discovery:

individuare i contenuti su cui verificare la violazione del copyright obbligando le parti a cessare di farsi la guerra e ad intraprendere insieme un processo iterativo;
verificare insieme le criticità privacy e proporre delle ipotesi bilanciate che consentano la disclosure ma garantiscano anche la privacy sui prompt e sugli output dell’utente finale;
circoscrivere unicamente a quanto necessario il perimetro della disclosure sui dati di registro e sui registri di output delle AI companies. Dopo il fallimento delle disclosure nelle sandbox riservate a ciascun attore dalle GenAI Tech Companies a causa di errori tecnici, questa operazione pare possibile soltanto se in queste sandbox gli esperti dei ricorrenti si interfacciano con gli esperti dei resistenti in piena buona fede vicendevole.

All’esito di queste attività, le parti dovranno stilare un Protocollo condiviso di Ispezione da presentare al giudice entro il 30 aprile 2025.

Un primo accordo in questo senso arriva dalla transazione su una delle questioni preliminari della causa di Concord Music Group+21/Anthropic, Case No. 5:24-cv-03811, (N.D. California). Le 2 questioni preliminari poste dalle case discografiche sono:

cessare l’uso dei testi e delle composizioni musicali sotto copyright per addestrare Claude;
mantenere e migliorare “i guardrail già implementati” da Anthropic affinchè questi guardrail rendano “improbabile che qualsiasi futuro utente possa spingere Claude a produrre parti materiali delle opere in causa“.

Il giudice Lee è riuscito a far addivenire le parti ad una transazione sulla questione n.2. I termini dell’accordo:

“B. In qualsiasi momento durante la pendenza di questo procedimento, gli editori possono notificare ad Anthropic per iscritto che i suoi Guardrail non impediscono efficacemente l’output che riproduce, distribuisce o visualizza, in tutto o in parte, i testi delle composizioni di proprietà o controllate dagli editori, o crea opere derivate basate su tali composizioni.

Anthropic risponderà rapidamente agli editori e intraprenderà un’indagine su tali accuse, indagine a cui gli editori collaboreranno in buona fede. Anthropic alla fine fornirà una risposta scritta dettagliata che identifica quando e come Anthropic affronterà il problema identificato nell’avviso degli editori, o Anthropic dichiarerà chiaramente il suo intento di non affrontare il problema. La procedura di cui sopra non pregiudica il diritto degli editori di chiedere l’intervento della Corte su base accelerata, a seconda dei casi.

Anthropic si sottoporrà alla giurisdizione di questa Corte in qualsiasi controversia che coinvolge questa clausola e la Corte avrà l’autorità di far rispettare questa clausola con tutti i mezzi legali e appropriati”.

Tali forme di accordo costituiscono una possibilità di coesistenza equilibrata tra GenAI e Autori. Si tratta di accordi dinamici in continuo adeguamento alle novità tecniche e alle esigenze di tutele autorali condotti secondo un processo iterativo.

Se questa è la strada indicata dalle Corti statunitensi non conviene più affrontare la battaglia giudiziaria ma cercare una soluzione in licenze apposite stilate dalle gilde degli autori e condivise dalle GenAI companies. Infatti, The Authors Guild ha quasi completato il progetto di licenza per l’utilizzo delle opere da parte dei GenAI. Così si sta muovendo anche GEMA per gli autori del settore musicale.

Licenze di addestramento GenAI di The Authors Guild e di GEMA

The Authors Guild (AG) ritiene che solo gli Autori debbano gestire questo tipo di licenza a prescindere dalle scelte dei loro editori. Pensiamo ad esempio agli accordi che grandi gruppi editoriali hanno stretto con OpenAI concedendo parte dei loro patrimoni informativi: avranno chiesto prima l’autorizzazione degli autori giornalisti?

Secondo la gilda degli autori americani la licenza GenAI non deve essere ricompresa negli accordi standard di pubblicazione, dev’essere negoziata a parte:

“un accordo di pubblicazione commerciale garantisce proprio questo: una licenza per pubblicare. L’addestramento di un GenAI non è pubblicazione e un contratto di pubblicazione non garantisce in alcun modo tale diritto. L’addestramento di un GenAI non è un nuovo formato di libro, non è un nuovo mercato, non è un nuovo meccanismo di distribuzione. La licenza per l’addestramento di un GenAI è un diritto del tutto estraneo alla pubblicazione e non è un diritto che può essere semplicemente attaccato a una clausola di diritti sussidiari. È un diritto riservato agli autori, un diritto che deve essere negoziato individualmente per ogni contratto di pubblicazione e solo se l’autore sceglie di concedere in licenza tale diritto”[4]

Nel caso si addivenga a una negoziazione con l’editore, secondo AG l’autore dovrebbe riservarsi il 75-85%.

HarperCollins-Collins sta proponendo ai propri autori una licenza per addestramento GenAI molto probabilmente perché ha stretto un accordo con Microsoft per l’allenamento del suo modello generativo. Tale licenza prevede un 50 e 50 tra autore ed editore. Durata: 3 anni. Guardrails: massimo 200 parole consecutive per ciascun out-put; limite massimo del 5% del testo, no estrazione da siti di torrent o siti pirata a tutela della buona reputazione dell’autore (AG “HarperCollins AI Licensing Deal”, 19.11.24.

GEMA, a tutela dei propri iscritti, ha elaborato una licenza con 2 basi di calcolo: la prima individuata nei proventi (es. abbonamenti al servizio) del produttore del GenAI addestrato sui contenuti dell’Autore e la seconda individuata nei proventi derivanti dall’uso successivo dei contenuti generati con il modello (ad esempio una musica di sottofondo creata da un utente del GenAI). Questa licenza è stata presentata nel settembre 2024. Per approfondimenti si veda[5].

Voilà: allora con la licenza GenAI è tutto risolto.

Ne siamo veramente certi? Forse stiamo dimenticando che il GenAI interiorizza lo stile, la forma mentis e il know how dell’Autore fino al punto di essere in grado di sostituirlo.

Macchine che leggono macchine

I modelli di intelligenza generativa interiorizzano non solo lo stile dell’uomo ma anche quello dei contenuti di altre macchine. Vi ricordate la notizia di qualche anno fa? “Due chatbot di Facebook iniziano a dialogare tra loro in una lingua sconosciuta e vengono subito spenti…”[6].

Al di là delle sirene catastrofali scatenate allora dalla notizia, dobbiamo aspettarci ben presto una infosfera generata da macchine che leggono altre macchine. Immagini, testi, audio, persone pubbliche e private, influencer, volti noti del giornalismo: saranno tutti contenuti sintetici. Europol nel suo rapporto 2022 “Facing reality? Law enforcement and the challenge of deepfakes” ha dichiarato che nel 2026 il 90% dei contenuti sarà generato dall’IA. Notizia poi scomparsa dal rapporto a seguito di una revisione del 2024 in cui una nota avvisa: “La versione attuale di questo rapporto è stata pubblicata nel gennaio 2024 e sostituisce quella precedente. Nella versione aggiornata, è stata rimossa una dichiarazione da una fonte imprecisa sulla quota futura prevista di contenuti generati sinteticamente[7]”

A parte l’errore sulla quota del 90%, Europol non smentisce il trend di forte crescita dei contenuti sintetici e comunque ciascuno di noi sperimenta quotidianamente questa situazione.

Rifuggendo da ipotesi pessimistiche e distaccandosi perfino da consapevolezze certe (es. disinformazione, manipolazione di massa) non possiamo non nutrire qualche dubbio sulla tenuta dell’infosfera digitale. Andando al pratico: per quanto tempo ancora gli inserzionisti vorranno continuare a investire in post pubblicitari probabilmente letti e commentati unicamente da macchine?

La fiducia nel sistema Internet sta collassando progressivamente ma non per questo la gente è meno curiosa dei fatti del mondo. Sazierà questa curiosità altrove.

La sfida, la rilevanza del giornalismo è proprio questa: costruire un altrove informativo, anche digitale, radicato nella realtà. Un giornalismo a forte vocazione identitaria che intesse relazioni umane concrete sul territorio e risulta attrattivo per gli sponsor. Un giornalismo che si scuote di dosso modelli di business digitale obsoleti, utili solo per ingrassare le piattaforme e ristabilisce il contatto con i fatti.

Allora dobbiamo buttare a mare l’infosfera e i GenAI? No, neppure questo sarebbe realistico.

Intanto facciamo tesoro di tutto il vissuto giudiziario sorto intorno alle cause sul “GenAI Selvaggio” che solo apparentemente risultano superate dagli accordi tra Big Tech e Gruppi Editoriali.

Cause su GenAI e copyright: cosa stiamo imparando

L’impasse di sistema dovuto all’irrompere dei GenAI sul mercato ha costretto i gruppi editoriali a riadattare i propri modelli operativi e di business. Le strade imboccate: la via giudiziaria e/o la via dell’accordo.

Verrebbe da pensare: che senso ha defatigarsi in cause molto onerose quando ormai tutti fanno gli accordi?

Accordi a quale prezzo? Accordi forse in violazione del diritto di autore dei giornalisti. Accordi probabilmente più subiti che concordati.

Le cause giudiziarie, come abbiamo visto sopra, sono partite muro contro muro ma adesso stanno diventando delle fucine di nuovi esperimenti di “ibridazione” tra mondo del giornalismo e mondo tecnologico.

Pensiamo alle linee guida che il giudice Wang è riuscito ad elaborare nelle cosiddette “Newspaper Cases” dopo centinaia di mozioni. Linee guida imposte alle parti affinché traccino un protocollo di discovery congiunto. Tuttavia, leggendole, si capisce che non sono solo questo. Sono il pungolo che costringerà le parti – obtorto collo – ad “ibridarsi” costruendo un nuovo modo di convivere: il protocollo congiunto di discovery si trasformerà da progetto di breve periodo ad accordo di lungo periodo grazie al processo dinamico ed iterativo imposto dal giudice. Si svilupperanno protocolli meno opprimenti e forzatamente (per ordini del giudice) tendenti verso l’equità. Gli accordi stretti privatamente tra le parti che al momento sembrano la soluzione [solo] economicamente migliore, risulteranno obsoleti di fronte agli accordi che scaturiranno dai protocolli congiunti forgiati nella battaglia giudiziale.

Le linee guida del giudice Wang in estrema sintesi impongono di lavorare insieme in buona fede e secondo un processo iterativo in cui si evitano ridondanze inutili nelle richieste di verifica, si valutano rimedi per la gestione del rischio privacy dei terzi e si presta collaborazione fattiva. Tali criteri uniti all’imposizione di guardrails stabilita nella transazione Concord Music Group+21/Anthropic possono costituire già una buona partenza per accordi di lungo periodo. Si potrebbe profilare uno scenario di collaborazione in cui gli editori e gli autori attivano segnalazioni verso I GenAI richiedendo adeguati guardrails sia sull’in-put che sull’out-put. Collaborazione utile non solo per gli autori o editori ma anche per le Big Tech che per attirare gli umani e di conseguenza gli inserzionisti necessitano delle segnalazioni che consentono di alimentare modelli sempre meno affetti dai dataset tossici originariamente utilizzati.

DEBORAH BIANCHI

L’Avv. Deborah Bianchi è specializzato in diritto dell’Internet dal 2006. Opera da 15 anni in consulenza e tutela: diritto all’oblio, web reputation e brand reputation, cyberbullismo, cyberstalking, diffamazione on line. Svolge incarichi di DPO e di consulenza e adeguamento al GDPR 2016/679. Scrive per le riviste giuridiche de Il Sole 24 Ore, Giuffrè, Giappichelli. E’ autore dei libri: Internet e il danno alla persona-Giappichelli;Danno e Internet. Persona, Impresa, Pubblica Amministrazione-Il Sole 24 Ore;Difendersi da Internet-Il Sole 24 Ore;Sinistri Internet. Responsabilità e risarcimento-Giuffrè. E’ formatore in corsi e convegni

NOTE

[1] Interskills, “L’Intelligenza Artificiale non sarà una miniera d’oro per gli editori”, Carla Federico, 13.01.2025

[2] interskills.it, Carla Federico, “The Intercept vs OpenAI: la causa procede”, 3.12.24

[3] ANI Media PVT LTD/OpenAI Inc.&ANR, Alta Corte di Nuova Delhi, 19.11.24, testo originale:

“I.Whether the storage by the defendants of plaintiff’s data (which is in the nature of news and is claimed to be protected under the Copyright Act, 1957) for training its software i.e., ChatGPT, would amount to infringement of plaintiff’s copyright.

1. Whether the use by the defendants of plaintiff’s copyrighted data in order to generate responses for its users, would amount to infringement of the plaintiff’s copyright.

III. Whether the defendants’ use of plaintiff’s copyrighted data qualifies as ‘fair use’ in terms of Section 52 of the Copyright Act, 1957.

1. Whether the Courts in India have jurisdiction to entertain the present lawsuit considering that the servers of the defendants are located in the United States of America”.

[4] Authors Guild, “AI Licensing for Authors: Who Owns the Rights and What’s a Fair Split?”, 12.12.24

[5] Two components – one goal: Music creators shall receive fair shares through effective AI licensing”, GEMA News, 17.10.24

[6] Rebecca Mantovani, “La lingua segreta dei bot di Facebook”, Focus, 2 agosto 2017

[7] Europol (2022), “Facing reality? Law enforcement and the challenge of deepfakes”, an observatory report from the Europol Innovation Lab, Publications Office of the European Union, Luxembourg

Bibliografia

Caso Ultraman, Sentenza 8.02.2024 Guangzhou Internet Court
ANI Media PVT LTD/OpenAI Inc.&ANR, Alta Corte di Nuova Delhi, 19.11.24,
Getty Image/StabilityAI, Case No: IL-2023-000007, England and Wales High Court (Chancery Division) [2023] EWHC 3090 (Ch) (01 December 2023)
Toronto Star Newspaper+16/OpenAI, Case No CV-24-00732231-00CL, Superior Court of Justice Ontario, 28.11.24
Carla Federico,“L’Intelligenza Artificiale non sarà una miniera d’oro per gli editori” , it, 13.01.2025
19 Codice Deontologico Giornalisti approvato 11.12.24,
Rapporto Ufficio Copyright americano
Carla Federico,“The Intercept vs OpenAI: la causa procede”, interskills.it, 3.12.2024,
Authors Guild, “AI Licensing for Authors: Who Owns the Rights and What’s a Fair Split?”, 12.12.24,
Authors Guild, “HarperCollins AI Licensing Deal”, 19.11.24,
GEMA News, “Two components – one goal: Music creators shall receive fair shares through effective AI licensing”, 17.10.24,
Rebecca Mantovani, “La lingua segreta dei bot di Facebook”, Focus, 2 agosto 2017
Europol (2022) “Facing reality? Law enforcement and the challenge of deepfakes”, an observatory report from the Europol Innovation Lab, Publications Office of the European Union, Luxembourg,

2025 Home Osservatorio

Executive summary

Scenari e prospettive

Approfondimenti tematici

con il patrocinio di:

in collaborazione con:

I contenuti di questo documento vengono distribuiti con licenza Creative Commons By

Condividere — riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire e recitare questo materiale con qualsiasi mezzo e formato
Modificare — remixare, trasformare il materiale e basarti su di esso per le tue opere per qualsiasi fine, anche commerciale.

Il licenziante non può revocare questi diritti fintanto che tu rispetti i termini della licenza

URL pagina: https://www.odg.it/intelligenza-artificiale-nel-giornalismo-e-le-battaglie-giudiziarie-sul-copyright/59844