Articolo IV: Addestramento dell'IA
- Ciascuna Parte si impegna a vietare l'addestramento dell'IA al di sopra delle seguenti soglie: qualsiasi sessione di addestramento che superi 1e24 FLOP o qualsiasi sessione di post-addestramento che superi 1e23 FLOP. Ciascuna Parte si impegna a non condurre sessioni di addestramento al di sopra di tali soglie e a non permettere a nessuna entità soggetta alla propria giurisdizione di condurre tali sessioni.
- Il Segretariato Tecnico può modificare queste soglie, in conformità con la procedura descritta nell'Articolo III. Il Consiglio Esecutivo può porre il veto a tali decisioni con un voto a maggioranza di due terzi.
- Ciascuna Parte deve notificare all'AISI qualsiasi sessione di addestramento compresa tra 1e22 e 1e24 FLOP prima del suo avvio. Ciò si applica alle sessioni di addestramento condotte dalla Parte o da qualsiasi entità soggetta alla sua giurisdizione.
- Tale notifica deve includere, a titolo esemplificativo ma non esaustivo, tutto il codice di addestramento e una stima delle FLOP totali da utilizzare. La Parte deve fornire al personale dell'AISI un accesso supervisionato a tutti i dati, con una registrazione degli accessi adeguata alla sensibilità dei dati e protezioni contro la duplicazione o la divulgazione non autorizzata. La mancata fornitura di un sufficiente accesso ai dati al personale dell'AISI costituisce motivo di diniego della sessione di addestramento, a discrezione dell'AISI. L'AISI può richiedere qualsiasi documentazione aggiuntiva relativa alla sessione di addestramento. L'AISI approverà inoltre in via preliminare una serie di piccole modifiche che potrebbero essere apportate alla procedura durante la sessione di addestramento. Tali modifiche dovranno essere comunicate all'AISI qualora vengano apportate.
- La mancata risposta da parte dell'AISI trascorsi 30 giorni costituisce approvazione; tuttavia, l'AISI può prorogare tale periodo comunicando di necessitare di ulteriore tempo per la revisione. Non vi sono limiti a tali proroghe, ma le Parti possono presentare ricorso per ritardi eccessivi al Direttore o al Consiglio Esecutivo.
- L'AISI può monitorare tali sessioni di addestramento e la Parte fornirà all'AISI, su richiesta, i checkpoint del modello, compreso il modello finale addestrato [i dettagli iniziali di tale monitoraggio dovranno essere descritti in un Allegato].
- Nel caso in cui il monitoraggio indichi capacità o comportamenti preoccupanti dell'IA, l'AISI può emettere un ordine di sospensione di una sessione o di una classe di sessioni di addestramento, finché non riterrà sicuro procedere con la sessione.
- L'AISI adotterà pratiche di sicurezza solide. L'AISI non condividerà informazioni sulle sessioni di addestramento dichiarate, a meno che non stabilisca che una di esse violi il Trattato; in tal caso, fornirà a tutte le Parti del Trattato informazioni sufficienti per determinare se si sia verificata una violazione.
- Qualora una Parte individui una sessione di addestramento al di sopra delle soglie designate, dovrà segnalarla all'AISI e interromperla (se in corso). Tale sessione potrà riprendere solo previa approvazione dell'AISI.
- Ogni Parte, e gli enti sotto la sua giurisdizione, possono condurre sessioni di addestramento inferiori a 1e22 FLOP senza la supervisione o l'approvazione dell'AISI.
- L'AISI può autorizzare, con una maggioranza di due terzi dei voti del Consiglio Esecutivo, deroghe specifiche per attività quali valutazioni di sicurezza, veicoli a guida autonoma, tecnologia medica e altre attività, con modalità ritenute sicure dal Direttore Generale. Tali deroghe possono consentire sessioni di addestramento superiori a 1e24 FLOP con la supervisione dell'AISI, o una presunzione di approvazione da parte dell'AISI per sessioni di addestramento comprese tra 1e22 e 1e24 FLOP.
Note
Uno dei modi principali per migliorare le attuali IA è aumentare le risorse computazionali investite nell'addestramento delle IA. Limitare queste risorse e la ricerca sul progresso algoritmico (descritta nell'Articolo VIII) può ridurre il rischio, che nel breve periodo, venga creata un'IA più intelligente dell'uomo.
Il divieto si basa sul numero di operazioni computazionali, dato che è un parametro relativamente facile da definire e misurare, e le prestazioni degli attuali modelli di IA all'avanguardia ci danno un'idea delle quantità di potenza di calcolo che risultano sicure con gli algoritmi odierni.
In un mondo perfetto, limiteremmo invece l'addestramento in base alle capacità del sistema addestrato. Ma nessuno ha la capacità tecnica di prevedere con certezza cosa sarà in grado di fare o non fare una nuova IA prima che venga addestrata. Pertanto, le risorse computazionali vengono utilizzate come proxy.
Il divieto assoluto di 1e24 FLOP per l'addestramento è leggermente inferiore alla quantità di risorse computazionali usate per i modelli prossimi allo stato dell'arte dell'agosto 2025, come DeepSeek-V3 con 3e24 FLOP. Abbiamo scelto questa soglia perché è al di sotto del livello al quale prevediamo che le IA possano diventare pericolose (dati gli algoritmi attuali), e perché offre un certo margine di manovra in caso di lievi progressi algoritmici.
Il divieto di superare 1e23 FLOP nel post-addestramento è pensata per essere applicata alle IA create prima dell'entrata in vigore del Trattato. Molte di queste IA saranno state create usando più di 1e24 FLOP (a metà 2025 esistono tra 50 e 100 modelli di questo tipo). Dato che i pesi di molte di queste IA saranno stati resi pubblici, non è fattibile impedirne l'uso, ma è fattibile impedirne modifiche sostanziali tramite il post-addestramento.
Un addestramento da 1e22 FLOP su 16 H100 richiederebbe circa una settimana. È un'operazione che richiede una potenza di calcolo tale che gli hobbisti non rischiano di superare accidentalmente la soglia addestrando modelli piccoli e consentiti. Le IA addestrate su questa scala (con gli algoritmi attuali) si sono finora dimostrate tutt'altro che pericolose. I progressi nella ricerca sugli algoritmi di IA, se la loro esecuzione e disseminazione non venissero altrimenti impedite, potrebbero porre l'umanità in uno scenario ancora più pericoloso, richiedendo divieti mirati ad attività che attualmente potrebbero essere svolte da piccoli gruppi determinati e disposti a sostenere spese ingenti.
Nella fascia di potenza di calcolo tra 1e22 e 1e24 FLOP, l'AISI riceverebbe in anticipo il codice di addestramento e le stime delle FLOP totali. Ciò le consentirebbe di approvare il ciclo di addestramento, a condizione che questo non utilizzi metodi algoritmici innovativi.
L'addestramento di un'IA comporta spesso piccole correzioni di bug in corso d'opera (come l'installazione della versione corretta di una libreria o il rimescolamento dei dati di addestramento). L'AISI può pre-approvare una serie di piccole modifiche a un ciclo di addestramento che non richiedano una nuova approvazione. Tali modifiche andrebbero comunque segnalate all'AISI.
La segnalazione e il monitoraggio richiesti per i cicli di addestramento tra 1e22 e 1e24 FLOP consentirebbero di ottenere alcuni dei benefici derivanti dall'addestramento di IA con modalità che al momento appaiono sicure, prevenendo al contempo la costruzione di IA più grandi e potenzialmente pericolose.
Il monitoraggio da parte dell'AISI le permetterebbe inoltre di rimanere (in una certa misura) aggiornata sui progressi algoritmici che si verificano nonostante i divieti; inoltre, l'Articolo XIII prevede che l'AISI effettui valutazioni dei modelli addestrati in questa fascia. Ciò aiuterà a rendere l'AISI consapevole delle tendenze nello sviluppo dell'IA e le consentirà (si spera) di abbassare le soglie di FLOP se necessario.
Il monitoraggio dei cicli di addestramento da parte dell'AISI è fattibile e applicabile grazie al consolidamento dei chip (Articolo V) e alla verifica del loro uso (Articolo VII). Il consolidamento dei chip implica che l'hardware utilizzato per i cicli di addestramento su larga scala sarà accessibile all'AISI. La verifica dell'uso dei chip permetterà all'AISI di avere una ragionevole certezza che i chip vengano utilizzati per addestrare IA solo previa autorizzazione.
Al personale dell'AISI è permesso l'accesso ai dati di addestramento utilizzati nelle sessioni di addestramento monitorate, fatte salve diverse restrizioni. L'intento di queste restrizioni è di garantire che la registrazione e altri metodi di controllo siano utilizzati per prevenire la divulgazione non autorizzata di contenuti sensibili nei dati di addestramento, inclusi, a titolo esemplificativo ma non esaustivo, informazioni di identificazione personale, informazioni sanitarie personali, dati classificati, segreti commerciali, dati bancari soggetti a obbligo di segretezza, e così via.
Precedenti
Sebbene i valori numerici delle soglie specificate nel nostro accordo possano e debbano essere riesaminati una volta superata la fase iniziale di stesura, i tetti quantitativi sono comuni negli accordi internazionali, in quanto prevengono controversie che altrimenti dipenderebbero da diverse interpretazioni del linguaggio qualitativo.
Il Trattato sulla limitazione degli esperimenti nucleari sotterranei (Threshold Test Ban Treaty) del 1974 stabilì un tetto di 150 chilotoni per i test nucleari sotterranei eseguiti da Stati Uniti e URSS.* Lo scopo e l'effetto del trattato furono di ostacolare, almeno in parte, l'ulteriore sviluppo di testate più grandi e distruttive del tipo "city buster". Un parallelo pertinente con lo sviluppo dell'IA è che, a metà del 2025, i modelli più generici e potenti (e quindi più pericolosi) richiedono per la loro creazione sessioni di addestramento corrispondentemente più grandi; il nostro trattato specifica dei tetti volti a impedire che tali IA vengano sviluppate intenzionalmente, ma anche a cogliere il vantaggio essenziale (sebbene non parallelo) di ridurre il rischio che una soglia di capacità imprevista venga superata accidentalmente e irrimediabilmente.
Il limite di addestramento che abbiamo suggerito come punto di partenza è abbastanza basso da essere superato da alcuni modelli di IA addestrati al giorno d'oggi; lo consideriamo prudente in previsione di progressi che renderanno i modelli più recenti più potenti a parità di addestramento (come discusso nell'Articolo VIII). Gli accordi per la riduzione degli armamenti costituiscono un precedente per soglie fissate al di sotto del livello massimo attuale. Il Trattato navale di Washington del 1922 fissò limiti al dislocamento delle navi da guerra, che costrinsero gli Stati Uniti e altre potenze navali a rottamare decine di capital ship.† Nell'Articolo II del trattato START del 1991,‡ gli Stati Uniti e l'Unione Sovietica (e in seguito la Federazione Russa) concordarono limiti alle dimensioni dei loro arsenali nucleari e dei loro sistemi di lancio che richiesero a ciascuna parte di eliminare gradualmente più di quattromila testate ciascuno.
I precedenti per le soglie quantitative che limitano il potenziale di fuga verranno discussi nell'Articolo V.
* Gli Stati Uniti e l'URSS avevano già deciso di smettere di fare altri tipi di test nucleari nel 1963 con il Trattato che Vieta i Test Nucleari nell'Atmosfera, nello Spazio e Sott'Acqua, comunemente chiamato Trattato sulla Limitazione dei Test Nucleari o Trattato di Divieto dei Test.
† Il Trattato tra l'Impero Britannico, la Francia, l'Italia, il Giappone e gli Stati Uniti d'America per la Limitazione degli Armamenti Navali (il Trattato Navale di Washington) elenca in una tabella (Sezione II) le navi da demolire, indicandone i nomi.
‡ Il Trattato sulla Riduzione delle Armi Strategiche è stato firmato nel 1991 ed è entrato in vigore nel 1994. A ciascuna delle parti firmatarie è stato vietato di schierare più di 6.000 testate nucleari su un totale di 1.600 missili balistici intercontinentali e bombardieri.