Articolo XIII: Revisioni dell'AISI

Per i modelli di IA creati tramite addestramento dichiarato o post-addestramento entro i limiti dell'Articolo IV, l'AISI può richiedere valutazioni e altri test. Questi test serviranno a determinare se le soglie fissate negli Articoli IV, V, VII e VIII debbano essere riviste. I metodi utilizzati per le revisioni saranno stabiliti dall'AISI e potranno essere aggiornati.
Le valutazioni saranno effettuate presso le strutture dell'AISI o i CCC monitorati, da funzionari dell'AISI. I funzionari delle Parti del Trattato potranno essere informati in merito ai test condotti e l'AISI potrà fornire una sintesi dei risultati dei test. Le Parti non avranno accesso ai modelli di IA che non hanno addestrato, a meno che l'accesso non sia concesso dal proprietario del modello, e l'AISI adotterà misure per garantire la sicurezza delle informazioni sensibili.
L'AISI può condividere informazioni dettagliate con le Parti o il pubblico, qualora il Direttore Generale lo ritenga necessario per ridurre il rischio di estinzione umana causata dall'IA avanzata.

Note

Lo scopo di questo Articolo è garantire che l'AISI si mantenga aggiornata sullo stato dell'IA, in caso di suoi progressi. Ad esempio, la revisione dell'addestramento dichiarato permetterebbe all'AISI di comprendere il livello di potenza dell'IA che si può raggiungere con diversi livelli di FLOP di addestramento.

Anche se la ricerca algoritmica è vietata, potrebbero esserci progressi che non possono essere fermati in modo efficace, e l'AISI deve tenerne traccia. Inoltre, l'AISI deve monitorare i progressi nellasollecitazione delle capacità. Per esempio, potrebbero essere scoperti nuovi metodi di prompting che consentono a una vecchia IA di ottenere prestazioni molto migliori su alcuni parametri di valutazione critici. Questi sono solo due esempi di cambiamenti nel panorama dello sviluppo dell'IA che potrebbero richiedere modifiche alle soglie rilevanti per l'Articolo IV e l'Articolo V, nonché modifiche alle definizioni di Ricerca Soggetta a Restrizioni nell'Articolo VIII. Le revisioni previste dall'Articolo XIII sono un meccanismo che consente all'AISI di comprendere meglio lo stato delle capacità dell'IA e di rispondere in modo appropriato.

Un articolo del genere potrebbe non essere strettamente necessario, considerati i divieti sui grandi cicli di addestramento e sui progressi algoritmici. Tuttavia, le revisioni appaiono una misura prudente e sembrano essere parte del modo in cui il mondo potrebbe continuare a usare le moderne IA come ChatGPT senza rischiare una corsa alla superintelligenza.

Queste revisioni dell'AISI potrebbero includere valutazioni di capacità pericolose, per assicurarsi che le IA non diventino eccessivamente potenti in aree specifiche. Potrebbero anche esaminare i dati di addestramento per garantire che le IA non vengano addestrate per compiti specificamente pericolosi (come l'automazione della ricerca sull'IA), o altrimenti testare l'IA per rilevare comportamenti inaspettati.

Precedenti

I precedenti per i test con supervisione richiesti dall'AISI sono analoghi a quelli relativi alla verifica dell'uso dei chip discussi nell'Articolo VII, con il protocollo di condivisione della telemetria dei missili dello START I come caso particolarmente rilevante. L'elemento aggiuntivo qui, nel nostro Articolo XIII, è l'utilizzo dei dati raccolti per formulare raccomandazioni su potenziali correzioni delle soglie (che potrebbero avvenire tramite i meccanismi con precedenti di cui discutiamo nell'Articolo XIV).

Per quanto riguarda la tensione intrinseca tra la divulgazione al pubblico (Paragrafo 3) e le disposizioni sul consolidamento delle informazioni del nostro Articolo X, notiamo che la disposizione sulla riservatezza dell'Articolo VII dello Statuto dell'AIEA^* non ha impedito all'agenzia di pubblicare rapporti regolari e dettagliati sui principali sviluppi nel suo campo di competenza e sulle loro implicazioni per la sicurezza globale.

* Il punto VII.F dice che "[...] nel rispetto delle loro responsabilità nei confronti dell'Agenzia, [il Direttore Generale e il personale] non devono rivelare alcun segreto industriale o altre informazioni riservate di cui vengono a conoscenza nell'esercizio delle loro funzioni ufficiali per l'Agenzia".

Articolo XIV: Procedura di revisione del Trattato

→