L'intelligenza non è ineffabile

Negli ultimi anni, il campo dell'intelligenza artificiale ha fatto progressi, non approfondendo la nostra comprensione dell'intelligenza, ma trovando metodi per "far crescere" le IA. Dopo che i tentativi di comprendere l'intelligenza stessa hanno incontrato anni di vicoli ciechi e stagnazione, e che lo sviluppo di IA potenti ha avuto successo, alcuni si chiedono se l'idea di "comprendere l'intelligenza" sia solo un miraggio. Forse non ci sono principi generali da comprendere? O forse i principi sono troppo strani o troppo complicati perché gli esseri umani possano mai comprenderli?

Altri ritengono che ci debba essere qualcosa di speciale e mistico nella mente umana, qualcosa di troppo sacro per essere ridotto ad aride equazioni. E poiché l'intelligenza non è ancora stata compresa, forse la vera intelligenza deriva da questa parte ineffabile dello spirito umano.

Il nostro punto di vista è piuttosto più noioso. L'intelligenza è un fenomeno naturale, come tutti gli altri. E come per molti fenomeni in biologia, psicologia e altre scienze, siamo ancora all'inizio nei nostri tentativi di comprenderla.

Molti degli strumenti e dei concetti di base della psicologia e delle neuroscienze moderne esistono solo da pochi decenni. Potrebbe sembrare umile dire: "La scienza ha i suoi limiti, e questo è forse uno di essi". Ma immaginate invece di dire a qualcuno che pensate che gli scienziati tra un milione di anni non capiranno molto di più dell'intelligenza rispetto a quello che sappiamo nel 2025. In questi termini, l'affermazione che l'intelligenza è ineffabile sembra più arrogante dell'alternativa.

Il motivo principale per cui questa domanda ci interessa è che riguarda la possibilità che l'umanità possa un giorno costruire una superintelligenza senza minacciare la nostra sopravvivenza. Nel capitolo 11 sosterremo che l'IA oggi assomiglia più all'alchimia che alla chimica. Ma è davvero possibile che esista una "chimica" dell'IA?

Dato che oggi non abbiamo le conoscenze scientifiche rilevanti a disposizione, non è banale stabilire che una "chimica dell'IA" sia possibile! Possiamo solo fare ipotesi su come sarebbe una scienza dell'IA matura. Considerato quanto al moemnto siamo lontani da questo obiettivo, è probabile che molti dei concetti che usiamo nell'IA oggi debbano essere raffinati o sostituiti nel corso del progresso intellettuale.

Nonostante ciò, pensiamo che l'intelligenza sia comprensibile in linea di principio. Non crediamo sia una conclusione particolarmente difficile da trarre, anche se le ricerche degli ultimi decenni dimostrano che l'intelligenza non è facile da capire.

Ci sono quattro ragioni fondamentali per cui la pensiamo così:

Le affermazioni di ineffabilità hanno sempre avuto scarso successo nelle scienze.
L'intelligenza presenta una struttura e delle regolarità.
Ci sono molte cose che ancora non capiamo sull'intelligenza umana che dovrebbero essere comprensibili in linea di principio.
Ci sono già stati dei progressi nella comprensione dell'intelligenza.

Le affermazioni di ineffabilità hanno sempre avuto scarso successo nelle scienze

Quando l'umanità non capisce una cosa, questa spesso può sembrare minacciosa e profondamente misteriosa. Può essere difficile immaginare, o difficile apprezzare emotivamente, come sarebbe acquisire quell'intuizione in futuro.

Un tempo, tra filosofi e scienziati, era diffusa la credenza nel vitalismo, l'idea che i processi biologici non potessero mai essere ridotti alla semplice chimica e fisica. La vita sembrava qualcosa di speciale, qualcosa di incomparabilmente diverso dai semplici atomi e molecole, dalla semplice gravità e dall'elettromagnetismo.

L'errore dei vitalisti è stato straordinariamente comune nel corso della storia. Le persone sono rapide nel concludere che le cose che oggi sono misteriose siano intrinsecamente misteriose, inconoscibili anche in linea di principio.

Se alzate lo sguardo verso il cielo notturno e vedete un campo scintillante di luci la cui natura e leggi vi sono ignote… perché pensare di poterle mai conoscere? Perché questo aspetto del futuro dovrebbe essere prevedibile?

Una lezione fondamentale della storia è che la ricerca scientifica può affrontare questi enigmi profondi. A volte il mistero viene risolto rapidamente, altre volte ci vogliono centinaia di anni. Ma sembra sempre più improbabile che ci siano aspetti della vita quotidiana umana, come l'intelligenza, che non possano essere compresi nemmeno in linea di principio.

L'intelligenza presenta una struttura e delle regolarità

Immaginate di vivere migliaia di anni fa, quando anche fenomeni come il "fuoco" sembravano misteri ineffabili. Come avreste potuto indovinare che un giorno gli esseri umani avrebbero compreso il fuoco?

Un indizio è che il fuoco non era un evento isolato. Bruciava in molti luoghi diversi, e sempre in modi simili. Questo era indice un fenomeno stabile, regolare e compatto nascosto dietro il "fuoco", nella realtà: diverse possibili disposizioni della materia avevano diverse energie potenziali chimiche legate, e riscaldando la materia si permetteva a quelle configurazioni di rompersi e riformarsi in configurazioni nuove, più strettamente legate con energia potenziale inferiore, rilasciando la differenza come calore. Il fatto che si possa accendere un fuoco più di una volta suggerisce che dietro di esso c'è qualche fenomeno ripetibile da comprendere, che il "fuoco" non è come "i numeri vincenti esatti della lotteria della settimana scorsa" per quanto riguarda ciò che di esso c'è da comprendere o prevedere.

Allo stesso modo, se guardate il cielo notturno, vedrete più di una stella. Anche i pianeti, che risultano diversi dalle altre "stelle", hanno qualcosa in comune con le stelle, in termini di conoscenze necessarie per comprenderli.

I nostri antenati, che non avevano esperienza nel comprendere con successo il fuoco come fenomeno chimico, potrebbero non essere stati fiduciosi nella loro capacità di comprendere un giorno le stelle. Ma oggi abbiamo compreso il fuoco, le stelle e molti altri fenomeni, e possiamo trarne una sottile lezione che va oltre il semplice "Beh, abbiamo compreso quelle altre cose, quindi in futuro comprenderemo tutto il resto." È la lezione che la ripetizione corrisponde alla regolarità, che le cose che accadono spesso accadono per un motivo.

L'intelligenza mostra regolarità simili che suggeriscono che può essere compresa. Per esempio, si manifesta in ogni essere umano e potrebbe essere stata costruita dalla cieca selezione evolutiva attraverso i genomi. Evidentemente, insiemi simili di geni potrebbero avere successo in molteplici compiti diversi. I geni che permettono al cervello umano di scheggiare asce di pietra ci permettono anche di fabbricare lance e archi. E più o meno quegli stessi geni hanno prodotto cervelli che hanno poi inventato l'agricoltura, le armi da fuoco e i reattori nucleari.

Se non ci fosse nessuna struttura, nessun ordine, nessuna regolarità nell'intelligenza che potremmo riconoscere come un modello, allora ogni animale dovrebbe prevedere o inventare una cosa alla volta. I cervelli delle api sono specializzati negli alveari; non possono anche costruire dighe. Gli esseri umani avrebbero potuto necessitare di altrettanta specializzazione per ogni compito che possiamo risolvere; avremmo potuto avere bisogno di sviluppare aree cerebrali specializzate per i "reattori nucleari" prima di poter costruire reattori nucleari. Se questo fosse ciò che i neuroscienziati avessero trovato all'interno dei cervelli, sarebbero stati autorizzati a sospettare che non ci fossero principi profondi dell'intelligenza da comprendere, e che ci fossero principi diversi per ogni compito diverso.

Ma questo non è quello che troviamo nei cervelli umani. Scopriamo che gli stessi cervelli progettati per scheggiare asce di pietra sono capaci di inventare reattori nucleari, il che implica che c'è qualche modello di base che i geni sono stati in grado di sfruttare, volta dopo volta dop volta.

L'intelligenza non è un fenomeno caotico, imprevedibile e unico come gli esatti numeri vincenti della lotteria della scorsa settimana. C'è una regolarità dell'universo da comprendere.

**Ci sono molte cose che ancora non capiamo sull'intelligenza umana che dovrebbero essere comprensibili in linea di principio**

Per quanto riguarda gli esseri umani, la scienza oggi può dire molto sulla struttura e sul comportamento dei singoli neuroni. E possiamo dire molto su argomenti ordinari della psicologia popolare, come: "Bob è andato al supermercato da solo perché era arrabbiato con Alice". Ma tra questi due livelli di descrizione c'è un'enorme lacuna nella nostra comprensione.

Sappiamo pochissimo di molti degli algoritmi cognitivi che il cervello utilizza. Possiamo dire cose molto grossolane sulle funzioni che sono correlate con particolari regioni del cervello, ma non siamo neanche lontanamente in grado di descrivere meccanicisticamente cosa stia effettivamente facendo il cervello.

Un modo semplice per vedere che manca un livello di astrazione è che i nostri modelli neuroscientifici di alto livello fanno previsioni molto peggiori di quelle che si potrebbero ottenere con una simulazione completa dei neuroni. Le nostre comprensioni meccanicistiche delle altre persone devono quindi essere incomplete.

Una certa perdita di informazioni è presumibilmente necessaria, ma un buon modello ne perderebbe molto meno. Una certa "comprensione" del differenziale di un'auto non vi permetterà di prevedere tutto ciò che fa il differenziale altrettanto bene quanto una simulazione a livello atomico — perché a volte i denti degli ingranaggi si consumeranno e slitteranno, per esempio. Ma il modello a livello di ingranaggi di un differenziale è ancora in grado di fare certe previsioni in modo molto preciso, ed è facile riconoscere il confine tra le cose che il modello dovrebbe essere in grado di prevedere (come il modo in cui gli ingranaggi gireranno quando sono correttamente interconnessi) e ciò che non dovrebbe essere in grado di prevedere (come cosa succede quando i denti degli ingranaggi si consumano).

Perché aspettarsi che questo grado di modellizzazione sia possibile con le menti umane? Forse le menti umane sono troppo casuali. Forse, se si vogliono previsioni accurate, o neuroni o niente.^*

Una prova che non sia "neuroni o niente" è che persino vostra madre può prevedere il vostro comportamento meglio dei migliori modelli formali del cervello. Il che significa che c'è sicuramente una struttura nella psicologia umana che può essere conosciuta implicitamente, senza simulare esattamente i neuroni di qualcuno. Semplicemente non è stata ancora resa esplicita.

Prove più concrete che sia possibile modellizzare meglio le menti umane vengono dagli studi sugli amnesici. Alcuni amnesici sono inclini a ripetere testualmente la stessa battuta più volte. Questo suggerisce un certo tipo di regolarità nel cervello di quelle persone. Suggerisce che eseguono inconsciamente un particolare calcolo (basato, forse, sulle loro circostanze e sulla presenza dell'infermiera e sui loro ricordi e storia e sul loro desiderio di diffondere gioia ed essere visti come intelligenti) che è stabile attraverso una varietà di perturbazioni minori.

Se c'è così tanta regolarità nel calcolo mentale di una persona, allora sembra che dovrebbe essere possibile comprenderlo — che dovrebbe essere possibile imparare gli ingranaggi della decisione, comprendere il cervello con sufficiente profondità da poter dire:

"Ah, questi neuroni corrispondono al desiderio di diffondere gioia, e quei neuroni corrispondono al desiderio di essere considerati intelligenti, e questi neuroni qui sono quelli che generano possibili pensieri dopo aver visto l’infermiera entrare nella stanza, e qui ci sono i generatori che producono il pensiero 'fare una battuta', ed ecco come i neuroni del desiderio di cui sopra interagiscono con esso, in modo che il pensiero venga promosso in primo piano nel contesto più ampio seguente. Ed ecco come quel contesto influenza l’accesso alla memoria con i parametri seguenti — i quali, se si seguono questi percorsi qui, mostrano come scaturisca l’idea di muovere lo sguardo per la stanza. E dato che nella stanza c’è un quadro con una barca a vela, si può capire come il concetto di 'barca a vela' venga attivato da questa nuvola di neuroni qui, e se si tracciano gli effetti fino al richiamo della memoria, si può capire come il paziente finisca per fare una battuta sulle barche a vela."

La spiegazione corretta non sarà esattamente così. Ma la regolarità del semplice osservabile macroscopico ("stessa battuta ogni mattina") suggerisce fortemente che non sia tutta casualità irriducibile — che ci sia qualche calcolo riproducibile che avviene lì dentro. (Il che, ovviamente, corrisponde anche al buon senso: se i cervelli fossero puramente casuali, non potremmo funzionare).

Ci sono già stati dei progressi nella comprensione dell'intelligenza

Questo è il motivo principale per cui siamo convinti che ci sia ancora molto da imparare sull'intelligenza. Potete leggere libri più vecchi come The MIT Encyclopedia of the Cognitive Sciences o Artificial Intelligence: A Modern Approach (2a edizione) — scritti prima che le moderne tecniche di "apprendimento profondo" (per far crescere le IA) divorassero il campo dell'IA — per ottenere una buona dose di intuizioni su come vengono risolti diversi problemi nella cognizione. Non tutte queste intuizioni sono state completamente riscritte per essere intelligibili da un pubblico non specializzato o ampiamente diffuse agli studenti universitari; c'è molto di più di quanto sia stato divulgato.

Prendiamo il principio scientifico secondo cui dovremmo preferire ipotesi più semplici a quelle più complesse, a parità di condizioni. Cosa significa esattamente "semplice" in questo contesto?

"La mia vicina è una strega, è stata lei!" sicuramente sembra più semplice per molte persone rispetto alle equazioni di Maxwell che governano l'elettricità. In che senso le equazioni sono l'opzione "più semplice"?

A proposito, come definiamo l'idea che le prove "corrispondano" a un'ipotesi, o che un'ipotesi "spieghi" le prove? E come bilanciamo la semplicità delle ipotesi con il loro potere esplicativo? "La mia vicina è una strega, è stata lei!" potrebbe spiegare un'infinità di cose! Eppure molti (giustamente) intuiscono che questa sia una cattiva spiegazione. Infatti, il fatto che la stregoneria possa "spiegare" così tante cose è parte del motivo per cui è sbagliata.

Esistono dei principi unificanti per scegliere tra ipotesi diverse? O ci sono solo un centinaio di strumenti diversi da usare per problemi diversi? E in quest'ultimo caso, come fa il cervello umano a inventare strumenti del genere?

Esiste un linguaggio che potremmo usare per descrivere ogni ipotesi che i computer o i cervelli potrebbero mai utilizzare con successo?

Domande come queste potrebbero sembrare molto imponderabili e filosofiche a chi le incontra per la prima volta. In realtà, però, sono tutte domande risolte e ben comprese nell'informatica, nella teoria della probabilità e nella teoria dell'informazione, con risposte che hanno nomi come "lunghezza minima del messaggio", "prior di Solomonoff" o "rapporto di verosimiglianza."^†

Sembra anche rilevante il fatto che esistano già IA completamente comprese che sono superumane in campi specifici. Comprendiamo tutti i principi rilevanti all'opera nell'IA scacchistica Deep Blue. Dato che Deep Blue è stato programmato a mano, possiamo facilmente ispezionare diverse parti del suo codice, vedere tutto quello che fa un dato frammento di codice e vedere come si relaziona al resto del codice.

Quando si parla di modelli linguistici di igrandi dimensioni come ChatGPT, non è del tutto chiaro che possa esistere una descrizione completa e breve di come funzionano. Questi modelli linguistici sono così grandi che possono avere comportamenti simili per molte ragioni contingenti diverse, se (per esempio) il meccanismo che genera quel comportamento si trova in mille punti diversi all'interno del modello linguistico.

ChatGPT potrebbe rivelarsi difficile da capire per gli scienziati, anche dopo decenni di studio. Ma l'esistenza di ChatGPT non vuol dire che l'intelligenza debba essere disordinata per funzionare. Vuole solo dire che sarebbe una pessima idea cercare di portare qualcosa come ChatGPT fino al livello di superintelligenza, per motivi che vedremo nei prossimi capitoli del libro.

Il fatto che una particolare mente sia disordinata non vuol dire che sia impossibile capire l'intelligenza. Non vuol dire nemmeno che sia impossibile capire ChatGPT un giorno. Se guardate da vicino un centinaio di tronchi in fiamme, potete vedere che non ce ne sono due che brucino esattamente allo stesso modo. Il fuoco si diffonde in modi diversi, le braci volano in direzioni diverse ed è tutto molto caotico. Se poteste guardare molto da vicino e osservare il ceppo con un microscopio ignifugo, potreste vedere dettagli ancora più vertiginosi. Sembra facile immaginare un antico filosofo che, osservando questi dettagli caotici, concludesse che il fuoco non sarebbe mai stato compreso appieno.

E forse avevano anche ragione! Forse non avremo mai il potere di guardare un ceppo e prevedere esattamente quale frammento di legno si trasformerà nella prima brace che volerà via verso ovest. Ma l'antico filosofo avrebbe commesso un grave errore se avesse concluso che non avremmo mai compreso cosa sia il fuoco, perché si manifesti, come crearlo in condizioni controllate o sfruttarlo a nostro vantaggio.

Il modello esatto delle braci non è né molto regolare né molto riproducibile. Ma a un livello più astratto, quella roba calda e tremolante di colore giallo-arancio-rosso è una regolarità che si ripete continuamente nel mondo, ed è una cosa che l'umanità è riuscita a comprendere.

Le argomentazioni in Prima che sia troppo tardi non dipendono molto dai dettagli tecnici che si conoscono oggi sull'intelligenza. "Le persone continuano a costruire computer sempre più intelligenti, senza però averne il controllo; e se creano qualcosa di molto intelligente e fuori controllo, finiremo per morire" non è un concetto così esoterico. Ma è utile sapere che esiste un ampio corpus di conoscenze in questo campo, anche se rimangono molti misteri e incognite.

Le argomentazioni principali del libro non dipendono dal fatto che l'intelligenza sia comprensibile in linea di principio, motivo per cui non abbiamo approfondito la letteratura esistente. Anche se nessun essere umano potesse mai comprendere i misteri di un'intelligenza artificiale superumana, la superintelligenza artificiale potrebbe comunque ucciderci.

La questione è importante soprattutto quando si tratta di decidere cosa fare dopo aver fermato la corsa suicida all'IA.

Ed è importante il fatto che l'intelligenza probabilmente può essere compresa, il che significa che probabilmente, in linea di principio, delle persone intelligenti potrebbero sviluppare un campo maturo di intelligenza e trovare una soluzione al problema dell'allineamento dell'IA.

È anche importante che l'umanità moderna non sia neanche lontanamente vicina a tale impresa, ovviamente. Ma il fatto che l'impresa sia possibile in linea di principio ha delle implicazioni su come l'umanità dovrebbe uscire da questa situazione, come vedremo più avanti, nella discussione approfondita del capitolo 10.

* Diamine, forse anche le simulazioni neurali sono ancora inaffidabili, se, per dire, il comportamento umano è altamente sensibile al calore.

† Yudkowsky ha approfondito questi argomenti in post come "Che cos'è l'evidenza?", "Quanta evidenza serve?" e "Il rasoio di Occam".

Notes

[1] incomparabilmente diverso: Come disse l'eminente fisico Lord Kelvin nel 1903: "I biologi moderni stanno tornando ad accettare con fermezza l'esistenza di qualcosa che va oltre le semplici forze gravitazionali, chimiche e fisiche; e quella cosa sconosciuta è un principio vitale". Fonte: Silvanus Phillips Thompson, The Life of Lord Kelvin (American Mathematical Society, 2005).

Le intuizioni "ovvie" richiedono tempo

→