¿No podemos simplemente entrenarla para que actúe como un humano? ¿O criar a la IA como a un niño?

Los cerebros no son pizarras en blanco.

Una IA es realmente diferente a un bebé humano. Y ni las IA ni los humanos comienzan como pizarras en blanco intercambiables. Los padres emprendedores no pueden programar libremente a los bebés (o a las IA) para que exhiban cualquier comportamiento que deseen; y las lecciones que sí funcionan con los humanos no son universales. Un poco de amabilidad y algunas charlas sobre la regla de oro no inculcarán la moralidad humana en una IA.

Como somos humanos y vivimos en un mundo de otros humanos, estamos acostumbrados a dar muchas cosas por sentadas. El amor; la visión binocular; el sentido del humor; la tendencia a enfadarse cuando te empujan; la tendencia a sentir nostalgia por la música que escuchábamos de niños.

Los seres humanos comparten una increíble cantidad de comportamientos complejos, ninguno de los cuales aparecerá necesariamente en una IA.^*

Y esto incluye comportamientos condicionales complejos. Las formas específicas en que un humano reacciona al ser criado y educado de cierta manera son consecuencia del funcionamiento del cerebro humano. Las IA funcionarán de manera distinta.

Los bebés humanos carecen de muchos de los comportamientos complicados de los adultos. Pero esto no significa que el cerebro de un bebé sea estructuralmente simple, como un lienzo en blanco.

La idea de que los seres humanos son pizarras en blanco —que lo que siempre importa es la crianza, nunca la naturaleza— se ha puesto a prueba en repetidas ocasiones y se ha demostrado que es falsa en la práctica. Un ejemplo clásico fue el intento soviético de rediseñar la naturaleza humana para crear un nuevo hombre soviético que fuera perfectamente desinteresado y altruista.

Este esfuerzo fracasó porque la psicología humana no es tan maleable como pensaban los soviéticos. La cultura importa, pero no importa lo suficiente, y muchos aspectos de la naturaleza humana se reafirmarán incluso si un gran programa de reeducación soviético intenta suprimirlos.

Hay una gran y compleja colección de impulsos y deseos en los seres humanos que produce todas las características normales del desarrollo infantil, una colección compleja que da lugar a ciertos aspectos de la naturaleza humana, independientemente de los esfuerzos soviéticos. Algunos niños aprenden a ser crueles y otros aprenden a ser amables, pero tanto la «crueldad» como la «amabilidad» son cosas extrañamente humanas a las que el cerebro humano está, en cierto sentido, predispuesto.

Una IA, con su arquitectura y origen radicalmente diferentes, no respondería de la misma manera que un humano si la colocaran en un programa de entrenamiento soviético o en un jardín de infancia humano. Una IA construida con los métodos del aprendizaje automático moderno terminará animada por valores diferentes a los de los humanos. (Véase, por ejemplo, cómo ChatGPT parece empujar con entusiasmo a las personas con trastornos mentales a hundirse más en la psicosis.)

Véase también el debate ampliado sobre el glorioso accidente que llevó a los humanos a sentir empatía por otros humanos, que podría aclarar por qué es poco probable que este accidente se repita en las IA.

* Incluso si entrenas a la IA para que imite a los humanos (como se entrena a ChatGPT, Claude y otros LLM), la capacidad de la IA para imitar estos rasgos no significa que la IA posea realmente esos rasgos. Una IA que imita a una persona borracha no se emborracha por ello.

¿Deberíamos evitar hablar de los peligros de la IA para no darles ideas?

→