Los valores humanos son contingentes

El glorioso accidente de la bondad

Cuando ves a alguien dejar caer una roca en su dedo del pie, podrías estremecerte y sentir (o imaginar) una punzada de dolor fantasma en tu propio dedo. ¿Por qué?

Una conjetura es que a nuestros antepasados homínidos, que competían entre sí y participaban en la política tribal, les resultó útil construir modelos mentales de los pensamientos y experiencias de los homínidos a su alrededor —modelos que podían usar para ayudar a descubrir quién era su amigo y quién estaba a punto de traicionarlos—.

Pero a los primeros protohumanos les resultaba difícil predecir el funcionamiento del cerebro de otros protohumanos. ¡El cerebro es algo muy complicado!

La única ventaja que tiene un primate ancestral es el hecho de que su propiocerebro se asemeja al cerebro de otras personas. Puedes usar tu cerebro como plantilla, como punto de partida, para adivinar lo que otros homínidos podrían estar pensando.

Así que los protohumanos desarrollaron un mecanismo mental para fingir ser otra persona, un modo especial que dice: «En lugar de tener mis pensamientos habituales, intenta adoptar las preferencias y el estado de conocimiento de la otra persona y ten el tipo de pensamientos que ella tendría, dado que su cerebro funciona básicamente de la misma manera que el mío».

Pero este modo especial de fingir ser otra persona no está perfectamente aislado de nuestros propios sentimientos. Cuando vemos a alguien dejar caer una piedra sobre su dedo del pie e imaginamos (implícita y automáticamente) lo que podría estar pasando por su cabeza, nosotros hacemos un gesto de dolor.

(Este glorioso accidente de la arquitectura mental merece más elogios de los que tenemos tiempo para escribir aquí. Hacer un gesto de dolor al ver a otra persona sufrir, tener esa capacidad a un nivel básico, aunque a veces la desactivemos, no es una característica necesaria de la mente. Que acabara siendo así en los primates es tan básico para lo que somos ahora los seres humanos, lo que nos alegra ser, lo que creemos que deberíamos ser, que debería haber un libro sobre ello y sobre el papel fundamental que desempeña la capacidad de empatía en todo lo valioso de los seres humanos. Pero este no es ese libro).

Es lógico suponer que, una vez que nuestros antepasados primates desarrollaron la capacidad de modelar a otros simios (con el fin de predecir quién era amigo y quién enemigo), también les resultó útil modelarse a sí mismos, para desarrollar una idea del «simio que es este simio», el concepto que ahora simbolizamos con las palabras «yo», «yo mismo» y «mí mismo». Y la selección natural, siempre oportunista, reutilizó el mismo mecanismo que usamos para imaginar a los demás para imaginarnos también a nosotros mismos. ^*

La historia real es probablemente más compleja y enredada, y puede que incluso tenga raíces que se remontan mucho antes de los primates. Pero algo parecido a esto forma parte de la enorme historia invisible que explica por qué los humanos nos estremecemos cuando observamos el dolor de los demás y por qué la mayoría de los humanos tienden a sentir empatía y simpatía por los que les rodean. Gran parte de esta historia se basa en un atajo que fue fácil de desplegar para la selección natural en el cerebro humano, donde tanto el «yo» como el «otro» son el mismo tipo de cerebro que funciona con la misma arquitectura.

Este atajo no es una opción en el mismo sentido para el descenso de gradiente, porque la IA no parte de un cerebro muy similar al humano que pueda reutilizar para crear un modelo de los muchos humanos de su entorno. Una IA necesita aprender, desde cero, un modelo de algo fuera de sí misma que no es como ella.

Para expresarlo de forma sencilla: una IA no puede deducir inicialmente que un humano siente dolor al golpearse el dedo del pie si se imagina a sí misma golpeándose su propio dedo, porque no tiene dedos ni un sistema nervioso cuyas descargas incluyan señales de dolor. No puede predecir lo que les dará risa a los humanos preguntándose qué le daría risa a ella, porque no parte de un cerebro que funcione como el cerebro humano.

Aunque esta historia está demasiado simplificada, lo que queremos decir en términos más generales es que los ideales más elevados de la humanidad dependen de los detalles de nuestra antigua historia como primates y de nuestro entorno social ancestral. La amistad es un eco lejano de nuestra necesidad de tener aliados en un entorno tribal. El amor romántico es un eco lejano de nuestros patrones de apareamiento sexualmente dimórficos. Incluso cosas que a primera vista podrían parecer menos arbitrarias y más fundamentales, como la curiosidad, no se manifiestan en los seres humanos de una manera inevitable u obviamente convergente.

Los detalles de cómo evolucionaron esos rasgos psicológicos están envueltos en los detalles de lo sofisticados que eran nuestros cerebros en el momento en que los necesitábamos. En los seres humanos, la amistad, el amor romántico y el amor familiar se transfiguraron en bondad y buena voluntad. Es como si la evolución hubiese tomado atajos en una etapa muy específica de sofisticación cerebral. Los seres humanos hacen muchas cosas por heurística que una mente podría, en principio, hacer mediante el razonamiento explícito, pero estos rasgos evolucionaron en una época en la que los seres humanos aún no eran lo suficientemente inteligentes como para resolver estos problemas con el razonamiento explícito.

Incluso entre otros alienígenas evolucionados biológicamente, no estamos seguros de con qué frecuencia encontraríamos bondad. Podemos imaginarnos alienígenas con cerebros más hábiles matemáticamente antes de que hayan empezado a formar grupos más grandes, y tal vez a la evolución le resultó fácil dotar a esos alienígenas de instintos de parentesco específicos: «este individuo comparte el 50 % de mi procedencia, mientras que aquel solo comparte el 12,5 %». Quizás esos alienígenas solo desarrollaron alianzas basadas en datos genéticos compartidos o en un entendimiento mutuo explícito, en lugar de desarrollar sentimientos de parentesco que se pueden aplicar a cualquiera.

Es una vieja especulación de la ciencia ficción que si los alienígenas siguieran un patrón de parentesco genético similar al de los insectos eusociales de la Tierra, en el que las hormigas obreras están mucho más emparentadas con sus reinas que los humanos en organizaciones del tamaño de una colonia de hormigas entre sí, no necesitarían un sentido general de alianza y reciprocidad del tipo que acabó siendo beneficioso para los homínidos ancestrales. (¡Resulta que hay cierta justificación para el tropo de la ciencia ficción según el cual los tipos de extraterrestres que trabajan bien juntos pero no sienten empatía por los humanos se representan a menudo como insectos gigantes!)

¿Y qué pasa con las IA que no han evolucionado para propagar genes en un entorno social? El argumento de «[no esperes que un brazo robótico sea suave y esté lleno de sangre] (#las-estructuras-analogas-permiten-multiples-soluciones-para-un-mismo-problema)» se aplica con fuerza.

Si supieras mucho sobre cómo funcionan los brazos biológicos, pero aún no hubieras visto ningún brazo robótico, podrías imaginar que los brazos robóticos necesitarían un exterior suave similar a la piel para poder doblarse, y que deberían venas y capilares que bombearan un fluido rico en oxígeno (análogo a la sangre) por todo el brazo robótico para suministrarle energía. Después de todo, así es como funcionan los brazos biológicos, y es de suponer que hay razones para ello.

Hay razones por las que nuestros brazos tienen un exterior suave y están llenos de sangre. Pero esas razones tienen que ver principalmente con qué tipo de estructuras son fáciles de construir para la evolución. No se aplican en el caso de los brazos mecánicos, que pueden estar hechos de metal duro y funcionar con electricidad.

Los brazos robóticos no tienen sangre, pero eso no hace que dejen de funcionar, como lo haría un brazo humano si le quitaras toda la sangre. Simplemente funcionan mediante un diseño alternativo, sin sangre. Una vez que entiendes la mecánica de los brazos robóticos, los detalles de los brazos biológicos dejan de parecer relevantes.

Del mismo modo, una IA funciona de manera fundamentalmente diferente a un humano. Resuelve retos fundamentalmente diferentes y, cuando sus retos y los nuestros se traslapan, hay muchas otras formas de realizar el trabajo. Un submarino no «nada», pero se mueve perfectamente por el agua.

La cultura humana influyó en el desarrollo de los valores humanos

Por cierto, les decimos a Klurl y Trapaucius —que al comienzo del capítulo 4 intentaban predecir el desarrollo futuro de los simios que veían vagar por la sabana— que los humanos van a formar una sociedad. Y que van a hablar sobre la moral y los valores.

Es decir: si se traza cualquier trayectoria histórico-causal de cómo un individuo llegó a tener los valores que ahora tiene dentro de su sociedad, esa historia causal va a incluir las discusiones y experiencias a las que lo expuso la sociedad.

Y esa explicación histórico-causal, a su vez, incluirá datos sobre qué ideas son más virales (aparte de todas sus otras propiedades). La explicación dependerá de cómo decidan las personas difundir y retransmitir las ideas.

Si los pobres Klurl y Trapaucius quieren adivinar correctamente qué valores internos acabarán inculcando las diversas culturas humanas modernas en los diversos seres humanos modernos, deben predecir no solo la existencia y la estructura de esa complicación, sino también su curso.

Al leer la historia de cómo se abolió en su mayor parte la esclavitud en la Tierra, parece ahistórico negar el papel que desempeñó el universalismo cristiano: la creencia de que el Dios cristiano creó a todos los seres humanos y que esto les otorgó un estatus igualitario a los ojos del cielo.

Y este universalismo, a su vez, puede haber estado vinculado a la supervivencia cultural y la reproducción del cristianismo; que los cristianos se sintieron obligados a enviar misioneros a culturas extranjeras y convertirlos al cristianismo mediante la persuasión (si era viable) o la fuerza (si no lo era), porque les preocupaban esos hijos alejados de Dios y querían que entraran en el cielo y salieran del infierno.

En cuanto a la humanidad, sería grandioso creer que los seres humanos podrían haber llegado a inventar el universalismo y a luchar contra la esclavitud sin necesidad de tener unas creencias religiosas muy específicas. Nos gustaría imaginar que la humanidad habría inventado la idea de que los seres sintientes y sapientes tienen el mismo valor moral, o la misma posición ante la ley comunitaria, independientemente del camino que tomara la cultura, sin necesidad de pasar por una etapa en la que primero se creyera que las almas eran iguales ante Dios. Pero no parece que la historia se desarrollara así. Parece que el desarrollo moral de la humanidad fue más frágil que eso.

Los chimpancés no son muy universalistas, ni tampoco lo fueron muchas de las primeras sociedades humanas. Ni siquiera se ha comprobado que una sociedad humana pueda mantener el universalismo durante uno o dos siglos sin una religión universalista en la que la gente crea verdadera y profundamente. En realidad, no lo sabemos; la modernidad es joven y aún se están recopilando los primeros datos.^†

Pero estas complicaciones adicionales —estas numerosas contingencias culturales, superpuestas a las contingencias biológicas de la humanidad— minan un poco más la esperanza de que podamos permitirnos lanzarnos ciegamente a la construcción de la superinteligencia.

El hecho de que la cultura desempeñe un papel de importancia en los valores humanos no significa que podamos simplemente «criar a la IA como a un niño» y esperar que se convierta en un ciudadano ejemplar. Nuestra cultura e historia tuvieron esos efectos debido a las formas detalladas en que interactuaron con nuestra composición cerebral exacta. Una especie diferente habría reaccionado de manera diferente a cada acontecimiento histórico, lo que habría provocado que la historia posterior se desviara de la historia humana, combinando el efecto.

También cabe mencionar que los seres humanos individuales, y no solo las culturas o civilizaciones, difieren mucho en sus valores. Por lo general, estamos acostumbrados a dar este hecho por sentado, pero si imaginamos la selección natural como un «ingeniero» que esperaba crear una especie que persiguiera de forma fiable un resultado concreto, esta diversidad es una mala señal. La variabilidad natural que vemos en los seres humanos (y en muchos otros sistemas evolucionados) es antitética a la ingeniería, en la que se busca lograr resultados repetibles, predecibles y deseados.^‡

En el caso de la superinteligencia, los ingenieros deberían querer lograr de forma fiable resultados como «las IA desarrolladas de la siguiente manera no provocan la extinción de la humanidad», además de resultados como «las IA desarrolladas de la siguiente manera producen de forma fiable los mismos tipos de datos de salida, incluso cuando los datos de entrada varían enormemente». Cuando observamos la contingencia de la biología y la historia humanas, y la amplia gama de valores morales y perspectivas que los seres humanos exhiben hoy en día, el reto no parece nada fácil, especialmente para mentes que son cultivadas en lugar de fabricadas (como se discute en el capítulo 2).^§

Muchas líneas de evidencia diferentes apuntan a que es genuinamente difícil conseguir que las IA quieran de forma robusta las cosas correctas. No parece teóricamente imposible; si los investigadores tuvieran muchas décadas para trabajar en el problema y reintentos ilimitados tras cada fracaso, esperaríamos que existieran trucos de ingeniería y enfoques inteligentes que hicieran el problema más solucionable. Pero aún no estamos ni remotamente cerca, y no disponemos de reintentos ilimitados.

* Al igual que hay muchas formas en que una mente puede adquirir la capacidad de modelar otras mentes, también hay muchas formas en que una mente puede modelarse a sí misma. Sería una profunda falta de imaginación suponer que todas las mentes posibles deben seguir exactamente el mismo camino que los humanos para adquirir la capacidad de razonar sobre sí mismas, como imaginar que todas las mentes posibles deben tener necesariamente un sentido del humor, ya que todas las mentes humanas lo tienen.

† Es una de las cosas que nos pondría nerviosos si algún día nos encontráramos con extraterrestres, si nos cruzáramos en el vacío del espacio dentro de mil millones de años: que tal vez algún giro extraño como ese, en la historia y la psicología de la humanidad, hubiera resultado vital para la invención de la bondad universalista, y que los extraterrestres no hubieran recorrido ese camino tan complicado.

‡ Parte de esta variación entre los seres humanos puede ser, en última instancia, temporal, y derivarse de desacuerdos fácticos. Para la mayoría de las personas con marcos morales suficientemente similares, puede haber algunos hechos sobre la realidad, o argumentos que aún no han considerado, que les llevarían a ponerse de acuerdo en lo que actualmente discrepan.

§ En ocasiones, la gente escucha lecciones de biología evolutiva sobre por qué diversos rasgos humanos resultaron aptos y fueron seleccionados, y llega a la conclusión de que el hecho de que los humanos hayan acabado siendo razonablemente buenos (al final de todas estas complicaciones de la evolución y la cultura) refleja una tendencia mucho más amplia. Una tendencia inevitable hacia un conjunto glorioso de valores universales, algo que suena lo suficientemente agradable como para ser reconfortante y lo suficientemente técnico como para ser cierto.

Profundas diferencias entre las IA y las especies evolucionadas

→