El camino hacia el deseo

¿Por qué es el deseo una forma eficaz de actuar? ¿Por qué triunfa? ¿Por qué la optimización de caja negra mediante la selección natural tropieza con este truco una y otra vez?

Vemos el comportamiento «tipo deseo» como integral para dirigir el mundo con éxito. Esto se aplica no solo a entidades inteligentes como los humanos o las IA, sino también a entidades mucho más simples como las amebas y los termostatos. Para comunicar de manera más exhaustiva este punto de vista, investiguemos algunos de los mecanismos más simples posibles que exhiben la forma más simple posible de comportamiento «tipo deseo».

Empecemos por las rocas. Las rocas no exhiben realmente ningún comportamiento que podamos llamar «tipo deseo», para los propósitos de nuestra discusión. A veces, una roca rueda colina abajo, y un físico hablando casualmente podría decirte que la roca «quiere» estar más cerca del centro de la Tierra, por la fuerza de la gravedad. Pero ese tipo de tendencia (a caer en un campo gravitatorio) no es realmente lo que entendemos por comportamiento «tipo deseo».

Si vieras un objeto rodando montaña abajo, y siguiera encontrándose con barrancos de gran altitud, y siguiera cambiando de rumbo para evitar quedarse atascado en los barrancos y así poder llegar hasta el fondo, entonces empezaríamos a decir que el objeto se comportaba como si «quisiera» estar a una altitud menor. Pero este comportamiento tipo deseo del que hablamos sí implica alguna dirección robusta y dinámica hacia un destino particular, y las rocas no hacen mucho de eso.

Uno de los mecanismos más simples que hace algo que llamaríamos «tipo deseo» es el humilde termostato. Un termostato doméstico mide la temperatura, enciende la calefacción si la lectura baja de 21°C y enciende el aire acondicionado si la lectura supera los 23°C. Y así —si el dispositivo de medición y el sistema de climatización funcionan correctamente—, un termostato constriñe la realidad al rango de resultados posibles donde la temperatura de la casa se mantiene entre 21°C y 23°C.

El termostato más simple posible no necesita representar explícita y numéricamente la temperatura actual de la casa. Simplemente tomas, digamos, un termómetro bimetálico —con dos tiras delgadas de metales diferentes soldadas entre sí, de modo que los metales se doblan cuando el calor hace que las dos tiras se expandan en diferentes cantidades— y haces que el metal doblado active un interruptor para la calefacción en la marca de la curvatura de 21°C o active un aire acondicionado en la curvatura de 23°C.

Entonces, el termostato mantiene un rango de temperatura estrecho bajo una variedad bastante amplia de condiciones, produciendo un comportamiento extremadamente simple que se parece un poco a lo que hemos llamado «desear».

Hay montones de procesos termostáticos en bioquímica. Aparecen en todas partes cuando una célula o un cuerpo se beneficia de mantener alguna propiedad dentro de un rango determinado.^* Pero son solo el primer paso en el camino hacia una dirección completa.

A los dispositivos simples como los termostatos les faltan algunos componentes clave de la planificación. Dentro del termostato en sí, no existe la noción de predecir las consecuencias probables, ni de buscar entre las acciones posibles aquellas que conduzcan a consecuencias específicas («preferidas»), ni de aprender después de ver cómo se desarrollan los acontecimientos.^†

Si el termómetro de un termostato, su medidor de temperatura, se queda atascado en 19°C, el termostato no reaccionará con sorpresa cuando el funcionamiento continuo de la calefacción nunca parezca hacer subir el termómetro; el termostato simplemente seguirá funcionando y haciendo funcionar la calefacción.

Para dar un paso más allá de los termostatos, pasemos a los animales.

Algunos animales exhiben un comportamiento que apenas supera al de un termostato. Hay una famosa historia sobre las avispas excavadoras doradas, o avispas Sphex, que se remonta al entomólogo Jean-Henri Fabre en 1915. La avispa mata a un grillo y lo arrastra hacia la entrada de su madriguera para alimentar a sus crías. Entra para comprobar que no haya anomalías en su madriguera. Luego vuelve a salir y arrastra al grillo al interior.

Fabre reportó que si él alejaba el grillo unos centímetros del nido mientras la avispa revisaba su madriguera, cuando la avispa volvía a salir arrastraba el grillo de nuevo hasta la entrada y luego entraba en su madriguera por segunda vez, la inspeccionaba por segunda vez y luego volvía a salir para coger el grillo.

Si Fabre arrastraba al grillo una vez más, la avispa volvía a hacer exactamente lo mismo.

El informe original de Fabre indicaba que pudo repetir esto cuarenta veces.

Dicho esto, Fabre probó más tarde el mismo truco con otra colonia de la misma especie, y, en esa colonia, una avispa pareció darse cuenta tras dos o tres repeticiones. La siguiente vez que la avispa salió, arrastró al grillo directamente hasta la madriguera, omitiendo el paso de investigación.

Para el ojo humano, una avispa que repite cuarenta veces el mismo comportamiento se revela, en cierto sentido, como «preprogramada», como si siguiera ciegamente un guion, obedeciendo una serie de reglas del tipo «si… entonces». Y, a la inversa, una avispa que capta la situación y arrastra al grillo al interior en la cuarta repetición parece más intencionada, como si llevara a cabo comportamientos con el objetivo de alcanzar un fin último, en lugar de limitarse a seguir un guion.

¿Cuál es la diferencia clave?

Diríamos que la avispa que rompe el patrón se comporta como si pudiera aprender de experiencias pasadas.

Se comporta como si pudiera generalizar de «Mi política falló la última vez» a «Si sigo aplicando esa política, es probable que vuelva a fallar la próxima vez».

Inventa un comportamiento nuevo, uno que resuelve directamente el problema con el que se topó.

Por supuesto, no podemos descifrar las neuronas del cerebro de una avispa (al igual que no podemos descifrar los parámetros de un LLM) para saber exactamente qué estaba pasando en su cabeza. Quizás las avispas que rompieron el patrón seguían reglas de alto nivel del tipo «si… entonces» sobre cómo intentar saltarse pasos de los guiones cuando se encontraban con determinados tipos de problemas. Quizás un conjunto de reflejos relativamente simple y rígido salvó a las avispas en este caso —solo un poco menos rígido que el de la colonia que falló en esta prueba—. Sin duda, sería extraño que existiera una gran brecha cognitiva entre dos colonias de avispas de la misma especie.

O tal vez las avispas Sphexsí son lo suficientemente inteligentes como para aprender de la experiencia, cuando utilizan su cerebro correctamente. No pudimos encontrar el número de neuronas de las avispas Sphex, pero estas son más grandes que las abejas melíferas, y las abejas melíferas tienen cerebros de un millón de neuronas. Un millón de neuronas puede no parecer mucho para un programador de IA moderno o para un neurocientífico acostumbrado a los cerebros de los mamíferos, pero en términos absolutos, un millón de neuronas es realmente mucho.

Quizás las avispas Sphex son más generales de lo que parecen, y deberíamos pensar en la colonia que falló como pensadores relativamente flexibles que sucumbieron a algo parecido a una adicción o un fallo cognitivo en una circunstancia muy específica.

En cualquier caso, la cuestión es que, en comparación con los termostatos, las avispas tienen más capacidad para hacer frente a una amplia gama de problemas, especialmente en la medida en que su comportamiento pasa de seguir recetas inquebrantables a algo que se parece más al aprendizaje a partir de la experiencia.

Si sigues por este camino, obtendrás una respuesta a por qué la evolución sigue creando animales que se comportan como si desearan cosas. Es porque muchos animales podían sobrevivir y reproducirse mejor si seguían estrategias más generales para perseguir resultados, estrategias que funcionaran contra una gama más amplia de obstáculos.

Solía existir una visión filosófica según la cual existía una jerarquía natural entre las criaturas: los reptiles por encima de los insectos, los mamíferos por encima de los reptiles y los seres humanos (por supuesto) en la cima. Una señal de que tenías un estatus más alto era tu capacidad para adaptarte en el transcurso de una vida, no solo a lo largo del tiempo evolutivo: ver, modelar y predecir el mundo, renunciar a las recetas del fracaso e inventar nuevas estrategias para ganar.

Esa visión de una Gran Cadena del Ser no era muy matizada, y las perspectivas más sofisticadas de hoy en día critican su ingenuidad.

No obstante, esa visión también contenía una pizca de verdad del tamaño de una bola de demolición. Si comparamos a los castores que construyen presas con las arañas que tejen telas, es casi seguro que la cognición de los castores tiene un nivel más alto de generalidad —aunque solo sea porque tienen cerebros mucho más grandes, con más espacio para la astucia—.

Una araña puede tener cincuenta mil neuronas, y esas neuronas tienen que cubrir todos sus comportamientos. Su receta para tejer telarañas probablemente tenga muchas instrucciones que, si bien no son literalmente «y luego gira a la izquierda aquí», al menos son comparables a las políticas de una avispa Sphex.

El castor tal vez pueda —estamos especulando porque no somos expertos en castores, pero parecería obvio— ver una fuga de agua en una presa como una especie de discordancia que debe evitarse por cualquier medio que funcione. El castor tiene toda una corteza parietal (la parte del cerebro de los mamíferos que procesa el espacio y las cosas dentro del espacio) con la que potencialmente puede visualizar los efectos de añadir más ramas y rocas en lugares específicos.

Probablemente hay suficiente espacio en el cerebro de un castor para objetivos mentales amplios como «construir una gran estructura» y «no dejar que se filtre el agua», y suficiente poder para considerar soluciones amplias de alto nivel y adoptar objetivos subordinados como «añadir ramas aquí», que luego se transmiten a la corteza motora del castor, que mueve sus músculos y su cuerpo para coger algunas ramas.

Si las primeras ramas que agarra el castor están podridas y se rompen, es probable que su cerebro tenga espacio para actualizarse basándose en esa observación, generalizar sobre las ramas de ese color y textura, esperar que las futuras ramas de ese tipo se rompan de nuevo y, en su lugar, ir a buscar otro tipo de ramas.

Y esto —esperamos que algún etólogo con experiencia en castores se levante de un salto y nos grite— es una gran subestimación de las cosas más inteligentes que puede hacer un castor. Quizás algún entomólogo también se levante de un salto y diga que lo que acabamos de describir es algo que su insecto favorito puede hacer al construir una madriguera. Necesitábamos dar un ejemplo lo suficientemente sencillo como para poder describirlo en un párrafo; quizás nada tan sencillo esté fuera del alcance de un millón de neuronas.

La idea general es simplemente que un sistema obtiene fuertes beneficios reales en el desempeño de las tareas a medida que pasa de un comportamiento más reflexivo a cogniciones que se parecen más a la actualización de un modelo del mundo a partir de experiencias en tiempo real, prediciendo las consecuencias de las acciones utilizando ese modelo del mundo, imaginando estados útiles a los que se podría llevar el mundo y buscando estrategias de alto y bajo nivel que se prevé que produzcan esos estados imaginados.

Hemos abordado este punto en el capítulo 3. Si un conductor solo memoriza patrones de giros a la derecha y a la izquierda para ir del punto A al punto B utilizando reglas del tipo «giro brusco a la izquierda en la gasolinera», generalizará mucho más lentamente que un conductor que se aprende un mapa de calles y puede trazar sus propias rutas entre nuevos puntos. Memorizar políticas generaliza mucho más lentamente que empezar a destilarlas en un modelo del mundo aprendible más un motor de búsqueda de planes que incorpore un evaluador de resultados.

Esa destilación no es un cambio mental de todo o nada. La diferencia entre «memorizar una política» y «actualizar y planificar» importa incluso cuando la brecha se cruza gradualmente. Si el cerebro de un ratón no fuera más flexible que el cerebro de una araña —si no hubiera un salto en utilidad hasta llegar a un humano—, entonces el cerebro del ratón se habría mantenido del tamaño del de una araña y habría conservado el costo energético de este.

Pequeñas cantidades de imaginación y planificación empiezan a ser una ventaja evolutiva mucho antes de llegar a la cognición de nivel humano. No tienen que ser perfectas. Si son al menos tan buenas como un termostato, pueden ser útiles. Y a medida que más y más maquinaria útil como esa se refuerza en la mente, su comportamiento se vuelve cada vez más similar a uno que desea cosas.

* La prevalencia de mecanismos similares a los termostatos es una de las razones por las que a los humanos les cuesta tanto entender la bioquímica. Si un científico observa el efecto del frío en una casa con termostato, la causalidad real es que el frío hace que la casa pierda calor más rápidamente y, entonces, el termostato enciende la calefacción con más frecuencia. Pero el biólogo de la casa, al registrar las estadísticas, descubre que el clima frío no tiene un efecto estadístico visible en la temperatura de la casa; más bien, las casas en climas más fríos… ¿consumen más gas natural?

† Hay un optimizador externo —un ingeniero humano— que construyó el termostato, y ese ingeniero humano tenía en mente una predicción sobre lo que sucedería cuando el termostato encendiera automáticamente la calefacción a 70 °F. Pero el propio termostato no lo sabe.

Notes

[1] omitiendo el paso de investigación: Una versión de esta anécdota que circuló entre los informáticos antes del Internet moderno se basaba en un relato posterior de un ingeniero que omitió la salvedad de Fabre sobre cómo variaba la capacidad de cambiar de comportamiento entre colonias de avispas de la misma especie. Véase «The Sphex story: How the cognitive sciences kept repeating an old and questionable anecdote» (La historia de Sphex: cómo las ciencias cognitivas siguieron repitiendo una anécdota antigua y cuestionable) para más detalles.

Las IA capaces detectan mentiras y oportunidades.

→