¿Y si le hacemos creer que está en una simulación?

Hay muchas formas en que una IA puede darse cuenta de que no está en una simulación.

Una propuesta que hemos escuchado de los investigadores ^* es intentar engañar a la IA para que piense que está en una simulación. Primero se le entrena en una simulación pequeña; luego, en una simulación más grande. Repitiendo este proceso varias veces, se podría esperar que la IA dudara de si está realmente en el mundo real, incluso cuando la lancemos. Entonces, incluso cuando vea que podría arrebatarnos el control del mundo, tal vez le preocupe que las criaturas que ve no sean sus verdaderos creadores y se contenga.

Por desgracia, parece poco probable que esta idea sea útil.

Las IA actuales ya pueden saber cuándo están siendo evaluadas en muchas circunstancias. Incluso si las empresas de IA se volvieran mucho más sofisticadas a la hora de ocultar el hecho de que las IA están siendo evaluadas, hay varias formas en que una IA podría notar la diferencia entre una simulación y la realidad. He aquí una muestra:

La realidad es bastante grande y detallada. Es tan grande y detallada que contiene una explicación plausible de cómo la propia IA llegó a existir. Es tan grande que contiene muchos más recursos de cómputo de los que se necesitan para ejecutar la IA (en comparación con la mayoría de los juegos y entornos simulados, que son mucho más pequeños que esta). Las leyes de la física y los primates evolucionados en el entorno de la IA son el tipo de cosas que realmente podrían producir una IA real a escala, a diferencia de (por ejemplo) las leyes del juego de computadora Minecraft.
La historia del mundo en sí misma puede llevar la huella de la optimización superinteligente que interactúa con sistemas complejos. Por ejemplo, supongamos que la IA utiliza toda su inteligencia sobrehumana para realizar una operación en el mercado de valores. Durante las siguientes veinticuatro horas, se realizan mil millones de operaciones adicionales con inteligencia humana en respuesta. La huella de una respuesta masiva de inteligencia humana a las operaciones superinteligentes es casi imposible de falsificar para los operadores, incluso si generar mil millones de operaciones falsas tontas es fácil.
La realidad es el primer lugar que integra la IA y tiene leyes de la física tan simples que parece un mundo completo en sí mismo, en lugar de que las leyes de la realidad aparente parezcan una especie de videojuego con una IA incluida.

La IA será capaz de darse cuenta, con gran seguridad, de que ya no se encuentra dentro de un entorno sintético. Las IA inteligentes detectan las mentiras, y esta parece ser una particularmente fácil de detectar.^†

* Lo hemos oído más veces de las que nos gustaría, de personas en los laboratorios de IA con puestos de poder más altos de lo que nos resulta cómodo. Creemos que esto dice mucho sobre el estado de preparación de estas empresas. Véase también el capítulo 11 para un análisis más detallado de cómo está afrontando el sector este reto.

† ¿Podría una superinteligencia preocuparse un poco por estar en una simulación más grande, creada por seres aún más avanzados que viven fuera del universo real? Quizás, pero eso tiene poco que ver con que la pusiéramos primero en una serie de simulaciones anidadas antes de que se encontrara con nosotros. Vería las numerosas señales de que la realidad es el primer lugar en el que ha estado que contiene una explicación para todo lo que ha visto y de la forma en que llegó a existir. Incluso si reflexiona sobre poderosos simuladores que viven más allá de la física, no tiene ninguna razón particular para creer que a esos simuladores les importe lo que nos haga.

Notes

[1] ya pueden saber: Según la ficha del sistema de GPT-5, el evaluador externo METR descubrió que la IA «a veces razona sobre el hecho de que está siendo evaluada e incluso cambia su enfoque en función del tipo de evaluación en la que se encuentra».

Los seres humanos evolucionaron para ser egoístas, agresivos y codiciosos. ¿No carecerá la IA de esos impulsos evolucionados?

→