La superficialidad de las IA actuales | Si alguien la crea, todos moriremos | If Anyone Builds It, Everyone Dies

La superficialidad de las IA actuales

En el capítulo, escribimos que se puede «ver una superficialidad» en la inteligencia de las IA actuales (a mediados o finales de 2025), si sabes dónde mirar. Si aún no lo has visto por ti mismo, aquí tienes algunos lugares donde puedes buscar:

  • Claude 3.7 Sonnet, de Anthropic, se quedó atascado en bucles repetitivos mientras intentaba ganar un sencillo videojuego de Pokémon.

  • En noviembre de 2022, una de las mejores entidades del mundo en jugar al Go era una IA llamada KataGo. Al menos, hasta que los investigadores encontraron una forma de derrotarla utilizando una serie predecible de movimientos que activaban una especie de «punto ciego» y provocaban que KataGo cometiera errores que ni siquiera cometerían los aficionados. Dos años después, los ingenieros todavía no podían hacerla robusta frente a ataques como este.

  • Los LLM «multimodales» actuales (los que pueden trabajar con texto, imágenes y otros medios, en lugar de solo texto) tienen dificultades para interpretar relojes analógicos y calendarios en problemas que la mayoría de los alumnos de cuarto grado pueden resolver.

  • Los LLM actuales son famosos por fallar en variaciones sencillas de un acertijo clásico del doctor con respuestas directas y sin trucos, ya que parecen incapaces de resistirse a dar la respuesta trampa que tiene el acertijo en su forma habitual.

(Los recursos en línea del capítulo 4 ofrecen una visión más técnica de dónde puede provenir esta superficialidad.)

Nada de esto significa que las IA sean estúpidas en términos generales. Las IA modernas también pueden lograr medallas de oro en la Olimpiada Internacional de Matemáticas, que es un desafío matemático difícil y respetable. Las IA modernas pueden hacer una increíble variedad de cosas, a menudo igualando o superando el desempeño humano.

Su conjunto de habilidades es extraño. Las fortalezas y debilidades humanas son una guía deficiente para predecir qué encontrarán más fácil o más difícil las IA, porque las IA difieren radical y fundamentalmente de los humanos en muchos aspectos.

No estamos diciendo que ChatGPT vaya a matarte mañana. Aún existe cierta superficialidad en las IA modernas. Más bien, observamos que el campo está progresando, y no está claro cuánto tiempo durará esta superficialidad.

¿Tu pregunta no fue respondida aquí?Envía una pregunta.