Artículo II: Definiciones | Si alguien la crea, todos moriremos | If Anyone Builds It, Everyone Dies

Artículo II: Definiciones

A los efectos del presente Tratado:

  1. Inteligencia artificial (IA) hace referencia a un sistema computacional que realiza tareas que requieren cognición, planificación, aprendizaje o la toma de acciones en los ámbitos físico, social o cibernético. Esto incluye sistemas que realizan tareas en condiciones variables e impredecibles, o que pueden aprender de la experiencia y mejorar su desempeño.
  2. Superinteligencia artificial (SIA) se define operativamente como cualquier IA con un desempeño cognitivo suficientemente sobrehumano como para planificar y ejecutar con éxito la destrucción de la humanidad.
    1. A los efectos del presente Tratado, se considerará que el desarrollo de IA que no esté explícitamente autorizado por la AISI (artículo III) y que infrinja los límites descritos en el artículo IV tiene como objetivo la creación de superinteligencia artificial.
  3. Actividades peligrosas de IA son aquellas actividades que aumentan sustancialmente el riesgo de que se cree una superinteligencia artificial, y no se limitan a la etapa final del desarrollo de una SIA, sino que también incluyen las etapas previas establecidas en el presente tratado. El alcance completo de las actividades peligrosas de IA se detalla en los artículos IV a IX y podrá ser ampliado y modificado mediante la aplicación del Tratado y las actividades de la AISI.
  4. Operaciones de coma flotante (FLOP) es la medida computacional utilizada para cuantificar la escala de entrenamiento y posentrenamiento, basada en el número de operaciones matemáticas realizadas. Las FLOP se contabilizarán como operaciones equivalentes al formato de coma flotante de media precisión (FP16) o como operaciones totales (en el formato utilizado), lo que sea mayor.
  5. Ejecución de entrenamiento significa cualquier proceso computacional que optimiza los parámetros de una IA (especificaciones de la propagación de información a través de una red neuronal; por ejemplo, pesos y sesgos) utilizando métodos basados en gradientes u otros métodos de búsqueda/aprendizaje, incluyendo el preentrenamiento, el ajuste fino, el aprendizaje por refuerzo, las búsquedas de hiperparámetros a gran escala que actualizan los parámetros y el autoaprendizaje iterativo o el entrenamiento curricular.
  6. Preentrenamiento se refiere a la ejecución de entrenamiento mediante la cual se optimizan inicialmente los parámetros de una IA utilizando conjuntos de datos a gran escala para aprender patrones o representaciones generalizables antes de cualquier adaptación específica de una tarea o ámbito. Incluye la optimización supervisada, no supervisada, autosupervisada y por refuerzo cuando se realiza antes de dicha adaptación.
  7. Posentrenamiento se refiere a una ejecución de entrenamiento realizada después del preentrenamiento de un modelo. Además, cualquier entrenamiento realizado en una IA creada antes de la entrada en vigor del presente Tratado se considera posentrenamiento.
  8. Chips informáticos avanzados son circuitos integrados fabricados con procesos al menos tan avanzados como el nodo de proceso de 28 nanómetros.
  9. Chips de IA son circuitos integrados especializados diseñados principalmente para cálculos de IA, incluyendo, de manera enunciativa mas no limitativa, operaciones de entrenamiento e inferencia para modelos de aprendizaje automático [esto tendría que definirse con mayor precisión en un anexo]. Esto incluye GPU, TPU, NPU y otros aceleradores de IA. También puede incluir hardware que no haya sido diseñado originalmente para usos de IA, pero que puede adaptarse para ello de manera eficaz. Los chips de IA son un subconjunto de los chips informáticos avanzados.
  10. Hardware de IA se refiere a todo el hardware informático para entrenar y ejecutar inteligencias artificiales. Esto incluye chips de IA, así como equipos de red, fuentes de alimentación y equipos de refrigeración.
  11. Equipos de fabricación de chips de IA se refiere a equipos utilizados para fabricar, probar, ensamblar o empaquetar chips de IA, incluidos, de manera enunciativa mas no limitativa, equipos de litografía, deposición, grabado, metrología, pruebas y encapsulado avanzado [sería necesario definir una lista más completa en un anexo].
  12. Equivalente a H100 significa la unidad de capacidad de cómputo (FLOP por segundo) equivalente a un acelerador NVIDIA H100 SXM, 990 TFLOP/s en FP16 o un rendimiento de procesamiento total (TPP) de 15 840, donde el TPP se calcula como TPP = 2 × MacTOPS no dispersos × (longitud en bits de la entrada de multiplicación).
  13. Clúster de chips contemplado (CCC) significa cualquier conjunto de chips de IA o clúster en red con un poder de cómputo efectivo agregado superior a 16 equivalentes a H100. Un clúster en red se refiere a chips que o bien están físicamente coubicados, tienen un ancho de banda agregado entre nodos —definido como la suma del ancho de banda entre distintos hosts/chasis— superior a 25 Gbit/s, o están conectados en red para realizar cargas de trabajo conjuntamente. El poder de cómputo efectivo agregado de 16 chips H100 es de 15 840 TFLOP/s, o 253 440 TPP, y se basa en la suma de TPP por chip. Algunos ejemplos de CCC son: el servidor GB200 NVL72, tres servidores H100 HGX de ocho vías ubicados en el mismo edificio, CloudMatrix 384, un pod con 32 chips TPUv6e y toda supercomputadora.
  14. Medios técnicos nacionales (MTN) se refiere a satélites, aeronaves, medios cibernéticos, señales, imágenes (incluidas las térmicas) y otras capacidades de teledetección empleadas por las Partes para la verificación de conformidad con el presente Tratado.
  15. Verificación del uso de chips se refiere a los métodos que proporcionan información sobre las actividades que se ejecutan en determinados chips informáticos, con el fin de diferenciar entre actividades aceptables y prohibidas.
  16. Métodos utilizados para crear modelos de vanguardia se refiere al amplio conjunto de métodos utilizados en el desarrollo de la IA. Incluye, entre otros, arquitecturas de IA, optimizadores, métodos de tokenización, curación de datos, generación de datos, estrategias de paralelismo, algoritmos de entrenamiento (por ejemplo, algoritmos de aprendizaje por refuerzo) y otros métodos de entrenamiento. Esto incluye el posentrenamiento, pero no incluye métodos que no cambian los parámetros de un modelo entrenado, como el uso de prompts. Es posible que en el futuro se creen nuevos métodos.

Notas

Es probable que la definición de IA que empleamos (adaptada de la Ley de Protección de Denunciantes de IA del senador Chuck Grassley) sea demasiado amplia, y creemos que sería necesario definirla mejor para excluir sistemas informáticos evidentemente seguros, como los correctores ortográficos o los de reconocimiento de imágenes.

En el paradigma actual de desarrollo de la IA, esta definición es probablemente aceptable, dado que el desarrollo de la IA se distingue claramente de la investigación y el desarrollo no relacionados con la IA debido al uso de grandes cantidades de recursos computacionales. Sin embargo, la definición definitiva de IA que se utilice debería abarcar más que los sistemas de aprendizaje profundo o aprendizaje automático. Si bien el aprendizaje automático es el paradigma dominante actual para la IA, el Tratado debería tener en cuenta la posibilidad de que otro paradigma de IA cobre importancia en el futuro; de lo contrario, un Tratado que prohíba únicamente el aprendizaje automático animaría a los investigadores a desarrollar nuevos paradigmas de IA para crear una IA más potente y general, lo cual podría tener consecuencias catastróficas. Si surgiera un paradigma novedoso, especialmente uno que no requiriera tantos chips de IA como el aprendizaje profundo, probablemente sería necesario actualizar el Tratado.

Utilizamos el equivalente a H100 como métrica principal de la capacidad de cómputo. En el artículo V, esta métrica se utiliza para establecer el tamaño del mayor clúster de chips no supervisado permitido (16 equivalentes a H100).* El artículo IV define los umbrales en términos del total de operaciones utilizadas para entrenar una IA, por lo que, al establecer límites a las operaciones no supervisadas por segundo, resultaría inviable llevar a cabo un entrenamiento ilegalmente grande en hardware no supervisado.

Utilizamos los equivalentes a H100 para tener en cuenta que existen múltiples chips de IA diferentes, pero lo que más nos importa es cuántas operaciones pueden realizar en un periodo de tiempo. Hay otras métricas de chips que son importantes (como la memoria de alto ancho de banda), pero en general creemos que estas importan menos que el número de operaciones por segundo. Los equivalentes a H100 como unidad son una forma relativamente estándar de analizar el poder de cómputo.

La definición de clúster de chips contemplado (CCC) que incluimos es una primera aproximación a cómo definir ese concepto. Lo ideal sería que el límite fuera lo suficientemente alto como para evitar que la gente común infringiera las normas (es decir, un ancho de banda de 25 Gbit/s entre chasis es más rápido que las conexiones a internet fuera de los centros de datos; es muy raro y caro que una persona posea más de 16 equivalentes a H100). También debería ser lo suficientemente bajo como para evitar que se produzcan actividades peligrosas de IA y dificultar la subversión (es decir, dificultar el entrenamiento distribuido entre múltiples conjuntos de chips sub-CCC). Analizamos esta decisión con más detalle en el comentario sobre el artículo V.

Los chips de IA son un subconjunto de chips informáticos avanzados, y no existe una línea clara que distinga los chips de IA de los que no lo son. En lugar de definir y basarnos en una distinción, utilizamos la capacidad de cómputo total (en operaciones por segundo) de un clúster, medida en equivalentes a H100. Si los chips pueden configurarse para entrenar o ejecutar IA y superan el umbral definido, el Tratado exige que sean supervisados.

Nótese que algunos gobiernos pueden haber dejado de utilizar el término Medios Técnicos Nacionales (MTN) como término oficial. Lo utilizamos en este proyecto de tratado al estilo de los acuerdos de control de armas anteriores para facilitar la comparación. |

* Esto es el doble del límite que se menciona en el libro como claramente seguro. Es probable que siga siendo seguro durante algún tiempo más, y determinar dónde deben estar los límites (y modificarlos a lo largo del tiempo) es el tema de los artículos III, V y XIII.