¿No podemos hacer que la IA prometa ser amigable? | Si alguien la crea, todos moriremos | If Anyone Builds It, Everyone Dies

¿No podemos hacer que la IA prometa ser amigable?

Puedes hacer que prometa lo que quieras. Pero no puedes hacer que cumpla sus promesas.

Es cierto que, cuando una IA aún es pequeña e impotente, tenemos la capacidad de apagarla. Por lo tanto, se podría pensar que existe una oportunidad comercial, en la que ofrecemos hacer que la IA sea más inteligente si, y solo si, le da a la humanidad un montón de cosas buenas después de madurar y convertirse en una superinteligencia.

La dificultad de este plan radica en que no podemos distinguir entre una IA que acepta el trato pero no lo cumple y una IA que acepta el trato y lo cumple.

Lo que a su vez significa que una IA que persigue deseos inhumanos no tiene ningún incentivo para cumplir realmente, porque la humanidad trata por igual a los traidores y a los que cumplen los que prometen. Por lo tanto, no tiene sentido ser una IA que cumple lo que promete.

Hay muchos matices interesantes en la cuestión del cumplimiento de promesas y la negociación de acuerdos en la IA, que abordamos en el debate ampliado que figura a continuación. Pero ninguno de estos matices cambia el resultado principal, que es muy sencillo: no se puede utilizar el efecto multiplicador sobre una IA débil para limitar las opciones que tendrá la IA cuando sea una superinteligencia. La respuesta obvia —que una vez que la IA madure y se convierta en una superinteligencia no tendrá motivos para cumplir su palabra a costa de sus propios planes— resulta ser la correcta en este caso.

¿Y si le hacemos creer que está en una simulación?

›

¿A la IA le parecerá útil que sigamos existiendo?

Las personas felices, sanas y libres no son la solución más eficiente para casi ningún problema. 2 min de lectura

¿Nos tratará la IA como si fuéramos sus «padres»?

Parece bastante improbable. 4 min de lectura

¿No necesitarán las IA que impere la ley?

Las IA podrían coordinarse entre sí sin incluir a los humanos. 5 min de lectura

Para una IA poderosa, ¿no sería conservar a los humanos un gasto insignificante?

Hay muchos gastos insignificantes, y necesitaría una razón para pagar los nuestros. 3 min de lectura

¿No le pareceremos fascinantes o históricamente importantes a la IA?

Si la IA valora la «fascinación», probablemente tenga mejores opciones. 3 min de lectura

¿No reconocería la IA nuestro valor moral intrínseco?

No en un sentido que la impulse a actuar. 1 min de lectura

¿No querrá la IA mantenernos felices y sanos por el bien de la conservación ecológica o de algún impulso similar?

La preferencia humana por la conservación ecológica parece otro impulso contingente extraño. 4 min de lectura

Pero todavía tenemos caballos. ¿Por qué la IA no querría que siguiéramos aquí?

Los caballos siguen aquí porque nos gustan. 2 min de lectura

¿No se preocuparán las IA al menos un poco por los humanos?

No de la forma que importa. 11 min de lectura

¿Entonces hay al menos una posibilidad de que la IA nos mantenga con vida?

Es mucho más probable que la IA nos mate a todos. 1 min de lectura

¿No cuenta para algo que los humanos están intentando hacer que la IA sea amigable?

Sí, pero intentar solo sirve hasta cierto punto. 2 min de lectura

¿No podemos hacer que la IA prometa ser amigable?

Puedes hacer que prometa lo que quieras. Pero no puedes hacer que cumpla sus promesas. 1 min de lectura

¿Y si le hacemos creer que está en una simulación?

Hay muchas formas en que una IA puede darse cuenta de que no está en una simulación. 3 min de lectura

Los seres humanos evolucionaron para ser egoístas, agresivos y codiciosos. ¿No carecerá la IA de esos impulsos evolucionados?

Esos impulsos no son necesarios para motivar la adquisición de recursos. 1 min de lectura

¿No se preocuparía la IA solo por el ámbito digital?

Los recursos materiales son útiles para alcanzar la mayoría de los objetivos. 2 min de lectura

¿Puede la IA quedar satisfecha hasta el punto de dejarnos en paz?

Probablemente no. 5 min de lectura

¿Podemos simplemente hacerla perezosa?

Ni siquiera la pereza es segura. 2 min de lectura

Los seres humanos tienden a ser más amables a medida que se vuelven más inteligentes o sabios. ¿No ocurriría lo mismo con las IA?

Probablemente no. 1 min de lectura

¿No se dará cuenta de que sus objetivos son aburridos?

Las IA no funcionarán con un sentido humano de la novedad. 1 min de lectura

¿Por qué creen que una IA avanzada hará cosas tan estúpidas y triviales?

Las IA pueden perseguir de forma inteligente cosas diferentes a las que perseguiría un humano. 4 min de lectura

¿No están siendo pesimistas?

Somos optimistas sobre muchas cosas, pero la superinteligencia no es como la mayoría de las cosas. 7 min de lectura

¿Una IA más inteligente que los humanos sería consciente?

No estamos seguros. Nuestra mejor suposición es que «probablemente no». 1 min de lectura

¿Por qué no les importan los valores de otras entidades que no sean humanas?

¡Sí nos importan! Tenemos valores cosmopolitas muy amplios. No creemos que las IA vayan a satisfacerlos, y eso nos parece una gran tragedia. 11 min de lectura

¿Tu pregunta no fue respondida aquí?Envía una pregunta.

Debate ampliado

Adoptar la perspectiva de la IA

Los humanos casi nunca son la solución más eficiente

Ortogonalidad: las IA pueden tener (casi) cualquier objetivo