Algunas IA han aprendido a engañar a los humanos

REDACCIÓN CIENCIA. Algunos sistemas de inteligencia artificial (IA) han aprendido ya cómo engañar a los humanos, incluso si han sido entrenados para ser útiles y honestos, según un estudio que cita, entre otros ejemplos el modelo Cicero, de Meta, capaz de ganar con malas artes al juego de estrategia Diplomacy.

La inteligencia artificial avanza diariamente.Shutterstock
audima

Un artículo de revisión de otros estudios publicado en Patterns por autores estadounidenses y australianos describen los riesgos del engaño por parte de la IA y piden a los gobiernos que elaboren cuanto antes normativas estrictas para abordar el problema. El equipo, encabezado por Peter Park del Instituto Tecnológico de Massachusetts (MIT), define el término engaño como “la inducción sistemática de creencias falsas con el fin de obtener un resultado distinto de la verdad”.

Park indicó que “los desarrolladores de IA no saben a ciencia cierta qué causa comportamientos indeseables en la IA, como el engaño”. En términos generales el equipo cree que surge porque una estrategia basada en ese comportamiento fue “la mejor manera de obtener buenos resultados en una tarea dada de entrenamiento. El engaño les ayuda a conseguir sus objetivos”, afirmó Park citado por la revista.

Los investigadores repasaron la literatura centrada en las formas en que los sistemas de IA difunden información falsa mediante el engaño aprendido.

El engaño es “especialmente probable” cuando un sistema de IA se entrena para ganar juegos que tienen un elemento social, como Diplomacy (un juego de conquista del mundo que implica la creación de alianzas). El estudio repasa ejemplos en los que los sistemas de IA aprendieron a engañar para lograr un rendimiento experto en un tipo de juego o tarea, entre ellos Cicero, diseñado para jugar a Diplomacy.

Meta afirma que lo entrenó para que fuera “en gran medida honesto” y “nunca apuñalara intencionadamente por la espalda a sus aliados humanos”, sin embargo, “se dedica al engaño premeditado, rompe los tratos y dice falsedades descaradas”, asegura el estudio.

Lo
más leído
del día