-
Israel afirma haber matado al poderoso jefe de seguridad de Irán Alí Larijani
-
La fiscalía mexicana denuncia la contaminación del sitio donde se encontraba "El Mencho"
-
Más de 250 detenidos en Ecuador en el primer día de toque de queda anticrimen
-
"No maté a Narumi", reitera chileno Zepeda durante nuevo juicio en Francia
-
Cinco claves sobre Francia tras la primera vuelta de las elecciones municipales
-
Un tribunal de apelaciones federal de EEUU vuelve a autorizar las expulsiones de migrantes a terceros países
-
Cancelan la secuela de "Buffy, la cazavampiros"
-
Zelenski viaja esta semana a Londres y Madrid
-
Un hombre afgano muere bajo custodia del servicio de inmigración en EEUU
-
El riesgo de estanflación en EEUU es "bastante elevado", dice a la AFP el nobel de economía Stiglitz
-
HRW denuncia la "desaparición forzada" en El Salvador de migrantes deportados por EEUU
-
Afganistán acusa a Pakistán de haber matado a 400 personas en centro médico de Kabul
-
Israel bombardea Teherán y Beirut, y se registra una ola de ataques en Bagdad
-
Doncic lleva a los Lakers a su sexto triunfo seguido, los Spurs hunden a los Clippers
-
Alcaldes de EEUU se oponen a centros de datos mientras crece la reacción contra IA
-
Tres adolescentes de EEUU demandan a xAI por imágenes sexualizadas generadas con Grok
-
Nvidia lanza plataforma de agentes de IA impulsada por la fiebre de OpenClaw
-
Cuba abre la inversión a sus emigrados, en particular a los que viven en EEUU
-
Trump llama a sus aliados a defender el paso de petróleo por Ormuz
-
Trump reprocha falta de "entusiasmo" de aliados para reabrir estrecho de Ormuz
-
Presidente de Alemania dice que Latinoamérica no es un "patio trasero de nadie"
-
Los aliados de la OTAN rechazan la propuesta de Trump de intervenir en Ormuz
-
Trump reprocha a algunos países falta de "entusiasmo" para ayudar a reabrir el estrecho de Ormuz
-
El presidente alemán pide cesar la guerra en Oriente Medio para evitar consecuencias "desastrosas"
-
La BBC pide a un tribunal estadounidense que desestime la demanda de Trump de 10.000 millones de dólares
-
Cuba abre la inversión a emigrados, en particular a los que viven en EEUU
-
El Chelsea es sancionado con 13 millones de dólares por irregularidades
-
Los precios del petróleo cotizan a la baja, las bolsas se recuperan
-
Hoteles y apartamentos de Líbano rechazan a los desplazados por temor a los ataques de Israel
-
El rey de España reconoce que hubo "mucho abuso" en la conquista de América
-
Trump anuncia que su jefa de gabinete, Susie Wiles, tiene cáncer de mama
-
El jefe de derechos humanos de la ONU sigue "preocupado" por la "continua tortura" de presos en Venezuela
-
Las rutas alternativas al estrecho de Ormuz son insuficientes para responder a la demanda
-
UniCredit lanza una oferta de 40.000 millones de dólares por Commerzbank
-
China y EEUU afirman que sus negociaciones comerciales han sido "constructivas"
-
España sustituye la Finalissima por un amistoso ante Serbia en Villarreal
-
Comienza el juicio en apelación contra Sarkozy en Francia por la presunta financiación libia
-
Contratar un seguro contra los errores de la IA ya es posible
-
Cuatro países, 11 discursos y 7 misas: así será la gira africana de León XIV
-
La justicia española rechaza investigar al expresidente de Valencia por las letales inundaciones de 2024
-
Los políticos daneses buscan votantes hasta en la sauna
-
El presidente de Ucrania visitará Madrid el miércoles para reunirse con Pedro Sánchez
-
Irán advierte que llevará la guerra "tan lejos como sea necesario"
-
Sean Penn, ganador de un tercer Óscar, se encuentra en Kiev
-
Tres muertos en bombardeos rusos en Ucrania, explosiones en Kiev en pleno día
-
Alemania contesta a Trump: la guerra en Oriente Medio "no tiene nada que ver con la OTAN"
-
La Confederación Asiática insiste en que Irán jugará el Mundial 2026
-
Videos falsos sobre guerra en Oriente Medio se multiplican en X pese a las advertencias
-
Afectados los vuelos del aeropuerto de Dubái por un incendio causado por un dron
-
La UE evaluará extender su misión naval en el mar Rojo al estrecho de Ormuz
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
L.Meier--VB