
-
Los puntos clave del nuevo acuerdo de la OMC sobre la pesca
-
Momentos clave de los Emmy: donaciones para los niños, política, redadas y Gaza
-
La actividad industrial y el consumo se ralentizan en China entre dificultades económicas
-
Ganadores de las principales categorías de los premios Emmy
-
"Adolescencia" arrasa en los premios Emmy
-
"The Studio", "Severance" y "Adolescencia" arrancan triunfantes en los Emmy
-
En EEUU, el debate se aviva en torno al perfil del presunto asesino de Kirk
-
Las estrellas de la televisión deslumbran en la alfombra roja de los Emmy
-
"The Studio" arranca triunfante en los Emmy
-
El príncipe Enrique afirma tener la "conciencia tranquila" respecto a su autobiografía
-
Batalla política por la suspensión de la última etapa de la Vuelta
-
Al grito de "¡esta Vuelta, la gana Palestina!", los manifestantes impiden el fin de la prueba en Madrid
-
Vingegaard gana la Vuelta tras una última etapa suspendida por las protestas
-
Vingegaard se corona por primera vez en la Vuelta en medio de protestas propalestinas
-
Multitudinaria protesta en Turquía antes de audiencia clave para el principal partido opositor
-
Rumania alerta de que la intrusión de un dron ruso plantea un "nuevo desafío" de seguridad
-
"Adolescencia" y "The Studio" se perfilan para ganar a lo grande en los Emmy
-
La Fed se prepara para la primera reducción de tasas en 2025 en medio de tensión política
-
Miles de palestinos huyen de Ciudad de Gaza a pie o amontonados en camionetas
-
Redadas migratorias espantan a trabajadores y clientes de restaurantes en Texas
-
Marc Márquez gana GP de San Marino y queda a un paso del título de MotoGP
-
La policía de Londres promete "más arrestos" tras la multitudinaria manifestación de ultraderecha
-
Pedro Sánchez expresa "orgullo" por las protestas propalestinas en la Vuelta a España
-
La nueva primera ministra interina de Nepal promete acabar con la corrupción
-
El papa León XIV celebra su 70º cumpleaños con miles de fieles en el Vaticano
-
Hallan un muerto en los escombros del bar de Madrid que sufrió una explosión
-
La nueva primera ministra interina de Nepal promete poner fin a la corrupción
-
Rubio visita Israel para reiterar el apoyo de EEUU pese al ataque a Catar
-
Más de 110.000 personas se manifiestan en Londres convocadas por activista de ultraderecha
-
Netanyahu afirma que si se eliminara a los dirigentes de Hamás terminaría la guerra en Gaza
-
"Los recibiremos con plomo": milicia en Venezuela se adiestra ante "amenaza" de EEUU
-
Nueva incursión de un dron ruso en el espacio aéreo de un país de la OTAN, esta vez en Rumania
-
Ataques aéreos, drones, aranceles: ser aliado de EEUU ya no es lo que era
-
El nuevo primer ministro francés retira la supresión de dos festivos y tiende la mano a la izquierda
-
Venezuela denuncia que EEUU retuvo un barco pesquero en aguas venezolanas
-
Al menos 25 heridos por una explosión en un bar en Madrid
-
Miles de personas se manifiestan en Berlín en apoyo a Gaza
-
Austria gana en el primer campeonato mundial de conductores de tranvía, celebrado en Viena
-
Ejército israelí afirma que más de 250.000 palestinos abandonaron Ciudad de Gaza
-
El asesino de Charlie Kirk, un exestudiante brillante y bastante solitario
-
Más de 100.000 personas manifiestan en Londres convocadas por un activista de ultraderecha
-
En México, la macabra Isla de las Muñecas inspira a Lady Gaga y Tim Burton
-
La OLP entrega armas del mayor campo de refugiados palestinos de Líbano
-
La calma vuelve a Nepal tras el nombramiento de la primera ministra interina
-
Nadeen Ayoub, primera palestina en Miss Universo: "Somos más que nuestro sufrimiento"
-
Frente a la muerte, los animales tienen reacciones "muy complejas"
-
El Comité Noruego del Nobel hace valer su independencia ante Trump
-
Fitch sanciona a Francia por incertidumbre presupuestaria y recorta la nota de su deuda
-
El español José Manuel Campa dejará la presidencia de la Autoridad Bancaria Europea
-
La Defensa Civil reporta al menos 50 muertos en bombardeos israelíes en Gaza

La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
L.Meier--VB