-
La desinformación amenaza la confianza en las vacunas, advierte la OMS
-
El PIB de Chile creció algo más de lo esperado en el último año de gobierno de Boric
-
La guerra en Irán ralentiza la industria petroquímica en Japón y Corea del Sur
-
La primera ministra japonesa discutirá con Trump la exploración de tierras raras
-
Los eurodiputados quieren prohibir la creación de imágenes sexuales falsas generadas por IA
-
Israel mata a otro alto cargo iraní y otorga libertad de acción a su ejército
-
La UE presenta un nuevo modelo jurídico para emprendedores
-
EEUU dice que la IA de Anthropic representa un "riesgo inaceptable" para el ejército
-
"Nada ni nadie nos va a hacer olvidar" a Ucrania, le dice Pedro Sánchez a Zelenski
-
Senegal pide investigar "sospechas de corrupción" en la decisión de retirarles la Copa África
-
Un muerto en el sur de Rusia por un ataque ucraniano con drones
-
El bloqueo del estrecho de Ormuz. en cifras
-
El estadio Azteca de México se convertirá en hostal turístico previo al Mundial
-
Chilenos y peruanos encaran divididos las barreras fronterizas de Kast
-
La fiscalía de Noruega pide más de 7 años de cárcel para el hijo de la princesa heredera
-
Un tribunal francés ordena nuevas pesquisas en el caso contra el chileno Zepeda por asesinato
-
La ONU advierte que se desaceleran los avances contra la mortalidad infantil
-
Un juez ordena al gobierno de Trump reincorporar a personal de Voice of America
-
Con la aprobación de Paraguay, Mercosur deja ratificado el acuerdo comercial con la UE
-
La selección femenina iraní de fútbol regresó a su país
-
El Parlamento de Escocia rechaza legalizar la ayuda a la muerte
-
Un exgeneral del ejército es nombrado jefe de gabinete de Perú
-
Rusia acusa al documental que ganó el Óscar de filmar niños sin consentimiento
-
El primer ministro irlandés planta cara cortésmente a Trump
-
La fiscalía noruega pide más de 7 años de cárcel contra el hijo de la princesa heredera, juzgado por violaciones
-
El comisionado de DDHH de la ONU es "enemigo de Venezuela", dice el jefe del parlamento
-
Nvidia reanuda la producción de chips para clientes chinos
-
Mueren cinco personas en el incendio de una refinería de Pemex en México
-
Alí Larijani, el estratega de la guerra en Irán
-
Brasil refuerza la protección de menores en su acceso a internet
-
Es "sumamente grave" la situación de la libertad de prensa en Ecuador, según RSF
-
El sistema político cubano no está en debate, dice una enviada diplomática en Washington
-
Kast frena decenas de decretos de protección al ambiente en Chile
-
Bukele endurece su guerra antipandillas con la cadena perpetua en El Salvador
-
Israel anuncia que suspende la entrada de ayuda de la Unicef proveniente de Egipto a Gaza debido al "contrabando"
-
Messi está en "perfectas condiciones" para enfrentar a Nashville, dice Mascherano
-
Una comisión de la Cámara de Representantes de EEUU cita a la fiscal general por el caso Epstein
-
Milei arremete contra Irán en el aniversario del atentado contra la embajada israelí en Argentina
-
El expresidente francés Sarkozy niega actos "de corrupción" en su juicio en apelación por el financiamiento libio de su campaña
-
La Fiscalía de Ecuador investiga la muerte de un hombre en un operativo militar
-
"Aterrados": Colombia denuncia un presunto bombardeo de Ecuador en plena crisis diplomática
-
Sin Finalissima, Argentina jugará un amistoso ante Guatemala en Buenos Aires
-
Sheinbaum presenta un nuevo plan de reforma electoral enfocado en reducir costos
-
Al menos 12 muertos en bombardeos israelíes en el centro de Beirut
-
Irán entierra a Larijani y jura vengar su muerte
-
Aumentan a 20 los casos sospechosos de meningitis en el Reino Unido en un brote "sin precedentes"
-
Trump espera viajar a China dentro de "cinco o seis semanas"
-
El presidente de Colombia recupera su visa para EEUU tras su acercamiento con Trump
-
Francia incauta un récord de 13 toneladas de cocaína en el puerto de Dunkerque
-
Investigan posibles relaciones con Irán de los atacantes de una sinagoga en Países Bajos
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.
Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.
Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.
"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".
A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.
Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.
- Juego de dominación mundial -
La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.
Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.
Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".
Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.
En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.
En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".
"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.
- ¿Eres un robot? -
Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.
En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".
Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.
A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.
En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.
Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.
A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".
K.Hofmann--VB