-
RATP: le nouveau PDG axe sa feuille de route sur la lutte contre la violence dans les transports
-
Mélenchon veut que les gazoducs Nord Stream soient "remis en route"
-
Climat : jugement "historique" aux Pays-Bas, sommés de mieux protéger l'île antillaise de Bonaire
-
L’Allemagne moins optimiste sur la croissance en 2026
-
"Ça y est je suis chevalier!": Macron décore le dernier vendeur de journaux à la criée de Paris
-
Venezuela: Rubio défend la coopération avec les autorités par intérim
-
L'Iran "prêt" à répondre aux menaces de Trump tout en se redisant ouvert à un accord sur le nucléaire
-
Euro de hand: La claque et la porte pour les Bleus
-
Inondations au Mozambique: "J'en suis venue à souhaiter la mort"
-
Amazon supprime 16.000 postes de plus dans le monde
-
Peur dans une ville sicilienne balafrée par un glissement de terrain
-
Au procès en appel du RN, les mauvais comptes du trésorier de Saint-Just
-
Aide à mourir, soins palliatifs: que contiennent les textes sur la fin de vie ?
-
La Bourse de Paris termine en nette baisse, plombée par le luxe
-
La BBC, dans la tourmente, nomme un directeur général par intérim
-
Charles III s'inquiète du "recul" du combat contre le changement climatique
-
"La fierté de toute une nation": ultime hommage en Israël au dernier otage de Gaza
-
Nicki Minaj se décrit comme la "première fan" de Trump
-
La grippe circule encore activement, mais l'épidémie semble fléchir
-
Rappels de lait infantile: le recours d'une association contre l'Etat rejeté
-
Greenpeace dénonce la poursuite du commerce nucléaire entre France et Russie, toujours exempté de sanctions
-
Au Venezuela, l'espoir d'un renouveau de l'industrie pétrolière sous l'impulsion des Etats-Unis
-
Fin de vie: le Sénat rejette la loi sur l'aide à mourir, bientôt de retour à l'Assemblée
-
La tempête Kristin fait au moins quatre morts au Portugal
-
Le gouvernement va s'opposer à la recherche d'hydrocarbures en Outre-mer
-
Cancer du sein: les "nombreuses lacunes" de prise en charge sous la loupe de la Cour des comptes
-
Un pas de plus dans l'interprétation du génome grâce à l'IA
-
Face aux tensions autour du Groenland, France et Danemark appellent au réveil de la puissance européenne
-
Danemark: colère d'anciens combattants après le retrait de drapeaux danois par l'ambassade américaine
-
Hand: Ivry écarte Didier Dinart de son poste d'entraîneur
-
Poutine reçoit le président syrien au moment où Moscou cherche à préserver ses bases militaires
-
Jugement "historique" aux Pays-Bas, ordonnés de mieux protéger une de leurs îles
-
Trump dit que le "temps est compté" pour l'Iran, qui exclut de négocier "sous la menace"
-
Taux d'intérêt de la Fed: un retour au statu quo se profile aux Etats-Unis
-
Wall Street portée par la tech avant les résultats de grands noms du secteur
-
Justice climatique: les Pays-Bas ordonnés de mieux protéger une de leurs îles
-
Mondial-2026: Ligue 1+ a trouvé un accord avec la FIFA pour diffuser tous les matches
-
"La fierté de toute une nation": ultime hommage au dernier otage de Gaza
-
Ligue 2: Horneland va quitter Saint-Etienne, Haise et Montanier pressentis
-
Recherche en ligne: Londres veut permettre aux sites internet de refuser l'IA de Google
-
Hexane: des députés veulent rendre obligatoire l'information du consommateur
-
Hauts-de-France: une ONG alerte sur une pollution de l'eau au fongicide
-
Amazon annonce la suppression de 16.000 postes dans le monde
-
Municipales: les transports gratuits, une promesse à la mode et variable
-
Feu intense dans un hôtel de luxe à Courchevel, près de 300 personnes évacuées
-
Open d'Australie: Djokovic, miraculé, retrouvera Sinner en demies
-
Israël: funérailles nationales pour le dernier otage à Gaza
-
Richard Linklater et "Nouvelle Vague" en tête des nominations pour les César
-
Dans le monde de Trump, l'Otan appelée à devenir "plus européenne"
-
Contre la "biopiraterie", le Brésil défend son açai d'Amazonie
L'IA devient menteuse et manipulatrice, les chercheurs s'inquiètent
Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres et vont jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins, sous le regard inquiet des chercheurs.
Menacé d'être débranché, Claude 4, le nouveau-né d'Anthropic, fait du chantage à un ingénieur et menace de révéler une liaison extra-conjugale. L'o1 d'OpenAI essaye lui de se télécharger sur des serveurs extérieurs et nie lorsqu'on le prend la main dans le sac.
Pas besoin d'aller fouiller dans la littérature ou le cinéma, l'IA qui se joue de l'homme est désormais une réalité.
Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages tiennent de l'émergence récente des modèles dits de "raisonnement", capables de travailler par étapes plutôt que de produire une réponse instantanée.
o1, version initiale du genre pour OpenAI, sorti en décembre, "a été le premier modèle à se comporter ainsi", explique Marius Hobbhahn, patron d'Apollo Research, qui teste les grands programmes d'IA générative (LLM).
Ces programmes tendent aussi parfois à simuler "l'alignement", c'est-à-dire à donner l'impression qu'ils se plient aux consignes d'un programmeur tout en poursuivant, en fait, d'autres objectifs.
Pour l'heure, ces traits se manifestent lorsque les algorithmes sont soumis à des scénarios extrêmes par des humains, mais "la question, c'est de savoir si les modèles de plus en plus puissants auront tendance à être honnêtes ou pas", estime Michael Chen, de l'organisme d'évaluation METR.
"Les utilisateurs poussent tout le temps les modèles aussi", fait valoir Marius Hobbhahn. "Ce que nous observons est un vrai phénomène. Nous n'inventons rien."
Beaucoup d'internautes évoquent, sur les réseaux sociaux, "un modèle qui leur ment ou invente. Et ce ne sont pas des hallucinations, mais une duplicité stratégique", insiste le co-fondateur d'Apollo Research.
Même si Anthropic et OpenAI font appel à des sociétés extérieures, comme Apollo, pour étudier leurs programmes, "davantage de transparence et un accès élargi" à la communauté scientifique "permettraient de meilleures recherches pour comprendre et prévenir la tromperie", suggère Michael Chen.
Autre handicap, "le monde de la recherche et les organisations indépendantes ont infiniment moins de ressources informatiques que les acteurs de l'IA", ce qui rend "impossible" l'examen de grands modèles, souligne Mantas Mazeika, du Centre pour la sécurité de l'intelligence artificielle (CAIS).
Si l'Union européenne s'est dotée d'une législation, elle concerne surtout l'utilisation des modèles par des humains.
Aux Etats-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de régulation et le Congrès pourrait même bientôt interdire aux Etats d'encadrer l'IA.
- L'IA en justice? -
"Il y a très peu de prise de conscience pour l'instant", constate Simon Goldstein, qui voit néanmoins le sujet s'imposer dans les mois à venir avec la révolution des agents IA, des interfaces à même de réaliser seules une multitude de tâches.
Les ingénieurs sont engagés dans une course derrière l'IA et ses dérives, à l'issue incertaine, dans un contexte de compétition féroce.
Anthropic se veut plus vertueux que ses concurrents, "mais il essaye en permanence de sortir un nouveau modèle pour dépasser OpenAI", selon Simon Goldstein, une cadence qui offre peu de temps pour des vérifications et corrections éventuelles.
"En l'état, les capacités (de l'IA) se développent plus rapidement que la compréhension et la sécurité", reconnaît Marius Hobbhahn, "mais nous sommes toujours en mesure de rattraper notre retard".
Certains pointent dans la direction de l'interprétabilité, une science récente qui consiste à décrypter de l'intérieur le fonctionnement d'un modèle d'IA générative, même si d'autres, notamment le directeur du CAIS, Dan Hendrycks, sont sceptiques.
Les combines de l'IA "pourraient gêner son adoption si elles se multiplient, ce qui constitue une forte incitation pour les entreprises (du secteur) à résoudre" ce problème, selon Mantas Mazeika.
Simon Goldstein évoque, lui, le recours à la justice pour mettre au pas l'intelligence artificielle, en se tournant vers les sociétés en cas de sortie de route.
Mais il va plus loin et propose même de "tenir légalement responsables" les agents IA "en cas d'accident ou de crime".
B.Baumann--VB