
-
Lecornu sous le feu croisé des oppositions et des mouvements sociaux
-
Léon XIV fête ses 70 ans, des fidèles lui souhaitent un joyeux anniversaire au Vatican
-
Budget: Yaël Braun-Pivet appelle à un accord autour de 35 milliards d'économies
-
Népal: la nouvelle Première ministre promet de suivre les revendications des manifestants
-
Boxe: Canelo tombe contre un immense Crawford, Mbilli doit se contenter du nul
-
La seule banque de lait maternel du Kenya, bouée de sauvetage de bébés prématurés
-
"Biens mal acquis": enquête en France contre un ancien Premier ministre libanais
-
Le plus grand lac du Royaume-Uni suffoque à cause des algues toxiques
-
Face au climat qui change, la moule bulgare veut croire en sa chance
-
Agriculture: la FNSEA appelle à "une grande journée d’action" le 25 septembre
-
La Fête du sport étrennée dans un contexte budgétaire tendu pour le secteur
-
Emmy Awards: "Severance" et "The Pitt" se disputent le titre de meilleure série dramatique
-
Visite de soutien de Rubio en Israël malgré l'attaque au Qatar
-
Mondiaux d'athlétisme: hécatombe sur le 1.500 m, Ingebrigtsen et Habz sortis dès les séries
-
Frappes russes en Ukraine : nouvelle incursion d'un drone dans le ciel d'un pays de l'Otan, en Roumanie
-
Ligue 1: Monaco s'en tire bien à Auxerre avant l'Europe
-
Top 14: Lyon, le Stade toulousain et Pau trio de tête
-
Italie: la Juve renverse l'Inter, Naples seul en tête
-
L'extrême droite réunit jusqu'à 150.000 personnes à Londres, incidents avec la police
-
Avant une visite de Rubio, Netanyahu dit que l'élimination des dirigeants du Hamas mettrait fin à la guerre à Gaza
-
Budget: le Medef menace d'une "grande mobilisation patronale" si les impôts des entreprises augmentent
-
Teddy Riner vise un retour sur les tatamis d'ici "deux ou trois mois"... et la présidence de la République
-
Non-suppression des jours fériés: bonne nouvelle mais insuffisante pour CGT et CDFT
-
Allemagne: le Bayern déjà seul en tête de la Bundesliga après trois matches
-
Lecornu retire la suppression de deux jours fériés et tend la main à la gauche
-
Foot: les recrues à la fête pour Arsenal et Newcastle
-
Italie: la Juve renverse l'Inter et prend seule la tête
-
Tour d'Espagne: Vingegaard sur orbite
-
Manifestation d'extrême droite à Londres: 110.000 participants, incidents avec la police
-
Espagne: le Real Madrid s'en sort contre la Real Sociedad, Mbappé sur sa lancée
-
Avant sa rencontre avec Lecornu lundi, Binet demande "des actes immédiats"
-
Mondiaux d'athlétisme: Beatrice Chebet en or sur 10.000m, Duplantis visera 6,30 m en finale
-
Le tueur de Charlie Kirk, un ex-lycéen brillant, plutôt solitaire
-
VTT: la Suédoise Jenny Rissveds sacrée championne du monde
-
Athlétisme: Alfred et Thompson envoient un signal fort avant les finales du 100 mètres
-
Au Népal, la Première ministre au chevet des victimes des émeutes, lent retour à la normale
-
Mondiaux d'athlétisme: "Tokyo est un très bel endroit" pour décrocher un 5e titre affirme Yulimar Rojas
-
Plus grosse défaite de leur histoire pour les All Blacks, humiliés à domicile par l'Afrique du Sud
-
Rugby: l'Afrique du Sud inflige à la Nouvelle-Zélande la plus grosse défaite de son histoire
-
Top 14: à Toulouse, "pas une chose n'est faite sans qu'il y ait de la compétition" (Mola)
-
Au Népal, les familles des victimes des émeutes veulent croire à un avenir meilleur
-
Sur les traces de Noah Lyles à Alexandria, l'ado réservé devenu roi de la piste
-
Top 14: Toulouse, Toulon, Pau et Bayonne pour confirmer à domicile
-
Mondiaux de VTT: Van der Poel, la dernière pièce du puzzle ?
-
Ligue 1: le gardien Philipp Köhn revient en jeu à Monaco
-
WTA 500 de Guadalajara: Elsa Jacquemot qualifiée pour sa première demi-finale
-
Pour Sébastien Lecornu, un premier déplacement consacré à la santé
-
A Londres, un rassemblement pour la liberté d'expression porté par une figure de l'extrême droite
-
Athlétisme: les marcheurs Evan Dunfee et Maria Perez premiers champions des Mondiaux de Tokyo
-
L1: l'OM nouvelle formule se reprend contre Lorient

L'IA devient menteuse et manipulatrice, les chercheurs s'inquiètent
Les derniers modèles d'intelligence artificielle (IA) générative ne se contentent plus de suivre les ordres et vont jusqu'à mentir, manigancer ou menacer pour parvenir à leurs fins, sous le regard inquiet des chercheurs.
Menacé d'être débranché, Claude 4, le nouveau-né d'Anthropic, fait du chantage à un ingénieur et menace de révéler une liaison extra-conjugale. L'o1 d'OpenAI essaye lui de se télécharger sur des serveurs extérieurs et nie lorsqu'on le prend la main dans le sac.
Pas besoin d'aller fouiller dans la littérature ou le cinéma, l'IA qui se joue de l'homme est désormais une réalité.
Pour Simon Goldstein, professeur à l'université de Hong Kong, ces dérapages tiennent de l'émergence récente des modèles dits de "raisonnement", capables de travailler par étapes plutôt que de produire une réponse instantanée.
o1, version initiale du genre pour OpenAI, sorti en décembre, "a été le premier modèle à se comporter ainsi", explique Marius Hobbhahn, patron d'Apollo Research, qui teste les grands programmes d'IA générative (LLM).
Ces programmes tendent aussi parfois à simuler "l'alignement", c'est-à-dire à donner l'impression qu'ils se plient aux consignes d'un programmeur tout en poursuivant, en fait, d'autres objectifs.
Pour l'heure, ces traits se manifestent lorsque les algorithmes sont soumis à des scénarios extrêmes par des humains, mais "la question, c'est de savoir si les modèles de plus en plus puissants auront tendance à être honnêtes ou pas", estime Michael Chen, de l'organisme d'évaluation METR.
"Les utilisateurs poussent tout le temps les modèles aussi", fait valoir Marius Hobbhahn. "Ce que nous observons est un vrai phénomène. Nous n'inventons rien."
Beaucoup d'internautes évoquent, sur les réseaux sociaux, "un modèle qui leur ment ou invente. Et ce ne sont pas des hallucinations, mais une duplicité stratégique", insiste le co-fondateur d'Apollo Research.
Même si Anthropic et OpenAI font appel à des sociétés extérieures, comme Apollo, pour étudier leurs programmes, "davantage de transparence et un accès élargi" à la communauté scientifique "permettraient de meilleures recherches pour comprendre et prévenir la tromperie", suggère Michael Chen.
Autre handicap, "le monde de la recherche et les organisations indépendantes ont infiniment moins de ressources informatiques que les acteurs de l'IA", ce qui rend "impossible" l'examen de grands modèles, souligne Mantas Mazeika, du Centre pour la sécurité de l'intelligence artificielle (CAIS).
Si l'Union européenne s'est dotée d'une législation, elle concerne surtout l'utilisation des modèles par des humains.
Aux Etats-Unis, le gouvernement de Donald Trump ne veut pas entendre parler de régulation et le Congrès pourrait même bientôt interdire aux Etats d'encadrer l'IA.
- L'IA en justice? -
"Il y a très peu de prise de conscience pour l'instant", constate Simon Goldstein, qui voit néanmoins le sujet s'imposer dans les mois à venir avec la révolution des agents IA, des interfaces à même de réaliser seules une multitude de tâches.
Les ingénieurs sont engagés dans une course derrière l'IA et ses dérives, à l'issue incertaine, dans un contexte de compétition féroce.
Anthropic se veut plus vertueux que ses concurrents, "mais il essaye en permanence de sortir un nouveau modèle pour dépasser OpenAI", selon Simon Goldstein, une cadence qui offre peu de temps pour des vérifications et corrections éventuelles.
"En l'état, les capacités (de l'IA) se développent plus rapidement que la compréhension et la sécurité", reconnaît Marius Hobbhahn, "mais nous sommes toujours en mesure de rattraper notre retard".
Certains pointent dans la direction de l'interprétabilité, une science récente qui consiste à décrypter de l'intérieur le fonctionnement d'un modèle d'IA générative, même si d'autres, notamment le directeur du CAIS, Dan Hendrycks, sont sceptiques.
Les combines de l'IA "pourraient gêner son adoption si elles se multiplient, ce qui constitue une forte incitation pour les entreprises (du secteur) à résoudre" ce problème, selon Mantas Mazeika.
Simon Goldstein évoque, lui, le recours à la justice pour mettre au pas l'intelligence artificielle, en se tournant vers les sociétés en cas de sortie de route.
Mais il va plus loin et propose même de "tenir légalement responsables" les agents IA "en cas d'accident ou de crime".
B.Baumann--VB