
-
Euro-2025: Cascarino libère les Bleues qui se hissent en quarts
-
Foot: Chelsea brise le rêve mondial de Paris, sous les yeux de Trump
-
Mondial des clubs: le PSG rate la dernière marche contre un Chelsea implacable
-
Tennis: Jannik Sinner, un "gars normal" au talent féroce
-
Tennis: Sinner prend sa revanche sur Alcaraz et gagne son premier titre à Wimbledon
-
Défense: Macron veut 3,5 mds d'euros de dépenses supplémentaires en 2026, 3 mds de plus en 2027
-
Gaza: la Défense civile annonce un bilan de 43 morts dans des raids israéliens
-
"Superman" vole au-dessus du box-office nord-américain
-
Macron affirme que la liberté n'a "jamais été si menacée" depuis 1945
-
Un village de Cisjordanie en colère pour les funérailles de deux jeunes tués
-
Tour de France: Merlier récidive et brise les ailes de Van der Poel à Châteauroux
-
Tour de France: Merlier brise les ailes de Van der Poel à Châteauroux
-
Tour de France: quand les Bleus vont voir si l'herbe est plus verte ailleurs
-
Droits de douane: l'UE temporise sa riposte dans l'espoir d'un accord
-
Tour de France: abandon de Joao Almeida, coup dur pour Pogacar
-
MotoGP: Marquez s'impose en Allemagne, Quartararo 4e
-
Italie: départ d'un nouveau bateau pour Gaza chargé d'aide humanitaire
-
La dixième étape du Tour de France: un festival de cols pour le 14-Juillet
-
Gaza: la Défense civile annonce plus de 40 morts dans de nouveaux raids israéliens
-
Ambiance festive à Castel Gandolfo pour le premier Angélus du pape Léon XIV
-
Tour de France: dans les premières étapes de montagne, avantage Pogacar sur Vingegaard
-
La Sierra Leone au patrimoine mondial grâce aux 25 ans de combat d'un activiste passionné
-
A Copenhague, un chef à vélo fait sortir au grand air la gastronomie locale
-
Budget 2026: les pistes d'économies sur la table avant les annonces de Bayrou
-
Face aux canicules, le combat des Amérindiens Navajo pour l'électricité et la clim
-
Les négociations commerciales viennent tester l'image de faiseur d'accord de Donald Trump
-
En Irlande du Nord, les pièces rouillées dispersées par les touristes menacent la Chaussée des Géants
-
Gaza: la Défense civile annonce près de 30 morts, les négociations piétinent
-
Euro-2025: un quart et pas de "calculs" pour les Bleues
-
Mondial des clubs: les hommes forts de Chelsea
-
Wimbledon: Alcaraz-Sinner, la finale des temps modernes
-
Los Angeles: un ouvrier agricole blessé dans une descente de la police de l'immigration est décédé
-
Foot: Paris à la conquête du monde, sous les yeux de Trump
-
Macron va fixer de nouvelles ambitions de défense face aux menaces
-
Kim assure Lavrov de son soutien "inconditionnel" contre l'Ukraine
-
Trump surenchérit avec 30% de droits de douane pour l'UE et le Mexique
-
Bad Bunny le Portoricain rend hommage à ses racines et fait briller son île natale
-
Droits de douane: Macron exprime sa "très vive désapprobation" et appelle l'UE à défendre ses intérêts
-
Indépendantistes et loyalistes s'accordent sur un futur "Etat de la Nouvelle-Calédonie"
-
Gaza: le Hamas et Israël s'accusent mutuellement d'enrayer les négociations sur une trêve
-
Droits de douane américains: un impact différent d'un pays européen à l'autre
-
Tour de France: Milan libère l'Italie à Laval
-
Tennis: Iga Swiatek gagne son premier Wimbledon en battant Anisimova 6-0, 6-0
-
Les mégalithes de Carnac, premier site breton inscrit par l'Unesco au patrimoine mondial
-
Tour de France: Jonathan Milan libère l'Italie à Laval
-
Tour de France: le ton monte entre Pogacar et l'équipe de Vingegaard
-
Au Pérou, une citadelle de 3.800 ans ouvre ses portes aux touristes
-
Trump surenchérit et annonce 30% de droits de douane pour UE et Mexique
-
Les mégalithes de Carnac, premier site breton classé par l'Unesco au patrimoine mondial
-
MotoGP: Marc Marquez remporte le sprint en Allemagne, Quartararo troisième

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
T.Egger--VB