
-
Les villes sont "l'épicentre" de la lutte contre la chaleur, dit une consultante de l'ONU
-
Le Festival de Cannes ouvre avec De Niro et DiCaprio, entre Gaza et l'Ukraine
-
Panne électrique en Espagne: l'autorité de la concurrence ouvre à son tour une enquête
-
Nissan: perte nette annuelle de 4,1 milliards d'euros, 20.000 suppressions d'emplois prévues
-
60 millions de consommateurs: le conseil d'administration vote contre la recherche d'un repreneur
-
La princesse Kate lance une série de vidéos sur les pouvoirs de la nature
-
La fin de l'univers arrivera plus vite que prévu, selon une étude
-
Trois insurgés présumés tués au Cachemire indien après la pire confrontation avec le Pakistan
-
Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
-
Les centaines de millions d'euros que l'Europe a accordés à Musk
-
Cyberattaque contre Marks & Spencer: des données personnelles volées
-
ArcelorMittal: les salariés à Paris, pour l'emploi et le futur de la sidérurgie
-
L'Inde et le Pakistan comptent plus de 70 morts après leur confrontation récente
-
Tennis: Djokovic entraîné par Andy Murray, c'est (déjà) fini
-
Confidentialité des données: une action collective lancée en France contre Apple
-
La plus grande usine de e-méthanol en Europe ouvre au Danemark
-
L'Allemagne dissout un "Royaume" complotiste et extrémiste
-
Gérard Depardieu condamné à 18 mois de prison avec sursis pour agressions sexuelles
-
La Chine dénonce le "harcèlement" américain et courtise l'Amérique latine
-
Mexique: une tortilla expérimentale, longue conservation sans réfrigérateur
-
La Bourse de Paris prudente malgré la trêve commerciale
-
Un record de plus de 83 millions de déplacés dans le monde
-
L'Allemagne dissout un important réseau complotiste et extrémiste
-
Trump entame en Arabie saoudite une tournée dans le Golfe
-
Air Force One, l'avion présidentiel américain que Trump veut remplacer
-
ArcelorMittal : les salariés à Paris, pour "stopper" le plan social
-
Face à la mortalité infantile en France, des hypothèses faute de mieux
-
Xi Jinping vante les liens Chine-Amérique latine face au "harcèlement" américain
-
Play-offs NBA: les Knicks rugissent et entrevoient la finale de conférence, comme Minnesota
-
L'ère de Jean-Laurent Bonnafé à la tête de BNP Paribas partie pour se poursuivre
-
L'heure de vérité pour les amoureux du sauna de KAJ en demi-finale de l'Eurovision
-
Une agence de l'ONU juge la Russie responsable de la destruction du MH17, des pays demandent réparation
-
En quête de contrats, Trump attendu dans le Golfe sur fond d'offensive diplomatique américaine
-
Agressions sexuelles: l'heure du jugement pour Gérard Depardieu
-
Royaume-Uni: la justice se penche sur les ventes d'armes à Israël
-
Le Festival de Cannes ouvre avec De Niro, entre Gaza et l'Ukraine
-
Référendum, fin de vie, Ukraine: Macron a rendez-vous avec les Français
-
Pneus mortels: mise en examen en vue pour Goodyear
-
Rap: les Flammes changent de dimension pour leur 3e édition, en public
-
Assemblée: la réintroduction de néonicotinoïdes joue son match retour en commission
-
Kim in Paris: la star face aux braqueurs au procès Kardashian
-
Fin de vie: les députés entament l'examen du volet "soins palliatifs" dans l'hémicycle
-
Le rappeur Tory Lanez agressé en prison et hospitalisé
-
Tennis: Sinner enchaîne à Rome, Sabalenka, Gauff et Paolini en quarts
-
Des stars du cinéma, dont Pedro Almodovar et Richard Gere, dénoncent dans une tribune le "silence" face au "génocide" à Gaza
-
Les marchés mondiaux en grande forme après le coup de frein à la guerre commerciale
-
L'écrivain franco-algérien Kamel Daoud dénonce une "persécution judiciaire"
-
Trump dit "envisager" se rendre en Turquie jeudi pour des discussions Ukraine-Russie
-
Wall Street termine sur les chapeaux de roues grâce à l'apaisement des tensions commerciales
-
Stade de France: GL Events annonce être "attributaire" de la concession pour 30 ans

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
T.Egger--VB