
-
Pour Sébastien Lecornu, un premier déplacement consacré à la santé
-
A Londres, un rassemblement pour la liberté d'expression porté par une figure de l'extrême droite
-
Athlétisme: les marcheurs Evan Dunfee et Maria Perez premiers champions des Mondiaux de Tokyo
-
L1: l'OM nouvelle formule se reprend contre Lorient
-
Wall Street conclut en ordre dispersé avant la Fed la semaine prochaine
-
Euro de basket: la Turquie gifle la Grèce et rejoint l'Allemagne en finale
-
Népal: l'ex-cheffe de la Cour suprême à la tête du pays jusqu'à des élections en mars 2026
-
Népal: l'ex-cheffe de la Cour suprême à la tête du pays jusqu'à des élections
-
Ce que l'on sait de Tyler Robinson, l'assassin présumé de Charlie Kirk
-
L'Union européenne se divise sur son objectif climatique avant la COP
-
Tour d'Espagne: Jasper Philipsen voit triple avant le verdict
-
Euro de basket: l'Allemagne première finaliste
-
Malgré sa mort, les partisans de Charlie Kirk restent attachés aux armes à feu
-
"On l'a eu": l'assassin présumé de Charlie Kirk arrêté
-
Les partenaires sociaux à Matignon, l'attente de "rupture" et la mobilisation du 18 en toile de fond
-
Mondial de rugby: Morgane Bourgeois, artilleuse en chef des Bleues
-
L'Eurovision dit respecter les décisions des diffuseurs après des menaces de boycott de l'Eurovision si Israël y participe
-
Népal: l'ex-cheffe de la Cour suprême à la tête du gouvernement de transition
-
Mondial de volley: pour Ngapeth, une question de temps
-
En Turquie, un bébé gorille prépare son retour au Nigeria
-
Trump annonce l'arrestation de l'assassin présumé de Charlie Kirk
-
Wall Street reprend son souffle après de nouveaux records
-
Mort de l'ancien directeur de Courrier International et président de Télérama, Philippe Thureau-Dangin
-
LGV Sud-Est: retards après un vol de câbles, retour à la normale vers 18h
-
Affaire Legrand/Cohen: Cohen pas en faute, selon le comité d'éthique de France Télévisions
-
Joggeuse morte dans la Vienne: le suspect était surveillé par la justice
-
Fraude fiscale: Isabelle Adjani sera jugée en appel le 26 février
-
Les Pays-Bas boycotteront l'Eurovision 2026 si Israël participe
-
Les flamants roses migrateurs vieillissent mieux que les sédentaires, selon une étude
-
Le prince Harry en visite surprise en Ukraine
-
A Londres, les manifestations anti-immigration inquiètent demandeurs d'asile et habitants
-
Frappes ukrainiennes sur les raffineries et forte demande: en Russie, l'essence devient chère
-
Indonésie: 23 morts dans les inondations à Bali et Florès, selon un nouveau bilan
-
Italie: l'Inter Milan attend encore la "Chivu-lution"
-
Drogue, armes, données personnelles: une importante plateforme du darknet démantelée
-
Testament Armani: un géant de la mode pourrait prendre le contrôle de la société
-
Concurrence: Microsoft échappe à une amende de l'UE liée à Teams
-
Taxe Zucman: "pas de tabou" pour Ferracci mais attention à "ne pas pénaliser l'esprit d'entreprise"
-
En Guadeloupe, le nombre d'oiseaux tropicaux en chute libre
-
L'Indonésie prend le contrôle d'une partie de la plus grande mine de nickel au monde
-
CMA CGM grandit encore dans les médias en rachetant Brut
-
Face à la mort, les animaux ont des réactions "très complexes"
-
L1: A l'OM, cartes rebattues et nouveau départ attendu
-
Foot: l'heure du début des recrues partout en Europe
-
Mondial de volley: pour les Bleus, une malédiction à briser et un manque à combler
-
Népal: poursuite des tractations politiques,le bilan des émeutes monte à 51 morts
-
Les Sud-Coréens arrêtés aux Etats-Unis de retour dans leur pays
-
BCE: une nouvelle prochaine baisse de taux reste "possible", estime le gouverneur de la Banque de France
-
La Chine annonce que son porte-avions dernier cri a transité par le détroit de Taïwan
-
Après l'accord commercial noué avec Trump, la crainte d'un afflux de pick-up en Europe

Comprendre comment l'IA raisonne avant qu'elle ne devienne surpuissante, une urgence
Des humains l'ont programmée mais ne la comprennent pas complètement. L'intelligence artificielle (IA) générative reste un mystère, que des ingénieurs s'efforcent de percer avant que ses capacités n'explosent, pour éviter des dérapages.
"Les gens étrangers à ce milieu sont souvent surpris et alarmés d'apprendre que nous ne comprenons pas comment fonctionnent nos propres créations IA", a écrit, dans un long essai fin avril, Dario Amodei, le co-fondateur d'Anthropic, fleuron du secteur.
"Ils ont raison d'être préoccupés", a-t-il poursuivi. "Ce défaut de compréhension est sans précédent dans l'histoire de la technologie."
A la différence des programmes traditionnels, effectuant uniquement les tâches demandées, les modèles d'IA générative ne sont, en effet, qu'une rampe de lancement.
C'est "un échafaudage", selon l'expression de Chris Olah, ancien d'OpenAI aujourd'hui passé chez Anthropic et considéré comme l'un des inventeurs de la "mechanistic interpretability", qui déconstruit l'intelligence artificielle.
Cette jeune science, née au milieu des années 2010, s'attache à décrypter le cheminement qui mène d'une requête à une réponse, à travers une forêt de probabilités.
"Appréhender la totalité d'un grand modèle de langage", qui sert de base aux ChatGPT ou Gemini, "est une tâche incroyablement ambitieuse", explique à l'AFP Neel Nanda, chercheur chez DeepMind, le laboratoire d'IA de Google.
"C'est un peu comme essayer de décoder complètement le cerveau humain", selon lui, "ce que les neuroscientifiques essayent de faire depuis des décennies, sans y parvenir."
Confidentiel il y a encore quelques années, la discipline prend aujourd'hui une dimension nouvelle.
"Elle attire beaucoup nos étudiants", observe Mark Crovella, professeur d'informatique à l'université de Boston, "du fait de son potentiel à améliorer la sécurité des modèles, mais aussi parce que c'est un champ très stimulant intellectuellement."
- Tromper les humains -
Pour étudier ces phénomènes au plus près, retrace l'universitaire, la "mech interp", de son nom de code, ne se contente pas d'observer le résultat qu'offre un assistant IA à une demande.
"On observe les calculs à mesure qu'ils sont réalisés" par le programme d'IA, décrit-il.
La start-up Goodfire, en pointe sur le sujet, utilise des modèles d'interprétation, algorithmes IA à même de représenter des données sous forme d'étapes de raisonnement.
L'objectif est de saisir suffisamment bien la mécanique de l'IA générative pour la guider et corriger ses possibles errements.
Il s'agit d'empêcher les erreurs, mais aussi l'utilisation à des fins nocives ou de voir un modèle suffisamment autonome tromper les humains sur la nature de ses actions.
"Cela ressemble à une course contre la montre", situe Eric Ho, le patron de Goodfire, "avant que nous ne lancions des modèles d'IA extrêmement intelligents sans comprendre comme ils marchent."
Fin avril, Dario Amodei a fait état de "progrès récents", qui lui laissent penser que "nous sommes sur le point de trouver la clef de l'interprétabilité", au point de fixer une échéance, en 2027.
"Vu les avancées actuelles, il me semble plausible que d'ici 2027, nous disposions des outils à même de détecter, de façon fiable, les biais d'un modèle et ses intentions nocives" éventuelles, abonde Anh Nguyen, professeur à l'université d'Auburn.
Mark Crovella relève qu'à la différence du cerveau humain, "nous avons une représentation de chaque neurone dans ces modèles". "Nous pouvons voir tout ce qu'il se passe. La question, c'est comment l'interpréter."
Entrer dans le secret de l'IA générative rendrait possible, selon Dario Amodei, l'adoption de cette technologie dans des domaines où "un petit nombre d'erreurs pourrait être très préjudiciable", notamment pour ceux qui présentent des enjeux de sécurité importants.
Pour Neel Nanda, l'interprétabilité ouvrirait aussi la voie à des découvertes pour les humains, à l'instar du modèle AlphaZero de DeepMind, qui a dévoilé de nouvelles combinaisons au jeu d'échecs.
Par ailleurs, les premiers à maîtriser le raisonnement de l'IA générative pourront délivrer un label de fiabilité aux grands modèles qu'ils testeront, les rendant ainsi plus attractifs aux yeux de leurs clients potentiels.
"Il est clair pour nous, et pour Anthropic", qui a investi dans Goodfire, "que nous serons les premiers à le commercialiser", affirme Eric Ho.
Une percée américaine repositionnerait aussi les Etats-Unis en tête de la pyramide IA, position aujourd'hui contestée par la Chine.
"L'IA surpuissante va définir le destin de l'humanité", prévient Dario Amodei, "et nous devons comprendre nos propres créatures avant qu'elles ne transforment notre économie, nos vies et notre avenir."
T.Egger--VB