-
SpaceX veut lever 75 milliards de dollars pour son entrée en Bourse, un record
-
Wall Street termine en baisse, met un terme à sa série de records
-
Affaire Dupont de Ligonnès: M6 piégée par le faux témoignage d'un prétendu prêtre
-
Chili : heurts entre police et étudiants lors d'une manifestation antigouvernementale
-
Les concerts de Patrick Bruel à Montréal à leur tour annulés
-
Mondial-2026: mise en garde du régulateur contre les addictions aux paris sportifs
-
Roland-Garros: Sabalenka sombre, Auger-Aliassime tombe, la surprise Chwalinska
-
Ebola : la riposte humanitaire est en train de "rattraper" son retard selon l'OMS
-
Kev Adams s'illustre dans une célèbre émission télé américaine
-
En visio depuis l'espace, Sophie Adenot confie à des élèves voir "la marque de l'être humain sur la nature"
-
Moscou "panique" face aux frappes de drones ukrainiens, selon Kaja Kallas à l'AFP
-
Moscou "panique" face aux frappes de drones ukrainiens,selon Kaja Kallas à l'AFP
-
Liban: au moins neuf morts dans des frappes israéliennes, le Hezbollah dit avoir visé Israël
-
Violences sexuelles: les concerts à Montréal de Patrick Bruel annulés, selon les organisateurs
-
Foot: Pierre Sage à Lens, un an seulement et puis s'en va
-
L'aversion au risque gagne la Bourse de Paris après le regain de tensions au Moyen-Orient
-
Disparition de Lyhanna: le suspect visé par d'autres plaintes pour des faits antérieurs
-
Algérie: les derniers obstacles judiciaires levés avant une possible grâce de Gleizes
-
Moscou "panique" face aux frappes de drones ukrainiens (Kaja Kallas à l'AFP)
-
Les Bourses mondiales en baisse, inquiètes de la guerre au Moyen-Orient et de l'inflation
-
Lyhanna: enquête administrative pour de possibles "dysfonctionnements" sur les antécédents du suspect
-
Pétrolier de la flotte fantôme russe arraisonné: le commandant en garde à vue
-
Roland-Garros: Sabalenka sombre, Chwalinska invitée surprise du dernier carré
-
Critiquée par les Occidentaux, la présidente de Tanzanie en visite en Russie
-
La Russie est "de plus en plus désespérée" face à l'Ukraine, estime le chef de l'Otan
-
Wall Street en baisse, consolide après une série de records
-
Les deux frères d'Anouchka Delon condamnés à des amendes pour la diffusion d'un enregistrement privé
-
Meurtre d'un étudiant blanc par un Sikh au Royaume-Uni: Starmer appelle au calme
-
Des chercheurs trouvent de la levure dans les entrailles d'Ötzi... et en font du pain
-
Une coalition mondiale de médias s'élargit pour parler d'une voix face à l'IA
-
Violences xénophobes en Afrique du Sud: "ils nous ont chassés comme des chiens"
-
Vatican: des activistes anti-corrida neutralisés avant l'audience du pape
-
L'Iran et les Etats-Unis s'affrontent dans le Golfe, un mort et 63 blessés au Koweït
-
Gestion de l'eau: comment EDF adapte centrales et barrages au changement climatique
-
Les Îles Salomon vont réexaminer leur traité avec la Chine
-
Danemark: la Première ministre dévoile son gouvernement, composé d'une majorité de femmes
-
Hommage à Edgar Morin : Macron salue "un destin exceptionnel du siècle" qui ne céda jamais à "la vérité d'un seul camp"
-
Droit du consommateur: Shein écope de nouvelles amendes en France
-
Inde: au moins 21 morts dans l'incendie d'un hôtel de la capitale New Delhi
-
USA: les démocrates tiennent la corde aux primaires en Californie et à Los Angeles
-
Des drones ukrainiens frappent Saint-Pétersbourg où s'ouvre le Forum économique
-
La Bourse de Paris en repli prudent, rattrapée par la guerre au Moyen-Orient
-
Duralex: l'ancien directeur général et son fils contestent leurs licenciements
-
Moyen-Orient: la Bourse de Paris en repli prudent
-
Pancréas, désescalade thérapeutique et Ozempic: des avancées sur le front de la lutte anti-cancer
-
Guerre au Moyen-Orient: l'OCDE plus pessimiste pour une économie mondiale "sous pression"
-
Japon: une tempête tropicale frappe Tokyo et déverse des pluies torrentielles
-
Se transformer en Musclor a "été une tâche colossale", confie Nicholas Galitzine
-
L'Iran et les Etats-Unis s'affrontent dans le Golfe, l'aéroport du Koweit fermé
-
"Obsession" et "Backrooms": les films d'horreur indépendants attirent les jeunes au cinéma
Les entreprises se tournent vers de l'IA moins gourmande, sur fond de flambée des coûts
L'émergence des agents d'intelligence artificielle (IA) a fait exploser la facture IA de bon nombre d'entreprises, qui se tournent vers des modèles moins coûteux pour ne pas rogner sur leur consommation.
Finie, l'ère de "l'intelligence subventionnée" - selon l'expression de Kevin Simback, de l'incubateur Delphi Labs - née avec ChatGPT et la déferlante de l'IA générative.
Pour favoriser l'adoption de cette nouvelle technologie, les grands acteurs du secteur, OpenAI en tête, ont proposé initialement des tarifs très attractifs, au point que leur activité était déficitaire.
"Mais le vent est en train de tourner", prévient Kevin Simback.
Chacun à leur tour, les poids lourds de l'IA ont récemment revu leurs prix pour les ajuster à l'utilisation réelle des capacités informatiques nécessaires pour faire tourner les modèles.
L'avènement des agents IA, des programmes capables d'effectuer des tâches et plus seulement de donner des réponses, a, en outre, fait bondir le recours aux infrastructures informatiques.
Pour une même mission, l'interface peut se démultiplier en plusieurs agents, chacun avec sa feuille de route, le tout assemblé et vérifié par d'autres agents.
A l'arrivée, le nombre de "tokens", unité de référence pour mesurer le résultat produit par l'IA, peut représenter des dizaines de fois celui correspondant à une simple question à ChatGPT.
Le tout s'inscrit dans une période de déséquilibre. Les centres de données et les fabricants de puces ne parviennent pas à suivre le rythme effréné de la demande d'intelligence artificielle, ce qui renchérit l'accès aux infrastructures.
"En particulier chez les développeurs, le coût d'utilisation de l'IA pour la programmation s'est accru de façon exponentielle", observe Mark Barton, de la société d'accompagnement numérique Omniux.
Par extension, pour tous les modèles de référence du marché, "les prix commencent à s'envoler", insiste-t-il.
Face à ce nouveau paradigme, certains questionnent le déploiement à tout crin de l'IA, tels l'enseigne de grande distribution Target, Starbucks ou Uber.
"Dans certains cas, le coût dépasse celui d'un employé au bout d'un mois ou deux parce qu'ils l'utilisent trop", décrit Jack Gold, président du cabinet J.Gold Associates.
- Pas d'IA "sans raison" -
Pourtant sacré, en début d'année, champion du "tokenmaxxing", mouvement qui glorifie la dépense maximale de "tokens" comme mètre étalon de productivité des employés, Meta a récemment mis le hola.
"Personne ne devrait recourir à des outils IA sans raison", a ainsi écrit le responsable technologique du groupe, Andrew Bosworth, dans un mémo interne relayé par le Wall Street Journal.
Mais si le discernement est désormais de mise, la plupart des sociétés cherchent surtout à accéder à une IA moins onéreuse, en recourant à des modèles moins performants que les fleurons du secteur.
Dans ce contexte, la popularité des modèles dits "open weights", téléchargeables gratuitement, est croissante, leur usage ne nécessitant que l'achat de puissance de calcul.
Les entreprises se tournent aussi vers des modèles de plus petite taille, les SLM (small language models) en lieu et place des LLM, qui servent de base à ChatGPT, Claude ou Gemini.
Ces SLM peuvent parfois tourner sur les serveurs locaux ou même directement sur l'ordinateur, une option plus économique car elle évite de payer un fournisseur de capacité à distance (cloud).
Il est aussi possible de scinder une demande unique (prompt) en étapes distinctes pour les confier, à chaque fois, à l'interface adaptée, explique Adrian Balfour, du cabinet de conseil numérique Enverso.
"Quand vous passez par un grand modèle monolithique, vous en aurez à peu près pour 15 dollars le million de +tokens+ alors qu'en prenant des mini-modèles, vous ferez descendre le tout à 5 cents", assure-t-il.
Beaucoup voient dans cette refonte la première étape de la banalisation des modèles, devenus interchangeables sans déperdition.
Dès lors, ce sont les plateformes de sélection et de coordination des modèles et des agents qui prennent de l'importance, selon John Belton, gérant au sein de la société d'investissement Gabelli Funds.
Sur ce créneau, des start-up se battent avec des mastodontes du "cloud" comme Amazon, qui propose déjà de jongler avec une multitude d'IA via sa plateforme Bedrock, mais aussi les géniteurs de l'intelligence artificielle eux-mêmes.
Anthropic dispose ainsi d'une gamme complète de modèles, dont Haiku, l'option la plus économique, à l'instar d'OpenAI et de Google.
John Belton ne voit d'ailleurs pas ces étoiles de l'IA perdre des parts de marché à mesure que les clients cherchent l'efficacité plutôt que la performance.
"Les utilisateurs les plus avancés seront toujours prêts à payer" pour ce qui se fait de mieux, prévoit-il. "Le gâteau ne fait que grossir."
T.Suter--VB