-
En Afghanistan, une montagne sableuse attire les fans de roulades et de parkour
-
Japon: une startup demande l'homologation d'un traitement rénal pour chats
-
PSG-Bayern: Kvaratskhelia et Olise, duel d'ailiers virevoltants
-
Kim Jong Un réaffirme son soutien à la "guerre sacrée" de la Russie en Ukraine
-
Pour éviter une pénurie, l’Inde diversifie ses approvisionnements pétroliers
-
Les Etats-Unis regardent ailleurs, la Corée du Nord en profite
-
Une "nouvelle puissance" pour sortir des énergies fossiles, assure l'hôte du sommet en Colombie
-
NBA: retour gagnant pour Wembanyama à Portland
-
Semaine cruciale de négociations à l'OMS sur les vaccins et pathogènes
-
Trump reçoit le roi Charles dans la foulée de l'attaque au gala de la presse
-
Genèse d'OpenAI: le duel judiciaire Musk-Altman s'ouvre en Californie
-
Audiovisuel public: le "rapport Alloncle" soumis au vote crucial de députés
-
Macron en Ariège puis en Andorre pour parler de réindustrialisation, santé et avortement
-
Gala de la presse: le suspect présenté à la justice américaine
-
Le chef de la diplomatie iranienne reçu lundi par Poutine
-
Un technicien meurt lors du montage du concert de Shakira à Rio
-
Top 14: Toulouse chute à domicile contre Clermont
-
Ballet diplomatique pour l'Iran, en l'absence de Washington
-
Ligue 1: Tenu en échec par Nice, l'OM décroche
-
Ligue 1: l'OM toujours en plein marasme, suspense total pour l'Europe
-
Un attentat à la bombe fait 20 morts en Colombie, en proie à une vague de violences
-
Liège-Bastogne-Liège: Seixas, la jeunesse rayonnante de la Doyenne
-
Liège-Bastogne-Liège: Continuons à "gagner jusqu'à ce que Seixas nous détruise tous", dit Pogacar
-
Liège-Bastogne-Liège: Continuons à "gagner jusqu'à ce que Seixas nous déruise tous", dit Pogacar
-
Ligue des champions féminine: l'OL Lyonnes plombé à Arsenal
-
Situation sécuritaire critique au Mali, les rebelles touareg à Kidal
-
Le chef de la diplomatie iranienne de retour au Pakistan, malgré l'absence des émissaires américains
-
Liège-Bastogne-Liège: Pogacar s'impose pour la 4e fois, Seixas épatant 2e
-
MotoGP: Alex Marquez (Ducati-Gresini) remporte chez lui le Grand Prix d'Espagne
-
Ukraine: Zelensky accuse la Russie de "terrorisme nucléaire" 40 ans après Tchernobyl
-
Marathon de Londres: Sabastian Sawe sous la barre mythique des 2 heures
-
Vatican: 40 ans après Tchernobyl, le pape appelle à utiliser l'énergie atomique à des fins pacifiques
-
Marathon de Londres: le Kényan Sabastian Sawe premier homme de l'histoire sous les 2 heures
-
Le chef de la diplomatie iranienne attendu à Islamabad, malgré l'absence des Américains
-
Réactions de dirigeants mondiaux aux coups de feu lors du gala de Washington
-
La diaspora tibétaine élit son Parlement, un vote condamné par la Chine
-
Au Japon, les omniprésents distributeurs de boissons sous pression de l'inflation
-
Au Soudan, ces civils devenus secouristes et fossoyeurs par la force des choses
-
Ukraine: à Slavoutytch, cité vestige de l'URSS, les déplacés de Tchernobyl accueillent ceux de l'invasion russe
-
A Jérusalem-Est, l'angoisse d'un quartier palestinien menacé d'expulsion
-
Tirs au gala de la presse avec Trump: ce que l'on sait
-
Trump évacué après des coups de feu lors d'un gala à Washington
-
Cinq choses à savoir sur Tchernobyl, 40 ans après le désastre nucléaire
-
"A terre!" Comment le gala de la presse à Washington a tourné au chaos
-
Un assaillant armé tente de forcer l'entrée d'un gala auquel assiste Trump
-
Moyen-Orient: un émissaire iranien attendu au Pakistan malgré le faux départ des Américains
-
Un tireur tente de forcer l'entrée d'un gala auquel assiste Trump
-
Tirs au dîner des correspondants de la Maison Blanche, Trump évacué
-
Un attentat à la bombe fait 14 morts en Colombie, en proie à une vague de violences
-
Colombie: sept morts dans un attentat à la bombe
Google lance deux nouvelles puces pour s'adapter à l'ère des agents IA
Google a dévoilé mercredi deux nouvelles puces pour l'intelligence artificielle (IA), l'une pour entraîner les puissants nouveaux modèles d'IA générative, l'autre pour l'usage rapide et économique du quotidien, dont la demande pourrait exploser avec le rapide déploiement mondial des agents IA autonomes.
Google rejoint ainsi Amazon, qui a adopté dès 2018 cette même stratégie de distinction d'usage des puces, et fait un pas de plus dans sa quête d'une moindre dépendance de Nvidia, qui contrôle environ 80% du marché mondial des puces pour centres de données IA.
Cette 8e génération des Tensor Processing Unit (TPU), les processeurs maisons de Google, a été présentée mercredi à Las Vegas, lors de la conférence annuelle de Google Cloud, la division des services d'informatique à distance (cloud) du géant de Mountain View (Californie).
Cette nouvelle génération est pour la première fois constituée de deux composants distincts: les TPU 8t, conçues pour l'entraînement long et coûteux des modèles d'IA générative, et les TPU 8i, destinées à l'inférence, c'est-à-dire les multiples interactions d'usage d'un utilisateur ou d'un agent IA autonome, nécessitant rapidité et sobriété énergétique donc économique.
Ces deux puces, conçues en partenariat avec le fabricant de semi-conducteurs Broadcom, "seront disponibles plus tard cette année", a indiqué Thomas Kurian, le patron de Google Cloud.
Cette distinction reflète une réalité nouvelle: un agent IA autonome enchaîne des dizaines d'actions sans intervention humaine, générant bien plus d'opérations de calcul que le dialogue humain avec les assistants comme Gemini, ChatGPT, Claude ou Le Chat.
Les nouvelles puces d'exécution TPU 8i sont donc conçues pour "assurer le débit massif et la faible latence (temps de réaction) nécessaires pour faire tourner des millions d'agents simultanément, à moindre coût", a écrit mercredi Sundar Pichai, PDG d'Alphabet, maison mère de Google, dans un billet de blog.
Google revendique des performances 2,8 fois meilleures pour l'entraînement et un coût réduit de 80% à performances équivalentes à la génération précédente.
En janvier, le leader Nvidia avait annoncé le lancement de la production de ses nouvelles puces Vera et Rubin, affichant des performances jusqu'à cinq fois supérieures à la génération précédente.
Amazon, premier acteur mondial du cloud avec sa filiale AWS, avait de son côté dévoilé en décembre sa Trainium 3, une puce conçue elle aussi pour réduire la dépendance de ses clients aux GPU (processeurs graphiques) de Nvidia, avec un coût d'entraînement et d'inférence réduit jusqu'à 50% selon le groupe.
Google, Amazon et Microsoft continuent néanmoins d'intégrer les GPU de Nvidia dans leurs infrastructures, aucun n'envisageant de s'en passer entièrement à court terme.
P.Keller--VB