-
MotoGp: Brasile; problemi all'asfalto, slitta la Sprint
-
Audizioni live a Musicultura, a Gianvito Premio del Pubblico Banca Macerata
-
A Praga manifestazione contro il governo Babis, 'non ci rubi il futuro'
-
Media, 'Israele prolungherà la guerra in Iran almeno per altre due settimane'
-
Bts, The Comeback live Airgang su Netflix dalla storica Gwanghwamun Square di Seul
-
Manifestazione a Londra, 'Stop alla guerra in Iran'
-
Pogacar "sono felicissimo di aver finalmente vinto la Sanremo"
-
Calcio: Parma-Cremonese 0-2
-
Turbanti, mostra fotografica con modelli speciali
-
Milei da Orban, 'l'immigrazione che non si adatta è un'invasione'
-
Canottaggio: Galtarossa nuovo presidente federale, eletto con l'85% dei voti
-
MotoGp: Brasile; Di Giannantonio in pole, poi Bezzecchi e Marc Marquez
-
Calcio: Chivu, il silenzio stampa l'abbiamo deciso tutti assieme
-
Inter: Chivu, Bastoni indisponibile con la Fiorentina
-
Plt Holding presenta una lista per Mps, Lovaglio ad e Bisoni presidente
-
Salgono a 22 i Paesi pronti ad impegnarsi per Hormuz dopo la tregua
-
Kopecky vince la Milano-Sanremo donne, terza Gasparrini
-
Prezzo della benzina oggi sotto la media degli ultimi quattro anni
-
Axios, 007 Usa-Israele ritengono che Mojtaba Khamenei sia vivo
-
Calcio: Juve; Spalletti ritrova Vlahovic e recupera Thuram
-
Mondiali atletica indoor, Dosso protagonista nella batteria dei 60 metri con 7''07
-
Crescono le pressioni su Sarah Ferguson, 'testimoni su Epstein'
-
Sci: Cdm; Pirovano vince anche la libera di Lillehammer
-
Pentagono, integreremo l'IA Palantir nelle Forze armate Usa
-
Da Harry Styles a Lady Gaga, lo styling delle star in mostra a Trieste
-
Operazione terrestre dell'Idf nel sud del Libano, 'uccisi 4 terroristi'
-
Londra, 'missili iraniani su Diego Garcia, minaccia a interessi britannici'
-
Ft, 'Ue invita i 27 a ridurre gli obiettivi di stoccaggio del gas'
-
++ Sci: Cdm; Paris vince la discesa di Lillehammer ed e' il secondo jet della storia ++
-
A Singapore maxi-appalto a Woh Hup per l'espansione di Marina Bay
-
Listini delle uova decollano, +27% da inizio anno per quelle allevate a terra
-
Mozart e Haydn, nuovo album di Accademia Bizantina e Ottavio Dantone
-
Coldiretti e Federforeste, 'serve una svolta nella gestione dei boschi'
-
Media iraniani, Usa e Israele attaccano l'impianto nucleare di Natanz
-
Tennis: Miami; Berrettini 'conosco il mio valore, mi serve solo continuità'
-
Achille Lauro aprirà al Dall'Ara di Bologna il tour 2027 negli stadi
-
Rincari gas, le bollette fisse migliori più care del 13%, punte del 45%
-
Cgia Mestre, 'nonostante i tagli, il caro diesel rimane, urge intervento dell'Ue'
-
Teheran conferma l'attacco all'isola di Diego Garcia, a 4mila km da Iran
-
Iran: pronti a facilitare transito navi giapponesi nello Stretto di Hormuz
-
Brasile, Lula propone al Messico un accordo sul petrolio
-
Moraes chiede parere alla Procura su eventuali domiciliari per Bolsonaro
-
Caracas, cala il peso dei militari nel governo dopo rimpasto di Delcy Rodriguéz
-
Usa danno via libera a vendita petrolio iraniano già in navigazione
-
Tennis: Miami, Berrettini batte Bublik ed è al terzo turno
-
Tennis: Wta Miami; battuta l'americana Townsend, Paolini parte bene
-
Trump, 'valuto un ridimensionamento dell'operazione in Iran'
-
Iran, 'non abbiamo eccedenze di greggio da offrire ai mercati globali'
-
Sisi inaugura la prima monorotaia, rivoluzionerà i trasporti del Cairo
-
++ Mondiali atletica: Diaz oro nel triplo, prima medaglia azzurra ++
Il paradosso dei chatbot, più crescono più sbagliano
Dà risposte errate piuttosto che ammettere l'ignoranza
Più crescono e fanno esperienza, maggiore è il rischio che rispondano in modo errato piuttosto che ammettere di non saper rispondere: è uno dei grandi problemi dei grandi modelli linguistici che alimentano i chatbot, come ChatGpt e Llama. A dirlo è lo studio pubblicato sulla rivista Nature da José Hernández-Orallo, dell'Istituto di ricerca per l'Intelligenza Artificiale di Valencia in Spagna, che sottolinea inoltre come questi errori sfuggano facilmente agli umani. Una delle importanti caratteristiche dei grandi modelli linguistici, o Llm, è la capacità di evolvere nel tempo integrando al loro interno nuove informazioni derivanti dalle interazioni con gli utenti o con gli sviluppatori, così da diventare teoricamente sempre più affidabili. Ma analizzando questo percorso in tre degli Llm più polari, in particolare ChatGpt di OpenAi, Llama di Meta e il modello aperto Bloom, i ricercatori spagnoli hanno osservato un cambiamento del loro comportamento. Secondo gli autori della ricerca i tre modelli inizialmente erano più propensi di oggi nell'ammettere di non poter rispondere a domande su questioni su cui non si sentivano certi di dare risposte accurate. Una prudenza che è andata gradualmente svanendo: "i modelli 'ingranditi' e modellati tendono a dare una risposta apparentemente sensata, ma sbagliata, molto più spesso rispetto al passato", affermano i ricercatori nell'articolo. I chatbot "stanno diventando più bravi a fingere di essere informati", ha commentato Hernández-Orallo. Un problema che si aggiunge inoltre all'incapacità da parte degli umani di riuscire a notare questi errori, spesso perché ci si fida automaticamente della macchina. Un problema che potrebbe essere parzialmente risolto impostando negli Llm una sorta di soglia di affidabilità più alta, al di sotto della quale l'IA non rilascia una risposta. Scelta possibile per i chatbot ideati per lavorare in settori specifici, ad esempio in campo medico, ma più difficile immaginare, sottolineano i ricercatori, possa essere introdotta da quelle aziende che sviluppano chatbot 'generalisti' che puntano proprio sulla capacità di risposta in settori molto ampi.
R.Kloeti--VB