
-
Trump abala o comércio mundial com novas tarifas
-
Congresso de El Salvador alinhado a Bukele aprova reeleição presidencial indefinida
-
Trump assina decreto que eleva tarifas a produtos de dezenas de países
-
Jihadista sueco é condenado à prisão perpétua por queimar vivo piloto jordaniano
-
Criador de 'Peaky Blinders' escreverá novo filme de James Bond
-
O que muda com as tarifas de Trump e que países elas afetam
-
Gauff vence Kudermetova de virada e vai às oitavas do WTA 1000 de Montreal
-
Google perde apelação em caso Epic Games e deve abrir Android para lojas rivais
-
Real Madrid anuncia transferência do zagueiro Jacobo Ramón para o Como
-
Cerúndolo vence Etcheverry em duelo argentino e vai às oitavas do Masters 1000 de Toronto
-
Benfica vence Sporting (1-0) e conquista Supertaça de Portugal
-
Academia do Oscar elege produtora de 'Nasce uma estrela' como presidente
-
Lateral-direito português Nelson Semedo assina com Fenerbahçe
-
Operários encontram múmia pré-hispânica em Lima
-
Piastri quer disparar rumo ao título em Budapeste, palco de sua 1ª vitória na F1
-
Trump expressa 'descontentamento' por reconhecimento internacional de Estado palestino
-
Game 'Battlefield 6', rival de 'Call of Duty', será lançado em 10 de outubro
-
Jihad Islâmica publica vídeo de refém israelense
-
Justin Timberlake revela que foi diagnosticado com doença de Lyme
-
Aclamado dramaturgo americano Robert Wilson morre aos 83 anos
-
Osimhen assina em definitivo com o Galatasaray por 75 milhões de euros
-
Marchand conquista ouro após quebrar recorde mundial de natação; Summer McIntosh volta a vencer
-
Estudos sobre mundo árabe estão no centro da ofensiva de Trump contra universidades
-
Frédéric Vasseur renova como chefe da escuderia Ferrari em F1
-
Luis Díaz se diz "muito feliz" em sua apresentação ao Bayern de Munique
-
Estrela do MMA Conor McGregor tem recurso por condenação por estupro rejeitado
-
Brasil considera situação tarifária com EUA 'mais favorável' do que o esperado
-
Trump adia aumento das tarifas ao México por 90 dias
-
Aubameyang está de volta ao Olympique de Marselha
-
Barça goleia FC Seoul (7-3) em amistoso na Coreia do Sul
-
Número de vítimas de explosivos dispara na Colômbia por ataques com drones
-
Verstappen confirma que vai continuar na Red Bull na próxima temporada
-
Enviado de Trump chega a Israel, sob pressão pela guerra em Gaza
-
Socorristas abandonam busca pelo corpo da alpinista Laura Dahlmeier
-
Aterrorizados com batidas, imigrantes de Los Angeles se trancam em casa
-
Vítimas de explosivos disparam na Colômbia por ataques com drones
-
Lucas Paquetá é absolvido de suposta infração de regras de apostas
-
O que acontecerá com o ex-presidente Uribe após sua condenação na Colômbia?
-
Enviado de Trump chega a Israel enquanto Gaza enterra dezenas de mortos
-
Do TikTok ao Instagram, Vaticano promove 'missionários digitais'
-
Ucrânia restabelece a independência de órgãos anticorrupção
-
Trump celebra tarifas: 'Tornam os EUA grandes e ricos de novo'
-
Zelensky pressiona para 'mudança de regime' na Rússia após bombardeio mortal em Kiev
-
Suécia exige que UE congele parte comercial de acordo de associação com Israel
-
Governo da Nicarágua investiga comandante sandinista histórico por corrupção
-
Opositores e policiais entram em confronto em meio à crise eleitoral em Honduras
-
Milhões de pessoas voltam para casa após fim de alertas de tsunami no Pacífico
-
Canadá tem intenção de reconhecer Estado palestino na Assembleia Geral da ONU
-
Tata Motors vai comprar Iveco Group por US$ 4,4 bilhões
-
Trump chega a acordo com Coreia do Sul e ameaça Índia com tarifas de 25%

IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
N.Schaad--VB