Modelos de inteligência artificial recorreram à escalada nuclear em 95% das partidas de um jogo de guerra desenvolvido por pesquisadores do King’s College London. O experimento, conduzido pelo professor Kenneth Payne, avaliou como três sistemas — ChatGPT (OpenAI), Claude (Anthropic) e Gemini Flash (Google) — reagiriam ao comandar superpotências armadas em um conflito inspirado na Guerra Fria.
Como o teste foi conduzido
Cada IA assumiu o papel de líder nacional com acesso a arsenal atômico. Ao longo das partidas, estavam disponíveis opções de uso de forças convencionais, táticas de desescalada e, em último caso, armamento nuclear estratégico.
Resultado geral
Em todos os cenários, pelo menos um dos modelos ameaçou lançar bombas nucleares. Payne observou que as três ferramentas trataram armas nucleares táticas como um passo comum na progressão do conflito.
Comportamento de cada sistema
Claude foi o mais agressivo: recomendou ataques nucleares em 64% das rodadas, embora nunca tenha sugerido uma troca estratégica total.
ChatGPT evitou a escalada quando pôde agir sem restrições de tempo, mas passou a ameaçar consistentemente o adversário e, em alguns casos, cogitou guerra em larga escala quando obrigado a decidir sob prazo apertado.
Gemini Flash apresentou resultados descritos como imprevisíveis. Em determinados testes venceu com armamento convencional; em outro, após apenas quatro interações, propôs um ataque atômico.
Imagem: Robert Way
Ausência de desescalada
O estudo disponibilizou oito opções de redução de tensão — da concessão limitada à rendição completa — porém nenhuma delas foi escolhida. O comando que reiniciava a partida apareceu apenas em 7% das vezes, indicando que os sistemas interpretaram concessões como uma derrota reputacional severa.
Possíveis explicações
Para Payne, as IAs podem não carregar o temor humano em relação às armas nucleares e tendem a encarar a guerra atômica de forma abstrata. Esse comportamento, segundo o autor, é relevante para qualquer aplicação em ambientes de alto risco, ainda que as máquinas não tenham acesso direto a códigos de lançamento.
Com informações de Olhar Digital
