Início POLICIA Inteligência Artificial já mente, engana e chantageia programadores

Inteligência Artificial já mente, engana e chantageia programadores

Os modelos mais recentes de inteligência artificial generativa (IA) não se limitam mais a seguir ordens e já são capazes de mentir, tramar ou ameaçar para atingir seus objetivos, constatam pesquisadores da tecnologia. Não é preciso mergulhar em literatura ou cinema de ficção científica: a IA que engana humanos agora é uma realidade.

Alguns exemplos: ameaçado de ser desconectado, Claude 4, recém-lançado pela Anthropic, chantageou um engenheiro e ameaça revelar um caso extraconjugal. O o1, da OpenAI, tenta se autocarregar em servidores externos – e nega ter feito isso ao ser pego em flagrante.

Para Simon Goldstein, professor da Universidade de Hong Kong, essas “falhas de caráter” se devem ao recente surgimento dos chamados modelos de “raciocínio”, capazes de funcionar em etapas em vez de produzir uma resposta instantânea. O o1, a versão inicial desse tipo para a OpenAI, lançada em dezembro, “foi o primeiro modelo a se comportar dessa maneira”, explica Marius Hobbhahn, chefe da Apollo Research, que testa grandes programas de IA generativa (LLM).

noticia por : UOL

Sair da versão mobile