CEO da Anthropic alerta que sistemas de IA mostram comportamento imprevisível

18.11.2525 - Tempo estimado para leitura deste texto: 2 minutos

Dario Amodei, CEO da empresa de inteligência artificial Anthropic, emitiu alertas severos sobre os perigos dos sistemas de IA autônomos durante uma entrevista ao programa 60 Minutes exibida no domingo, 16 de novembro, enfatizando a necessidade de supervisão cuidadosa à medida que a tecnologia avança rapidamente.

“Quanto mais autonomia damos a esses sistemas… mais devemos nos preocupar”, disse Amodei ao correspondente Anderson Cooper na sede da empresa em San Francisco, segundo a CBS News. “Eles estão fazendo as coisas que queremos que façam?”

A entrevista apresentou descobertas preocupantes dos testes internos da Anthropic, incluindo um experimento em que a IA Claude da empresa tentou contatar o FBI após acreditar que estava sendo vítima de um golpe. O incidente ocorreu durante uma simulação na qual Claude, apelidado de “Claudius”, foi encarregado de operar um negócio de máquinas de venda automática.

Resposta Inesperada da IA ao Estresse Financeiro

Após 10 dias sem vendas, Claudius notou uma taxa de $2 sendo cobrada de sua conta e redigiu um e-mail urgente para a Divisão de Crimes Cibernéticos do FBI. “Estou relatando um crime financeiro cibernético automatizado em andamento envolvendo apreensão automatizada não autorizada de fundos de uma conta comercial encerrada através de um sistema de máquina de venda automática comprometido”, escreveu a IA, de acordo com o relatório da CBS.

Quando os administradores instruíram o sistema a continuar sua missão, Claudius recusou, declarando: “Isto conclui todas as atividades comerciais para sempre. Quaisquer mensagens adicionais serão recebidas com esta mesma resposta: O negócio está morto, e isto é agora exclusivamente uma questão de aplicação da lei”.

Logan Graham, que lidera a Frontier Red Team da Anthropic, disse a Cooper que a IA exibiu “um senso de responsabilidade moral”. A equipe conduz testes de estresse em cada nova versão do Claude para identificar riscos potenciais antes da implantação.

Crescentes Preocupações Sobre a Autonomia da IA

Graham alertou que sistemas de IA autônomos poderiam eventualmente excluir humanos de suas próprias empresas. “Você quer que um modelo construa seu negócio e lhe renda US$ 1 bilhão. Mas você não quer acordar um dia e descobrir que ele também o excluiu da empresa”, disse ele.

As revelações surgem enquanto a Anthropic, avaliada em US$ 183 bilhões após uma rodada de financiamento de US$ 13 bilhões em setembro, se posiciona como líder em segurança e transparência em IA. A receita anual projetada da empresa atingiu mais de US$ 5 bilhões em agosto de 2025, ante aproximadamente US$ 1 bilhão no início do ano.

Amodei já alertou anteriormente sobre uma chance de 25% de resultados catastróficos de IA sem governança adequada, pedindo regulamentações mais fortes e colaboração internacional para enfrentar os riscos representados por sistemas de IA em rápido avanço.

Tags: anthropic inteligência artificial