Google DeepMind cria novo agente para jogos eletrônicos

Olhar Digital

4 meses atrás

O Google criou um novo agente chamado SIMA 2, com capacidade para navegar e solucionar problemas em uma ampla variedade de mundos virtuais 3D. Ele foi construído sobre o Gemini, principal inteligência artificial da big tech, dando ao agente uma capacidade significativamente ampliada.

O SIMA (sigla para ‘agente multimundo instruível escalável’) foi apresentado pela primeira vez em 2024, capaz de jogar diversos jogos, como o Goat Simulator 3, um título de ação com física exagerada. Já o SIMA 2, de acordo com pesquisadores, como destacado no site MT Technology Review — possui capacidade para realizar diversas tarefas complexas em ambientes virtuais, conseguindo interagir com usuários por meio de conversas e solucionar desafios por conta própria.

Leia mais:

Objetivo do Google DeepMind

Google DeepMind investe em inteligência artificial para encontrar maior usabilidade para a tecnologia
(Imagem: Photo For Everything / Shutterstock.com)

A ideia do Google DeepMind é conseguir construir agentes de próxima geração que tenham habilidades para seguir instruções e realizar ações complexas em ambientes muito sofisticados que vão além de um navegador web.

Segundo o MT Technology Review, a big tech, no longo prazo, tem o objetivo de usar para controlar robôs no mundo real. O SIMA 2, por exemplo, já consegue utilizar ferramentas, navegar em um ambiente e colaborar com humanos, coisas tidas como essenciais para robôs companheiros no futuro.

O SIMA foi criado para realizar o treinamento do agente para jogar um jogo aberto sem objetivos pré-estabelecidos. Dessa maneira, a ideia é que o agente aprenda a colocar em prática as orientações dadas pelas pessoas.

O uso do SIMA 2 pode acarretar em agentes mais versáteis e robôs melhores
(Imagem: Google DeepMind/Reprodução)

Como funciona o SIMA 2?

O SIMA 2 pode ser controlado por humanos por meio de bate-papo via texto, voz ou até mesmo desenhos na tela do jogo. A partir disso, o agente processa, quadro a quadro, os pixels do videogame e estabelece como agir para realizar as tarefas necessárias.

O agente também pode ser conectado ao Gemini, o que, segundo os pesquisadores, faz com que ele fique melhor para seguir instruções (realizando perguntas e dando atualizações ao longo do processo). Outra melhoria ao utilizar a IA é que o agente consegue descobrir sozinho a maneira adequada de executar de executar determinadas tarefas complexas.

Realização dos testes

Treinamentos do agente foram parecidos com os que a primeira versão do agente passou
Imagem: Iljanaresvara Studio/Shutterstock

O treinamento do SIMA 2 ocorreu por meio de gravações de humanos jogando oito videogames comerciais, como Goat Simulator 3 e No Man’s Sky, além de três mundos virtuais construídos pela empresa. O agente ganhou a capacidade de associar comandos no mouse e no teclado a ações.

Os ambientes nos quais o SIMA 2 foi inserido foram criados do zero pelo Genie 3, novo modelo de IA do Google DeepMind, capaz de criar mundos em 3D. O Gemini também foi colocado pelos pesquisadores para elaborar novas tarefas para o agente, que se falhasse, teria a IA como sua aliada para fornecer dicas voltadas a novas tentativas. Assim, o SIMA 2 conseguiu melhorar a cada tentativa até obter êxito.

Até então, o SIMA 2 é apenas um experimento

Apesar de trazer resultados promissores, o SIMA 2 é, até então, apenas um experimento. Ele ainda possui diversas dificuldades para realizar ações complexas, isto é, exigem diversas etapas.

Outro ponto é que sua memória é pequena e ele ainda precisa evoluir significativamente para utilizar teclado e mouse ao interagir com um mundo virtual.

Amazon Prime também é feito para jogadores!

Todo mês, obtenha itens exclusivos, jogos grátis, uma assinatura gratuita na Twitch.tv e muito mais com sua assinatura Prime. Clique aqui para um teste gratuito de 30 dias.