Siga o Olhar Digital no Google Discover
O Google criou um novo agente chamado SIMA 2, com capacidade para navegar e solucionar problemas em uma ampla variedade de mundos virtuais 3D. Ele foi construído sobre o Gemini, principal inteligência artificial da big tech, dando ao agente uma capacidade significativamente ampliada.
O SIMA (sigla para ‘agente multimundo instruível escalável’) foi apresentado pela primeira vez em 2024, capaz de jogar diversos jogos, como o Goat Simulator 3, um título de ação com física exagerada. Já o SIMA 2, de acordo com pesquisadores, como destacado no site MT Technology Review — possui capacidade para realizar diversas tarefas complexas em ambientes virtuais, conseguindo interagir com usuários por meio de conversas e solucionar desafios por conta própria.
Leia mais:
- O balé robótico da DeepMind: uma IA para coordenar robôs de fabricação
- Medicamentos mais rápidos: IA pode encurtar pesquisas e salvar vidas
- Google cria IA que pode prever trajetória de ciclones
Objetivo do Google DeepMind

(Imagem: Photo For Everything / Shutterstock.com)
A ideia do Google DeepMind é conseguir construir agentes de próxima geração que tenham habilidades para seguir instruções e realizar ações complexas em ambientes muito sofisticados que vão além de um navegador web.
Segundo o MT Technology Review, a big tech, no longo prazo, tem o objetivo de usar para controlar robôs no mundo real. O SIMA 2, por exemplo, já consegue utilizar ferramentas, navegar em um ambiente e colaborar com humanos, coisas tidas como essenciais para robôs companheiros no futuro.
O SIMA foi criado para realizar o treinamento do agente para jogar um jogo aberto sem objetivos pré-estabelecidos. Dessa maneira, a ideia é que o agente aprenda a colocar em prática as orientações dadas pelas pessoas.
(Imagem: Google DeepMind/Reprodução)
Como funciona o SIMA 2?
O SIMA 2 pode ser controlado por humanos por meio de bate-papo via texto, voz ou até mesmo desenhos na tela do jogo. A partir disso, o agente processa, quadro a quadro, os pixels do videogame e estabelece como agir para realizar as tarefas necessárias.
O agente também pode ser conectado ao Gemini, o que, segundo os pesquisadores, faz com que ele fique melhor para seguir instruções (realizando perguntas e dando atualizações ao longo do processo). Outra melhoria ao utilizar a IA é que o agente consegue descobrir sozinho a maneira adequada de executar de executar determinadas tarefas complexas.
Realização dos testes
Imagem: Iljanaresvara Studio/Shutterstock
O treinamento do SIMA 2 ocorreu por meio de gravações de humanos jogando oito videogames comerciais, como Goat Simulator 3 e No Man’s Sky, além de três mundos virtuais construídos pela empresa. O agente ganhou a capacidade de associar comandos no mouse e no teclado a ações.
Os ambientes nos quais o SIMA 2 foi inserido foram criados do zero pelo Genie 3, novo modelo de IA do Google DeepMind, capaz de criar mundos em 3D. O Gemini também foi colocado pelos pesquisadores para elaborar novas tarefas para o agente, que se falhasse, teria a IA como sua aliada para fornecer dicas voltadas a novas tentativas. Assim, o SIMA 2 conseguiu melhorar a cada tentativa até obter êxito.
Até então, o SIMA 2 é apenas um experimento
Apesar de trazer resultados promissores, o SIMA 2 é, até então, apenas um experimento. Ele ainda possui diversas dificuldades para realizar ações complexas, isto é, exigem diversas etapas.
Outro ponto é que sua memória é pequena e ele ainda precisa evoluir significativamente para utilizar teclado e mouse ao interagir com um mundo virtual.
Amazon Prime também é feito para jogadores!
Todo mês, obtenha itens exclusivos, jogos grátis, uma assinatura gratuita na Twitch.tv e muito mais com sua assinatura Prime. Clique aqui para um teste gratuito de 30 dias.