A Inteligência Artificial do Google, Deep Mind, completa complexo jogo graças a novo e interessante algoritmo

Deep Mind capa

Quanto tratamos do tamanho do Google neste post aqui, citamos todo o trabalho com inteligência artificial que está sendo feito no projeto Deep Mind.

Uma das primeiras demonstrações da tecnologia foi quando foi exibido que o “Deep Mind” aprendeu sozinho a jogar inúmeros jogos de Atari e, depois de várias tentativas, até mesmo vencer os jogos.

Agora a demonstração segue a mesma linha, mas vai um passo além.

Um dos jogos mais complicados da era do Atari é o jogo Montezuma’s Revenge. O jogo possui inúmeros obstáculos, inimigos e chaves que abrem portas dos labirintos. O primeiro level é composto por 24 salas. Na versão “antiga” do Deep Mind, em 100 milhões de tentativas, apenas 2 salas das 24 possíveis foram visitadas pela Inteligência Artificial.

 

Deep Mind montezuma

Por que? Porque simplesmente não havia motivação para a máquina visitar mais do que isso. (pois é, até as máquinas tem vontades hoje em dia).

Para superar esta limitação, foi testado um algoritmo chamado “Motivação Intrínseca” que é baseado em recompensar o Deep Mind por movimentos que esta faça. Desta forma, todas as vezes que o agente (a IA) tentar algo diferente no jogo, esta é recompensada (dinheiro, mulheres, poder!?). As transições de tela também eram recompensadas (engraçado até mesmo ver no vídeo a IA “roubando” trocando de tela freneticamente em busca da sua recompensa).

No final das contas, com as motivações, das 24 salas possíveis, o agente visitou 15 delas. O vídeo do feito após as milhões de tentativas é sensacional.

A máquina empiricamente vai entendendo o que é perigo, o que é benéfico, etc. e no final é capaz de jogar um jogo bastante complicado.

Veja por você mesmo:

 

 

 

A cada dia que passa o Deep Mind vem fazendo avanços interessantes. Pode parecer besteira uma IA que joga video-game, mas a prova de conceito é demonstrar como uma IA, na base do erro/acerto/observação consegue aprender “qualquer” coisa, mais ou menos da forma como um ser humano faz.

Abraços

Fonte:Wired

Paper do algoritmo Intrinsic Motivation (PDF)

Comentários

Comentários

Be the first to comment

Leave a comment

Your email address will not be published.


*