Aprendizado por Reforço com CMAC não-linear no treinamento de uma equipe para o simulador 2D da Robocup

7 de março de 2015
Pesquisas Individuais

Petiano: Lucas Albero Orientador: Prof. Dr. Valdinei Freire da Silva

Aprendizado por reforço (Reinforcement Learning) considera o problema de um agente interagindo com um ambiente completamente desconhecido no qual o agente deve aprender a agir otimamente; embora considere ambientes de forma genéricas, o aprendizado pode ser extremamente lento devido a utilização de estratégias de tentativa e erro. Esta extrema lentidão evidencia-se no futebol de robô, no qual a quantidade de dimensões do espaço de estado é muito grande.Uma forma de acelerar o aprendizado por reforço é utilizar abstração de forma a generalizar o conhecimento; por exemplo, alguns trabalhos utilizam a estrutura CMAC (Cerebellar Model Articulation Controller) para generalizar o conhecimento, mas consideram as dimensões linearmente. Este trabalho tem como objetivo desenvolver um time de futebol de robôs para o simulador 2D da Robocup utilizando aprendizado por reforço e CMAC, mas considerando as dimensões não linearmente. Utilizando a equipe Helios Base como modelo, serão definidas quais dimensões devem possuir relações não lineares de modo a potencialmente evoluir um melhor agente; a equipe também será treinada utilizando níveis de dificuldades menores até se alcançar o nível de dificuldade do Helios Base. Espera-se que o time obtido com essa estratégia possa jogar melhor que o Helios Base.

Tags: Pesquisa