Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional

André Luiz Carvalho Ottoni, Erivelton Geraldo Nepomuceno, Marcos Santos de Oliveira

Resumo


Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.

Palavras-chave


Aprendizado por Reforço; Otimização Combinatória; Problema da Mochila Multidimensional

Texto completo:

PDF


DOI: http://dx.doi.org/10.5335/rbca.v9i3.6601