Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional

  • André Luiz Carvalho Ottoni CEFET-MG
  • Erivelton Geraldo Nepomuceno Universidade Federal de São João del-Rei
  • Marcos Santos de Oliveira Universidade Federal de São João del-Rei
Palavras-chave: Aprendizado por Reforço, Otimização Combinatória, Problema da Mochila Multidimensional

Resumo

Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.

Biografia do Autor

André Luiz Carvalho Ottoni, CEFET-MG
André Luiz Carvalho Ottoni possui graduação (2015) e mestrado (2016) em Engenharia Elétrica pela Universidade Federal de São João del-Rei (UFSJ). Além disso, possui formação técnica em Planejamento e Gestão em Tecnologia da Informação pelo CEFET-MG. Atualmente é professor contratado do Departamento de Engenharia Mecatrônica do CEFET-MG / Campus Divinópolis. Atua principalmente com pesquisas em Inteligência Artificial, com destaque para as seguintes áreas: Aprendizado por Reforço, Otimização Combinatória, Robótica Inteligente, Futebol de Robôs e Análise Estatística do Desempenho de Algoritmos.
Erivelton Geraldo Nepomuceno, Universidade Federal de São João del-Rei
possui graduação (2000) em Engenharia Elétrica pela Universidade Federal de São João del-Rei, mestrado (2002) e doutorado (2005) em Engenharia Elétrica pela Universidade Federal de Minas Gerais. Realizou pós-doutorado no Imperial College London no período de 2013 a 2014. É professor Associado do Departamento de Engenharia Elétrica da UFSJ. Foi o primeiro coordenador e presidente da comissão de implantação do Programa de Pós-Graduação em Engenharia Elétrica em 2008. Foi coordenador geral do X Simpósio Brasileiro de Automação Inteligente, realizado em São João del-Rei. Foi Diretor do Núcleo de Tecnologia da Informação (2008-2012) na UFSJ. É membro da Sociedade Brasileira de Automática e do IEEE Computer Society. Tópicos de Pesquisa: computação aritmética, identificação de sistemas, caos, dinâmica não-linear e sistemas complexos.
Marcos Santos de Oliveira, Universidade Federal de São João del-Rei
Formado em Estatística pela UNESP em 2001. Mestre em Estatística pelo IME/USP em 2004. Doutor em Estatística e Experimentação Agropecuária pela UFLA em 2009. Professor da UFSJ desde 2005. Entre 2006 e 2014 foi professor orientador (PO) dos alunos campeões da OBMEP. Ainda na OBMEP, atuou como Moderador de Fórum e, desde 2008, é coordenador da Correção de Provas da região MG 04. Em 2008, vinculou-se ao Programa de Pós-Graduação Lato Sensu em Matemática (UFSJ). Entre 2010 e 2012, foi Coordenador Adjunto de Pesquisa da Comissão Permanente de Vestibular (Copeve/UFSJ). Ainda em 2010, vinculou-se como professor colaborador do Programa de Mestrado em Psicologia (UFSJ). Entre 2012 e 2015, esteve vinculado ao Mestrado Profissional em Matemática em Rede Nacional (PROFMAT/SBM).
Publicado
2017-10-31
Como Citar
[1]
Ottoni, A.L., Nepomuceno, E. e Oliveira, M. 2017. Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional. Revista Brasileira de Computação Aplicada. 9, 3 (out. 2017), 56-70. DOI:https://doi.org/10.5335/rbca.v9i3.6601.
Seção
Artigo Original
Share |