A PCA and SPCA based procedure to variable selection in agriculture

  • Juscelino Izidoro de Oliveira Jr Fundação ABC para Assistência e Divulgação Técnica Agropecuária
  • José Carlos Ferreira da Rocha Universidade Estadual de Ponta Grosa
  • Alaine Margarete Guimarães Universidade Estadual de Ponta Grossa
  • Adriel Ferreira da Fonseca Universidade Estadual de Ponta Grossa
Palavras-chave: Mineração de dados agrícolas, seleção de variáveis, complexidade da amostra

Resumo

A mineração de dados agrícolas, frequentemente, envolve o processamento de bases de dados com poucas observações e alta dimensionalidade. Como a complexidade da amostra cresce com a dimensionalidade dos dados e esses dois fatores podem limitar a confiança nos resultados obtidos ou produzir modelos em que há overfitting. Uma forma de reduzir a dimensionalidade dos dados e a complexidade da amostra é selecionar os atributos que são relevantes para a descrição do fenômeno de interesse. Este trabalho apresenta um procedimento que combina métodos de busca e análise de componentes principais supervisionada e não supervisionada para selecionar variáveis. O procedimento remove as variáveis irrelevantes ou com pouca influência sobre a variação dos dados e avalia o impacto da seleção sobre tarefas de regressão e classificação. Sempre que possível, o número de variáveis selecionadas é aquele que atende aos requerimentos da complexidade da amostra. O procedimento foi testado na seleção de variáveis para indução de modelos lineares multivariados e redes neurais artificiais mediante uma base de dados de agricultura de precisão. O procedimento proposto permite uma solução de custo-benefício entre a redução da dimensionalidade e a acurácia do modelo.

Downloads

Não há dados estatísticos.

Biografia do Autor

Juscelino Izidoro de Oliveira Jr, Fundação ABC para Assistência e Divulgação Técnica Agropecuária
Mestre em Computação Aplicada
José Carlos Ferreira da Rocha, Universidade Estadual de Ponta Grosa
Professor Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa. Doutorado em Engenharia Mecânica pela USP.
Alaine Margarete Guimarães, Universidade Estadual de Ponta Grossa
Prof. Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa.
Adriel Ferreira da Fonseca, Universidade Estadual de Ponta Grossa
Prof. Adjunto do Departamento de Ciência do Solo e Engenharia Agrícola da Universidade Estadual de Ponta Grossa.
Publicado
2014-12-08
Como Citar
[1]
de Oliveira Jr, J., da Rocha, J.C., Guimarães, A. e da Fonseca, A. 2014. A PCA and SPCA based procedure to variable selection in agriculture. Revista Brasileira de Computação Aplicada. 7, 1 (dez. 2014), 30-41. DOI:https://doi.org/10.5335/rbca.2015.3727.
Seção
Artigo Original
Share |