Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/55736
Título: Aplicações de métodos de seleção de variáveis em modelos de regressão
Título(s) alternativo(s): Applications of variable selection methods in regression models
Autores: Oliveira, Izabela Regina Cardoso de
Lima, Renato Ribeiro de
Ferreira, Daniel Furtado
Pereira, Gustavo Henrique de Araujo
Palavras-chave: Alta dimensionalidade
Importância de variáveis
Lasso
Floresta aleatória
Regressão logística
High dimensionality
Variables importance
Random forest
Logistic regression
Stepwise
Data do documento: 5-Jan-2023
Editor: Universidade Federal de Lavras
Citação: DUARTE, A. S. Aplicações de métodos de seleção de variáveis em modelos de regressão. 2022. 70 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)–Universidade Federal de Lavras, Lavras, 2022.
Resumo: Regression models are appliedtostudy a cause/effectrelationshipbetween a response variable and oneor more explanatory variables. Withtechnologicaladvances, the volume and dimension of theanalyzed data canbeincreasing. Whilethelargenumber of variables canincreasethepredictivecapacity of the model many of them variables cancontributelittle and generate a high computational cost. Then it maybenecessarytoselect variables and search for thosethathavethegreatestimpact in the model. In thisworkweevaluatethe use of variable selection methods in two case studies. The firstonewascarried out toevaluatethefrequency and food security of preschoolers in thecity of Lavras, MG. The responses analyzed in thisfirststage are data fromcategories of theBrazilianScale of Food Insecurity (EBIA) and the Food Frequency Questionnaire (FFQ), analyzedthroughlogistic models. Data werecollectedfrom 581 preschoolers and refertoabout 50 variables of differenttypes. The methods Stepwise, Lasso, the Purposeful Selection of Covariates (PSV) and Random Forest wereconsidered for the selection of variables. Subsequently, thelogistic models wereobtainedwiththe variables selectedbythesemethods. The models wereevaluated in terms of AIC. Amongtheevaluatedmethods, theonethatproducedthebestperforming model was Stepwise. The secondapplicationinvolved a high-dimensional data scenario, obtainedwiththe use of NIRS (Near infraredspectroscopy) in a problem of predicting food consumption, fromfeces of dairycows. The methods Stepwise, lasso and Random Forest wereconsidered for the selection of variables. Lasso performedwell in thecross-validationstudy. However, thisstudyislimitedtothe use of themethodsindependently. Other authorsobtainedgoodresultsapplying more thanonemethodsimultaneously. The contributions of this case study are thecomparisonamong lasso and Random Forest, usedseparately for the selection of variables in NIRS and thecomparisonbetweendifferenttypes of validations for the models obtainedusing lasso.
URI: http://repositorio.ufla.br/jspui/handle/1/55736
Aparece nas coleções:Estatística e Experimentação Agropecuária - Mestrado (Dissertações)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
DISSERTAÇÃO_Aplicações de métodos de seleção de variáveis em modelos de regressão.pdf1,02 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.