dissertação

Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Departamento

Instituto de Ciências Exatas e Tecnológicas – ICET

Programa de Pós-Graduação

Programa de Pós-Graduação em Estatística e Experimentação Agropecuária

Agência de fomento

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Em diversas pesquisas, encontram-se amostras aleatórias de variáveis univariadas ou multivari- adas. Em muitos casos, a existência de observações denominadas de outliers são responsáveis por sérios comprometimentos da inferência estatística. A detecção dos outliers se torna de ex- trema importância nestes casos, uma vez que as inferências realizadas podem levar a conclusões equivocadas. Em um conjunto de dados multivariados, a detecção de outliers é mais complexa que nos casos univariados em razão da dimensão ser definida além da reta real. Existem testes para a detecção de outliers multivariados. Todos são dependentes de distribuições assintóticas e normais e são extremamente influenciados pela presença dos próprios outliers que se pretende identificar e excluir da amostra aleatória. Nesse sentido, o objetivo deste trabalho foi propor testes assintóticos robustos baseados nos estimadores comedian e em resíduos da análise de componentes principais para detectar outliers multivariados. Objetivou-se também comparar o desempenho dos testes propostos e dos testes existentes avaliados no presente trabalho por meio de simulação Monte Carlo, mensurando a capacidade dos testes de identificar os outliers e os não outliers na amostra aleatória. Para a geração dos dados simulados, utilizou-se uma amostra proveniente de uma população normal multivariada. A partir dos dados amostrais, foram obti- dos os componentes principais para a realização dos testes por meio do programa R. Os testes existentes são os de Jackson e Mudholkar e de Rao. Já os testes propostos consistem no teste de Jackson e Mudholkar e no teste de Rao, ambos utilizando o estimador robusto comedian. Conclui-se que os testes propostos, utilizando o estimador robusto comedian, obtiveram os me- lhores resultados na detecção dos outliers. Além disso, o teste de Rao, ao utilizar o comedian, destacou-se como o melhor, pois também detectou corretamente os não outliers.

Abstract

In various studies, random samples of univariate or multivariate variables are encountered. In many cases, the presence of observations referred to as outliers is responsible for significant compromises in statistical inference. Detecting outliers becomes extremely important in these cases, as the inferences made can lead to incorrect conclusions. In a multivariate dataset, the detection of outliers is more complex than in univariate cases because the dimension is defined beyond the real line. There are tests for detecting multivariate outliers. All of them depend on asymptotic and normal distributions and are highly influenced by the presence of the very ou- tliers they aim to identify and exclude from the random sample. In this context, the objective of this study was to propose robust asymptotic tests based on the comedian estimator and residu- als from principal component analysis to detect multivariate outliers. It also aimed to compare the performance of the proposed tests with existing tests evaluated in this study through Monte Carlo simulation, measuring the tests’ ability to identify outliers and non-outliers in the random sample. For the generation of simulated data, a sample from a multivariate normal population was used. From the sample data, principal components were obtained for conducting the tests using the R software. The existing tests are those of Jackson and Mudholkar and Rao. The proposed tests consist of the Jackson and Mudholkar test and the Rao test, both using the robust comedian estimator. It was concluded that the proposed tests, utilizing the robust comedian estimator, achieved the best results in detecting outliers. Furthermore, the Rao test, when using the comedian estimator, stood out as the best, as it also correctly identified non-outliers.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

NEVES, Maria Vitória. Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais. 2024. 91 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 4.0 International