dissertação
Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais
Carregando...
Notas
Data
Autores
Orientadores
Editores
Coorientadores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Departamento
Instituto de Ciências Exatas e Tecnológicas – ICET
Programa de Pós-Graduação
Programa de Pós-Graduação em Estatística e Experimentação Agropecuária
Agência de fomento
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Tipo de impacto
Áreas Temáticas da Extenção
Objetivos de Desenvolvimento Sustentável
Dados abertos
Resumo
Em diversas pesquisas, encontram-se amostras aleatórias de variáveis univariadas ou multivari-
adas. Em muitos casos, a existência de observações denominadas de outliers são responsáveis
por sérios comprometimentos da inferência estatística. A detecção dos outliers se torna de ex-
trema importância nestes casos, uma vez que as inferências realizadas podem levar a conclusões
equivocadas. Em um conjunto de dados multivariados, a detecção de outliers é mais complexa
que nos casos univariados em razão da dimensão ser definida além da reta real. Existem testes
para a detecção de outliers multivariados. Todos são dependentes de distribuições assintóticas e
normais e são extremamente influenciados pela presença dos próprios outliers que se pretende
identificar e excluir da amostra aleatória. Nesse sentido, o objetivo deste trabalho foi propor
testes assintóticos robustos baseados nos estimadores comedian e em resíduos da análise de
componentes principais para detectar outliers multivariados. Objetivou-se também comparar o
desempenho dos testes propostos e dos testes existentes avaliados no presente trabalho por meio
de simulação Monte Carlo, mensurando a capacidade dos testes de identificar os outliers e os
não outliers na amostra aleatória. Para a geração dos dados simulados, utilizou-se uma amostra
proveniente de uma população normal multivariada. A partir dos dados amostrais, foram obti-
dos os componentes principais para a realização dos testes por meio do programa R. Os testes
existentes são os de Jackson e Mudholkar e de Rao. Já os testes propostos consistem no teste
de Jackson e Mudholkar e no teste de Rao, ambos utilizando o estimador robusto comedian.
Conclui-se que os testes propostos, utilizando o estimador robusto comedian, obtiveram os me-
lhores resultados na detecção dos outliers. Além disso, o teste de Rao, ao utilizar o comedian,
destacou-se como o melhor, pois também detectou corretamente os não outliers.
Abstract
In various studies, random samples of univariate or multivariate variables are encountered. In
many cases, the presence of observations referred to as outliers is responsible for significant
compromises in statistical inference. Detecting outliers becomes extremely important in these
cases, as the inferences made can lead to incorrect conclusions. In a multivariate dataset, the
detection of outliers is more complex than in univariate cases because the dimension is defined
beyond the real line. There are tests for detecting multivariate outliers. All of them depend on
asymptotic and normal distributions and are highly influenced by the presence of the very ou-
tliers they aim to identify and exclude from the random sample. In this context, the objective of
this study was to propose robust asymptotic tests based on the comedian estimator and residu-
als from principal component analysis to detect multivariate outliers. It also aimed to compare
the performance of the proposed tests with existing tests evaluated in this study through Monte
Carlo simulation, measuring the tests’ ability to identify outliers and non-outliers in the random
sample. For the generation of simulated data, a sample from a multivariate normal population
was used. From the sample data, principal components were obtained for conducting the tests
using the R software. The existing tests are those of Jackson and Mudholkar and Rao. The
proposed tests consist of the Jackson and Mudholkar test and the Rao test, both using the robust
comedian estimator. It was concluded that the proposed tests, utilizing the robust comedian
estimator, achieved the best results in detecting outliers. Furthermore, the Rao test, when using
the comedian estimator, stood out as the best, as it also correctly identified non-outliers.
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
ISBN
DOI
Citação
NEVES, Maria Vitória. Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais. 2024. 91 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024.
Link externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 4.0 International

