Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais
| dc.contributor.advisor1 | Ferreira, Daniel Furtado | |
| dc.contributor.referee1 | Guimarães, Paulo Henrique Sales | |
| dc.contributor.referee2 | Batista, Ben Dêivide de Oliveira | |
| dc.contributor.referee3 | Nunes, José Airton Rodrigues | |
| dc.creator | Neves, Maria Vitória | |
| dc.creator.Lattes | https://lattes.cnpq.br/3217932377278951 | pt_BR |
| dc.date.accessioned | 2024-12-17T19:44:40Z | |
| dc.date.available | 2024-12-17T19:44:40Z | |
| dc.date.issued | 2024-12-17 | |
| dc.date.submitted | 2024-10-16 | |
| dc.description.abstract | In various studies, random samples of univariate or multivariate variables are encountered. In many cases, the presence of observations referred to as outliers is responsible for significant compromises in statistical inference. Detecting outliers becomes extremely important in these cases, as the inferences made can lead to incorrect conclusions. In a multivariate dataset, the detection of outliers is more complex than in univariate cases because the dimension is defined beyond the real line. There are tests for detecting multivariate outliers. All of them depend on asymptotic and normal distributions and are highly influenced by the presence of the very ou- tliers they aim to identify and exclude from the random sample. In this context, the objective of this study was to propose robust asymptotic tests based on the comedian estimator and residu- als from principal component analysis to detect multivariate outliers. It also aimed to compare the performance of the proposed tests with existing tests evaluated in this study through Monte Carlo simulation, measuring the tests’ ability to identify outliers and non-outliers in the random sample. For the generation of simulated data, a sample from a multivariate normal population was used. From the sample data, principal components were obtained for conducting the tests using the R software. The existing tests are those of Jackson and Mudholkar and Rao. The proposed tests consist of the Jackson and Mudholkar test and the Rao test, both using the robust comedian estimator. It was concluded that the proposed tests, utilizing the robust comedian estimator, achieved the best results in detecting outliers. Furthermore, the Rao test, when using the comedian estimator, stood out as the best, as it also correctly identified non-outliers. | pt_BR |
| dc.description.resumo | Em diversas pesquisas, encontram-se amostras aleatórias de variáveis univariadas ou multivari- adas. Em muitos casos, a existência de observações denominadas de outliers são responsáveis por sérios comprometimentos da inferência estatística. A detecção dos outliers se torna de ex- trema importância nestes casos, uma vez que as inferências realizadas podem levar a conclusões equivocadas. Em um conjunto de dados multivariados, a detecção de outliers é mais complexa que nos casos univariados em razão da dimensão ser definida além da reta real. Existem testes para a detecção de outliers multivariados. Todos são dependentes de distribuições assintóticas e normais e são extremamente influenciados pela presença dos próprios outliers que se pretende identificar e excluir da amostra aleatória. Nesse sentido, o objetivo deste trabalho foi propor testes assintóticos robustos baseados nos estimadores comedian e em resíduos da análise de componentes principais para detectar outliers multivariados. Objetivou-se também comparar o desempenho dos testes propostos e dos testes existentes avaliados no presente trabalho por meio de simulação Monte Carlo, mensurando a capacidade dos testes de identificar os outliers e os não outliers na amostra aleatória. Para a geração dos dados simulados, utilizou-se uma amostra proveniente de uma população normal multivariada. A partir dos dados amostrais, foram obti- dos os componentes principais para a realização dos testes por meio do programa R. Os testes existentes são os de Jackson e Mudholkar e de Rao. Já os testes propostos consistem no teste de Jackson e Mudholkar e no teste de Rao, ambos utilizando o estimador robusto comedian. Conclui-se que os testes propostos, utilizando o estimador robusto comedian, obtiveram os me- lhores resultados na detecção dos outliers. Além disso, o teste de Rao, ao utilizar o comedian, destacou-se como o melhor, pois também detectou corretamente os não outliers. | pt_BR |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
| dc.identifier.citation | NEVES, Maria Vitória. Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais. 2024. 91 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2024. | pt_BR |
| dc.identifier.uri | https://repositorio.ufla.br/handle/1/59755 | |
| dc.language | pt_BR | pt_BR |
| dc.publisher | Universidade Federal de Lavras | pt_BR |
| dc.publisher.country | brasil | pt_BR |
| dc.publisher.department | Instituto de Ciências Exatas e Tecnológicas – ICET | pt_BR |
| dc.publisher.initials | UFLA | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Estatística e Experimentação Agropecuária | pt_BR |
| dc.rights | Attribution 4.0 International | * |
| dc.rights | Attribution 4.0 International | |
| dc.rights | acesso aberto | pt_BR |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | * |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Simulação Monte Carlo | pt_BR |
| dc.subject | Verdadeiros positivos | pt_BR |
| dc.subject | Verdadeiros negativos | pt_BR |
| dc.subject | Monte Carlo simulation | pt_BR |
| dc.subject | True positives | pt_BR |
| dc.subject | True negatives | pt_BR |
| dc.subject | Estimador robusto comedian | pt_BR |
| dc.subject | Comedian robust estimator | pt_BR |
| dc.subject.cnpq | Probabilidade e Estatística | pt_BR |
| dc.title | Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais | pt_BR |
| dc.title.alternative | Proposal of robust comedian tests for detecting multivariate outliers based on principal component analysis residuals | pt_BR |
| dc.type | dissertação | pt_BR |
Arquivos
Pacote original
1 - 2 de 2
Carregando...
- Nome:
- DISSERTAÇÃO_ Proposição de testes robustos comedian para detecção de outliers multivariados baseados em resíduos da análise de componentes principais.pdf
- Tamanho:
- 793.7 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
Carregando...
- Nome:
- INDICADORES da pesquisa.pdf
- Tamanho:
- 153.37 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 956 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
