tese

Proposição de teste de médias robustos e não robustos sob distribuições normais contaminadas e não normais

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Departamento

Departamento de Estatística

Programa de Pós-Graduação

Programa de Pós-graduação em Estatística e Experimentação Agropecuária

Agência de fomento

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Em uma análise estatística, o processo inferencial para a média de uma população inclui o chamado teste de hipóteses. Considerando o caso univariado e se tratando de uma população normalmente distribuída, quando não se conhece a variância populacional utiliza-se a distribuiçãot-student para tomar a decisão de rejeitar ou não a hipótese nula de que a média populacional é igual a uma dada constante. Para o caso multivariado, nas mesmas condições, utiliza-seo teste T2 proposto por Harold Hotelling para testar as hipóteses sobre um vetor de médiaspopulacional. Uma outra forma de realizar esses testes de hipóteses é por meio do teste darazão de verossimilhanças, denominado de LRT (likelihood ratio test). Na presença de outliers, ambos os testes T2 e LRT não devem ser utilizados, pois seus estimadores que são o vetorde médias e a matriz de covariâncias amostrais são influenciados por valores discrepantes. Naliteratura, existem muitos estudos sobre a construção de estimadores para o vetor de médiase para a matriz de covariâncias que são robustos à presença de outliers, possuindo alto pontode ruptura e mantendo a propriedade de afim-equivariância. Porém, muitos destes estimadores estão condicionados à existência dos dois primeiros momentos. Um caso especial destesestimadores é o estimador robusto comedian que não está condicionado a existência dos doisprimeiros momentos e, em síntese, considera medianas correlacionadas. Sendo assim, nestatese, busca-se construir testes robustos alternativos ao T2 de Hotelling tradicional e ao testeda razão de verossimilhanças, utilizando os estimadores comedian do vetor de médias e matrizde covariâncias. Estes testes foram gerados por meio de adaptações feitas tanto no teste T2quanto no teste LRT, sendo que alguns desses testes são assintóticos e outros são construídosatravés dos estimadores bootstrap paramétrico comedian para o vetor de médias e matriz decovariâncias. Os testes adaptados ao teste LRT possuem a vantagem de poderem ser utilizadospara dados de alta dimensão. O desempenho destes testes foi avaliado e comparado ao teste T2tradicional considerando distribuições normais contaminadas e distribuições não normais, utilizando de simulações Monte Carlo. Foram considerados o poder do teste e a taxa de erro tipo Icomo medidas avaliativas. Como resultado, verificou-se que o desempenho da versão bootstrapparamétrico com traço do teste da razão de verossimilhanças TLRPBT (Trace Likelihood Ratio Bootstrap Parametric test) teve melhor desempenho entre todos os testes considerados. Umoutro fato é que a versão assintótica do teste da razão de verossimilhanças com traço ATLRT(Asymptotic Trace Likelihood Ratio Test) não deve ser descartado entre todos os testes propostos, pois o mesmo resistiu controlado o erro tipo I e poder em situações extremas de assimetria.

Abstract

In a statistical analysis, the inferential process for the mean of a population includes the socalled hypothesis test. Considering the univariate case and dealing with a normally distributedpopulation, when the population variance is not known, the t-student distribution is used tomake the decision to reject or not the null hypothesis that the population average is equal to agiven constant . For the multivariate case, under the same conditions, the T2 test proposed byHarold Hotelling is used to test the hypotheses about a population mean vector. Another wayto perform these hypothesis tests is through the likelihood ratio test, called the LRT (likelihoodratio test). In the presence of outliers, both the T2 and LRT tests should not be used, as theirestimators, which are the vector of means and the sample covariance matrix, are influenced byoutliers. In the literature, there are many studies on the construction of estimators for the vectorof averages and for the covariance matrix that are robust to the presence of outliers, possessinga high breaking point and maintaining the affine-equivalence property. However, many of theseestimators are conditioned to the existence of the first two moments. A special case of theseestimators is the comedian robust estimator, which is not conditioned to the existence of the firsttwo moments and, in summary, considers correlated medians. Therefore, in this thesis, we seekto build robust tests alternative to the traditional Hotelling T2 and the likelihood ratio test, usingthe comedian estimators of the mean vector and covariance matrix. These tests were generatedthrough adaptations made both in the T2 test and in the LRT test, with some of these tests beingasymptotic and others being constructed using the comedic parametric bootstrap estimators forthe mean vector and covariance matrix. Tests adapted to the LRT test have the advantage thatthey can be used for high-dimensional data. The performance of these tests was evaluated andcompared to the traditional T2 test considering normal contaminated and non-normal distributions, using Monte Carlo simulations. The power of the test and the type I error rate wereconsidered as evaluative measures. As a result, it was found that the performance of the parametric boostrap version with trace of the TLRPBT likelihood ratio test (Trace Likelihood RatioBootstrap Parametric test) had better performance among all the considered tests. Another factis that the asymptotic version of the ATLRT trace likelihood ratio test (Asymptotic Trace Likelihood Ratio Test) should not be discarded among all the proposed tests, as the same resistedcontrolled type I error and power in extreme situations asymmetry.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

ALVES, H. J. de P. Proposição de teste de médias robustos e não robustos sob distribuições normais contaminadas e não normais. 2020. 112 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)–Universidade Federal de Lavras, Lavras, 2020.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por