dissertação
Proposição de dois testes, sendo um assintótico e outro bootstrap, para comparações entre dois vetores de médias independentes em alta dimensionalidade
Carregando...
Notas
Data
Autores
Orientadores
Editores
Coorientadores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Departamento
Departamento de Estatística
Programa de Pós-Graduação
Programa de Pós-graduação em Estatística e Experimentação Agropecuária
Agência de fomento
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Tipo de impacto
Áreas Temáticas da Extenção
Objetivos de Desenvolvimento Sustentável
Dados abertos
Resumo
A inferência relativa às comparações de vetores de médias entre duas populaçõesindependentes é de grande interesse nas áreas aplicadas, principalmente em cenários que asanálises de dados com alta dimensionalidade são comuns. Em casos de baixa dimensionalidade com problema de Behrens-Fisher multivariado, existem inúmeras soluções, mas a maioria das estatísticas dos testes possuem distribuição assintótica. Nos procedimentos multivariados existe um problema que surge quando o número de variáveis,p, é maior ou igual ao tamanho da amostra, n, neste caso, não é possível utilizar dos poucos métodos existentes, em razão deles dependerem da inversa da matriz de covariâncias amostral que, nesta situação (p≥n), não pode ser obtida, uma vez que a matriz de covariâncias é singular. Na maioria dos casos, os testes assintóticos são muito liberais, principalmente em pequenas amostras e, especificamente, no caso multivariado, quando a dimensionalidade é alta. O método bootstrap é um dos principais métodos computacionais intensivos, em que a principal vantagem é a não necessidade do conhecimento da distribuição de probabilidade populacional. Além disso, quando se viola as condições assumidas para a aplicação de um teste, com o bootstrap, o problema se torna extremamente simples de ser contornado. Com base nisso, o presente trabalho teve como objetivo propor testes de comparações multivariadas entre dois vetores de médias independentes, teste de Ahmad modificado (TAM) e sua versão bootstrap (TB), em alta dimensionalidade, para dados balanceados ou não, não-normais e normais sob o problema de Behrens-Fisher multivariado. O desempenho destes testes foi avaliado e comparado com o dos testes indicados pela literatura, sendo estes, T² de Hotelling, o teste modificado de Nel e Merwe (MNV) proposto por Krishnamoorthy e Yu e o teste proposto por Ahmad (TA), utilizando simulação Monte Carlo. Foram considerados o poder e a taxa de erro tipo I como medidas avaliativas. As comparações foram conduzidas em diversos cenários como, casos de homocedasticidade e heterocedasticidade das matrizes de covariâncias, em baixa e alta dimensionalidade para distribuições multivariadas normal, t com 7 graus de liberdade e uniforme (0,1), ou seja, cenários em que se violam as condições assumidas para aplicação da maioria dos testes. Os resultados mostraram que o teste TAM, em geral, foi robusto, superando seus concorrentes na maioria das situações avaliadas, já o teste usando o método bootstrap foi efetivo em situações de homogeneidade das matrizes de covariâncias e para o caso de heterocedasticidade, quando as matrizes são equicorrelacionadas.
Abstract
The inference related to comparisons of mean vectors between two independent populations is of
great interest in applied areas, mainly in scenarios where data analyzes with high dimensionality
are common. In low-dimensional cases with multivariate Behrens-Fisher problem, there are numerous
solutions, but most of the test statistics have an asymptotic distribution. In multivariate
procedures there is a problem that arises when the number of variables, p, is greater than or equal
to the sample size, n, in this case, it is not possible to use the few existing methods, because they
depend on the inverse of the sample covariance matrix which, in this situation (p ≥ n), cannot be
obtained, since the coveriance matrix is singular. In most cases, asymptotic tests are very liberal,
mainly in small samples and specifically in the multivariate case, when dimensionality is high.The
bootstrap method is one of the main computational intensive methods that, among its main advantages,
is in the no necessity of knowledge of the population probability distribution. Furthermore,
when the conditions assumed for the application of a test are violated, with bootstrap, the problem
becomes extremely simple to be circumvented. Based on this, the present work aimed to propose
tests of multivariate comparisons between two vectors of independent means, modified Ahmad test
(TAM) and its bootstrap version (TB), in high dimensionality, for balanced or unbalanced, nonnormal
and normal data under the multivariate Behrens-Fisher problem. The performance of these
tests was evaluated and compared with the tests indicated in the literature, being these, Hotelling’s
T2, the modified Nel and Merwe test (MNV) proposed by Krishnamoorthy and Yu and the test
proposed by Ahmad (TA), using Monte Carlo simulation. Power and type I error rate were considered
as evaluative measures. Comparisons were conducted in several scenarios, such as cases of
homoscedasticity and heteroscedasticity of covariance matrices, in low and high dimensionality for
multivariate distributions normal, t with 7 degrees of freedom and uniform (0, 1), that is, scenarios
in which the conditions assumed for the application of most tests are violated. The results showed
that the TAM test, in general, was robust, outperforming its competitors in most of the evaluated situations,
whereas the test using the bootstrap method was effective in situations of homogeneity of
the covariance matrices and in the case of heteroscedasticity, when the matrices are equicorrelated.
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
ISBN
DOI
Citação
NASCIMENTO, M. C. Proposição de dois testes, sendo um assintótico e outro bootstrap, para comparações entre dois vetores de médias independentes em alta dimensionalidade. 2023. 162 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)–Universidade Federal de Lavras, Lavras, 2023.
