Buscar

 

RI UFLA (Universidade Federal de Lavras) >
DEX - Departamento de Ciências Exatas >
DEX - Programa de Pós-graduação >
DEX - Estatística e Experimentação Agropecuária - Mestrado (Dissertações) >

Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/3084

Title: Estimadores da probabilidade total de classificação incorreta na análise discriminante
Other Titles: Estimators of the overall misclassification probability in discriminant analysis.
???metadata.dc.creator???: Braga, Altemir da Silva
???metadata.dc.contributor.advisor1???: Ferreira, Daniel Furtado
???metadata.dc.contributor.referee1???: Bueno Filho, Júlio Sílvio de Sousa
Ferreira, Eric Batista
Cirillo, Marcelo Ângelo
???metadata.dc.description.concentration???: Estatística e Experimentação Agropecuária
Keywords: Multivariada
Método
Classificar
Simulação
Jackknife
Multivariate
Methods
???metadata.dc.date.submitted???: 30-Oct-2008
Issue Date: 21-Aug-2014
Citation: BRAGA, A. S. Estimadores da probabilidade total de classificação incorreta na análise discriminante. 2008. 65 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2008.
???metadata.dc.description.resumo???: A análise discriminante faz parte de um conjunto de técnicas de estatística multivariada e o seu princípio básico consiste em classificar novos indivíduos com várias características em uma de diferentes populações definidas a priori. Assim, diversos estimadores da probabilidade total de classificação incorreta paramétrica (PTCI) foram propostos utilizando algum método de amostragem e avaliados por meio de simulação Monte Carlo. Neste trabalho, foram comparados os desempenhos dos estimadores PTCI1, PTCI2, PTCI3, PTCI4, PTCI5 e PTCI6 para duas populações normais multivariadas homocedásticas, considerando-se os custos para cada classificação incorreta e probabilidade a priori iguais. O primeiro estimador é o de Lachenbruch & Mickey (1968) que é baseado na metodologia jackknife, o segundo foi derivado utilizando desvio padrão comum no estimador de Lachenbruch & Mickey (1968). O terceiro e o quarto estimadores são parte da proposta do presente trabalho, em que modificou-se método de Lachenbruch & Mickey (1968), combinando a função linear de Fisher com a metodologia jackknife. O quinto e o sexto estimadores foram derivados utilizando o mesmo raciocínio anterior, porém, fixando-se o vetor de combinações lineares das variàveis e aplicando-se o jackknife para a constante da função linear de Fisher. Os desempenhos foram avaliados por meio dos vieses e dos erros quadráticos médios estimados. Dessa forma, o vetor de médias da população foi fixado em 0 ( = 0) e o vetor de médias da população foi simulado em função da distância de Mahalanobis ( ). A busca de aproximada para estabelecer o valor, fixado , foi realizada por tentativa e erro. Os tamanhos amostrais da população foram e os da população foram combinados fatorialmente com p = 2, 10 variáveis e coeficiente de correlação = 0, = 0,5 e = 0,9. Os estimadores PTCI5 e PTCI6 subestimaram a PTCI, enquanto que os estimadores PTCI1, PTCI2, PTCI3 e PTCI4 superestimaram. Os estimadores PTCI3, PTCI4, PTCI5 e PTCI6 foram mais eficientes do que o estimador PTCI1, original de Lachenbruch & Mickey (1968). O estimador PTCI3, que considerou desvios padrões heterogêneos foi determinado ótimo, porque apresentou menor viés positivo.
Discriminant analysis is one of the multivariate statistics techniques, which idea consists in classifying new individuals in one of several populations known a priori. Thus, several estimators for the parametric overall of misclassification probability (PTCI) were proposed, using sampling methods and assessed through Monte Carlo simulation. In the present work, the performance of PTCI1, PTCI2, PTCI3, PTCI4, PTCI5 and PTCI6 methods was compared for two homoscedastic multivariate normal populations, considering the same costs of misclassification and a priori probabilities. The first one is Lachenbruch & Mickey's method (1968), based on Jackknife methods, the second one was derived from Lachenbruch & Mickey's method (1968), using common variance into the function which estimates PTCI. Third and fourth methods were proposed in the present work, in which Lachenbruch & Mickey's method (1968) was been modified, associating Fisher's linear function with Jackknife methodology. Fifth and sixth methods were derived using the same previous reasoning, setting the linear combination vector of the variates and applying the Jackknife for the constant of the Fisher's linear combination. The performance was assessed through bias and quadratic mean square estimator. Thus, the mean vector from population was set to 0 ( = 0) . The approximate search of from population , for a settled value of the Mahalanobis distance ( ), was accomplished by trial and error. For population , the sampling sizes were and for , that were factorially combined with p = 2, 10 variates and correlation coefficient = 0, = 0.5 and = 0.9. The estimators PTCI5 and PTCI6 underestimated PTCI, whereas PTCI1, PTCI2, PTCI3 e PTCI4 superestimated it. The PTCI3, PTCI4, PTCI5 and PTCI6 estimators were more efficient than PTCI1 one, originally from Lachenbruch & Mickey's method (1968). The PTCI3 estimator with heterogeneous variances was considered optimum, due to the smallest positive bias.
URI: http://repositorio.ufla.br/jspui/handle/1/3084
Publisher: UNIVERSIDADE FEDERAL DE LAVRAS
???metadata.dc.language???: pt_BR
Appears in Collections:DEX - Estatística e Experimentação Agropecuária - Mestrado (Dissertações)

Files in This Item:

File Description SizeFormat
DISSERTAÇÃO_Estimadores da probabilidade total de classificação incorreta na análise discriminante.pdf6.25 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.


View Statistics

 


DSpace Software Copyright © 2002-2010  Duraspace - Feedback