dissertação
Comparando formas de análise para dados censurados por razões práticas em programas de melhoramento vegetal
Carregando...
Notas
Data
Autores
Orientadores
Editores
Coorientadores
Membros de banca
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Departamento
Departamento de Estatística
Programa de Pós-Graduação
Programa de Pós-graduação em Estatística e Experimentação Agropecuária
Agência de fomento
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Tipo de impacto
Áreas Temáticas da Extenção
Objetivos de Desenvolvimento Sustentável
Dados abertos
Resumo
Experimentos de diversas áreas estão sujeitos à ocorrência de dados censurados por razões práticas,
tais como limiares de detecção dados por aparelhos além dos quais não se registram valores. Nestes
casos, pode-se supor que há uma variável aleatória latente contínua que contém estes limiares.
Isto permite investigar as consequências da truncagem informada de dados para ajustar as distribuições
associadas às populações experimentais. Este trabalho foi inspirado em um experimento
de melhoramento genético de batata-doce e tem como objetivo desenvolver um método de análise
para dados com censura à esquerda implementando um algoritmo para a sua previsão condicional
usando a amostragem Gibbs e verificar suas propriedades em comparação a métodos usuais de
análise de ensaios deste tipo em um exemplo simulado com propriedades semelhantes. Para tanto,
simulamos um experimento em blocos incompletos parcialmente balanceados (PBIB) organizados
em látice quadrado (v = k2, r = 3, k = 11,b = 33,l1 = 1 e l2 = 0). Foram realizadas as seguintes
análises: a análise sem censura dos dados completos "DC", as análises usuais Censura Zero ("C0",
considerando zero para as censuras) e de Censura à esquerda ("CE", considerando observações
perdidas na censura) e a análise proposta de Previsão Condicional ("PC", com imputação condicional
dos dados censurados). As três formas de análise que lidam com censuras foram comparadas
às referências em dois cenários: 1) taxa de censura moderada (∼ 30%) e 2) taxa de censura alta
(∼ 50%). Foram verificadas a acurácia, a precisão e o viés na estimação dos parâmetros genéticos
(componentes de variância e herdabilidades). Foram também calculadas as correlações entre
os valores originalmente simulados com as observações que foram censuradas. Por fim, em cada
análise, foram calculadas as correlações de Pearson e Spearman entre os valores genéticos preditos
e respectivos valores paramétricos. Em ambos os cenários a análise "PC" foi precisa para fins de
seleção, apresentando correlações entre os efeitos de tratamentos e valores paramétricos próximas
da análise sem censura. Além disso, pelo método proposto, os valores simulados são frequentes
nas respectivas distribuição marginais a posteriori. As formas usuais de análise ("C0" e "CE") têm
correlação nula entre os valores tomados como zero e os valores paramétricos. A análise "CE"
foi ruim em ambos os cenários quanto a estimação de parâmetros genéticos (especialmente variâncias
e herdabilidades) e por apresentar baixa correlação, mas para seleção dos genótipos de elite
foi melhor que a análise "C0" no cenário 2). Para o cenário 1), menor taxa de censura, a análise
"C0" parece ser uma alternativa interessante, mas com uma piora considerável com o aumento
da censura. Embora a análise "PC" tenha produzido declarações mais difíceis de interpretar por
superestimar as herdabilidades, foi a análise mais indicada para se tomar decisões sobre seleção.
Abstract
Experiments in several areas are subject to occurrences of censored data for practical
reasons, such as detection thresholds given by devices beyond which no values
recorded. In these cases one can assume that a continuous latent random variable
contains these thresholds. Thus allows for investigating the consequences informed
truncation of data to fit distributions associated with experimental populations.
Present work, inspired by a sweet potato genetic improvement experiment, aims to
develop an analysis method for data with left censoring by implementing an algorithm
for its conditional prediction using Gibbs sampling and verifying its properties. We
compared the analysis on a simulated example with similar properties. Simulated
experiment was an incomplete block design partially balanced (PBIB) (square lattice
with v = k 2 ,r = 3, k = 11,b = 33,λ1 = 1 e λ2 = 0). The methods carried out were: the
uncensored analysis of the complete "DC"data, the usual Zero Censorship ("C0"
considering zero for the censorships) and Left Censorship ("CE" considering missing
observations in the censorship) and the proposed analysis of Conditional Prediction
("PC" with conditional imputation of censored data). Competing analysis with censored
data were compared to references in two scenarios: 1) moderate or high censoring (∼
30% ∼ 50%). We evaluated selective accuracy, precision and bias in the estimates of
genetic parameters (variance components and heritabilities). We also obtained
correlations of simulated and predicted the censored observations . Finally, in each
analysis, the Pearson and Spearman correlations between predicted genetic values and
respective parametic values were calculad. "PC" analysis was sensible and accurate for
selection purposes, showing correlations between treatment effects and parametric
values close to the uncensored case. The proposed method has the simulated values
very likely in the respective marginal a posteriori distributions. The usual forms of
analysis ("C0" and "CE") have zero correlation between the values taken as zero and
the parametric values. The "CE" analysis was bad in both scenarios regarding the
estimation of genetic parameters (especially variances and heritabilities) and for
presenting low correlation, but for the selection of the elite genotypes it was better
than the "C0" analysis in the scenario two). For scenario 1) the "C0" analysis seems to
be an promising alternative, but has shown a considerable worsening with increasing
censorship. Although the "PC" analysis produced statements that were more difficult
to interpret because it overestimated heritabilities, it was the most indicated to make
selection decisions.
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
ISBN
DOI
Citação
ROSA, L. F. Comparando formas de análise para dados censurados por razões práticas em programas de melhoramento vegetal. 2023. 101 p. Dissertação (Mestrado em Estatística e
Experimentação Agropecuária)–Universidade Federal de Lavras, Lavras, 2023.
