spANOVA: biblioteca para análise de variância de experimentos com dependência espacial em ambiente R
Carregando...
Notas
Data
Autores
Orientadores
Editores
Coorientadores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Departamento
Departamento de Estatística
Programa de Pós-Graduação
Programa de Pós-graduação em Estatística e Experimentação Agropecuária
Agência de fomento
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPQ)
Tipo de impacto
Áreas Temáticas da Extenção
Objetivos de Desenvolvimento Sustentável
Dados abertos
Resumo
Os procedimentos de inferência empregados na análise de variância (ANOVA) necessitam de algumas suposições acerca do erro experimental para que seus resultados sejam válidos, nomeadamente: normalidade, homoscedasticidade e independência. Um dos problemas mais frequentes ocorre quando a independência dos erros não é satisfeita, nem mesmo quando a casualização é realizada. Um dos motivos que conduzem à ocorrência desse fenômeno deve-se ao fato de que em muitos experimentos, sobretudo da área agrícola, há uma forte dependência espacial gerada pela localização da unidade experimental, que não é reduzida com a casualização ou com o controle local. Nesse contexto, foram desenvolvidos trabalhos no com o objetivo de modelar essa dependência e incluí-la na análise para obtenção de resultados mais fidedignos. Algumas abordagens compreendem a modelagem da dependência espacial diretamente a partir da matriz de covariância dos erros, como é o caso da abordagem geoestatística, enquanto outras utilizam transformações na variável resposta com o objetivo de neutralizar o efeito da correlação gerada pelo espaço, como é o caso da análise de variância via modelos autorregressivos espaciais (SAR). Embora essas teorias já estejam desenvolvidas e prontas para serem utilizadas, a ausência de softwares ou bibliotecas que realizem tais procedimentos torna-se um empecilho em sua utilização prática, fazendo com que muitos pesquisadores possam tomar uma interpretação equivocada de seus resultados ao optarem pela utilização de modelos que não consideram a informação espacial. Com isso, o objetivo deste trabalho consistiu em desenvolver uma biblioteca para ser utilizada em ambiente de programação, bem como um ambiente gráfico interativo, a fim de possibilitar a inclusão da dependência espacial na análise de variância de forma simples e intuitiva, utilizando tanto a abordagem geoestatística quanto a abordagem via modelos autorregressivos espaciais, viabilizando assim a obtenção de resultados mais precisos. Para isso, foram empregados softwares de código aberto. Especificamente, o R foi utilizado na construção de uma biblioteca baseada nessa linguagem de programação, uma vez que grande parte da comunidade científica que faz uso de métodos estatísticos está familiarizada com sua sintaxe. A construção do ambiente gráfico interativo também foi realizada no R por meio da biblioteca shiny. Para ilustrar o funcionamento do produto final obtido com a realização deste trabalho, foi analisado um experimento com plantio de candeia (Eremanthus erythropappus) realizado na região de Baependi – MG, cujo interesse foi verificar o efeito de 13 tipos de tratamentos de adubação na altura das árvores. Os resultados apontaram diferenças significativas entre os 13 tratamentos, os quais posteriormente foram submetidos a procedimentos de comparações múltiplas revelando que o tratamento adubo formulado NPK 8-28-16 forneceu os melhores resultados.
Abstract
The inference procedures used in the analysis of variance (ANOVA) need some assump-
tions about the experimental error so that its results are valid, namely: normality, ho-
moscedasticity, and independence. One of the most frequent problems occurs when the
independence of the errors is not satisfied, not even when the casualization is performed.
One of the reasons that lead to the occurrence of this phenomenon is that in many expe-
riments, especially in the agricultural area, there is a strong spatial dependence generated
by the location of the experimental unit, which is not reduced by randomization or local
control. In this context, work has been developed to model this dependency and include
it in the analysis to obtain more reliable results. Some approaches include the modeling
of spatial dependence directly from the error covariance matrix, as is the case with the
geostatistical approach, while others use transformations in the response variable in order
to neutralize the spatial correlation effect, as is the case of analysis of variance via spatial
autoregressive models (SAR). Although these theories are already developed and ready
to be used, the absence of software or libraries that perform such procedures becomes
a drawback in their practical use, causing many researchers to misinterpret their results
by opting to use models that do not consider spatial information. Thus, the objective of
this work was to develop a library to be used in a programming environment, as well as
an interactive graphical interface, in order to allow the inclusion of space dependence in
the analysis of variance in a simple and intuitive way, using both the approach geostatis-
tics approach using spatial autoregressive models, thus making it possible to obtain more
precise results. For this, open source software was used. Specifically, R was used in the
construction of a library based on this programming language, since much of the scientific
community that makes use of statistical methods is familiar with its syntax. The cons-
truction of the interactive graphical user interface was also performed in the R through
the textit shiny library. In order to illustrate the functioning of the final product obtained
by this work, an experiment was carried out with candeia (Eremanthus erythropappus)
carried out in the Baependi - MG region, whose interest was to verify the effect of 13
types of fertilization treatments at the height of the trees. The results showed significant
differences among the 13 treatments, which were later submitted to multiple comparison
procedures revealing that the formulated NPK 8-28-16 fertilizer treatment provided the
best results.
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
Palavras-chave
Análise de variância, Geoestatística, Modelo autorregressivo espacial, Modelo SAR, Ambiente computacional, Linguagem de programação, Shiny, Pacote computacional, Analysis of variance, Geostatistics, Spatial autoregressive model (SAR), SAR model, Computational environment, Programming language, Computational package
ISBN
DOI
Citação
CASTRO, L. R. de. spANOVA: biblioteca para análise de variância de experimentos com dependência espacial em ambiente R. 2019. 114 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)–Universidade Federal de Lavras, Lavras, 2019.
