Buscar

 

RI UFLA (Universidade Federal de Lavras) >
DCF - Departamento de Ciências Florestais >
DCF - Programa de Pós-graduação >
DCF - Engenharia Florestal - Mestrado (Dissertações) >

Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/9580

Title: Modelagem preditiva da distribuição potencial de espécies arbóreas na bacia hidrográfica do Rio Grande, MG
Other Titles: Predictive modelling of the tree species potential distribution in Rio Grande watershed
???metadata.dc.creator???: Carvalho, Mônica Canaan
???metadata.dc.contributor.advisor1???: Gomide, Lucas Rezende
???metadata.dc.contributor.referee1???: Dutra, Gleyce Campos
Oliveira, Luciano Teixeira de
???metadata.dc.description.concentration???: Manejo Florestal
Keywords: Fitogeografia
Random Forest
Árvore de decisão
Redes neurais artificiais
Maxent
Phytogeography
Decision tree
Artificial neural networks
???metadata.dc.date.submitted???: 20-Feb-2015
Issue Date: 15-May-2015
???metadata.dc.description.sponsorship???: Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Citation: CARVALHO, M. C. Modelagem preditiva da distribuição potencial de espécies arbóreas na bacia hidrográfica do rio Grande, MG. 2015. 87 p. Dissertação (Mestrado em Engenharia Florestal)-Universidade Federal de Lavras, Lavras, 2015.
???metadata.dc.description.resumo???: O presente estudo tem como objetivo principal comparar o desempenho de quatro algoritmos de aprendizagem de máquina (árvore de decisão, Random Forest, redes neurais artificiais e Maxent) na modelagem da distribuição de espécies arbóreas em Minas Gerais. Para este fim, utilizou-se os dados proveniente de 197 fragmentos inventariados em Minas Gerais e 25 variáveis relacionadas ao clima, topografia e solo. A capacidade preditiva dos algoritmos foi avaliada pela métrica Area Under the Curve (AUC), obtida através da validação cruzada (10%) e por um conjunto de dados de teste independente (30%). Os resultados obtidos pela validação cruzada foram testados pelo teste estatístico T-pareado, com 95% de confiança. Foram avaliados dois conjuntos de atributos abióticos na modelagem, sendo o primeiro formado por todas as 25 variáveis abióticas disponíveis e o segundo, pelas 10 variáveis com maior ganho de informação. As espécies com grande abundância e ampla distribuição selecionadas no estado de Minas Gerais são Casearia sylvestris, Copaifera langsdorffii, Croton floribundis e Tapirira guianensis. Para todas estas espécies, os algoritmos não apresentaram melhora significativa em seu desempenho quando modelados com os atributos pré-selecionados. De acordo com a validação cruzada, a maioria das espécies não apresentou diferença significativa entre a capacidade preditiva dos algoritmos árvore de decisão, Random Forest e redes neurais. Entretanto, o Random Forest demonstrou AUC numericamente superior na maioria dos casos. Já para a validação com o conjunto de teste, o Random Forest superou todos os algoritmos, inclusive o Maxent, para todas as espécies. A área predita pelo Random Forest foi menor do que a área predita pelo Maxent quando utilizado o limiar mínimo de adequabilidade ambiental presente no conjunto de treinamento; e menor quando a adequabilidade ambiental é reclassificada adotando o limiar 0,5. De acordo com as métricas de avaliação e os mapas obtidos para cada espécie, o Random Forest se mostrou um algoritmo com grande potencial para a modelagem da distribuição de espécies.
Abstract: The present study had the main objective of comparing the performance of four machine learning algorithms (Decision Tree, Random Forest, Artificial Neural Networks and Maxent) in modeling the distribution of tree species in the state of Minas Gerais, Brazil. To this end, we used data from 197 inventoried fragments in Minas Gerais and 25 variables related to climate, topography and soil. The predictive capacity of the algorithms was evaluated by measuring the Area Under the Curve (AUC) obtained by cross-validation (10%) and by a set of independent test data (30%). The results obtained by the cross-validation were tested by the T-matched statistical test, with 95% confidence. We evaluated two sets of abiotic attributes in the modeling, the first was formed by all 25 abiotic variables available and the second by 10 variables with the highest information gain. The species Casearia sylvestris, Copaifera langsdorffii, Croton floribundis and Tapirira guianensis were selected according to their high abundance and wide distribution in the state. For all these species, the algorithms showed no significant improvement in performance when modeled. According to the cross validation, most species showed no significant difference between the predictive capacity of the Decision tree, Random Forest and Artificial Neural Networks. However, Random Forest demonstrated numerically superior AUC in most cases. The Random Forest was the superior of all tested algorithms, including the Maxent, when the validation set was run. The area predicted by the Random Forest was smaller than that predicted by Maxent when using the minimum limit of environmental suitability present in the training set; and smaller when the environmental suitability is reclassified, adopting the limit of 0.5. According to the evaluation metrics and maps obtained for each species, the Random Forest algorithm showed great potential for modeling species distributions.
URI: http://repositorio.ufla.br/jspui/handle/1/9580
Publisher: UNIVERSIDADE FEDERAL DE LAVRAS
???metadata.dc.language???: pt_BR
Appears in Collections:DCF - Engenharia Florestal - Mestrado (Dissertações)

Files in This Item:

File Description SizeFormat
DISSERTACAO_Modelagem preditiva da distribuição potencial de espécies arbóreas na bacia hidrográfica do rio Grande, MG.pdf1.13 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.


View Statistics

 


DSpace Software Copyright © 2002-2010  Duraspace - Feedback