Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies

A modelagem de florestas, seja de suas variáveis dendrométricas ou de sua distribuição geográfica, é uma prática consolidada na Engenharia Florestal, na qual tradicionalmente são empregados modelos da estatística clássica. Entretanto, o progresso obtido pela ciência da computação nas últimas décadas tem possibilitado novos desafios e soluções, os quais podem limitar a utilização dos modelos estatísticos tradicionais. É no contexto de relações não-lineares pouco conhecidas que os algoritmos de aprendizagem de máquina ganham sua utilidade no setor florestal. Dentre esses algoritmos, recebe destaque o random forest (RF), por sua robustez, facilidade de parametrização e métricas internas. Apesar do grande potencial deste algoritmo, o mesmo carece de mais estudos para consolidar o uso da técnica. Nessa tese, o algoritmo foi aplicado em três situações diferentes para florestas nativas, abordando problemas de classificação e regressão, além de dados heterogêneos oriúndos de diversas fontes. O primeiro artigo (1) teve como objetivo avaliar três métodos de aprendizagem de máquina (árvore de decisão - J48, RF e redes neurais artificias), na modelagem da distribuição potencial de dez espécies arbóreas mais abundantes em uma subbacia do rio São Francisco, em Minas Gerais. Conclui-se que o algoritmo RF apresentou-se como o mais robusto para a modelagem da distribuição potencial de espécies arbóreas. Diante destes resultados obtidos pelo algoritmo, no segundo artigo (2) procurou-se modelar a distribuição potencial de Eremanthus erythropappus, considerando cenários de mudanças climáticas. A hipótese testada está associada aos efeitos no nicho ecológico da espécie no futuro (2050 e 2070). Os resultados indicam uma boa acurácia do método empregado, destacando as cadeias montanhosas do Espinhaço, Canastra e Mantiqueira como os três principais refúgios ecológicos da espécie. Constatou-se, caso confirmado os cenários de mudanças no clima, uma redução drástica na área potencial de desenvolvimento da espécie, no que tange sua interação com o clima local. O último artigo (3) concentrou-se na aplicação do RF para problemas de regressão, envolvendo a predição da variável quantitativa teor de Carbono acima do solo. O objetivo foi testar a combinação de métodos e estratégias na seleção de variáveis, empregando o RF. Os resultados alcançados indicam o algoritmo RF como um método robusto, pouco afetado pela inclusão de um grande número de variáveis correlacionadas. Mesmo com a pequena melhora nos erros do algoritmo, o uso das técnicas de seleção de variáveis se justifica visto que diminui consideravelmente o número de variáveis utilizadas. O algoritmo genético multiobjetivo obteve menor conjunto de dados selecionados bem como menor erro. Perante os resultados encontrados, atribui-se ao RF grande potencial para explorar relações ainda pouco conhecidas na Engenharia Florestal, sejam estas relações problemas classificatórios ou de regressão.

Abstract

Forest modeling, whether for its dendrometric variables or geographical distribution, is a consolidated practice in Forest Engineering in which traditional statistical models are typically employed. However, the progress made by computer science in recent decades has made new challenges and solutions possible, which may limit the use of traditional statistical models. Machine learning algorithms gain their use in the forestry sector within the context of little-known non-linear relations derived from large databases. Among these algorithms, the random forest (RF) is prominent due to its robustness, ease of parameterization, and internal metrics. Despite its great potential, this algorithm demands further studies to consolidate its use. In this dissertation, we applied the algorithm in three different situations for native forests, addressing classification and regression issues, as well as heterogeneous data from different sources. The first article (1) aimed to evaluate three machine learning methods (decision tree - J48, RF, and artificial neural networks) for the potential distribution modeling of the ten most abundant tree species in a subbasin of the Sao Francisco River, in Minas Gerais, Brazil. In conclusion, the RF algorithm presented the most robust tree species potential distribution model. With the results obtained by the algorithm, we wrote the second article (2) seeking to model the potential distribution of Eremanthus erythropappus, considering climatic change scenarios. The hypothesis tested is associated with future effects (2050 and 2070) on the ecological niche of the species. The results indicate a good accuracy of the method used, highlighting the Espinhaço, Canastra, and Mantiqueira mountain ranges as the three primary ecological refuges of the species. We verified a drastic reduction in the potential area of species development regarding its interaction with the local climate if the climate changes scenarios be come real. The last article (3) focused on the application of RF on regression problems involving the prediction of the quantitative variable of carbon content above the soil. The objective was to test the combination of methods and strategies in the selection of variables using the random forest. The results obtained indicate that the RF algorithm is a robust method, little affected by the inclusion of many correlated variables. Even with the slight improvement in algorithm errors, the use of variable selection techniques is justified since it considerably reduces the number of variables used. The multi-objective genetic algorithm obtained a smaller set of selected data and lower error. Given the results found, the RF has great potential to explore relationships still little known in Forest Engineering, whether they are classification or regression issues.

Palavras-chave

Aprendizagem de máquina, Floresta aleatória, Floresta nativa, Machine learning, Random forest, Native forest

Citação

CARVALHO, M. C. Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies. 2019. 148 p. Tese (Doutorado em Engenharia Florestal)–Universidade Federal de Lavras, Lavras, 2019.

URI

https://repositorio.ufla.br/handle/1/34041

Coleções

Engenharia Florestal - Doutorado (Teses)

Página do item completo

Inteligência computacional na modelagem florestal: teor de carbono e distribuição geográfica de espécies

Arquivos

Notas

Data

Autores

Orientadores

Editores

Coorientadores

Membros de banca

Título da Revista

ISSN da Revista

Título de Volume

Editor

Faculdade, Instituto ou Escola

Departamento

Programa de Pós-Graduação

Agência de fomento

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Abstract

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

Palavras-chave

ISBN

DOI

Citação

Link externo

URI

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por