dissertação

Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Escola de Engenharia (EENG)

Departamento

Departamento de Automática

Programa de Pós-Graduação

Programa de Pós-Graduação em Engenharia de Sistemas e Automação

Agência de fomento

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Tipo de impacto

Econômicos

Áreas Temáticas da Extenção

Tecnologia e produção
Trabalho

Objetivos de Desenvolvimento Sustentável

ODS 8: Trabalho decente e crescimento econômico
ODS 9: Indústria, inovação e infraestrutura
ODS 16: Paz, justiça e instituições eficazes

Dados abertos

Resumo

Este estudo investigou a aplicação de algoritmos de aprendizado de máquina para apoiar a detecção de fraudes e anomalias contábeis em uma empresa do setor logístico. A base de dados foi extraída do ERP (Enterprise Resource Planning), abrangendo registros de serviços vinculados à frota rodoviária adquiridos entre 2023 e 2025. Foram comparadas três estratégias de aprendizado semi-supervisionado, Active Learning, Pseudo-Labeling e Label Propagation, aplicadas a diferentes modelos, incluindo regressão logística, MLP, XGBoost e CatBoost. O protocolo experimental consistiu em executar cada combinação de modelo e estratégia por 10 repetições independentes, com amostragem estratificada e uso de um conjunto de teste fixo para aferição final. Os resultados indicaram que o Active Learning, em especial combinado ao CatBoost, alcançou o melhor desempenho, com F1 de 0,94 e PR-AUC de 0,98. Como segunda melhor estratégia, o CatBoost com Label Propagation obteve F1 de 0,80 e PR-AUC de 0,87. O PseudoLabeling, por sua vez, apresentou limitações em iterações posteriores devido à propagação de ruído. Em termos práticos, os achados demonstram o potencial de integração de técnicas semisupervisionadas aos processos de auditoria interna, promovendo maior eficiência na priorização de casos suspeitos, redução de custos operacionais e fortalecimento da governança corporativa.

Abstract

This study investigated the application of machine learning algorithms to support fraud and anomaly detection in accounting data from a logistics company. The dataset was extracted from the ERP (Enterprise Resource Planning) system, covering road fleet service records acquired between 2023 and 2025. Three semi-supervised learning strategies were compared, Active Learning, Pseudo-Labeling, and Label Propagation, applied to different models, including Logistic Regression, MLP, XGBoost, and CatBoost. The experimental protocol consisted of running each model-strategy combination over 10 independent repetitions, with stratified sampling and a fixed test set used exclusively for final evaluation. Results showed that Active Learning, particularly when combined with CatBoost, achieved the best performance, with an F1 score of 0.94 and PR-AUC of 0.98. As the second-best approach, CatBoost with Label Propagation reached an F1 score of 0.80 and PR-AUC of 0.87. In contrast, Pseudo-Labeling exhibited limitations in later iterations due to noise propagation from pseudo-labels. In practical terms, the findings demonstrate the potential of integrating semi-supervised learning techniques into internal auditing processes, enabling greater efficiency in prioritizing suspicious cases, reducing operational costs, and strengthening corporate governance.

Descrição

Área de concentração

Sistemas Inteligentes

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

PEDROSO, Sérgio Herique de Carvalho. Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado. 2026. 59 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) - Universidade Federal de Lavras, Lavras, 2026.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil