dissertação
Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado
Carregando...
Notas
Data
Orientadores
Editores
Coorientadores
Membros de banca
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Escola de Engenharia (EENG)
Departamento
Departamento de Automática
Programa de Pós-Graduação
Programa de Pós-Graduação em Engenharia de Sistemas e Automação
Agência de fomento
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Tipo de impacto
Econômicos
Áreas Temáticas da Extenção
Tecnologia e produção
Trabalho
Trabalho
Objetivos de Desenvolvimento Sustentável
ODS 8: Trabalho decente e crescimento econômico
ODS 9: Indústria, inovação e infraestrutura
ODS 16: Paz, justiça e instituições eficazes
ODS 9: Indústria, inovação e infraestrutura
ODS 16: Paz, justiça e instituições eficazes
Dados abertos
Resumo
Este estudo investigou a aplicação de algoritmos de aprendizado de máquina para apoiar a detecção de fraudes e anomalias contábeis em uma empresa do setor logístico. A base de dados foi extraída do ERP (Enterprise Resource Planning), abrangendo registros de serviços vinculados à frota rodoviária adquiridos entre 2023 e 2025. Foram comparadas três estratégias de aprendizado semi-supervisionado, Active Learning, Pseudo-Labeling e Label Propagation, aplicadas a diferentes modelos, incluindo regressão logística, MLP, XGBoost e CatBoost. O protocolo experimental consistiu em executar cada combinação de modelo e estratégia por 10 repetições independentes, com amostragem estratificada e uso de um conjunto de teste fixo para aferição final. Os resultados indicaram que o Active Learning, em especial combinado ao CatBoost, alcançou o melhor desempenho, com F1 de 0,94 e PR-AUC de 0,98. Como segunda melhor estratégia, o CatBoost com Label Propagation obteve F1 de 0,80 e PR-AUC de 0,87. O PseudoLabeling, por sua vez, apresentou limitações em iterações posteriores devido à propagação de ruído. Em termos práticos, os achados demonstram o potencial de integração de técnicas semisupervisionadas aos processos de auditoria interna, promovendo maior eficiência na priorização de casos suspeitos, redução de custos operacionais e fortalecimento da governança corporativa.
Abstract
This study investigated the application of machine learning algorithms to support fraud and anomaly detection in accounting data from a logistics company. The dataset was extracted from the ERP (Enterprise Resource Planning) system, covering road fleet service records acquired between 2023 and 2025. Three semi-supervised learning strategies were compared, Active Learning, Pseudo-Labeling, and Label Propagation, applied to different models, including Logistic Regression, MLP, XGBoost, and CatBoost. The experimental protocol consisted of running each model-strategy combination over 10 independent repetitions, with stratified sampling and a fixed test set used exclusively for final evaluation. Results showed that Active Learning, particularly when combined with CatBoost, achieved the best performance, with an F1 score of 0.94 and PR-AUC of 0.98. As the second-best approach, CatBoost with Label Propagation reached an F1 score of 0.80 and PR-AUC of 0.87. In contrast, Pseudo-Labeling exhibited limitations in later iterations due to noise propagation from pseudo-labels. In practical terms, the findings demonstrate the potential of integrating semi-supervised learning techniques into internal auditing processes, enabling greater efficiency in prioritizing suspicious cases, reducing operational costs, and strengthening corporate governance.
Descrição
Área de concentração
Sistemas Inteligentes
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
Palavras-chave
ISBN
DOI
Citação
PEDROSO, Sérgio Herique de Carvalho. Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado. 2026. 59 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) - Universidade Federal de Lavras, Lavras, 2026.
Link externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil

