Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado
| dc.contributor.advisor | Lacerda, Wilian Soares Lacerda | |
| dc.contributor.referee | Barbosa, Bruno Henrique Groenner | |
| dc.contributor.referee | Rodrigues, Thiago de Souza | |
| dc.creator | Pedroso, Sérgio Herique de Carvalho | |
| dc.creator.Lattes | http://lattes.cnpq.br/6388908053661315 | |
| dc.creator.orcid | https://orcid.org/0009-0008-7233-9616 | |
| dc.date.accessioned | 2026-01-30T20:52:10Z | |
| dc.date.issued | 2025-09-29 | |
| dc.description.abstract | This study investigated the application of machine learning algorithms to support fraud and anomaly detection in accounting data from a logistics company. The dataset was extracted from the ERP (Enterprise Resource Planning) system, covering road fleet service records acquired between 2023 and 2025. Three semi-supervised learning strategies were compared, Active Learning, Pseudo-Labeling, and Label Propagation, applied to different models, including Logistic Regression, MLP, XGBoost, and CatBoost. The experimental protocol consisted of running each model-strategy combination over 10 independent repetitions, with stratified sampling and a fixed test set used exclusively for final evaluation. Results showed that Active Learning, particularly when combined with CatBoost, achieved the best performance, with an F1 score of 0.94 and PR-AUC of 0.98. As the second-best approach, CatBoost with Label Propagation reached an F1 score of 0.80 and PR-AUC of 0.87. In contrast, Pseudo-Labeling exhibited limitations in later iterations due to noise propagation from pseudo-labels. In practical terms, the findings demonstrate the potential of integrating semi-supervised learning techniques into internal auditing processes, enabling greater efficiency in prioritizing suspicious cases, reducing operational costs, and strengthening corporate governance. | |
| dc.description.areastematicasdaextensao | Tecnologia e produção | |
| dc.description.areastematicasdaextensao | Trabalho | |
| dc.description.concentration | Sistemas Inteligentes | |
| dc.description.ods | ODS 8: Trabalho decente e crescimento econômico | |
| dc.description.ods | ODS 9: Indústria, inovação e infraestrutura | |
| dc.description.ods | ODS 16: Paz, justiça e instituições eficazes | |
| dc.description.resumo | Este estudo investigou a aplicação de algoritmos de aprendizado de máquina para apoiar a detecção de fraudes e anomalias contábeis em uma empresa do setor logístico. A base de dados foi extraída do ERP (Enterprise Resource Planning), abrangendo registros de serviços vinculados à frota rodoviária adquiridos entre 2023 e 2025. Foram comparadas três estratégias de aprendizado semi-supervisionado, Active Learning, Pseudo-Labeling e Label Propagation, aplicadas a diferentes modelos, incluindo regressão logística, MLP, XGBoost e CatBoost. O protocolo experimental consistiu em executar cada combinação de modelo e estratégia por 10 repetições independentes, com amostragem estratificada e uso de um conjunto de teste fixo para aferição final. Os resultados indicaram que o Active Learning, em especial combinado ao CatBoost, alcançou o melhor desempenho, com F1 de 0,94 e PR-AUC de 0,98. Como segunda melhor estratégia, o CatBoost com Label Propagation obteve F1 de 0,80 e PR-AUC de 0,87. O PseudoLabeling, por sua vez, apresentou limitações em iterações posteriores devido à propagação de ruído. Em termos práticos, os achados demonstram o potencial de integração de técnicas semisupervisionadas aos processos de auditoria interna, promovendo maior eficiência na priorização de casos suspeitos, redução de custos operacionais e fortalecimento da governança corporativa. | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | |
| dc.description.tipodeimpacto | Econômicos | |
| dc.identifier.citation | PEDROSO, Sérgio Herique de Carvalho. Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado. 2026. 59 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) - Universidade Federal de Lavras, Lavras, 2026. | |
| dc.identifier.uri | https://repositorio.ufla.br/handle/1/60574 | |
| dc.language.iso | pt_BR | |
| dc.publisher | Universidade Federal de Lavras | |
| dc.publisher.college | Escola de Engenharia (EENG) | |
| dc.publisher.country | brasil | |
| dc.publisher.department | Departamento de Automática | |
| dc.publisher.initials | UFLA | |
| dc.publisher.program | Programa de Pós-Graduação em Engenharia de Sistemas e Automação | |
| dc.rights | Attribution 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
| dc.subject | Aprendizado de máquina | |
| dc.subject | Fraudes | |
| dc.subject | Algoritmos | |
| dc.subject | Machine learning | |
| dc.subject | Auditing | |
| dc.subject | Fraud | |
| dc.subject | Auditoria interna | |
| dc.subject.cnpq | Ciências Exatas e da Terra | |
| dc.title | Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado | |
| dc.title.alternative | Fraud detection in internal auditing through semi-supervised learning algorithms | |
| dc.type | dissertação |
Arquivos
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 955 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
