Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado

dc.contributor.advisorLacerda, Wilian Soares Lacerda
dc.contributor.refereeBarbosa, Bruno Henrique Groenner
dc.contributor.refereeRodrigues, Thiago de Souza
dc.creatorPedroso, Sérgio Herique de Carvalho
dc.creator.Latteshttp://lattes.cnpq.br/6388908053661315
dc.creator.orcidhttps://orcid.org/0009-0008-7233-9616
dc.date.accessioned2026-01-30T20:52:10Z
dc.date.issued2025-09-29
dc.description.abstractThis study investigated the application of machine learning algorithms to support fraud and anomaly detection in accounting data from a logistics company. The dataset was extracted from the ERP (Enterprise Resource Planning) system, covering road fleet service records acquired between 2023 and 2025. Three semi-supervised learning strategies were compared, Active Learning, Pseudo-Labeling, and Label Propagation, applied to different models, including Logistic Regression, MLP, XGBoost, and CatBoost. The experimental protocol consisted of running each model-strategy combination over 10 independent repetitions, with stratified sampling and a fixed test set used exclusively for final evaluation. Results showed that Active Learning, particularly when combined with CatBoost, achieved the best performance, with an F1 score of 0.94 and PR-AUC of 0.98. As the second-best approach, CatBoost with Label Propagation reached an F1 score of 0.80 and PR-AUC of 0.87. In contrast, Pseudo-Labeling exhibited limitations in later iterations due to noise propagation from pseudo-labels. In practical terms, the findings demonstrate the potential of integrating semi-supervised learning techniques into internal auditing processes, enabling greater efficiency in prioritizing suspicious cases, reducing operational costs, and strengthening corporate governance.
dc.description.areastematicasdaextensaoTecnologia e produção
dc.description.areastematicasdaextensaoTrabalho
dc.description.concentrationSistemas Inteligentes
dc.description.odsODS 8: Trabalho decente e crescimento econômico
dc.description.odsODS 9: Indústria, inovação e infraestrutura
dc.description.odsODS 16: Paz, justiça e instituições eficazes
dc.description.resumoEste estudo investigou a aplicação de algoritmos de aprendizado de máquina para apoiar a detecção de fraudes e anomalias contábeis em uma empresa do setor logístico. A base de dados foi extraída do ERP (Enterprise Resource Planning), abrangendo registros de serviços vinculados à frota rodoviária adquiridos entre 2023 e 2025. Foram comparadas três estratégias de aprendizado semi-supervisionado, Active Learning, Pseudo-Labeling e Label Propagation, aplicadas a diferentes modelos, incluindo regressão logística, MLP, XGBoost e CatBoost. O protocolo experimental consistiu em executar cada combinação de modelo e estratégia por 10 repetições independentes, com amostragem estratificada e uso de um conjunto de teste fixo para aferição final. Os resultados indicaram que o Active Learning, em especial combinado ao CatBoost, alcançou o melhor desempenho, com F1 de 0,94 e PR-AUC de 0,98. Como segunda melhor estratégia, o CatBoost com Label Propagation obteve F1 de 0,80 e PR-AUC de 0,87. O PseudoLabeling, por sua vez, apresentou limitações em iterações posteriores devido à propagação de ruído. Em termos práticos, os achados demonstram o potencial de integração de técnicas semisupervisionadas aos processos de auditoria interna, promovendo maior eficiência na priorização de casos suspeitos, redução de custos operacionais e fortalecimento da governança corporativa.
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
dc.description.tipodeimpactoEconômicos
dc.identifier.citationPEDROSO, Sérgio Herique de Carvalho. Detecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado. 2026. 59 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) - Universidade Federal de Lavras, Lavras, 2026.
dc.identifier.urihttps://repositorio.ufla.br/handle/1/60574
dc.language.isopt_BR
dc.publisherUniversidade Federal de Lavras
dc.publisher.collegeEscola de Engenharia (EENG)
dc.publisher.countrybrasil
dc.publisher.departmentDepartamento de Automática
dc.publisher.initialsUFLA
dc.publisher.programPrograma de Pós-Graduação em Engenharia de Sistemas e Automação
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectAprendizado de máquina
dc.subjectFraudes
dc.subjectAlgoritmos
dc.subjectMachine learning
dc.subjectAuditing
dc.subjectFraud
dc.subjectAuditoria interna
dc.subject.cnpqCiências Exatas e da Terra
dc.titleDetecção de fraudes em auditoria interna por meio de algoritmos de aprendizado semi-supervisionado
dc.title.alternativeFraud detection in internal auditing through semi-supervised learning algorithms
dc.typedissertação

Arquivos

Pacote original

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
Texto completo
Tamanho:
2.73 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Nome:
Impactos da pesquisa
Tamanho:
195.59 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
955 B
Formato:
Item-specific license agreed upon to submission
Descrição: