Comparação de desempenho entre máquina de vetor de suporte e comitê de redes neurais artificiais para classificação de spam

Silva, André Hermenegildo Costa; Lacerda, Wilian Soares; Silva, Bruno de Abreu

Comparação de desempenho entre máquina de vetor de suporte e comitê de redes neurais artificiais para classificação de spam

dc.creator	Silva, André Hermenegildo Costa
dc.creator	Lacerda, Wilian Soares
dc.creator	Silva, Bruno de Abreu
dc.date.accessioned	2018-08-24T19:58:24Z
dc.date.available	2018-08-24T19:58:24Z
dc.date.issued	2017
dc.description.abstract	The e-mail is one of the most popular communication tool. However, it is not uncommon to find undesired messages in our electronic mail boxes. These messages are known as spams. In a context where more and more messages are sent and received over the world, computational techniques to filter spams have increasingly importance. This paper aims to present two classifiers to filter e-mail messages, which is to identify whether a particular email is spam or not. It was used two machine learning techniques: Support Vector Machine (SVM) and Artificial Neural Network (ANN). For the ANN classifier, we used five different ANNs with Resilient Propagation (Rprop) learning algorithm (Backpropagation variation) and distinct architectures (layers) and settings (learning rate and number of iterations), forming a committee of networks. The two classifiers showed average rates of accuracy of 91.3% and 93.6% respectively. The SVM showed superior results compared to a single specific ANN (depending on architecture), but it was lower in the performance of a committee of ANNs. Furthermore, SVM is faster in training than the committee of ANN.	pt_BR
dc.description.provenance	Submitted by Eliana Bernardes (eliana@biblioteca.ufla.br) on 2018-08-09T17:10:39Z No. of bitstreams: 0	en
dc.description.provenance	Approved for entry into archive by Eliana Bernardes (eliana@biblioteca.ufla.br) on 2018-08-24T19:58:24Z (GMT) No. of bitstreams: 0	en
dc.description.provenance	Made available in DSpace on 2018-08-24T19:58:24Z (GMT). No. of bitstreams: 0 Previous issue date: 2017	en
dc.description.resumo	O e-mail é uma das mais populares formas de comunicação. Porém, não é raro encontrar mensagens indesejadas nas caixas de entrada do correio eletrônico. Estas mensagens são conhecidas como spams. Em um contexto onde uma quantidade cada vez maior de mensagens são enviadas e recebidas por todo mundo, técnicas para filtrar automaticamente estas mensagens consideradas como spams são de grande importância. O objetivo deste artigo é apresentar dois classificadores para filtrar mensagens de e-mail indesejadas, isto é, identificar se determinado e-mail é ou não é um spam. Foram utilizadas duas técnicas de aprendizado de máquina: Máquina de Vetor de Suporte (SVM, do inglês SupportVectorMachine) e Rede Neural Artificial (RNA). Para o segundo classificador, utilizou-se 5 (cinco) RNAs do tipo MultilayerPerceptron (MLP) com o algoritmo de aprendizagem ResilientPropagation - Rprop (variação do Backpropagation), com arquiteturas (camadas) e configurações (taxa de aprendizado e número de épocas) distintas, formando um comitê de redes. Os dois classificadores apresentaram taxas médias de acerto de 91,3\% e 93,6\%, respectivamente. Percebeu-se que a técnica de aprendizado SVM apresentou resultados superiores quando comparada a uma única RNA específica (dependendo da arquitetura), porém mostrou-se inferior quanto ao desempenho de um comitê de RNA. Além disso, SVM se mostrou mais rápida na realização do treinamento do que as RNAs.	pt_BR
dc.identifier.citation	SILVA, A. H. C.; LACERDA, W. S.; SILVA, B. de A. Comparação de desempenho entre máquina de vetor de suporte e comitê de redes neurais artificiais para classificação de spam. Revista Eletrônica de Iniciação Científica em Computação, Porto Alegre, v. 15, n. 1, 2017.	pt_BR
dc.identifier.uri	https://repositorio.ufla.br/handle/1/30185
dc.identifier.uri	http://seer.ufrgs.br/index.php/reic/article/view/80235	pt_BR
dc.language	pt_BR	pt_BR
dc.publisher	Sociedade Brasileira de Computação	pt_BR
dc.rights	restrictAccess	pt_BR
dc.source	Revista Eletrônica de Iniciação Científica em Computação	pt_BR
dc.subject	Spam	pt_BR
dc.subject	Redes neurais	pt_BR
dc.subject	Support vector machine (SVM)	pt_BR
dc.title	Comparação de desempenho entre máquina de vetor de suporte e comitê de redes neurais artificiais para classificação de spam	pt_BR
dc.type	Artigo	pt_BR

Arquivos

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 953 B
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

DCC - Artigos publicados em periódicos