Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/49959
Registro completo de metadados
Campo DCValorIdioma
dc.creatorSilva, Fernanda Costa e-
dc.date.accessioned2022-05-18T20:09:30Z-
dc.date.available2022-05-18T20:09:30Z-
dc.date.issued2022-05-18-
dc.date.submitted2022-04-14-
dc.identifier.citationSILVA, F. C. e. Processamento de linguagem natural no segmento de e-commerce: uma aplicação few shot learning com redes neurais siamesas. 2022. 112 p. Dissertação (Mestrado em Engenharia de Sistemas e Automação) - Universidade Federal de Lavras, Lavras, 2022.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/49959-
dc.description.abstractThe number of companies making their products available for purchase online has increased, causing new offers to appear all the time. However, there is no pattern between the description of products provided by sellers, which can lead to a product being placed in a different cate- gory from the one to which it belongs and generating a poor shopping experience. E-commerce companies can use the large volume of data generated in the various transactions carried out on the Internet to build user profiles and make personalized product recommendations. Therefore, solutions applying natural language processing have the potential to solve problems related to E-commerce and also to optimize a good part of the processes. The issue addressed in this project is the study and improvement of artificial intelligence systems for E-commerce. Uns- tructured data classification techniques were analyzed and developed, considering the problem faced in online commerce platforms, since new registered products can be misclassified, while their classes are still unrepresentative in the database. This is a situation where one/few-shot learning algorithms can be applied, in which a classifier must learn information relevant to the classification of samples using one or a few samples of a class during its training. The amount of efficient tools to deal with such a situation is limited, as conventional classification methods cannot learn and establish meaningful relationships from a few training data. In this work, it is proposed to use a classifier with Siamese neural networks to classify new classes in an E- commerce problem. Different topologies were tested for the internal network of the Siamese network, as well as different approaches for choosing the representative sample used as a re- ference for each class, being proposed the random choice, with centroid and with ensemble of representatives. The proposed classifier with representative choice made with the centroid calculation obtained 98% accuracy when dealing with a problem of 6 classes and less than 400 samples. For a larger database, with approximately 4000 samples and 452 classes, the model with a three-layer internal network structure using the DropOut technique in one of the layers and the representative being the calculated centroid the Siamese network obtained the best re- sult among the tested options, with 90.31% of correct answers, against 83.62% of the random representative sample and 81.81% using the K-Nearest Neighbors (KNN) algorithm. as future works, strategies can be studied to improve the performance of the model, such as the formation of training pairs that maximize the differences between classes, instead of randomly combining samples. Different feature extractors for data from online sales platforms can also be developed, since an extractor that delivers features with a smaller dimension contributes to the reduction of the classifier’s complexity, which can result in savings in server usage.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.rightsacesso abertopt_BR
dc.subjectMineração de dadospt_BR
dc.subjectOne shot learningpt_BR
dc.subjectRedes neurais siamesaspt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectE-commercept_BR
dc.subjectData miningpt_BR
dc.subjectSiamese neural networkspt_BR
dc.subjectNatural language processingpt_BR
dc.subjectMachine learningpt_BR
dc.subjectExtração de característicaspt_BR
dc.subjectFeature extractionpt_BR
dc.titleProcessamento de linguagem natural no segmento de e-commerce: uma aplicação few shot learning com redes neurais siamesaspt_BR
dc.typedissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Engenharia de Sistemas e Automaçãopt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countrybrasilpt_BR
dc.contributor.advisor1Ferreira, Danton Diego-
dc.contributor.advisor-co1Barbosa, Bruno Henrique Groenner-
dc.contributor.referee1Ferreira, Danton Diego-
dc.contributor.referee2Vitor, Giovani Bernardes-
dc.contributor.referee3Huallpa, Belisario Nina-
dc.description.resumoO número de empresas que disponibilizam seus produtos para compra online tem aumentado, fazendo com que novas ofertas apareçam a todo momento. Entretanto, não há um padrão entre a descrição dos produtos fornecida pelos vendedores, o que pode levar um produto a ser colocado em uma categoria diferente daquela a que ele pertence e gerar uma experiência de compra ruim. As empresas que trabalham com comércio eletrônico podem utilizar o grande volume de dados gerados nas diversas transações realizadas na internet para construir perfis de usuário e fazer recomendações de produtos personalizadas. Assim sendo, soluções aplicando o processamento de linguagem natural têm o potencial de resolver problemas relacionados ao E-commerce e, também, otimizar boa parte dos processos. A linha de pesquisa abordada é de estudo e aprimo- ramento de sistemas de inteligência artificial para E-commerce. Foram analisadas e desenvol- vidas técnicas de classificação de dados não estruturados, considerando o problema enfrentado em plataformas de comércio online, já que novos produtos cadastrados podem ser classificados erroneamente enquanto suas classes ainda forem pouco representativas na base de dados. Essa é uma situação em que pode ser aplicada algoritmos de aprendizado one/few-shot learning, no qual um classificador deve aprender informações relevantes à classificação das amostras uti- lizando uma ou algumas amostras de uma classe durante seu treinamento. A quantidade de ferramentas eficientes para lidar com tal situação é limitada, pois os métodos de classificação convencionais não conseguem aprender e estabelecer relações significativas a partir de poucos dados de treinamento. Neste trabalho é proposto o uso de um classificador com redes neurais si- amesas para classificar classes novas num problema de E-commerce. Foram testadas diferentes topologias para a rede interna da rede siamesa, assim como diferentes abordagens para a escolha do representante usado como referência pela rede, sendo proposta a escolha aleatória, com cen- troide e com ensemble de representantes. O classificador proposto com escolha de representante feita com centroide obteve 98% de acurácia ao lidar com um problema de 6 classes e menos de 400 amostras. Para uma base de dados de aproximadamente 4000 amostras e 452 classes o modelo de rede siamesa com estrutura da rede interna de três camadas utilizando a técnica de DropOut em uma das camadas e o representante sendo o centroide obteve melhor resultado dentre as opções testadas, tendo 90,31% de acerto, contra 83,62% do modelo de rede siamesa com representante aleatório e 81,81% do K-Nearest Neighbors (KNN). Como trabalhos futuros podem ser estudadas estratégias para melhorar o desempenho do modelo, tais como a formação de pares de treino maximizando as diferenças entre as classes, ao invés da combinação aleatória das amostras. Além disso, podem ser desenvolvidos diferentes extratores de características para os dados das plataformas de vendas online pois um extrator que gere características com menor dimensão contribui para a redução da complexidade do classificador, o que pode levar a uma economia no uso de servidores.pt_BR
dc.publisher.departmentDepartamento de Engenhariapt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.creator.Latteshttp://lattes.cnpq.br/9380586467450481pt_BR
Aparece nas coleções:Engenharia de Sistemas e automação (Dissertações)



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.