Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/32175
metadata.teses.dc.title: BigFeel: um ambiente de processamento distribuído para integração de métodos de análise de sentimentos
metadata.teses.dc.creator: Ferreira, Roger Santos
metadata.teses.dc.creator.Lattes: http://lattes.cnpq.br/9961909524574149
metadata.teses.dc.contributor.advisor1: Pereira, Denilson Alves
metadata.teses.dc.contributor.referee1: Ribeiro, Leonardo Andrade
metadata.teses.dc.contributor.referee2: Zambalde, André Luiz
metadata.teses.dc.subject: Análise de sentimento
Aprendizagem de máquina
Processamento de linguagem natural
Sentiment analysis
Machine learning
Natural language processing
Hadoop
Spark
Big Data
metadata.teses.dc.date.issued: 17-Dec-2018
metadata.teses.dc.identifier.citation: FERREIRA, R. S. BigFeel: um ambiente de processamento distribuído para integração de métodos de análise de sentimentos. 2018. 101 p. Dissertação (Mestrado em Ciência da Computação)–Universidade Federal de Lavras, Lavras, 2018.
metadata.teses.dc.description.resumo: A análise de sentimentos tem sido foco de muita pesquisa, devido principalmente à sua importância comercial, tanto para consumidores quanto para empresas. Muitos métodos têm sido propostos, e os principais têm sido comparados em termos de eficácia. Entretanto, há uma carência na literatura da avaliação de eficiência desses métodos para processamento de grandes volumes de dados, os quais são gerados em grande velocidade, volume e variedade, conhecidos como Big Data. O presente trabalho apresenta uma abordagem para integração de métodos de análise de sentimentos de forma a processar grandes volumes de dados em um ambiente distribuído, usando para tanto das plataformas Hadoop e Spark, ambas da fundação Apache. Desenvolveu-se uma aplicação protótipo em ambiente distribuído, denominada BigFeel, a qual oferece suporte ao uso de 22 métodos de análise de sentimentos, além de alguns métodos de processamento de linguagem natural e pré-processamento textual em grandes volumes de dados. O BigFeel oferece serviços adaptados ao uso em redes de computadores, locais e na web, além de oferecer uma API para desenvolvedores Scala/Java. A eficiência dos métodos integrados foi avaliada experimentalmente, demonstrando ganho em comparação à execução na implementação não distribuída dos métodos. Usando os recursos oferecidos pelo BigFeel, é apresentado ainda um estudo de caso de detecção de sugestões de inovação com base em revisões de produtos e serviços.
metadata.teses.dc.description.abstract: Sentiment analysis has been the main focus of plenty of research efforts, particularly justified by its commercial significance, both for consumers and businesses. Thus, many methods have been proposed, and the main ones have been compared in terms of effectiveness. Nonetheless, the literature is deficient when it comes to assessing the efficiency of these methods for processing large volumes of data, which are generated at great speed, volume and variety, known as Big Data. The present work presents an approach for integrating methods of sentiment analysis in order to process large volumes of data in a distributed environment, using both the Apache Hadoop and Spark platforms. A distributed application prototype was developed, named BigFeel, which supports the use of 22 methods of sentiment analysis, as well as some methods of natural language processing and textual preprocessing in large volumes of data. BigFeel offers services tailored to the use of computer networks, local and web, as well as offering an API for Scala/Java developers. The efficiency of the integrated methods was evaluated experimentally, demonstrating gain in comparison to the execution in the non-distributed implementation of the methods. Using the features offered by BigFeel, a case study of detection of innovation suggestions based on product and service reviews is also presented.
metadata.teses.dc.identifier.uri: http://repositorio.ufla.br/jspui/handle/1/32175
metadata.teses.dc.publisher: Universidade Federal de Lavras
metadata.teses.dc.language: por
Appears in Collections:DCC - Ciência da Computação - Mestrado (Dissertações)



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.