dissertação

BigFeel: um ambiente de processamento distribuído para integração de métodos de análise de sentimentos

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Departamento

Departamento de Ciência da Computação

Programa de Pós-Graduação

Programa de Pós-graduação em Ciência da Computação

Agência de fomento

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

A análise de sentimentos tem sido foco de muita pesquisa, devido principalmente à sua importância comercial, tanto para consumidores quanto para empresas. Muitos métodos têm sido propostos, e os principais têm sido comparados em termos de eficácia. Entretanto, há uma carência na literatura da avaliação de eficiência desses métodos para processamento de grandes volumes de dados, os quais são gerados em grande velocidade, volume e variedade, conhecidos como Big Data. O presente trabalho apresenta uma abordagem para integração de métodos de análise de sentimentos de forma a processar grandes volumes de dados em um ambiente distribuído, usando para tanto das plataformas Hadoop e Spark, ambas da fundação Apache. Desenvolveu-se uma aplicação protótipo em ambiente distribuído, denominada BigFeel, a qual oferece suporte ao uso de 22 métodos de análise de sentimentos, além de alguns métodos de processamento de linguagem natural e pré-processamento textual em grandes volumes de dados. O BigFeel oferece serviços adaptados ao uso em redes de computadores, locais e na web, além de oferecer uma API para desenvolvedores Scala/Java. A eficiência dos métodos integrados foi avaliada experimentalmente, demonstrando ganho em comparação à execução na implementação não distribuída dos métodos. Usando os recursos oferecidos pelo BigFeel, é apresentado ainda um estudo de caso de detecção de sugestões de inovação com base em revisões de produtos e serviços.

Abstract

Sentiment analysis has been the main focus of plenty of research efforts, particularly justified by its commercial significance, both for consumers and businesses. Thus, many methods have been proposed, and the main ones have been compared in terms of effectiveness. Nonetheless, the literature is deficient when it comes to assessing the efficiency of these methods for processing large volumes of data, which are generated at great speed, volume and variety, known as Big Data. The present work presents an approach for integrating methods of sentiment analysis in order to process large volumes of data in a distributed environment, using both the Apache Hadoop and Spark platforms. A distributed application prototype was developed, named BigFeel, which supports the use of 22 methods of sentiment analysis, as well as some methods of natural language processing and textual preprocessing in large volumes of data. BigFeel offers services tailored to the use of computer networks, local and web, as well as offering an API for Scala/Java developers. The efficiency of the integrated methods was evaluated experimentally, demonstrating gain in comparison to the execution in the non-distributed implementation of the methods. Using the features offered by BigFeel, a case study of detection of innovation suggestions based on product and service reviews is also presented.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

FERREIRA, R. S. BigFeel: um ambiente de processamento distribuído para integração de métodos de análise de sentimentos. 2018. 101 p. Dissertação (Mestrado em Ciência da Computação)–Universidade Federal de Lavras, Lavras, 2018.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por