Use este identificador para citar ou linkar para este item:
http://repositorio.ufla.br/jspui/handle/1/39253
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Oliveira , Douglas Nunes de | - |
dc.date.accessioned | 2020-03-09T13:51:35Z | - |
dc.date.available | 2020-03-09T13:51:35Z | - |
dc.date.issued | 2020-03-09 | - |
dc.date.submitted | 2019-11-26 | - |
dc.identifier.citation | OLIVEIRA, D. N. de. Uma abordagem de auto-ML para análise de sentimentos na língua portuguesa. 2019. 125 p. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2019. | pt_BR |
dc.identifier.uri | http://repositorio.ufla.br/jspui/handle/1/39253 | - |
dc.description | Arquivo retido, a pedido do autor, até março de 2022. | - |
dc.description.abstract | Sentiment analysis is a raising field in academia and industry. It is a type of data extraction from knowledge that makes use of diverse natural language processing tasks and data mining tech- niques to obtain its results. Finding the best combination of these tasks for a given data set is not a trivial task as there may be a substantial amount of combinations to evaluate. Besides, the evaluation of each combination may require considerable computational power that can restrict the number of possible evaluations. Therefore, in this work, we first evaluate the combination of five NLP tasks and three classifiers in the domain of sentiment analysis using texts written in Portuguese. The experimental results showed that different combinations of preprocessing tasks can significantly affect the predictive performance of a classifier for a given dataset. Con- sequently, it is clear the importance of performing the joint evaluation of preprocessing tasks with classifiers when choosing which preprocessing tasks and classifier should be used for a dataset. Therefore, this paper also proposes a Automated Machine Learning (Auto-ML) ap- proach to search for a good combination of a classifier with natural languages processing tasks without having to evaluate all possible combinations. The proposed approach uses evolutio- nary algorithms and Bayesian optimization with the Bootstrap Corrected Cross-Validation Bias (BBC-CV) bias correction technique to find such a combination. The approach presented in this paper, evaluated with Portuguese written text data sets, showed performance equivalent or better than another Auto-ML tool. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Lavras | pt_BR |
dc.rights | restrictAccess | pt_BR |
dc.subject | Automated Machine Learning (Auto-ML) | pt_BR |
dc.subject | Análise de sentimentos | pt_BR |
dc.subject | Processamento de linguagem natural | pt_BR |
dc.subject | Sentiment analysis | pt_BR |
dc.subject | Natural language processing | pt_BR |
dc.title | Uma abordagem de auto-ML para análise de sentimentos na língua portuguesa | pt_BR |
dc.title.alternative | An Auto-ML approach for sentiment analysis in Portuguese language | pt_BR |
dc.type | dissertação | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação | pt_BR |
dc.publisher.initials | UFLA | pt_BR |
dc.publisher.country | brasil | pt_BR |
dc.contributor.advisor1 | Merschmann, Luiz Henrique de Campos | - |
dc.contributor.referee1 | Pereira, Denilson Alves | - |
dc.contributor.referee2 | Carvalho, Alexandre Plastino de | - |
dc.description.resumo | A análise de sentimentos é uma área em ascensão tanto no meio acadêmico quanto comercial. Ela é um tipo de extração de conhecimento a partir de dados que faz uso de diversas tarefas de processamento de linguagem natural e de técnicas de mineração de dados para obter seus resultados. Encontrar a melhor combinação dessas tarefas para uma determinada base de dados não é uma tarefa trivial, dado que pode existir uma grande quantidade de combinações a serem avaliadas. Além disso, a avaliação de cada combinação pode requerer um grande poder compu- tacional que pode restringir a quantidade de avaliações possíveis. Sendo assim, este trabalho ini- cialmente apresenta uma avaliação da combinação de cinco tarefas de pré-processamento e três classificadores considerando a tarefa de análise de sentimentos de textos da língua portuguesa. Os resultados dessa avaliação mostram que diferentes combinações podem afetar significativa- mente o desempenho preditivo obtido em uma base de dados. Isso deixa claro a importância de executar a avaliação conjunta de tarefas de pré-processamento com classificadores ao escolher quais tarefas de pré-processamento e classificador devem ser usados para uma base de dados. Desse modo, este trabalho também propõe uma abordagem de Aprendizado de Máquina Au- tomatizado (Automated Machine Learning – Auto-ML) para buscar uma boa combinação de classificador com técnicas de pré-processamento de textos (associadas com tarefas de proces- samento de linguagem natural) sem a necessidade de avaliar todas combinações possíveis. A abordagem proposta utiliza algoritmos evolutivos e otimização Bayesiana em conjunto com a técnica de correção de viés Bootstrap Bias Corrected Cross-Validation (BBC-CV) para encon- trar tal combinação. Essa abordagem, avaliada a partir de bases de dados com textos escritos em língua portuguesa, mostrou um desempenho tão bom quanto ou superior ao de outra ferramenta de Auto-ML. | pt_BR |
dc.publisher.department | Departamento de Ciência da Computação | pt_BR |
dc.subject.cnpq | Ciência da Computação | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/4543639138117731 | pt_BR |
Aparece nas coleções: | Ciência da Computação - Mestrado (Dissertações) |
Arquivos associados a este item:
Não existem arquivos associados a este item.
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.