Buscar

 

RI UFLA (Universidade Federal de Lavras) >
DCC - Departamento de Ciência da Computação >
DCC - Programa de Pós-graduação >
DCC - Ciência da Computação - Mestrado (Dissertações) >

Por favor, utilize esse identificador para citar este item ou usar como link: http://repositorio.ufla.br/jspui/handle/1/5570

Título: Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto
Título Alternativo: Discovering genres patterns of e-learning discussion forums via text mining
Autor(es): Guimarães, Fabrício dos Reis Neto
Orientador: Esmin, Ahmed Ali Abdalla
Membro da banca: Esmin, Ahmed Ali Abdalla
Zambalde, André Luiz
Castro, Cristiano Leite de
Área de concentração: Inteligência Computacional e Processamento Gráfico
Assunto: Mineração de texto
Classificação multi-classe
Classificação multi-rótulo
Desbalanceamento de dados
Text mining
Multi-class classification
Multi-label classification
Unbalance Data
Data de Defesa: 6-Fev-2015
Data de publicação: 29-Abr-2015
Agência de Fomento: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Referência: GUIMARÃES, F. dos R. Descobrindo padrões de gêneros das mensagens em fóruns de discussão de ambientes virtuais de aprendizagem via mineração de texto. 2015. 114 p. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal de Lavras, Lavras, 2015.
Resumo: Ambientes Virtuais de Aprendizagem fornecem um conjunto de ferramentas para auxiliar o processo de ensino e aprendizagem. Dentre elas, os fóruns de discussões são muito utilizados, pois permitem a troca de mensagens textuais entre alunos e tutores. O acompanhamento da grande quantidade de mensagens é uma tarefa que demanda grande quantidade de tempo e esforço tornando-se necessário o uso de técnicas para encontrar mensagens com mesmo conteúdo. Neste contexto a classificação de texto pode ser utilizada para agrupar as mensagens por gêneros, fornecendo uma nova visão sobre as mensagens para o acompanhamento destes fóruns. Para classificar a mensagem em um gênero, são utilizados algoritmos de classificação multi-classe, e para classificar mais de um gênero são utilizados algoritmos de classificação multi-rótulo. Um problema da classificação de texto conhecido e ocorrido neste trabalho foi o desbalanceamento da distribuição dos dados entre as classes, o que faz com que algoritmos de classificação tenham bons resultados para as classes com mais dados e resultados ruins para classes com menos dados. Para contornar este problema podem ser utilizados algoritmos de balanceamento dos dados, através da criação, remoção ou redistribuição dos dados e também abordagens de distribuição de modelos de classificação. Este trabalho realizou estudos e investigações com o objetivo de encontrar a melhor forma de classificar as mensagens de fóruns em gêneros. Como resultado principal é proposta uma abordagem que classifica a mensagem em um ou mais gêneros, com boas taxas de acerto comparadas com algoritmos de classificação da literatura. Com a vantagem de ser construída somente com algoritmos de classificação multiclasse, que já estão bem consolidados na literatura, e com o conjunto de mensagens de treino classificadas em um gênero.
Virtual Learning Environments provide a set of tools to assist in teaching and learning processes. Among them, the discussion forums are widely used, given that they allow the exchange of text messages between students and tutors. The monitoring of a large number of messages is a task that requires a great amount of time and effort, making necessary the use of techniques for grouping messages with the same content. In this context, text classification can be used to group messages by genres, providing a new insight over the messages in order to monitor these discussion forums. To classify the message by a genre, multi-class classification algorithms are used and, to classify more than one genre, multi-label classification algorithms are used. A known issue of text classification, which occurred in this study, was the unbalance of data distribution between classes, which leads the classification algorithms to presenting good results for classes with more data and poor results for classes with less data. To solve this issue, data balancing algorithms can be used by means of creating, deleting or redistributing data, in addition to a few classification model distribution approaches. This work conducted studies and researches in order to find the best way to classify the messages from the forums into genres. As main result, we proposed an approach that classifies the message into one or more genres, with good success rates when compared with classification algorithms from literature. With the advantage of being built with only multi-class classification algorithms, which are already well established in the literature, and with a dataset of messages classified in one genre.
Informações adicionais: Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em Ciência da Computação, área de concentração em Inteligência Computacional e Processamento Gráfico, para a obtenção do título de Mestre.
URI: http://repositorio.ufla.br/jspui/handle/1/5570
Publicador: UNIVERSIDADE FEDERAL DE LAVRAS
Idioma: pt_BR
Aparece nas coleções: DCC - Ciência da Computação - Mestrado (Dissertações)

Arquivos neste Item:

Arquivo Descrição TamanhoFormato
DISSERTAÇÃO_Descobrindo padrões de gêneros das mensagens em fóruns de.pdf1,04 MBAdobe PDFVer/abrir

Itens protegidos por copyright, com todos os direitos reservados, Salvo indicação em contrário.


Mostrar estatísticas

 


DSpace Software Copyright © 2002-2007 MIT and Hewlett-Packard - Feedback