dissertação
Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos
Carregando...
Notas
Arquivo retido, a pedido da autoria, até agosto de 2026.
Data
Autores
Orientadores
Editores
Coorientadores
Membros de banca
Título da Revista
ISSN da Revista
Título de Volume
Editor
Universidade Federal de Lavras
Faculdade, Instituto ou Escola
Instituto de Ciências Exatas e Tecnológicas – ICET
Departamento
Programa de Pós-Graduação
Programa de Pós-Graduação em Ciência da Computação
Agência de fomento
Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq
Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG
Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG
Tipo de impacto
Sociais
Tecnológico
Tecnológico
Áreas Temáticas da Extenção
Tecnologia e produção
Objetivos de Desenvolvimento Sustentável
ODS 9: Indústria, inovação e infraestrutura
Dados abertos
Resumo
Com a difusão do uso da internet, ferramentas de mineração de textos têm se tornado importantes para a estratégia de negócio das empresas. Ao mesmo tempo, o crescente volume de textos anônimos disponíveis na internet representa um desafio à obtenção de informações úteis, por exemplo, para modelos de personalização para comércio e marketing digital e em áreas como a forense digital. Na área de Caracterização Autoral — área que busca prever características sociais e demográficas de um grupo com base em seus textos —, embora haja um grande número de estudos, eles apresentam desigualdades quanto às características analisadas, à linguagem utilizada e às abordagens de classificação empregadas. Dessa forma, o presente trabalho busca propor e avaliar um método de classificação em cascata, que combina formas de classificação tradicional com um modelo baseado em dicionários, para predizer faixas etárias de autores com base em textos escritos na língua portuguesa. Os resultados encontrados mostram que o modelo baseado em dicionários em combinação com modelos tradicionais podem trazer melhoria na predição da faixa etária.
Abstract
With the widespread use of the Internet, text mining tools have become important for companies' business strategies. At the same time, the growing volume of anonymous texts available on the Internet poses a challenge to obtaining useful information, for example, in the development of personalization models for digital commerce and marketing, as well as in fields such as digital forensics. In the area of Authorial Characterization — an area that seeks to predict social and demographic characteristics of a group based on their texts —, although there are a large number of studies, they present inequalities regarding the characteristics analyzed, the language used and the classification approaches employed. Thus, this work seeks to propose and evaluate a cascade classification method, which combines traditional classification methods with a dictionaries-based model, in order to predict author age ranges based on texts written in Portuguese. The results found show that the dictionaries-based model in combination with traditional models can bring improvements in age range classification.
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
Palavras-chave
ISBN
DOI
Citação
RIBEIRO, Alice Rezende. Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos. 2025. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2025.
Link externo
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil

