dissertação

Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos

Carregando...
Imagem de Miniatura

Notas

Arquivo retido, a pedido da autoria, até agosto de 2026.

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Instituto de Ciências Exatas e Tecnológicas – ICET

Departamento

Programa de Pós-Graduação

Programa de Pós-Graduação em Ciência da Computação

Agência de fomento

Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq
Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG

Tipo de impacto

Sociais
Tecnológico

Áreas Temáticas da Extenção

Tecnologia e produção

Objetivos de Desenvolvimento Sustentável

ODS 9: Indústria, inovação e infraestrutura

Dados abertos

Resumo

Com a difusão do uso da internet, ferramentas de mineração de textos têm se tornado importantes para a estratégia de negócio das empresas. Ao mesmo tempo, o crescente volume de textos anônimos disponíveis na internet representa um desafio à obtenção de informações úteis, por exemplo, para modelos de personalização para comércio e marketing digital e em áreas como a forense digital. Na área de Caracterização Autoral — área que busca prever características sociais e demográficas de um grupo com base em seus textos —, embora haja um grande número de estudos, eles apresentam desigualdades quanto às características analisadas, à linguagem utilizada e às abordagens de classificação empregadas. Dessa forma, o presente trabalho busca propor e avaliar um método de classificação em cascata, que combina formas de classificação tradicional com um modelo baseado em dicionários, para predizer faixas etárias de autores com base em textos escritos na língua portuguesa. Os resultados encontrados mostram que o modelo baseado em dicionários em combinação com modelos tradicionais podem trazer melhoria na predição da faixa etária.

Abstract

With the widespread use of the Internet, text mining tools have become important for companies' business strategies. At the same time, the growing volume of anonymous texts available on the Internet poses a challenge to obtaining useful information, for example, in the development of personalization models for digital commerce and marketing, as well as in fields such as digital forensics. In the area of Authorial Characterization — an area that seeks to predict social and demographic characteristics of a group based on their texts —, although there are a large number of studies, they present inequalities regarding the characteristics analyzed, the language used and the classification approaches employed. Thus, this work seeks to propose and evaluate a cascade classification method, which combines traditional classification methods with a dictionaries-based model, in order to predict author age ranges based on texts written in Portuguese. The results found show that the dictionaries-based model in combination with traditional models can bring improvements in age range classification.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

RIBEIRO, Alice Rezende. Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos. 2025. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2025.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil