Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos

Ribeiro, Alice Rezende

dissertação

Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos

Arquivos

Texto completo.pdf (1.05 MB)

Impactos da pesquisa.pdf (116.01 KB)

Notas

Arquivo retido, a pedido da autoria, até agosto de 2026.

Data

30/05/2025

Autores

Ribeiro, Alice Rezende

Orientadores

Merschmann, Luiz Henrique de Campos

Membros de banca

Gato, Elaine Cecília

Santos Filho, Reginaldo Cordeiro dos

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Instituto de Ciências Exatas e Tecnológicas – ICET

Programa de Pós-Graduação

Programa de Pós-Graduação em Ciência da Computação

Agência de fomento

Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq
Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG

Tipo de impacto

Sociais
Tecnológico

Áreas Temáticas da Extenção

Tecnologia e produção

Objetivos de Desenvolvimento Sustentável

ODS 9: Indústria, inovação e infraestrutura

Resumo

Com a difusão do uso da internet, ferramentas de mineração de textos têm se tornado importantes para a estratégia de negócio das empresas. Ao mesmo tempo, o crescente volume de textos anônimos disponíveis na internet representa um desafio à obtenção de informações úteis, por exemplo, para modelos de personalização para comércio e marketing digital e em áreas como a forense digital. Na área de Caracterização Autoral — área que busca prever características sociais e demográficas de um grupo com base em seus textos —, embora haja um grande número de estudos, eles apresentam desigualdades quanto às características analisadas, à linguagem utilizada e às abordagens de classificação empregadas. Dessa forma, o presente trabalho busca propor e avaliar um método de classificação em cascata, que combina formas de classificação tradicional com um modelo baseado em dicionários, para predizer faixas etárias de autores com base em textos escritos na língua portuguesa. Os resultados encontrados mostram que o modelo baseado em dicionários em combinação com modelos tradicionais podem trazer melhoria na predição da faixa etária.

Abstract

With the widespread use of the Internet, text mining tools have become important for companies' business strategies. At the same time, the growing volume of anonymous texts available on the Internet poses a challenge to obtaining useful information, for example, in the development of personalization models for digital commerce and marketing, as well as in fields such as digital forensics. In the area of Authorial Characterization — an area that seeks to predict social and demographic characteristics of a group based on their texts —, although there are a large number of studies, they present inequalities regarding the characteristics analyzed, the language used and the classification approaches employed. Thus, this work seeks to propose and evaluate a cascade classification method, which combines traditional classification methods with a dictionaries-based model, in order to predict author age ranges based on texts written in Portuguese. The results found show that the dictionaries-based model in combination with traditional models can bring improvements in age range classification.

Palavras-chave

Caracterização autoral, Faixa etária, Mineração de textos, Author profiling, Age range, Text mining

Citação

RIBEIRO, Alice Rezende. Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos. 2025. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2025.

URI

https://repositorio.ufla.br/handle/1/60307

Coleções

Ciência da Computação - Mestrado (Dissertações)

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil

Página do item completo

Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos

Arquivos

Notas

Data

Autores

Orientadores

Editores

Coorientadores

Membros de banca

Título da Revista

ISSN da Revista

Título de Volume

Editor

Faculdade, Instituto ou Escola

Departamento

Programa de Pós-Graduação

Agência de fomento

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Abstract

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

Palavras-chave

ISBN

DOI

Citação

Link externo

URI

Coleções

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons