Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos

dc.contributor.advisorMerschmann, Luiz Henrique de Campos
dc.contributor.refereeGato, Elaine Cecília
dc.contributor.refereeSantos Filho, Reginaldo Cordeiro dos
dc.creatorRibeiro, Alice Rezende
dc.creator.Lattestps://lattes.cnpq.br/2133017638813194
dc.date.accessioned2025-09-18T20:32:21Z
dc.date.issued2025-05-30
dc.description.abstractWith the widespread use of the Internet, text mining tools have become important for companies' business strategies. At the same time, the growing volume of anonymous texts available on the Internet poses a challenge to obtaining useful information, for example, in the development of personalization models for digital commerce and marketing, as well as in fields such as digital forensics. In the area of Authorial Characterization — an area that seeks to predict social and demographic characteristics of a group based on their texts —, although there are a large number of studies, they present inequalities regarding the characteristics analyzed, the language used and the classification approaches employed. Thus, this work seeks to propose and evaluate a cascade classification method, which combines traditional classification methods with a dictionaries-based model, in order to predict author age ranges based on texts written in Portuguese. The results found show that the dictionaries-based model in combination with traditional models can bring improvements in age range classification.
dc.description.areastematicasdaextensaoTecnologia e produção
dc.description.notesArquivo retido, a pedido da autoria, até agosto de 2026.
dc.description.odsODS 9: Indústria, inovação e infraestrutura
dc.description.resumoCom a difusão do uso da internet, ferramentas de mineração de textos têm se tornado importantes para a estratégia de negócio das empresas. Ao mesmo tempo, o crescente volume de textos anônimos disponíveis na internet representa um desafio à obtenção de informações úteis, por exemplo, para modelos de personalização para comércio e marketing digital e em áreas como a forense digital. Na área de Caracterização Autoral — área que busca prever características sociais e demográficas de um grupo com base em seus textos —, embora haja um grande número de estudos, eles apresentam desigualdades quanto às características analisadas, à linguagem utilizada e às abordagens de classificação empregadas. Dessa forma, o presente trabalho busca propor e avaliar um método de classificação em cascata, que combina formas de classificação tradicional com um modelo baseado em dicionários, para predizer faixas etárias de autores com base em textos escritos na língua portuguesa. Os resultados encontrados mostram que o modelo baseado em dicionários em combinação com modelos tradicionais podem trazer melhoria na predição da faixa etária.
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG
dc.description.tipodeimpactoSociais
dc.description.tipodeimpactoTecnológico
dc.identifier.citationRIBEIRO, Alice Rezende. Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos. 2025. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2025.
dc.identifier.urihttps://repositorio.ufla.br/handle/1/60307
dc.language.isopt_BR
dc.publisherUniversidade Federal de Lavras
dc.publisher.collegeInstituto de Ciências Exatas e Tecnológicas – ICET
dc.publisher.countrybrasil
dc.publisher.initialsUFLA
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação
dc.rightsAttribution 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/
dc.subjectCaracterização autoral
dc.subjectFaixa etária
dc.subjectMineração de textos
dc.subjectAuthor profiling
dc.subjectAge range
dc.subjectText mining
dc.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.titleUma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos
dc.title.alternativeA cascade approach for predicting authors’ age range from their texts
dc.typedissertação

Arquivos

Pacote original

Agora exibindo 1 - 2 de 2
Carregando...
Imagem de Miniatura
Nome:
Texto completo.pdf
Tamanho:
1.05 MB
Formato:
Adobe Portable Document Format
Carregando...
Imagem de Miniatura
Nome:
Impactos da pesquisa.pdf
Tamanho:
116.01 KB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
955 B
Formato:
Item-specific license agreed upon to submission
Descrição: