Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos
| dc.contributor.advisor | Merschmann, Luiz Henrique de Campos | |
| dc.contributor.referee | Gato, Elaine Cecília | |
| dc.contributor.referee | Santos Filho, Reginaldo Cordeiro dos | |
| dc.creator | Ribeiro, Alice Rezende | |
| dc.creator.Lattes | tps://lattes.cnpq.br/2133017638813194 | |
| dc.date.accessioned | 2025-09-18T20:32:21Z | |
| dc.date.issued | 2025-05-30 | |
| dc.description.abstract | With the widespread use of the Internet, text mining tools have become important for companies' business strategies. At the same time, the growing volume of anonymous texts available on the Internet poses a challenge to obtaining useful information, for example, in the development of personalization models for digital commerce and marketing, as well as in fields such as digital forensics. In the area of Authorial Characterization — an area that seeks to predict social and demographic characteristics of a group based on their texts —, although there are a large number of studies, they present inequalities regarding the characteristics analyzed, the language used and the classification approaches employed. Thus, this work seeks to propose and evaluate a cascade classification method, which combines traditional classification methods with a dictionaries-based model, in order to predict author age ranges based on texts written in Portuguese. The results found show that the dictionaries-based model in combination with traditional models can bring improvements in age range classification. | |
| dc.description.areastematicasdaextensao | Tecnologia e produção | |
| dc.description.notes | Arquivo retido, a pedido da autoria, até agosto de 2026. | |
| dc.description.ods | ODS 9: Indústria, inovação e infraestrutura | |
| dc.description.resumo | Com a difusão do uso da internet, ferramentas de mineração de textos têm se tornado importantes para a estratégia de negócio das empresas. Ao mesmo tempo, o crescente volume de textos anônimos disponíveis na internet representa um desafio à obtenção de informações úteis, por exemplo, para modelos de personalização para comércio e marketing digital e em áreas como a forense digital. Na área de Caracterização Autoral — área que busca prever características sociais e demográficas de um grupo com base em seus textos —, embora haja um grande número de estudos, eles apresentam desigualdades quanto às características analisadas, à linguagem utilizada e às abordagens de classificação empregadas. Dessa forma, o presente trabalho busca propor e avaliar um método de classificação em cascata, que combina formas de classificação tradicional com um modelo baseado em dicionários, para predizer faixas etárias de autores com base em textos escritos na língua portuguesa. Os resultados encontrados mostram que o modelo baseado em dicionários em combinação com modelos tradicionais podem trazer melhoria na predição da faixa etária. | |
| dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq | |
| dc.description.sponsorship | Fundação de Amparo à Pesquisa do Estado de Minas Gerais - FAPEMIG | |
| dc.description.tipodeimpacto | Sociais | |
| dc.description.tipodeimpacto | Tecnológico | |
| dc.identifier.citation | RIBEIRO, Alice Rezende. Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos. 2025. 72 p. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2025. | |
| dc.identifier.uri | https://repositorio.ufla.br/handle/1/60307 | |
| dc.language.iso | pt_BR | |
| dc.publisher | Universidade Federal de Lavras | |
| dc.publisher.college | Instituto de Ciências Exatas e Tecnológicas – ICET | |
| dc.publisher.country | brasil | |
| dc.publisher.initials | UFLA | |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação | |
| dc.rights | Attribution 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/3.0/br/ | |
| dc.subject | Caracterização autoral | |
| dc.subject | Faixa etária | |
| dc.subject | Mineração de textos | |
| dc.subject | Author profiling | |
| dc.subject | Age range | |
| dc.subject | Text mining | |
| dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
| dc.title | Uma abordagem em cascata para predição de faixa etária de autores a partir dos seus textos | |
| dc.title.alternative | A cascade approach for predicting authors’ age range from their texts | |
| dc.type | dissertação |
Arquivos
Licença do pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 955 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
