Uma abordagem em cascata para predição de gênero a partir de textos em Português

dc.contributor.advisor1Merschmann, Luiz Henrique de Campos
dc.contributor.referee1Pereira, Denilson Alves
dc.contributor.referee2Paiva, Elaine Ribeiro de Faria
dc.creatorMorais, João Pedro Moreira de
dc.creator.Latteshttp://lattes.cnpq.br/9947741030819174pt_BR
dc.date.accessioned2022-02-07T19:32:40Z
dc.date.available2022-02-07T19:32:40Z
dc.date.issued2022-02-07
dc.date.submitted2021-12-10
dc.description.abstractAuthor Profiling, whose objective is the analysis of a text to uncover characteristics (e.g., gen- der and age) of its author, has become an important task in different areas such as forensics, marketing, and e-commerce. Although a lot of research has been conducted on this task for some widely used lan- guages (e.g., English), there is still a lot of room for improvement in studies involving the Portuguese language. Thus, this work contributes by proposing and evaluating a cascading approach, which combi- nes a weighted lexical approach, a heuristic and a classifier, for the gender prediction problem using only textual content written in the Portuguese language. The proposed approach takes into account both spe- cificities of the Portuguese language and domain characteristics of the texts. The results obtained from the proposed approach showed that exploring the specificities of the Portuguese language and domain characteristics of the texts can positively contribute to the performance of the gender prediction task.pt_BR
dc.description.resumoA área de estudo e pesquisa denominada Caracterização Autoral, cujo objetivo é analisar um texto para inferir informações a respeito do seu autor, vem sendo cada vez mais útil para diferentes se- tores, tais como o forense, marketing e comércio eletrônico. Apesar do crescente interesse em pesquisas nessa área, a quantidade de técnicas e ferramentas apresentadas na literatura com foco na língua portu- guesa é relativamente escassa quando comparada àquela disponível para outros idiomas. Desse modo, este trabalho contribui nessa área de estudo propondo e avaliando uma abordagem em cascata, que com- bina um módulo que utiliza um dicionário, uma heurística de gênero e um classificador, para a predição do gênero do autor de um texto escrito em português utilizando somente o conteúdo textual. A aborda- gem proposta leva em consideração tanto especificidades da língua portuguesa como características de domínio dos textos. Os resultados obtidos a partir da abordagem proposta mostraram que explorar as es- pecificidades da língua portuguesa e características de domínio dos textos pode contribuir positivamente no desempenho da tarefa de predição de gênero.pt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado de Minas Gerais (FAPEMIG)pt_BR
dc.identifier.citationMORAIS, J. P. M. de. Uma abordagem em cascata para predição de gênero a partir de textos em Português. 2021. 48 p. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufla.br/handle/1/49191
dc.languagept_BRpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.publisher.countrybrasilpt_BR
dc.publisher.departmentDepartamento de Ciência da Computaçãopt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.rightsacesso abertopt_BR
dc.subjectCaracterização autoralpt_BR
dc.subjectMineração de textopt_BR
dc.subjectPredição de gêneropt_BR
dc.subjectLíngua portuguesapt_BR
dc.subjectAuthor profilingpt_BR
dc.subjectPortuguese languagept_BR
dc.subjectText miningpt_BR
dc.subjectGender predictionpt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.titleUma abordagem em cascata para predição de gênero a partir de textos em Portuguêspt_BR
dc.title.alternativeA cascading approach to gender prediction from portuguese textspt_BR
dc.typedissertaçãopt_BR

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
DISSERTAÇÃO_Uma abordagem em cascata para predição de gênero a partir de textos em Português.pdf
Tamanho:
1.91 MB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
953 B
Formato:
Item-specific license agreed upon to submission
Descrição: