Junções por similaridade em múltiplos conjuntos utilizando MapReduce

dc.contributor.advisor1Ribeiro, Leonardo Andrade
dc.contributor.referee1Pereira, Marluce Rodrigues
dc.contributor.referee1Pereira, Denilson Alves
dc.creatorSousa, Luís Henrique Borges
dc.date.accessioned2018-10-10T13:53:48Z
dc.date.available2018-10-10T13:53:48Z
dc.date.issued2015-01-26
dc.date.submitted2013-08-29
dc.description.resumoOperações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.pt_BR
dc.identifier.citationSOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.pt_BR
dc.identifier.urihttps://repositorio.ufla.br/handle/1/31284
dc.languagept_BRpt_BR
dc.rightsacesso abertopt_BR
dc.subjectBanco de dadospt_BR
dc.subjectJunções de similaridadept_BR
dc.subjectMapReducept_BR
dc.subjectComputação paralelapt_BR
dc.subjectComputação Distribuídapt_BR
dc.titleJunções por similaridade em múltiplos conjuntos utilizando MapReducept_BR
dc.typeTCCpt_BR

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
MONOGRAFIA_Juncoes_por_similaridade_em_multiplos_conjuntos_utilizando_mapreduce.pdf
Tamanho:
3.21 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
953 B
Formato:
Plain Text
Descrição: