TCC
Junções por similaridade em múltiplos conjuntos utilizando MapReduce
Carregando...
Notas
Data
Autores
Orientadores
Editores
Coorientadores
Membros de banca
Título da Revista
ISSN da Revista
Título de Volume
Editor
Faculdade, Instituto ou Escola
Departamento
Programa de Pós-Graduação
Agência de fomento
Tipo de impacto
Áreas Temáticas da Extenção
Objetivos de Desenvolvimento Sustentável
Dados abertos
Resumo
Operações de similaridade são operações fundamentais para busca, gerenciamento
e análise de dados. Apesar dessas operações serem geralmente bastante onerosas
computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto,
para a realização de operações de similaridade sobre grandes volumes de dados,
técnicas de programação paralela e distribuída são imprescindíveis. O objetivo
deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos
para execução em paralelo utilizando o framework MapReduce. Visto que até
o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem
pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias
para distribuição do algoritmo são propostas, sendo que, de acordo com
os experimentos realizados, a terceira é a mais eficiente e escalável.
Abstract
Descrição
Área de concentração
Agência de desenvolvimento
Palavra chave
Marca
Objetivo
Procedência
Impacto da pesquisa
Resumen
Palavras-chave
ISBN
DOI
Citação
SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.
