TCC

Junções por similaridade em múltiplos conjuntos utilizando MapReduce

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Faculdade, Instituto ou Escola

Departamento

Programa de Pós-Graduação

Agência de fomento

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.

Abstract

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por