Buscar

 

RI UFLA (Universidade Federal de Lavras) >
DCC - Departamento de Ciência da Computação >
DCC - Graduação >
DCC - Bacharelado em Ciência da Computação (Monografias) >

Por favor, utilize esse identificador para citar este item ou usar como link: http://repositorio.ufla.br/jspui/handle/1/4954

Título: Junções por similaridade em múltiplos conjuntos utilizando MapReduce
Autor(es): Sousa, Luís Henrique Borges
Orientador: Ribeiro, Leonardo Andrade
Membro da banca: Pereira, Marluce Rodrigues
Pereira, Denilson Alves
Assunto: Banco de dados
Junções de similaridade
MapReduce
Computação paralela
Computação Distribuída
Data de Defesa: 29-Ago-2013
Data de publicação: 26-Jan-2015
Referência: SOUSA, L. H. B. Junções por similaridade em múltiplos conjuntos utilizando MapReduce. 2013. 77 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2013.
Resumo: Operações de similaridade são operações fundamentais para busca, gerenciamento e análise de dados. Apesar dessas operações serem geralmente bastante onerosas computacionalmente, já foram desenvolvidos algoritmos eficientes. No entanto, para a realização de operações de similaridade sobre grandes volumes de dados, técnicas de programação paralela e distribuída são imprescindíveis. O objetivo deste trabalho é generalizar o algoritmo mpjoin para múltiplos conjuntos com pesos para execução em paralelo utilizando o framework MapReduce. Visto que até o presente momento apenas o algoritmo ppjoin (para um único conjunto e sem pesos) foi utilizado, este trabalho traz novidades para a área de pesquisa. Três estratégias para distribuição do algoritmo são propostas, sendo que, de acordo com os experimentos realizados, a terceira é a mais eficiente e escalável.
URI: http://repositorio.ufla.br/jspui/handle/1/4954
Idioma: pt_BR
Aparece nas coleções: DCC - Bacharelado em Ciência da Computação (Monografias)

Arquivos neste Item:

Arquivo Descrição TamanhoFormato
MONOGRAFIA_Juncoes_por_similaridade_em_multiplos_conjuntos_utilizando_mapreduce.pdf3,28 MBAdobe PDFVer/abrir

Itens protegidos por copyright, com todos os direitos reservados, Salvo indicação em contrário.


Mostrar estatísticas

 


DSpace Software Copyright © 2002-2007 MIT and Hewlett-Packard - Feedback