Avaliação do framework mapreduce para paralelização do algoritmo apriori

Bolina, André Camilo

Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/5098

metadata.teses.dc.title:	Avaliação do framework mapreduce para paralelização do algoritmo apriori
metadata.teses.dc.creator:	Bolina, André Camilo
metadata.teses.dc.contributor.advisor1:	Pereira, Marluce Rodrigues
metadata.teses.dc.contributor.advisor-co:	Esmin, Ahmed Ali Abdalla
metadata.teses.dc.contributor.referee1:	Pereira, Denilson Alves Castro, Cristiano Leite de
metadata.teses.dc.subject:	Processamento paralelo e distribuido Mineração de dados Algoritmo apriori MapReduce
metadata.teses.dc.date.submitted:	15-Apr-2013
metadata.teses.dc.date.issued:	2015
metadata.teses.dc.identifier.citation:	BOLINA, A. C. Avaliação do framework mapreduce para paralelização do algoritmo apriori. 2013. 69 p. Monografia (Graduação em Ciência da Computação) - Universidade Federal de Lavras, Lavras, 2014.
metadata.teses.dc.description.resumo:	A mineração de padrões frequentes é uma área da computação de ampla utilização. Seu objetivo é encontrar padrões de informações relevantes em grandes quantidades de dados. Porém, os principais algoritmos para mineração de padrões frequentes possuem alto tempo de execução, visto o grande volume de dados com que trabalham. Sendo assim, a programação paralela e distribuída e os frameworks de paralelização de algoritmos são uma boa alternativa para reduzir o tempo de execução necessário para processar as aplicações. Este trabalho propõe a implementação paralela e distribuída do algoritmo Apriori, bastante conhecido na área da mineração de padrões frequentes, utilizando para isso o Framework MapReduce. Os resultados são comparados com o algoritmo DMTA (Distributed Multithread Apriori), que também executa o algoritmo Apriori de forma paralela e distribuída, mas utilizando as bibliotecas MPI e OpenMP para criar e gerenciar processos e threads.
metadata.teses.dc.description.abstract:	The frequent-patterns mining is an area of extensive use in computing, its your objective is to find information about relevant patterns in large amounts of data. But the main algorithms for frequent-patterns mining have a high execution time, due to the large volume of data they work with. Therefore, parallel programming and frameworks that use this concept seem a good solution to reduce the execution time and level of computing required by these algorithms. This work proposes the parallel and distributed implementation of the Apriori algorithm, well known in the research area of frequent-patterns mining, using MapReduce Framework. The results were compared with the DMTA algorithm (Distributed Multithread Apriori), which also implements the Apriori algorithm in distributed and parallel, but using MPI and OpenMP libraries to create and manage processes and threads
metadata.teses.dc.identifier.uri:	http://repositorio.ufla.br/jspui/handle/1/5098
metadata.teses.dc.language:	pt_BR
Appears in Collections:	PROGRAD - Ciência da Computação (Trabalhos de Conclusão de Curso)

Files in This Item:

File	Description	Size	Format
MONOGRAFIA_ Avaliação do framework mapreduce para paralelização do algoritmo apriori.pdf		2,29 MB	Adobe PDF	View/Open

Show full item record Recommend this item