Estudo de aplicação de um método híbrido para classificação de proteínas utilizando sequence coding by sliding window e redes neurais artificiais

Paiva, Jônatas Lopes de

Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/5238

Registro completo de metadados

Campo DC	Valor	Idioma
dc.creator	Paiva, Jônatas Lopes de	-
dc.date.accessioned	2015-03-17T14:28:20Z	-
dc.date.available	2015-03-17T14:28:20Z	-
dc.date.issued	2015-03-17	-
dc.identifier.citation	PAIVA, J. L. de. Estudo de aplicação de um método híbrido para classificação de proteínas utilizando sequence coding by sliding window e redes neurais artificiais. 2010. 44 p. Monografia (Graduação em Ciência da Computação) – Universidade Federal de Lavras, Lavras, 2010.	pt_BR
dc.identifier.uri	http://repositorio.ufla.br/jspui/handle/1/5238	-
dc.description.abstract	This work proposes the construction of a protein classifier for the public database COG (Clusters of Orthologous groups). The classifier is built using artificial neural networks (ANN). The major problem with this method is that ANNs accept only single sizes inputs, and the proteins in COG can have many different sizes, because of that the proteins need to be coded, and the coding method used in this work is the Sequence Coding By Sliding Window (SCSW), which uses sliding windows and generates unique size vectors for any entry. The downside with this coding is that the vectors generated can be ambiguous, causing different sequences to generate equal vectors, to avoid that an ideal size for the sliding window must be found. With the encoding ready the datasets for training and validation of ANN must be selected, this selection must be done because the data obtained from COG are too large; and this makes a selection of data required. The selection is done using the Fuzzy c-means method; it selects the points and creates sets for the creation of ANN. In the end, the results obtained with the ANN in the validation set are compared with the expected results, with these results the hit rate of the network is calculated.	pt_BR
dc.language	pt_BR	pt_BR
dc.rights	acesso aberto	pt_BR
dc.subject	Classificação de proteínas	pt_BR
dc.subject	Codificação de proteínas	pt_BR
dc.subject	Redes neurais artificiais	pt_BR
dc.subject	Clustering	pt_BR
dc.subject	Bioinformática	pt_BR
dc.subject	Protein classification	pt_BR
dc.subject	Protein coding	pt_BR
dc.subject	Artificial neural networks	pt_BR
dc.subject	Clustering	pt_BR
dc.subject	Bioinformatics	pt_BR
dc.title	Estudo de aplicação de um método híbrido para classificação de proteínas utilizando sequence coding by sliding window e redes neurais artificiais	pt_BR
dc.type	TCC	pt_BR
dc.contributor.advisor1	Castro, Cristiano Leite de	-
dc.contributor.referee1	Esmin, Ahmed Ali Abdalla	-
dc.contributor.referee1	Cardoso, Patrícia Gomes	-
dc.description.resumo	Este trabalho propõe a construção de um classificador para as proteínas do banco de dados público COG (Clusters of Orthologous Groups). O classificador é construído utilizando redes neurais artificiais (RNA). O grande problema deste método é que RNAs aceitam entradas de tamanho único, e as proteínas do COG possuem tamanhos variados, por este motivo as proteínas precisam ser codificadas, e a codificação utilizada neste trabalho é a Sequence Coding By Sliding Window (SCSW), que se utiliza de janelas deslizantes e gera vetores de tamanho único para qualquer entrada. O empecilho desta codificação é o fato de que os vetores gerados podem ser ambíguos, fazendo com que sequências diferentes gerem vetores iguais, por este motivo um tamanho ideal para a janela deslizante deve ser encontrado. Com a codificação pronta, os conjuntos de dados para treinamento e validação da RNA devem ser selecionados, essa seleção deve ser feita porque os dados obtidos do COG possuem dimensionalidade muito grande, o que torna uma seleção de dados necessária. A seleção é feita utilizando o método Fuzzy c-means, que seleciona os pontos e cria os conjuntos para a criação da RNA. Ao final, os resultados obtidos com a RNA no conjunto de validação são comparados aos resultados esperados, com esses resultados o índice de acerto da rede é calculado.	pt_BR
Aparece nas coleções:	PROGRAD - Ciência da Computação (Trabalhos de Conclusão de Curso)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_Estudo_de_aplicacao_de_um_metodo_hibrido_para_classificacao_de_proteinas_utilizando_sequence_coding_by_sliding_window_e_redes_neurais_artificiais.pdf		1,1 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Recomendar este item Visualizar estatísticas