Please use this identifier to cite or link to this item: http://repositorio.ufla.br/jspui/handle/1/33255
metadata.teses.dc.title: Evaluation of genome similarities: a wavelet-domain approach
metadata.teses.dc.title.alternative: Avaliação da similaridade de genomas: uma abordagem pelo domínio de ondaletas
metadata.teses.dc.creator: Ferreira, Leila Maria
metadata.teses.dc.creator.Lattes: http://lattes.cnpq.br/2292832403699146
metadata.teses.dc.contributor.advisor1: Sáfadi, Thelma
metadata.teses.dc.contributor.referee1: Silva, Alessandra Querino da
metadata.teses.dc.contributor.referee2: Bueno Filho, Júlio Sílvio de Souza
metadata.teses.dc.contributor.referee3: Nascimento, Moysés
metadata.teses.dc.contributor.referee4: Lima, Renato Ribeiro de
metadata.teses.dc.subject: Transformada não-decimada de ondaletas
Mycobacterium tuberculosis
Método de variância agregada
Agrupamento de genomas
Non-decimated wavelet transform
Method of aggregate variance
Clustering of genomes
metadata.teses.dc.date.issued: 22-Mar-2019
metadata.teses.dc.description.sponsorship: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
metadata.teses.dc.identifier.citation: FERREIRA, L. M. Evaluation of genome similarities: a wavelet-domain approach. 2018. 89 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2019.
metadata.teses.dc.description.resumo: As ondaletas surgiram para solucionar os problemas quando se trabalha com dados não estacionários, sinais contaminados com ruídos, grande volume de dados, detecção de auto-semelhança, separação de componentes num sinal, entre outros. A técnica chamada “transformada de ondaleta” corresponde a uma das suas principais características, pois o dado (sinal, imagem ou função) pode ser decomposto tanto no domínio da frequência, quanto no domínio do tempo. As frequências baixas (escalas maiores) correspondem a uma informação global, que geralmente se estende por todo o dado analisado, enquanto que as frequências altas (escalas reduzidas) correspondem a uma informação mais detalhada, que dura um período de tempo relativamente curto. O presente trabalho foi dividido na apresentação de três técnicas distintas de análise de agrupamento de genomas utilizando ondaletas. Essas técnicas foram empregadas em dez sequências do genoma da Mycobacterium tuberculosis. A primeira técnica utilizada para o agrupamento dos genomas foi o uso da energia (variância). Essa energia foi obtida por meio da soma dos coeficientes de detalhes ao quadrado de cada nível de decomposição (cinco níveis) do sinal original por meio da ondaleta Daubechies com quatro momentos nulos. Como resultado, verificou-se a formação de 3 grupos distintos. A segunda técnica abordou a junção de ondaletas com a metodologia Elastic net. Nessa análise, depois de obtidos os níveis de decomposição utilizando ondaletas, o Elastic net foi aplicado em cada nível, onde pode-se verificar a formação dos grupos. Os resultados obtidos mostraram que os níveis 4 e 5 foram os que apresentaram a melhor formação dos grupos, sendo encontrados três grupos distintos. A terceira técnica abrangeu a combinação de ondaletas com o expoente de Hurst. A partir dos resultados obtidos dos níveis de decomposição por ondaletas, utilizando as mesmas configurações da primeira e segunda técnicas descritas anteriormente, foi feito o cálculo do expoente de Hurst para cada nível de decomposição, utilizando cinco métodos de estimação do expoente de Hurst. Cada método apresentou formações de grupos diferentes, mas o método que apresentou os resultados similares de acordo com as duas técnicas anteriores, foi o método de variância agregada.
metadata.teses.dc.description.abstract: The wavelets arised to solve the problems when you work with non-stationary data, signals contaminated with noise, large data volume, detection of self-similarity, separation of components in a signal, among others. The technique called the “wavelet transform” corresponds to one of its main characteristics, because the data (signal, image or function) can be decomposed in the frequency domain as well as in the time domain. The low frequencies (larger scales) correspond to a global information, which generally extends over the analyzed data, while the high frequencies (reduced scales) correspond to more detailed information, which lasts a relatively short period of time. The present work was divided in the presentation of three different genome cluster analysis techniques using wavelets. These techniques were employed in ten sequences of the Mycobacterium tuberculosis genome. The first technique used to grouping the of genomes was the use of energy (variance). This energy was obtained by summing the detail coefficients by the square of each level of decomposition (five levels) of the original signal by means of the Daubechies wavelet with four null moments. As a result, the formation of 3 distinct groups was found. The second technique approached the junction of wavelets with the methodology Elastic net. In this analysis, after obtaining the levels of decomposition using wavelets, the Elastic net was applied at each level, where it was possible to verify the formation of the groups. The results showed that levels 4 and 5 were the ones that presented the best formation of the groups, being found three different groups. The third technique involved the combination of wavelets with the Hurst exponent. From the results obtained of the levels of decomposition by wavelets, using the same configurations of the first and second techniques previously described, the Hurst exponent was calculated for each level of decomposition, using five methods of estimation of the Hurst exponent. Each method presented different group formations, but the method that presented the similar results according to the two previous techniques was the method of aggregate variance.
metadata.teses.dc.description: Arquivo retido, a pedido da autora, até março 2020.
metadata.teses.dc.identifier.uri: http://repositorio.ufla.br/jspui/handle/1/33255
metadata.teses.dc.publisher: Universidade Federal de Lavras
metadata.teses.dc.language: eng
Appears in Collections:DEX - Estatística e Experimentação Agropecuária - Doutorado (Teses)

Files in This Item:
There are no files associated with this item.


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.