Use este identificador para citar ou linkar para este item:
http://repositorio.ufla.br/jspui/handle/1/33255
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.creator | Ferreira, Leila Maria | - |
dc.date.accessioned | 2019-03-22T16:45:49Z | - |
dc.date.available | 2019-03-22T16:45:49Z | - |
dc.date.issued | 2019-03-22 | - |
dc.date.submitted | 2019-02-07 | - |
dc.identifier.citation | FERREIRA, L. M. Evaluation of genome similarities: a wavelet-domain approach. 2018. 89 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2019. | pt_BR |
dc.identifier.uri | http://repositorio.ufla.br/jspui/handle/1/33255 | - |
dc.description.abstract | The wavelets arised to solve the problems when you work with non-stationary data, signals contaminated with noise, large data volume, detection of self-similarity, separation of components in a signal, among others. The technique called the “wavelet transform” corresponds to one of its main characteristics, because the data (signal, image or function) can be decomposed in the frequency domain as well as in the time domain. The low frequencies (larger scales) correspond to a global information, which generally extends over the analyzed data, while the high frequencies (reduced scales) correspond to more detailed information, which lasts a relatively short period of time. The present work was divided in the presentation of three different genome cluster analysis techniques using wavelets. These techniques were employed in ten sequences of the Mycobacterium tuberculosis genome. The first technique used to grouping the of genomes was the use of energy (variance). This energy was obtained by summing the detail coefficients by the square of each level of decomposition (five levels) of the original signal by means of the Daubechies wavelet with four null moments. As a result, the formation of 3 distinct groups was found. The second technique approached the junction of wavelets with the methodology Elastic net. In this analysis, after obtaining the levels of decomposition using wavelets, the Elastic net was applied at each level, where it was possible to verify the formation of the groups. The results showed that levels 4 and 5 were the ones that presented the best formation of the groups, being found three different groups. The third technique involved the combination of wavelets with the Hurst exponent. From the results obtained of the levels of decomposition by wavelets, using the same configurations of the first and second techniques previously described, the Hurst exponent was calculated for each level of decomposition, using five methods of estimation of the Hurst exponent. Each method presented different group formations, but the method that presented the similar results according to the two previous techniques was the method of aggregate variance. | pt_BR |
dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) | pt_BR |
dc.description.sponsorship | Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) | pt_BR |
dc.language | eng | pt_BR |
dc.publisher | Universidade Federal de Lavras | pt_BR |
dc.rights | restrictAccess | pt_BR |
dc.subject | Transformada não-decimada de ondaletas | pt_BR |
dc.subject | Mycobacterium tuberculosis | pt_BR |
dc.subject | Método de variância agregada | pt_BR |
dc.subject | Agrupamento de genomas | pt_BR |
dc.subject | Non-decimated wavelet transform | pt_BR |
dc.subject | Method of aggregate variance | pt_BR |
dc.subject | Clustering of genomes | pt_BR |
dc.title | Evaluation of genome similarities: a wavelet-domain approach | pt_BR |
dc.title.alternative | Avaliação da similaridade de genomas: uma abordagem pelo domínio de ondaletas | pt_BR |
dc.type | tese | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Estatística e Experimentação Agropecuária | pt_BR |
dc.publisher.initials | UFLA | pt_BR |
dc.publisher.country | brasil | pt_BR |
dc.contributor.advisor1 | Sáfadi, Thelma | - |
dc.contributor.referee1 | Silva, Alessandra Querino da | - |
dc.contributor.referee2 | Bueno Filho, Júlio Sílvio de Souza | - |
dc.contributor.referee3 | Nascimento, Moysés | - |
dc.contributor.referee4 | Lima, Renato Ribeiro de | - |
dc.description.resumo | As ondaletas surgiram para solucionar os problemas quando se trabalha com dados não estacionários, sinais contaminados com ruídos, grande volume de dados, detecção de auto-semelhança, separação de componentes num sinal, entre outros. A técnica chamada “transformada de ondaleta” corresponde a uma das suas principais características, pois o dado (sinal, imagem ou função) pode ser decomposto tanto no domínio da frequência, quanto no domínio do tempo. As frequências baixas (escalas maiores) correspondem a uma informação global, que geralmente se estende por todo o dado analisado, enquanto que as frequências altas (escalas reduzidas) correspondem a uma informação mais detalhada, que dura um período de tempo relativamente curto. O presente trabalho foi dividido na apresentação de três técnicas distintas de análise de agrupamento de genomas utilizando ondaletas. Essas técnicas foram empregadas em dez sequências do genoma da Mycobacterium tuberculosis. A primeira técnica utilizada para o agrupamento dos genomas foi o uso da energia (variância). Essa energia foi obtida por meio da soma dos coeficientes de detalhes ao quadrado de cada nível de decomposição (cinco níveis) do sinal original por meio da ondaleta Daubechies com quatro momentos nulos. Como resultado, verificou-se a formação de 3 grupos distintos. A segunda técnica abordou a junção de ondaletas com a metodologia Elastic net. Nessa análise, depois de obtidos os níveis de decomposição utilizando ondaletas, o Elastic net foi aplicado em cada nível, onde pode-se verificar a formação dos grupos. Os resultados obtidos mostraram que os níveis 4 e 5 foram os que apresentaram a melhor formação dos grupos, sendo encontrados três grupos distintos. A terceira técnica abrangeu a combinação de ondaletas com o expoente de Hurst. A partir dos resultados obtidos dos níveis de decomposição por ondaletas, utilizando as mesmas configurações da primeira e segunda técnicas descritas anteriormente, foi feito o cálculo do expoente de Hurst para cada nível de decomposição, utilizando cinco métodos de estimação do expoente de Hurst. Cada método apresentou formações de grupos diferentes, mas o método que apresentou os resultados similares de acordo com as duas técnicas anteriores, foi o método de variância agregada. | pt_BR |
dc.publisher.department | Departamento de Ciências Exatas | pt_BR |
dc.subject.cnpq | Estatística | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/2292832403699146 | pt_BR |
Aparece nas coleções: | Estatística e Experimentação Agropecuária - Doutorado (Teses) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
ARTIGO_Evaluation of genome similarities - a wavelet-domain approach.pdf | 4,89 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.