Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/33255
Registro completo de metadados
Campo DCValorIdioma
dc.creatorFerreira, Leila Maria-
dc.date.accessioned2019-03-22T16:45:49Z-
dc.date.available2019-03-22T16:45:49Z-
dc.date.issued2019-03-22-
dc.date.submitted2019-02-07-
dc.identifier.citationFERREIRA, L. M. Evaluation of genome similarities: a wavelet-domain approach. 2018. 89 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2019.pt_BR
dc.identifier.urihttp://repositorio.ufla.br/jspui/handle/1/33255-
dc.description.abstractThe wavelets arised to solve the problems when you work with non-stationary data, signals contaminated with noise, large data volume, detection of self-similarity, separation of components in a signal, among others. The technique called the “wavelet transform” corresponds to one of its main characteristics, because the data (signal, image or function) can be decomposed in the frequency domain as well as in the time domain. The low frequencies (larger scales) correspond to a global information, which generally extends over the analyzed data, while the high frequencies (reduced scales) correspond to more detailed information, which lasts a relatively short period of time. The present work was divided in the presentation of three different genome cluster analysis techniques using wavelets. These techniques were employed in ten sequences of the Mycobacterium tuberculosis genome. The first technique used to grouping the of genomes was the use of energy (variance). This energy was obtained by summing the detail coefficients by the square of each level of decomposition (five levels) of the original signal by means of the Daubechies wavelet with four null moments. As a result, the formation of 3 distinct groups was found. The second technique approached the junction of wavelets with the methodology Elastic net. In this analysis, after obtaining the levels of decomposition using wavelets, the Elastic net was applied at each level, where it was possible to verify the formation of the groups. The results showed that levels 4 and 5 were the ones that presented the best formation of the groups, being found three different groups. The third technique involved the combination of wavelets with the Hurst exponent. From the results obtained of the levels of decomposition by wavelets, using the same configurations of the first and second techniques previously described, the Hurst exponent was calculated for each level of decomposition, using five methods of estimation of the Hurst exponent. Each method presented different group formations, but the method that presented the similar results according to the two previous techniques was the method of aggregate variance.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)pt_BR
dc.description.sponsorshipConselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)pt_BR
dc.languageengpt_BR
dc.publisherUniversidade Federal de Lavraspt_BR
dc.rightsrestrictAccesspt_BR
dc.subjectTransformada não-decimada de ondaletaspt_BR
dc.subjectMycobacterium tuberculosispt_BR
dc.subjectMétodo de variância agregadapt_BR
dc.subjectAgrupamento de genomaspt_BR
dc.subjectNon-decimated wavelet transformpt_BR
dc.subjectMethod of aggregate variancept_BR
dc.subjectClustering of genomespt_BR
dc.titleEvaluation of genome similarities: a wavelet-domain approachpt_BR
dc.title.alternativeAvaliação da similaridade de genomas: uma abordagem pelo domínio de ondaletaspt_BR
dc.typetesept_BR
dc.publisher.programPrograma de Pós-Graduação em Estatística e Experimentação Agropecuáriapt_BR
dc.publisher.initialsUFLApt_BR
dc.publisher.countrybrasilpt_BR
dc.contributor.advisor1Sáfadi, Thelma-
dc.contributor.referee1Silva, Alessandra Querino da-
dc.contributor.referee2Bueno Filho, Júlio Sílvio de Souza-
dc.contributor.referee3Nascimento, Moysés-
dc.contributor.referee4Lima, Renato Ribeiro de-
dc.description.resumoAs ondaletas surgiram para solucionar os problemas quando se trabalha com dados não estacionários, sinais contaminados com ruídos, grande volume de dados, detecção de auto-semelhança, separação de componentes num sinal, entre outros. A técnica chamada “transformada de ondaleta” corresponde a uma das suas principais características, pois o dado (sinal, imagem ou função) pode ser decomposto tanto no domínio da frequência, quanto no domínio do tempo. As frequências baixas (escalas maiores) correspondem a uma informação global, que geralmente se estende por todo o dado analisado, enquanto que as frequências altas (escalas reduzidas) correspondem a uma informação mais detalhada, que dura um período de tempo relativamente curto. O presente trabalho foi dividido na apresentação de três técnicas distintas de análise de agrupamento de genomas utilizando ondaletas. Essas técnicas foram empregadas em dez sequências do genoma da Mycobacterium tuberculosis. A primeira técnica utilizada para o agrupamento dos genomas foi o uso da energia (variância). Essa energia foi obtida por meio da soma dos coeficientes de detalhes ao quadrado de cada nível de decomposição (cinco níveis) do sinal original por meio da ondaleta Daubechies com quatro momentos nulos. Como resultado, verificou-se a formação de 3 grupos distintos. A segunda técnica abordou a junção de ondaletas com a metodologia Elastic net. Nessa análise, depois de obtidos os níveis de decomposição utilizando ondaletas, o Elastic net foi aplicado em cada nível, onde pode-se verificar a formação dos grupos. Os resultados obtidos mostraram que os níveis 4 e 5 foram os que apresentaram a melhor formação dos grupos, sendo encontrados três grupos distintos. A terceira técnica abrangeu a combinação de ondaletas com o expoente de Hurst. A partir dos resultados obtidos dos níveis de decomposição por ondaletas, utilizando as mesmas configurações da primeira e segunda técnicas descritas anteriormente, foi feito o cálculo do expoente de Hurst para cada nível de decomposição, utilizando cinco métodos de estimação do expoente de Hurst. Cada método apresentou formações de grupos diferentes, mas o método que apresentou os resultados similares de acordo com as duas técnicas anteriores, foi o método de variância agregada.pt_BR
dc.publisher.departmentDepartamento de Ciências Exataspt_BR
dc.subject.cnpqEstatísticapt_BR
dc.creator.Latteshttp://lattes.cnpq.br/2292832403699146pt_BR
Aparece nas coleções:Estatística e Experimentação Agropecuária - Doutorado (Teses)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
ARTIGO_Evaluation of genome similarities - a wavelet-domain approach.pdf4,89 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.