Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/59309
Título: Transformada de wavelet discreta não decimada para o agrupamento de genomas de vírus das famílias coronaviridae e paramyxoviridae
Título(s) alternativo(s): Undecimated discrete wavelet transform for the clustering of virus genomes of the coronaviridae and paramyxoviridae families
Autor : Ernesto, Dulcídia Carlos Guezimane
Lattes: https://lattes.cnpq.br/3800458908284696
Primeiro orientador: Sáfadi, Thelma
Primeiro coorientador: Ferreira, Leila Maria
Primeiro membro da banca: Guimarães, Paulo Henrique Sales
Segundo membro da banca: Alencar, Airlane Pereira
Terceiro membro da banca: Herval , Ana Paula Festucci de
Palavras-chave: Transformada de Wavelet
Genomas virais
Agrupamento de dados
Coronaviridae
Paramyxoviridae
Vírus
Análise de dados genômicos
Viroses respiratórias
Wavelet Transform
Viral Genomes
Data Clustering
Viruses
Genomic data analysis
Data da publicação: 31-Ago-2023
Agência(s) de fomento: Coordenação de Aperfeiçoamento de Pessoal do Nível Superior (CAPES)
Referência: ERNESTO, Dulcídia Carlos Guezimane. Transformada de wavelet discreta não decimada para o agrupamento de genomas de vírus das famílias coronaviridae e paramyxoviridae. 2024. 111p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, 2023.
Resumo: Este trabalho teve por objetivo a implementação de duas formas de análise de similaridades de sequenciamentos de duas famílias de vírus, sob o domínio das wavelets. As wavelets são costumeiramente utilizadas quando se trabalha com uma extensa base de dados não estacionária. A técnica da transformada de wavelet trabalha com dados em tempo real, e permite que a série temporal possa ser decomposta em níveis, permitindo deste modo que a cada nível de decomposição seja possível se ampliar o nível de detalhe da série, e assim se observar detalhes omissos, que não se podem observar na série original. Após a decomposição do conteúdo GC de cada um dos sequenciamentos em estudo, duas formas distintas de agrupamento foram implementadas de modo a verificar, os sequenciamentos com algum nível de similaridade. Fez-se a análise de agrupamento com recurso à regressão penalizada no domínio das penalizações lasso, ridge e elastic net, e por outro lado, recorreu-se também ao expoente de Hurst implementado por meio de 5 técnicas diferentes nomeadamente: método peng, análise R/S, variância agregada, variância agregada diferenciada e pelo método dos momentos absolutos. Ao fim do estudo pode-se concluir que variantes mais fracas da família Coronaviridae é que se associam as estirpes da família Paramyxoviridae. E por outro lado, o elastic net (do 1º ao 3º nível), o método dos momentos absolutos e o método de variância agregada diferenciada, tiveram melhor desempenho em relação as demais metodologias.
Abstract: This work aimed to implement two forms of analysis of sequence similarities of two virus families, under the wavelet domain. Wavelets are commonly used when working with an extensive non-stationary database. The wavelet transform technique works with data in real time, and allows the time series to be decomposed into levels, thus allowing at each level of decomposition to increase the level of detail in the series, and thus observe details omissions, which cannot be observed in the original series. After decomposing the GC content of each of the sequences under study, two different forms of grouping were implemented in order to verify sequences with some level of similarity. Cluster analysis was carried out using penalized regression in the domain of lasso, ridge and elastic net penalties, and on the other hand, we also used the Hurst exponent implemented through 5 different techniques, namely: peng method, R analysis /S, aggregate variance, differentiated aggregate variance and by the method of absolute moments. At the end of the study, it can be concluded that weaker variants of the Coronaviridae family are associated with strains of the Paramyxoviridae family. And on the other hand, the elastic net (from the 1st to the 3rd level), the absolute moments method and the differentiated aggregate variance method performed better in relation to the other methodologies.
URI: http://repositorio.ufla.br/jspui/handle/1/59309
Publicador: Universidade Federal de Lavras
Idioma: por
Aparece nas coleções:DAE - Administração - Mestrado (Dissertações)



Este item está licenciada sob uma Licença Creative Commons Creative Commons