Use este identificador para citar ou linkar para este item: http://repositorio.ufla.br/jspui/handle/1/4401
Título: Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica
Título(s) alternativo(s): Cluster analysis for panel data: applications in time series of gene expression
Autor : Nascimento, Moysés
Primeiro orientador: Sáfadi, Thelma
metadata.teses.dc.contributor.advisor-co: Silva, Fabyano Fonseca e
Primeiro membro da banca: Bueno Filho, Júlio Sílvio de Sousa
Ferreira, Daniel Furtado
Morais, Augusto Ramalho de
Peternelli, Luiz Alexandre
Área de concentração: Estatística e Experimentação Agropecuária
Palavras-chave: Modelo autoregressivo
Microarray time series
Predição da expressão gênica
Séries temporais
Autoregressive model
Gene expression forecasting
Time series
Data da publicação: 10-Out-2014
Referência: NASCIMENTO, M. Análise de agrupamento para dados em painel: aplicações em séries temporais de expressão gênica. 2011. 121 p. Tese (Doutorado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2011.
Resumo: Este trabalho teve por objetivo propor uma metodologia para o agrupamento de genes com padrões de expressões gênicas similares, baseado nas estimativas dos parâmetros provenientes do modelo autorregressivo de ordem p, AR(p), para dados em painel. Foram utilizados dados referentes à expressão de genes que atuam sobre ciclo celular de Saccharomyces cerevisiae, os quais correspondem a 114 genes, sendo que, cada um deles apresentava 10 valores de fold-change (medida da expressão) ao longo do tempo (0, 15, 30,...., 135 minutos). A estimação dos parâmetros do modelo AR(p) para dados em painel foi realizada sob dois diferentes enfoques. Sob o enfoque frequentista buscou-se verificar a viabilidade da utilização de métodos de agrupamentos, hierárquico (Ward) e de otimização (Tocher), na formação de grupos homogêneos de séries de expressão gênica para posterior ajuste de modelos autorregressivos, AR(2), para dados em painel. Os resultados obtidos por este enfoque indicaram que o método de Ward mostrou-se mais apropriado para a obtenção de grupos homogêneos, e a eficiência de predição da expressão gênica resultante do ajuste do modelo AR(2) para dados em painel foi de 100%. Sob o enfoque bayesiano, considerou-se de forma conjunta a análise de agrupamento por meio do método de Ward e a análise bayesiana do modelo AR(p) para dados em painel. Os resultados obtidos por este enfoque mostraram que a metodologia proposta foi capaz de agrupar genes que apresentavam padrões de expressão similares e também de proporcionar previsões eficazes para valores futuros da expressão gênica, obtidos por meio da teoria de distribuições preditivas.
This work has as objective to propose a methodology for clustering genes with similar expression patterns based on parameter estimates from the autoregressive model of order p, AR (p), for panel data. Were used data from genes expression that are related with the Saccharomyces cerevisiae cell cycle. These data correspond to 114 genes, which each one had 10 fold-change values (expression measure) over time (0, 15, 30, ...., 135 minutes). The parameter estimation of AR(p) panel data model was realized by two different approaches. Under a frequentist approach, we aimed to verify the efficiency of hierarchical (Ward) and optimization (Tocher) clustering methods in the obtaining homogeneous clusters in order to FIT the AR(2) panel data model to gene expression series. The results obtained under this approach indicated that the Ward method was more appropriate to obtain homogeneous cluster in relation to gene expression pattern. Furthermore, the efficiency of the gene expressions forecasting from AR(2) panel data model were 100%. Under a bayesian approach, was considered a joint study of cluster (Ward method) and bayesian analyses of AR (p) model for panel data. The results obtained by this approaches showed that the used methodology provided clustering with similar gene expressions pattern and also effective forecasting for the expression values in future times by predictive distribution theory.
URI: http://repositorio.ufla.br/jspui/handle/1/4401
Publicador: UNIVERSIDADE FEDERAL DE LAVRAS
Idioma: pt_BR
Aparece nas coleções:DEX - Estatística e Experimentação Agropecuária - Doutorado (Teses)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE_Análise de agrupamento para dados em painel aplicações em séries temporais de expressão gênica.pdf2,52 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.