Use este identificador para citar ou linkar para este item: repositorio.ufla.br/jspui/handle/1/4630
Título: Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos
Autor : Alves, Rosiana Rodrigues
Primeiro orientador: Bueno Filho, Julio Silvio Sousa
Primeiro membro da banca: Balestre, Marcio
Ferreira, Daniel Furtado
Silva, Maria Imaculada de Sousa
Leandro, Roseli Aparecida
Área de concentração: Estatística e Experimentação Agropecuária
Palavras-chave: Regresão linear múltipla
Lasso bayesiano
Bayesian lasso
Tournament screening
Data da publicação: 2014
Agência(s) de fomento: Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Referência: ALVES, R. R. Seleção por torneios nas estimativas de associação entre marcadores SNP’s e fenótipos. 2014. 70 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) - Universidade Federal de Lavras, Lavras, 2014.
Resumo: Uma grande dificuldade em analisar dados de seleção genômica é que o número de preditores (marcadores SNPs) é muito maior que o número de animais avaliados. O número de correlações espúrias que surgem por mero acaso entre segregações de marcadores e fenótipos cresce exponencialmente. Uma nova série de abordagens têm sido propostas para solucionar o problema (n << p). O lasso bayesiano é uma opção estabelecida na literatura e métodos de seleção por torneios são sugestões recentes. Estes procedimentos consistem em dividir os SNP’s em grupos aleatórios e fazer um “torneio” entre os efeitos estimados. Cada grupo é analisado em separado com algum modelo de regressão. Em nosso caso, eliminava-se o SNP como menor efeito. Os marcadores selecionados são então reunidos e entram na próxima fase em que são divididas em grupos por sorteio. Este processo é continuado até o numero de variáveis seja reduzido ao desejado. Neste trabalho, em um estudo de simulação ajustou-se torneios usando a regressão múltipla e o lasso bayesiano. As análises foram comparadas ao lasso bayesiano sem a utilização de torneios (com todas as marcas). As metodologias propostas foram aplicadas em um conjunto de dados de 384 bovinos da raça Canchim genotipados usando o BovineHD BeadChip com 708.641 SNP’s identificados. Note-se que no estudo simulação foi utilizada a matriz de genótipos real e simulando os efeitos genéticos do SNP’s e o vetor de fenótipos considerando três herdabilidades (25%, 50% e 100%). Para cada herdabilidade analisou-se torneios com três tamanhos de grupos (25, 50 e 100). A validação cruzada foi feita usando 1/8 das observações. Os resultados encontrados no torneios e no lasso bayesiano mostram que esses métodos não são muito diferentes em simulação. Para os dados reais a validação cruzada também foi equivalente. É preciso notar que os torneios permitem a paralelização direta da análise. Com o equipamento usado, torneios com regressão múltipla foram 10 vezes mais rápidos que o laso bayesiano. Os torneios são metodologias simples e rápidas com eficiência equiparável ao lasso bayesiano.
A major difficulty in analyzing genomic selection data is that the number of predictor (SNP markers) is much larger than the number of evaluated animals. The spurious correlations that arises by chance in joint segregation of SNPs and phenotypes grows exponentialy. A new series of methods have been proposed to tackle this question (n << p). Bayesian Lasso and its variations are established in the literature and tournament screening is among the new suggestions. The idea is to divide SNPs in randomly assembled groups and make a “tournament” of estimated effects. Each group is analysed separately with a regression model. In our case, SNPs with saller effects were out. Remaining markers are pooled and new phase of random groups were generated. The process goes on until the remaining SNPs are as few as desired. In this work, in a simulation study, multiple regression and Bayesian lasso models were adjusted within groups. Analyses were then compared to Bayesian lasso with all markers (no tournaments). Proposed methods were applied to 384 bovine (Canchim breed animals) genotyped using the BovineHD Bead-Chip with 708;641 SNPs identified. Was also performed a simulation study using the real genotypes matrix and, simulating the genetical effects of SNPs and the vector of phenotypes, these, considering the following heritability estimates: 25%, 50% and 100%. For each heritability were analysed tournaments containing three sizes of groups: 25, 50 and 100. An 8-fold cross-validation was carried out. According to results from simulation, the tournaments and Bayesian lasso do not differ much. For real data, cross validation results are also equivalent. Note that tournaments allow for direct parallelization of analyses. With the used hardware tournaments with multiple regression were 10-fold faster than Bayesian lasso. Tournaments are simple and fast methods that yield equivalent results to Bayesian lasso.
metadata.teses.dc.description: Tese apresentada à Universidade Federal de La-vras, como parte das exigências do Programa de Pós-Graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Doutor.
URI: http://repositorio.ufla.br/jspui/handle/1/4630
Publicador: UNIVERSIDADE FEDERAL DE LAVRAS
Idioma: pt_BR
Aparece nas coleções:DEX - Estatística e Experimentação Agropecuária - Doutorado (Teses)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
TESE_Seleção por torneios nas estimativas de associação entre.pdf20,94 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.