tese

Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis

Carregando...
Imagem de Miniatura

Notas

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Departamento

Departamento de Estatística

Programa de Pós-Graduação

Programa de Pós-Graduação em Estatística e Experimentação Agropecuária

Agência de fomento

Tipo de impacto

Áreas Temáticas da Extenção

Objetivos de Desenvolvimento Sustentável

Dados abertos

Resumo

Há muitos métodos para a seleção genômica que tratam dos problemas da multicolinearidade e da alta dimensionalidade, dentre os quais destacam-se na literatura o rr-BLUP e o Bayes B. Métodos de genoma contínuo e regressão funcional em janelas cromossômicas (bins) foram recentemente propostas para melhor utilizar o desequilíbrio de ligação entre SNP (Single Nucleotide Polymorphism) e potenciais QTLs (Quantitative Trait Loci). Uma das estratégias propostas é utilizar funções polinomiais ou trigonométricas em versões ajustadas para janelas cromossômicas (bins). Nesse caso, um fator complicador é a potencial má especificação do número e tamanho dos bins, com potencial ampliação do erro de predição. Neste trabalho nós investigamos as vantagens de fazer a inferência conjunta a posteriori do número, do tamanho e dos efeitos das marcas nos bins em um processo de amostragem por saltos reversíveis. Este tipo de técnica era de difícil implementação para modelos anteriores que levavam em conta a distância entre marcas e QTLs, mas pode ser muito simplificado em modelos de regressão simples típicos da genômica moderna (em que cada SNP segrega potencialmente como um QTL). Estudamos as duas estratégias e suas consequências imediatas para a seleção genômica. Uma revisão de literatura inicial sobre os métodos foi feita como subsídio para dois artigos. No primeiro, avaliamos a implementação de modelos funcionais de bins com o uso de séries de Fourier e de B-Splines. No segundo, introduzimos o RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) para modelos funcionais em que cada bin é representado na amostragem por uma só de suas marcas. Os modelos considerados foram comparáveis aos métodos mais utilizados quanto à predição (Bayes-B, rr- BLUP) e são adequados para a seleção genômica. Como potencial subproduto do da tese, os resultados para estudos de associação são também interessantes, embora não tenha sido nosso objetivo principal avaliá-los.

Abstract

There are many methods for genomic selection that address the problems of multicollinearity and high dimensionality, among which the rr-BLUP and Bayes B stand out in the literature. Methods of continuous genome and functional regression in chromosomal windows (bins) were recently proposed to better utilize the linkage disequilibrium between SNP (Single Nucleotide Polymorphism) and potential QTLs (Quantitative Trait Loci). One of the proposed strategies is to use polynomial or trigonometric functions in bins-fitted versions. In this case, a complicating factor is the potential misspecification of the number and the sizes of the bins, with a potential increase in the prediction error. In this thesys we investigate the advantages of making inference in the joint posterior distribution for the number, the size and the effects of marks in bins in a reversible jump sampling process. This type of technique was difficult to implement for previous models that took into account the distance between marks and QTLs, but it can be greatly simplified in simple regression models typical of modern genomics (where each SNP potentially segregates as a QTL). We study the two strategies and their immediate consequences for genomic selection. A basic review of the literature methods was used to subsidize two original papers. In the first one, we evaluated the implementation of functional models of bins using Fourier series and B- Splines. In the second, we introduce the RJ-MCMC (Reverse Jump Markov Chain Monte Carlo) for functional models in which each bin is represented in the sampling by only one of its marks. The models considered were comparable to the most used for prediction (Bayes-B, rr-BLUP) and are suitable for genomic selection. As a potential by-product of the thesys, the results for association studies are also interesting, despite not being our main goal to evaluate them.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

MOURA, E. G. Análise genômica por janelas cromossômicas: regressão funcional e saltos reversíveis. 2021. 93 p. Tese (Doutorado em Estatística e Experimentação Agropecuária) – Universidade Federal de Lavras, Lavras, 2022.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por