tese

Uso de aprendizado de máquina para otimização da seleção recorrente recíproca em milho

Carregando...
Imagem de Miniatura

Notas

Arquivo retido, a pedido do autor, até abril de 2026.

Editores

Coorientadores

Título da Revista

ISSN da Revista

Título de Volume

Editor

Universidade Federal de Lavras

Faculdade, Instituto ou Escola

Instituto de Ciências Naturais – ICN

Departamento

Programa de Pós-Graduação

Programa de Pós-Graduação em Genética e Melhoramento de Plantas

Agência de fomento

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES

Tipo de impacto

Tecnológico

Áreas Temáticas da Extenção

Meio ambiente
Tecnologia e produção

Objetivos de Desenvolvimento Sustentável

ODS 2: Fome zero e agricultura sustentável
ODS 13: Ação contra a mudança global do clima

Dados abertos

Resumo

A Seleção Recorrente Recíproca (SRR) tem sido amplamente empregada no melhoramento genético do milho, com o objetivo de maximizar o potencial genético e a heterose entre populações. Contudo, sua eficácia está intrinsecamente ligada à análise precisa de caracteres e progênies de milho. Nesse contexto, metodologias baseadas em aprendizado de máquina e modelos estatísticos avançados podem ser conjuntamente utilizadas para otimizar a seleção e predizer o desempenho em programas de SRR. Este trabalho teve como objetivo principal otimizar o processo de seleção de progênies de milho no programa de SRR da Universidade Federal de Lavras, por meio do uso de técnicas de aprendizado de máquina. Os experimentos foram conduzidos na Universidade Federal de Lavras entre os anos de 2021 a 2024, em um delineamento Alpha Lattice. O estudo foi estruturado em quatro etapas principais: (i) Análise do potencial genético das progênies por meio de estratégias baseadas na integração da metodologia Best Subset Regression para otimização da seleção simultânea de características por meio de índices de seleção. (ii) Recombinação de 15% das progênies selecionadas, seguida da geração de quatro populações de intracruzamento e intercruzamento pelo método Bulk Pollen Pollination. Essas populações foram avaliadas e submetidas às análises de parâmetros genéticos e fatoriais baseadas em correlação fenotípica e genética, visando a seleção simultânea de progênies com expressão fenotípica e genética de suas características e otimização por agrupamento de K-means. (iii) Predição da produtividade das progênies por meio de modelos multiníveis no contexto de melhoramento aninhado (progênies dentro de populações e estas dentro de cruzamentos).(iv) Integração da fenotipagem de alto rendimento a modelos de aprendizado de máquina baseados em árvores interpretáveis e índices de seleção simultânea. Em conclusão, a integração das metodologias Best Subset Regression e índices de seleção simultânea é uma abordagem eficaz para orientar a identificação de linhagens promissoras e impulsionar o progresso genético das populações de milho em SRR. As estratégias de seleção fatorial em populações mostraram eficácia ao identificar progênies com desempenho simultâneo em relação à expressão fenotípica e genética, contribuindo para o desenvolvimento de cultivares de maior estabilidade agronômica e genética. O modelo multinível destacou-se como ferramenta com maior poder preditivo e suporte à seleção acurada de progênies superiores. A integração dos modelos de aprendizado de máquina com índices de seleção simultânea maximizou a resposta de seleção por meio da escolha de progênies de milho com ótimos ganhos genéticos. Este estudo valida o aprendizado de máquina e sua integração com modelos estatísticos como uma estratégia inovadora e eficaz para a otimização da SRR em milho, acelerando o progresso do melhoramento genético e contribuindo para o desenvolvimento de híbridos de elevado desempenho.

Abstract

Reciprocal Recurrent Selection (RRS) has been widely used in maize breeding to maximize genetic potential and heterosis between populations. However, its effectiveness is intrinsically linked to the precise analysis of maize traits and progenies. In this context, machine learning-based methodologies and advanced statistical models can be jointly employed to optimize selection and predict performance in RRS programs. The main objective of this study was to optimize the selection process of maize progenies in the Federal University of Lavras RRS program using machine learning techniques. The experiments were conducted at the Federal University of Lavras between 2021 and 2024 using an Alpha Lattice design. The study was structured into four main stages: i) Analysis of the genetic potential of progenies through strategies based on the integration of the Best Subset Regression methodology to optimize the simultaneous selection of traits using selection indices. ii) Recombination of the top 15% of selected progenies followed by the generation of four intrapopulation and interpopulation crosses using the Bulk Pollen Pollination method. These populations were evaluated and subjected to genetic and factorial parameter analyses based on phenotypic and genetic correlations, aiming for the simultaneous selection of progenies with optimal phenotypic and genetic expression of their traits, optimized through K-means clustering. iii) Prediction of progeny yield using multilevel models in the context of nested breeding progenies within populations and populations within crosses. iv) Integrating high-throughput phenotyping with interpretable tree-based machine learning models and simultaneous selection indices. In conclusion, the integration of Best Subset Regression and simultaneous selection indices proved to be an effective approach for identifying promising lineages and enhancing the genetic progress of maize populations in RRS. Factorial selection strategies in populations demonstrated efficacy in identifying progenies with simultaneous phenotypic and genetic performance, contributing to the development of cultivars with greater agronomic and genetic stability. The multilevel model stood out as a tool with high predictive power, supporting the accurate selection of superior progenies. The integration of machine learning models with simultaneous selection indices maximized selection response by choosing maize progenies with optimal genetic gains. This study validates machine learning and its integration with statistical models as an innovative and effective strategy for optimizing RRS in maize, accelerating genetic breeding progress, and contributing to the development of high-performance hybrids.

Descrição

Área de concentração

Agência de desenvolvimento

Palavra chave

Marca

Objetivo

Procedência

Impacto da pesquisa

Resumen

ISBN

DOI

Citação

PEDRO, César. Uso de aprendizado de máquina para otimização da seleção recorrente recíproca em milho. 2025. 76 p. Tese (Doutorado em Genética e Melhoramento de Plantas) - Universidade Federal de Lavras, Lavras, 2025.

Link externo

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution 3.0 Brazil